Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 37 Nächste Version anzeigen »

Die Archivsoftware von Oral-History.Digital ist für die Nutzung bestimmter Transkriptionszeichen optimiert, die in den Projekten der Digitalen Interview-Sammlungen an der Freien Universität Berlin verwendet werden. 

Sie können Oral-History.Digital aber auch mit anderen, einfacheren oder gar keinen Tranksriptionszeichen nutzen. 

Vor einigen Jahren wurden für die neueren Projekte der Digitalen Interview-Sammlungen Transkriptionsrichtlinien mit standardisierten, leicht maschinenlesbare Zeichen entwickelt, die als Vorschlag auch für andere Projekte in Oral-History.Digital dienen können.

 Folgende Punkte werden auf diese Wiki-Seite erklärt:


Vorteile der Nutzung der hier vorgeschlagenen Transkriptionszeichen

Die Auszeichnung von Transkripten mit den untenstehenden Transkriptionszeichen ist nicht notwendig für das Hochladen von Transkripten in die Archivsoftware.

Ihre Nutzung bietet aber einige Vorteile:

  1. Allgemein liefert die Auszeichnung bedeutungstragender Phänomene dort, wo das Transkript unabhängig vom Video gelesen wird, wichtige Informationen für den/die Nutzer/in. 
  2. Die unten genannten Transkriptionszeichen werden i.d.R. in der Untertiteldarstellung automatisch ausgeblendet. 
  3. Bestimmte Textteile in den Transkripten können anonymisiert dargestellt werden, ohne dass sie aus dem Original endgültig entfernt werden müssen.
  4. Um in Zukunft das Austauschformat TEI nutzen zu können, wurden die Transkriptionszeichen so gewählt, dass sie leicht in ein entsprechend kompatibles TEI-Format übersetzt werden können.
  5. Darüber hinaus erlaubt die vorgeschlagene Auszeichnung bestimmter bedeutungstragender Phänomene wie Sprechweisen, Pausen usw., eine sammlungsübergreifenden Durchsuchbarkeit dieser Phänomene in allen Archiven, die die diese standardisierten Begriffe verwenden, (z.B. eine Suche nach langen Pausen (s.u.)).

Was welche Zeichen bedeuten und auf welche Weise sie in den verschiedenen Darstellungsarten in Oral-History.Digital angezeigt oder ausgeblendet werden, wird in der untenstehenden Tabelle erläutert. 

Bei der Verwendung anderer als der unten aufgeführten Transkriptionszeichen ist darauf zu achten, dass nicht dieselben Zeichen in anderen Kontexten verwendet werden, um zu verhindern, dass etwas ausgeblendet wird, was nicht ausgeblendet werden soll.

 

 TO DO

  • Warum sollte man sich an die Listen gängiger Auzeichnungen bei <v(...)...>, <s(...)...> halten? → wegen TEI; aber kein Zwang → Vorteile erklären 



Transkriptionszeichen und Angaben für die Anzeige im Untertitel, auf der Plattform und im PDF-Download

Empfohlene Transkriptionszeichen

Transkriptionszeichen

Erklärung

Beispiel

Einfach-Anzeige im Untertitel und VTT-Export

Vollanzeige auf der Plattform

Vollanzeige im PDF-Export

Timecode:

hh:mm:ss.mmm

Vor jedem Sprecher*innenwechsel, nach jedem Satz, jeder Sinneinheit, nach maximal 120 Zeichen wird empfohlen einen Timecode zu setzen. hh:mm:ss.mmm ist das empfohlene Format, mmm entspricht dabei der Einheit Millisekunden.

Die Darstellung ist abhängig vom Datenformat, siehe csv, vtt und srt.

Abhängig vom Importformat:

csv/ods: in der Spalte "Timecode": 01:23:45.678

vtt: 00:00:00.130 --> 00:00:03.700

srt: 00:00:02,310 --> 00:00:12,888

odt: Timecodes aus Textdateien können beim Upload nicht ausgewertet werden!

Nicht angezeigt, signalisiert Wechsel des Untertitels. Wenn ein Segment kürzer als 1 Sekunde ist, soll es mit dem folgenden in einem Untertitel zusammengefasst werden.

Im vtt-Export sind die Timecodes enthalten:

00:00:00.146 --> 00:00:05.777

 

Anzeige nur bei Überschriften und im Inhaltsverzeichnis

Sprecher*innenauszeichnung

Sprecher*innenauszeichnungen können frei gewählt werden. Sie müssen aus mindestens zwei Buchstaben bestehen und dürfen keine Leerzeichen beinhalten. INT steht z.B. für die Interviewer*in, KAM für die Kameraperson. Für die interviewte Person wird empfohlen, den ersten Buchstaben des Vor- und Nachnamens zu verwenden.

Die Darstellung ist abhängig vom Datenformat, siehe csv, vtt und srt.

Abhängig vom Importformat:

csv/ods: in der Spalte "Sprecher" nur die abgekürzten Namen:
INT, KAM, AM

vtt und srt: unter dem Timecode in derselben Zeile mit Transkripttext abgetrennt durch Leerzeichen:  
<v INT> Transkripttext
<v AM> Transkripttext...

odt: vor dem Transkripttext abgetrennt durch Leerzeichen, am besten eingerahmt mit einem im Text nicht vorkommenden Zeichen, z.B.: 
#INT# Transkripttext
#AM# Transkripttext

Nicht angezeigt

Initialen des Sprechenden werden angezeigt (wie in Personendaten in ohd angelegt), bei Mouse Over Anzeige des vollständigen Namens

Vollständiger Name

<res>

Mit <res> (restricted) werden Segmente gekennzeichnet, die nicht veröffentlicht werden sollen. Erstreckt sich die Auslassung über mehrere Segmente muss <res> für jedes Segment neu gesetzt werden. 

Für die Nutzer*innen wird anstatt der so markierten Textsequenz folgender Text angezeigt: „Diese Passage wird nicht veröffentlicht.“ 

<res hier steht der Text, der nicht veröffentlicht werden soll>

Diese Passage wird nicht veröffentlicht.

Diese Passage wird nicht veröffentlicht.

Diese Passage wird nicht veröffentlicht.

<an>

Mit <an> (anonymous) können anonymisierte personenbezogene Daten markiert werden, die den Nutzer*innen mit XXX angezeigt werden sollen.

Ich war bei <an Maria Mustermann>, als das passierte.

Ich war bei XXX, als das passierte.

Ich war bei XXX, als das passierte.

Ich war bei XXX, als das passierte.

<n>

Anmerkungen und Ergänzungen (notes), wie die Korrektur offensichtlicher Irrtümer, können mit <n(Erläuterung)> gekennzeichnet werden.

Der wohnte ab ’77 <n(1977)>am Kudamm <n(Kurfürstendamm)>.

Der wohnte ab ’77 am Kudamm.

Der wohnte ab ’77 (1977) am Kudamm (Kurfürstendamm).

Der wohnte ab ’77 (1977) am Kudamm (Kurfürstendamm).

<i>

Eine Unterbrechung (interruption) des Interviews bzw. der Aufnahme kann mit <i> gekennzeichnet werden. Ist der Grund der Unterbrechung bekannt, wird empfohlen, ihn in Klammer anzugeben, z. B. „<i(Batteriewechsel)>“.

Wo waren Sie während dieser Zeit?

(neuer Timecode)<i(Batteriewechsel)>

(neuer Timecode) Ich war bei Maria Mustermann.

Wo waren Sie während dieser Zeit? Ich war bei Maria Mustermann, als das passierte.

Wo waren Sie während dieser Zeit?

<i(Batteriewechsel)>

Ich war bei Maria Mustermann, als das passierte.

Wo waren Sie während dieser Zeit?

<i(Batteriewechsel)>

Ich war bei Maria Mustermann, als das passierte.

<p2>,

<p3> usw.

Sprechpausen können mit der Länge in Sekunden gekennzeichnet werden, <p2> ab 2 Sek., <p3> ab 3 Sek. usw.

Ich war <p3> bei Maria Mustermann, als das passierte.

Ich war bei Maria Mustermann, als das passierte.

Ich war <p3> bei Maria Mustermann, als das passierte.

Ich war <p3> bei Maria Mustermann, als das passierte.

<? xyz>

Eine undeutliche, schwer verständliche Passage können mit <? hier steht die unsichere Transkription> transkribiert werden.

Ich war bei Maria <? Meier>, als das passierte.

Ich war bei Maria (Meier?), als das passierte.

Ich war bei Maria <? Meier>, als das passierte.

Ich war bei Maria <? Meier>, als das passierte.

<?1>,

<?2>,

<?3> usw.

Unverständliche Passagen können mit <? und ihrer Dauer in Sekunden markiert werden, <?1>, ab 1 Sek., <?2> ab 2 Sek., <?3> ab 3 Sek. usw.

Ich war bei Maria <?1>, als das passierte. Ich war <?3>.

Ich war bei Maria (…?), als das passierte. Ich war (…?).

Ich war bei Maria <?1>, als das passierte. Ich war <?3>.

Ich war bei Maria <?1>, als das passierte. Ich war <?3>.

_

Ein Unterstrich kann abgebrochene Wörter oder Sätze kennzeichnen.

Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?

Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?

Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?

Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?

<l(es) xyz>

Fremdsprachige Begriffe können mit „l“ für lexical phenomen und dem Sprachkürzel nach ISO 639-1, z. B. „l(de)“ für Deutsch, „l(es)“ für Spanisch oder „l(en)“ für Englisch, gekennzeichnet werden. Ein Beispiel ist „There was the <l(de) Pisspott> in the corner“. Lehnwörter (z.B. Smartphone) sind davon ausgenommen.

Wo waren Sie <l(es) en este tiempo>?

Wo waren Sie en este tiempo?

Wo waren Sie <l(es) en este tiempo>?

Wo waren Sie <l(es) en este tiempo>?

<v(nonverbale Äußerung - vocal)>

  • <v(Lachen)>
  • <v(Weinen)>
  • <v(Seufzen)>
  • <v(Räuspern)>
  • <v(Husten)>
  • <v(Gähnen)>

Nonverbale, aber lautliche Äußerungen wie Lachen, Weinen etc. (vocal) können mit <v(Art der Äußerung)> gekennzeichnet werden 

Für deren Spezifizierung schlagen wir die links stehenden Auszeichnungen vor. 

<v(Lachen)> Wo waren Sie während dieser Zeit?

Wo waren Sie während dieser Zeit?

<v(Lachen)>Wo waren Sie während dieser Zeit?

<v(Lachen)> Wo waren Sie während dieser Zeit?

<s(Sprechweise) xyz>

  • <s(leise)>
  • <s(flüsternd)>
  • <s(laut)>
  • <s(hoch)>
  • <s(tief)>
  • <s(lächelnd)>
  • <s(stockend)>
  • <s(betont)>

Deutliche Änderungen der Sprechweisen (shift in vocal qualitiy) können mit <s(Sprechweise) xyz> gekennzeichnet werden. Diese Kennzeichnung wird vorgenommen, wenn auffallend laut, leise, usw. gesprochen wird. Erstreckt sich eine Sprechweise über mehrere Segmente, werden Anfang und Ende notiert: <s(laut Anfang)> xyz <s(laut Ende)>. 

Für deren Spezifizierung schlagen wir die links stehenden Auszeichnungen vor.

Wo waren Sie<s(leise) während dieser Zeit?>

Wo waren Sie während dieser Zeit?

Wo waren Sie <s(leise) während dieser Zeit?>

Wo waren Sie <s(leise) während dieser Zeit?>

<sim>

Beim Simultansprechen, wenn Interviewer*in und Interviewte gleichzeitig sprechen, kann beides mit <sim> (simultan) gekennzeichnet werden. Erstreckt sich das gleichzeitige Sprechen über mehrere Segmente, werden Anfang und Ende notiert: <sim(Anfang)> xyz <sim(Ende)>.

Achtung:  Timecodes dürfen nie identisch sein und müssen chronologisch aufeinander folgen. Andernfalls kommt es zu Importproblemen.

TIMECODE A SPRECHER*INNENKÜRZEL A Wo waren Sie <sim während dieser Zeit?> 

TIMECODE B SPRECHER*INNENKÜRZEL B <sim Ich war bei Maria Mustermann,> als das passierte.

Wo waren Sie während dieser Zeit?

Ich war bei Maria Mustermann, als das passierte.

SPRECHER*INNENKÜRZEL A Wo waren Sie <sim während dieser Zeit?> 

SPRECHER*INNENKÜRZEL B <sim Ich war bei Maria Mustermann,> als das passierte.

SPRECHER*IN A: Wo waren Sie <sim während dieser Zeit?>

SPRECHER*IN B: <sim Ich war bei Maria Mustermann,> als das passierte.

<nl(Geräusch) xyz>Störende Innengeräusche: Telefonklingeln, Türklingeln

  • Handlungen des Interviewten, z.B.: <nl(zeigt einzelne Fotos)>, putzt sich die Nase etc. 
  • Störende Außengeräusche, z.B.: Flugzeuggeräusche, Straßengeräusche
  • Wechsel des Interviewsettings, z.B.: Durchblättern eines Fotoalbums, Fortsetzung des Interviews als Spaziergang

Ereignisse oder Geräusche, die das Interview beeinflussen, wie Telefonklingeln oder ein ins Bild laufender Mensch, können mit <nl> (nonlinguistic incidents) kenntlich gemacht werden.

Erstreckt sich ein Ereignis über mehrere Segmente, werden Anfang und Ende notiert: <nl(Telefonklingeln Anfang)> … <nl(Telefonklingeln Ende)>. 


Wo waren <nl(Telefonklingeln) Sie während dieser> Zeit?

Wo waren Sie während dieser Zeit?

Wo waren <nl (Telefonklingeln) Sie während dieser> Zeit?

Wo waren <nl (Telefonklingeln) Sie während dieser> Zeit?

<g(Art der Geste) xyz>

Gestikarten:

  • <g(Kopfschütteln)>
  • <g(Kopfnicken)>
  • <g(Achselzucken)>
  • <g(Anführungszeichengebärde)>

Auffällige und bedeutungstragende Gestik (gesture) kann mit <g(Art der Geste)> gekennzeichnet werden. 

Für deren Spezifizierung schlagen wir die links stehenden Auszeichnungen vor.

TIMECODE A SPRECHER*INNENKÜRZEL A: Ging es Ihnen gut damit?

TIMECODE B SPRECHER*INNENKÜRZEL B: <g(Kopfschütteln) Hm.>

Ging es Ihnen gut damit?

Hm.


 SPRECHER*INNENKÜRZEL A: Ging es Ihnen gut damit?

 SPRECHER*INNENKÜRZEL B: <g(Kopfschütteln) Hm.>

 SPRECHER*IN A: Ging es Ihnen gut damit?

 SPRECHER*IN B: <g(Kopfschütteln) Hm.>

Umgang mit anderen Transkriptionszeichen 

[Kommentare, Übersetzungen, Gesten, nonverbale Äußerungen, Unterbrechungen]

Alles in eckige Klammern gesetzte wird im Untertitel ausgeblendet, auf der Plattform und im PDF in eckigen Klammern angezeigt. 

[kretischer Dialekt während des gesamten Interviews] Ich wurde '30 [1930] hier in Koxare geboren, ah, soll ich so [lacht leise]_ [gleichzeitige Rede]. [Telefonklingeln].

Ich wurde '30 hier in Koxare geboren, ah, soll ich so_

[kretischer Dialekt während des gesamten Interviews] Ich wurde '30 [1930] hier in Koxare geboren, ah, soll ich so [lacht leise]_ [gleichzeitige Rede]. [Telefonklingeln],.

[kretischer Dialekt während des gesamten Interviews] Ich wurde '30 [1930] hier in Koxare geboren, ah, soll ich so [lacht leise]_ [gleichzeitige Rede]. [Telefonklingeln]. 

[…] UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

Mit […] werden anonymisierte personenbezogene Daten markiert, die den Nutzer*innen mit XXX oder geschwärzt angezeigt werden.

Ich war bei […], als das passierte.

Ich war bei XXX, als das passierte.

Ich war bei XXX, als das passierte.

Ich war bei XXX, als das passierte.

(-) UMWANDLUNG ENTFERNEN?(Verena und ADG fragen)

(--)

(---)

Für Sprechpausen wird je Sekunde ein Strich in Klammern gesetzt. Diese Auszeichnungen werden in der Untertiteldarstellung ausgeblendet. 

Ich war (-) bei Maria Mustermann, als das passierte.

Ich war bei Maria Mustermann, als das passierte.

Ich war (-) bei Maria Mustermann, als das passierte.

Ich war (-) bei Maria Mustermann, als das passierte.

(4), (5), (6) usw. UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

Sprechpausen werden mit der Länge in Sekunden gekennzeichnet

Ich war (4) bei Maria Mustermann, als das passierte.

Ich war bei Maria Mustermann, als das passierte.

Ich war (4) bei Maria Mustermann, als das passierte.

Ich war (4) bei Maria Mustermann, als das passierte.

(unverständlich, 1 Wort) UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

Unverständliche Passagen werden mit „unverständlich“ und ihrer Dauer in Wörtern markiert

wir hatten damals Rinder (unverständlich, 1 Wort) und ich ging

wir hatten damals Rinder (…?) und ich ging

wir hatten damals Rinder (unverständlich, 1 Wort) und ich ging

wir hatten damals Rinder (unverständlich, 1 Wort) und ich ging

{abcde} UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

Jeder Text in geschweiften Klammern wird in Plattform und PDF angezeigt, nicht aber im Untertitel.

Manchmal wurde damit nach der MIkrophonaufzeichnung transkribierter Text ausgezeichnet, der nicht auf dem Video zu hören ist.

{abcde}


{abcde}

 

[abcd]

~en este tiempo~ UMWANDLUNG FUNKTIONIERT NICHT RICHTIG (WIRD NICHT KURSIV. ENTFERNEN? (Verena und ADG fragen)

Fremdsprachige Begriffe werden mit ~ davor und danach gekennzeichnet. Ein Beispiel ist „There was the ~Pisspott~ in the corner“.

Wo waren Sie ~en este tiempo~ ?

Wo waren Sie en este tiempo ?

Wo waren Sie en este tiempo ?

Wo waren Sie en este tiempo ?

[---] UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

langes Schweigen der Interviewpartnerin / des Interviewpartners (ohne Unterbrechung durch den Interviewer / die Interviewerin)

Ich war [---] bei Maria Mustermann, als das passierte.

Ich war bei Maria Mustermann, als das passierte.

Ich war <p> bei Maria Mustermann, als das passierte.

Ich war <p> bei Maria Mustermann, als das passierte.

(???) UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

unverständliche Aussage  

Nice grandparents, we played football, (???) it’s 

Nice grandparents, we played football, (…?) it’s 

Nice grandparents, we played football, <?> it’s 

Nice grandparents, we played football, <?> it’s

(Wort ?) UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

unsichere Transkription eines Wortes

(By now?) it's the next generation

(By now?) it's the next gene-ration

<? By now> it's the next gene-ration …

<? By now> it's the next generation

<***> UMWANDLUNG ENTFERNEN? (Verena und ADG fragen)

Bandende

<***>


<i(Bandende)>

<i(Bandende)>




Weiterführende Seiten

Informationen zum Import von Transkripten in verschiedenen Dateiformaten sowie deren Bearbeitung in verschiedenen Transkriptionssoftwares finden Sie unter:


  • Keine Stichwörter