Transkriptionszeichen

Die Archivsoftware von Oral-History.Digital ist für die Nutzung bestimmter Transkriptionszeichen optimiert, die in den einzelnen Projekten der Digitalen Interview-Sammlungen an der Universitätsbibliothek verwendet werden. Dabei handelt es sich zum einen um die Zeichen, die in Transkripten des Projekts „Zwangsarbeit 1939-1945. Erinnerungen und Geschichte“ – Jahre vor der Entwicklung der neuen Software – verwendet wurden. Zum anderen wurden für die neueren Projekte der Digitalen Interview-Sammlungen („Colonia Dignidad. Ein chilenisch-deutsches Oral History-Archiv“, „Eiserner Vorhang. Tödliche Fluchten und Rechtsbeugung“, „Erlebte Geschichte“) neue Transkriptionsrichtlinien geschaffen, für die standardisierte, leicht maschinenlesbare Zeichen konzipiert wurden und die als Vorlage auch für andere Projekte in Oral-History.Digital dienen können.

Folgende Punkte werden auf diese Wiki-Seite erklärt:

Vorteile der Nutzung der hier vorgeschlagenen Transkriptionszeichen

Die Nutzung der weiter unten vorgeschlagenen Transkriptionszeichen ist nicht notwendig für das Hochladen von Transkripten in die Archivsoftware. Ihre Nutzung bietet aber einige Vorteile.

Die Transkriptionszeichen werden in der Untertiteldarstellung automatisch ausgeblendet.
Bestimmte Textteile in den Transkripten können anonymisiert dargestellt werden, ohne dass sie aus dem Original endgültig entfernt werden müssen.
Um in Zukunft das Austauschformat TEI nutzen zu können, wurden die Transkriptionszeichen so gewählt, dass sie leicht in ein entsprechend kompatibles TEI-Format übersetzt werden können.

Welche Zeichen auf welche Weise in den verschiedenen Darstellungsarten angezeigt oder ausgeblendet werden, wird in Tabelle 1 erläutert.

Bei der Verwendung anderer als der unten aufgeführten Transkriptionszeichen ist darauf zu achten, dass nicht zufälligerweise dieselben Zeichen in anderen Kontexten verwendet werden, d.h. dass z.B. nicht etwas ausgeblendet wird, was nicht ausgeblendet werden soll.

Darüber hinaus wird die Auszeichnung bestimmter bedeutungstragendes Phänomene wie Sprechweisen, Pausen usw., vorgeschlagen. Auch hier ist die Nutzung nicht zwingend, die Standardisierung der Bezeichnungen erlaubt jedoch eine vereinfachte sammlungsübergreifenden Durchsuchbarkeit aller Phänomene in allen Archiven, die die diese standardisierten Begriffe verwenden, z.B. eine Suche nach langen Pausen (s.u.).

Transkriptionszeichen und Angaben für die Anzeige im Untertitel, auf der Plattform, im PDF und im TEI-Export

Transkriptionszeichen	Erklärung	Beispiel	Einfach-Anzeige im Untertitel und VTT-Export	Vollanzeige auf der Plattform	Vollanzeige im PDF-Export
Timecode: hh:mm:ss.mmm	Vor jedem Sprecher*innenwechsel, nach jedem Satz, jeder Sinneinheit, nach maximal 120 Zeichen wird empfohlen einen Timecode zu setzen. hh:mm:ss.mmm ist das empfohlene Format, mmm entspricht dabei der Einheit Millisekunden. Die Darstellung ist abhängig vom Datenformat, siehe csv, vtt und srt.	Abhängig vom Importformat: csv/ods: in der Spalte "Timecode": 01:23:45.678 vtt: 00:00:00.130 --> 00:00:03.700 srt: 00:00:02,310 --> 00:00:12,888 odt: Timecodes aus Textdateien können beim Upload nicht ausgewertet werden!	Nicht angezeigt, signalisiert Wechsel des Untertitels. Wenn ein Segment kürzer als 1 Sekunde ist, soll es mit dem folgenden in einem Untertitel zusammengefasst werden. Im vtt-Export sind die Timecodes enthalten: 00:00:00.146 --> 00:00:05.777		Anzeige nur bei Überschriften und im Inhaltsverzeichnis
Sprecher*innenauszeichnung	Sprecherinnenauszeichnungen können frei gewählt werden. Sie müssen aus mindestens zwei Buchstaben bestehen und dürfen keine Leerzeichen beinhalten. INT* steht z.B. für die Interviewerin, KAM* für die Kameraperson. Für die interviewte Person wird empfohlen, den ersten Buchstaben des Vor- und Nachnamens zu verwenden. Die Darstellung ist abhängig vom Datenformat, siehe csv, vtt und srt.	Abhängig vom Importformat: csv/ods: in der Spalte "Sprecher" nur die abgekürzten Namen: INT, KAM, AM vtt und srt: unter dem Timecode in derselben Zeile mit Transkripttext abgetrennt durch Leerzeichen: <v INT> Transkripttext <v AM> Transkripttext... odt: vor dem Transkripttext abgetrennt durch Leerzeichen, am besten eingerahmt mit einem im Text nicht vorkommenden Zeichen, z.B.: #INT# Transkripttext #AM# Transkripttext	Nicht angezeigt	Initialen des Sprechenden werden angezeigt (wie in Personendaten in ohd angelegt), bei Mouse Over Anzeige des vollständigen Namens	Vollständiger Name
<res>	Mit <res> (restricted) werden Segmente gekennzeichnet, die nicht veröffentlicht werden sollen. Erstreckt sich die Auslassung über mehrere Segmente muss <res> für jedes Segment neu gesetzt werden. Für die Nutzer*innen wird anstatt der so markierten Textsequenz folgender Text angezeigt: „Diese Passage wird nicht veröffentlicht.“	<res hier steht der Text, der nicht veröffentlicht werden soll>	Diese Passage wird nicht veröffentlicht.	Diese Passage wird nicht veröffentlicht.	Diese Passage wird nicht veröffentlicht.
<an>	Mit <an> (anonymous) können anonymisierte personenbezogene Daten markiert werden, die den Nutzer*innen mit XXX angezeigt werden sollen.	Ich war bei <an Maria Mustermann>, als das passierte.	Ich war bei XXX, als das passierte.	Ich war bei XXX, als das passierte.	Ich war bei XXX, als das passierte.
<n>	Anmerkungen und Ergänzungen (notes), wie die Korrektur offensichtlicher Irrtümer, können mit <n(Erläuterung)> gekennzeichnet werden.	Der wohnte ab ’77 <n(1977)>am Kudamm <n(Kurfürstendamm)>.	Der wohnte ab ’77 am Kudamm.	Der wohnte ab ’77 (1977) am Kudamm (Kurfürstendamm).	Der wohnte ab ’77 (1977) am Kudamm (Kurfürstendamm).
<i>	Eine Unterbrechung (interruption) des Interviews bzw. der Aufnahme kann mit <i> gekennzeichnet werden. Ist der Grund der Unterbrechung bekannt, wird empfohlen, ihn in Klammer anzugeben, z. B. „<i(Batteriewechsel)>“.	Wo waren Sie während dieser Zeit? (neuer Timecode)<i(Batteriewechsel)> (neuer Timecode) Ich war bei Maria Mustermann.	Wo waren Sie während dieser Zeit? Ich war bei Maria Mustermann, als das passierte.	Wo waren Sie während dieser Zeit? <i(Batteriewechsel)> Ich war bei Maria Mustermann, als das passierte.	Wo waren Sie während dieser Zeit? <i(Batteriewechsel)> Ich war bei Maria Mustermann, als das passierte.
<p2>, <p3> usw.	Sprechpausen können mit der Länge in Sekunden gekennzeichnet werden, <p2> ab 2 Sek., <p3> ab 3 Sek. usw.	Ich war <p3> bei Maria Mustermann, als das passierte.	Ich war bei Maria Mustermann, als das passierte.	Ich war <p3> bei Maria Mustermann, als das passierte.	Ich war <p3> bei Maria Mustermann, als das passierte.
<? xyz>	Eine undeutliche, schwer verständliche Passage können mit <? hier steht die unsichere Transkription> transkribiert werden.	Ich war bei Maria <? Meier>, als das passierte.	Ich war bei Maria (Meier?), als das passierte.	Ich war bei Maria <? Meier>, als das passierte.	Ich war bei Maria <? Meier>, als das passierte.
<?1>, <?2>, <?3> usw.	Unverständliche Passagen können mit <? und ihrer Dauer in Sekunden markiert werden, <?1>, ab 1 Sek., <?2> ab 2 Sek., <?3> ab 3 Sek. usw.	Ich war bei Maria <?1>, als das passierte. Ich war <?3>.	Ich war bei Maria (…?), als das passierte. Ich war (…?).	Ich war bei Maria <?1>, als das passierte. Ich war <?3>.	Ich war bei Maria <?1>, als das passierte. Ich war <?3>.
_	Ein Unterstrich kann abgebrochene Wörter oder Sätze kennzeichnen.	Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?	Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?	Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?	Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?
<l(es) xyz>	Fremdsprachige Begriffe können mit „l“ für lexical phenomen und dem Sprachkürzel nach ISO 639-1, z. B. „l(de)“ für Deutsch, „l(es)“ für Spanisch oder „l(en)“ für Englisch, gekennzeichnet werden. Ein Beispiel ist „There was the <l(de) Pisspott> in the corner“. Lehnwörter (z.B. Smartphone) sind davon ausgenommen.	Wo waren Sie <l(es) en este tiempo>?	Wo waren Sie en este tiempo?	Wo waren Sie <l(es) en este tiempo>?	Wo waren Sie <l(es) en este tiempo>?
<v(nonverbale Äußerung - vocal)> <v(Lachen)> <v(Weinen)> <v(Seufzen)> <v(Räuspern)> <v(Husten)> <v(Gähnen)>	Nonverbale, aber lautliche Äußerungen wie Lachen, Weinen etc. (vocal) können mit <v(Art der Äußerung)> gekennzeichnet werden. Für deren Spezifizierung gibt es eine Liste vorgeschlagener Einträge (Lachen, Weinen etc., siehe nachfolgende Tabelle).	<v(Lachen)> Wo waren Sie während dieser Zeit?	Wo waren Sie während dieser Zeit?	<v(Lachen)>Wo waren Sie während dieser Zeit?	<v(Lachen)> Wo waren Sie während dieser Zeit?
<s(Sprechweise) xyz> <s(leise)> <s(flüsternd)> <s(laut)> <s(hoch)> <s(tief)> <s(lächelnd)> <s(stockend)> <s(betont)>	Deutliche Änderungen der Sprechweisen (shift in vocal qualitiy) können mit <s(Sprechweise) xyz> gekennzeichnet werden. Diese Kennzeichnung wird vorgenommen, wenn auffallend laut, leise, usw. gesprochen wird. Erstreckt sich eine Sprechweise über mehrere Segmente, werden Anfang und Ende notiert: <s(laut Anfang)> xyz <s(laut Ende)>.	Wo waren Sie<s(leise) während dieser Zeit?>	Wo waren Sie während dieser Zeit?	Wo waren Sie <s(leise) während dieser Zeit?>	Wo waren Sie <s(leise) während dieser Zeit?>
<sim>	Beim Simultansprechen, wenn Interviewerin und Interviewte gleichzeitig sprechen, kann beides mit <sim> (simultan) gekennzeichnet werden. Erstreckt sich das gleichzeitige Sprechen über mehrere Segmente, werden Anfang und Ende notiert: <sim(Anfang)> xyz <sim(Ende)>. Achtung:* Timecodes dürfen nie identisch sein und müssen chronologisch aufeinander folgen. Andernfalls kommt es zu Importproblemen.	TIMECODE A SPRECHERINNENKÜRZEL A* Wo waren Sie <sim während dieser Zeit?> TIMECODE B SPRECHERINNENKÜRZEL B* <sim Ich war bei Maria Mustermann,> als das passierte.	Wo waren Sie während dieser Zeit? Ich war bei Maria Mustermann, als das passierte.	SPRECHERINNENKÜRZEL A* Wo waren Sie <sim während dieser Zeit?> SPRECHERINNENKÜRZEL B* <sim Ich war bei Maria Mustermann,> als das passierte.	SPRECHERIN A: Wo waren Sie <sim während dieser Zeit?> SPRECHERIN B: <sim Ich war bei Maria Mustermann,> als das passierte.
<nl(Geräusch) xyz>Störende Innengeräusche: Telefonklingeln, Türklingeln Handlungen des Interviewten, z.B.: <nl(zeigt einzelne Fotos)>, putzt sich die Nase etc. Störende Außengeräusche, z.B.: Flugzeuggeräusche, Straßengeräusche Wechsel des Interviewsettings, z.B.: Durchblättern eines Fotoalbums, Fortsetzung des Interviews als Spaziergang	Ereignisse oder Geräusche, die das Interview beeinflussen, wie Telefonklingeln oder ein ins Bild laufender Mensch, können mit <nl> (nonlinguistic incidents) kenntlich gemacht werden. Erstreckt sich ein Ereignis über mehrere Segmente, werden Anfang und Ende notiert: <nl(Telefonklingeln Anfang)> … <nl(Telefonklingeln Ende)>.	Wo waren <nl(Telefonklingeln) Sie während dieser> Zeit?	Wo waren Sie während dieser Zeit?	Wo waren <nl (Telefonklingeln) Sie während dieser> Zeit?	Wo waren <nl (Telefonklingeln) Sie während dieser> Zeit?
<g(Art der Geste) xyz> Gestikarten: <g(Kopfschütteln)> <g(Kopfnicken)> <g(Achselzucken)> <g(Anführungszeichengebärde)>	Auffällige und bedeutungstragende Gestik (gesture) kann mit <g(Art der Geste)> gekennzeichnet werden.	TIMECODE A SPRECHERINNENKÜRZEL A:* Ging es Ihnen gut damit? TIMECODE B SPRECHERINNENKÜRZEL B:* <g(Kopfschütteln) Hm.>	Ging es Ihnen gut damit? Hm.	SPRECHERINNENKÜRZEL A:* Ging es Ihnen gut damit? SPRECHERINNENKÜRZEL B:* <g(Kopfschütteln) Hm.>	SPRECHERIN A:* Ging es Ihnen gut damit? SPRECHERIN B:* <g(Kopfschütteln) Hm.>
[Kommentare, Übersetzungen,Gesten, nonverbale Äußerungen,Unterbrechungen]	Alles in eckige Klammern gesetzte wird im Untertitel ausgeblendet, in Plattform und PDF in eckigen Klammern angezeigt. Außer […], siehe unten.	[kretischer Dialekt während des gesamten Interviews] Ich wurde '30 [1930] hier in Koxare geboren, ah, soll ich so_ [gleichzeitige Rede]. [telephone rings, background conversation], [laughs silently]	Ich wurde '30 hier in Koxare geboren, ah, soll ich so_	[kretischer Dialekt während des gesamten Interviews] Ich wurde '30 [1930] hier in Koxare geboren, ah, soll ich so_ [gleichzeitige Rede]. [telephone rings, background conversation], [laughs silently]	[kretischer Dialekt während des gesamten Interviews] Ich wurde '30 [1930] hier in Koxare geboren, ah, soll ich so_ [gleichzeitige Rede]. [telephone rings, background conversation], [laughs silently]
[…]	Mit […] werden anonymisierte personenbezogene Daten markiert, die den Nutzer*innen mit XXX oder geschwärzt angezeigt werden.	Ich war bei […], als das passierte.	Ich war bei XXX, als das passierte.	Ich war bei XXX, als das passierte.	Ich war bei XXX, als das passierte.
(-)	Sprechpausen werden mit der Länge in Sekunden gekennzeichnet	Ich war (-) bei Maria Mustermann, als das passierte.	Ich war bei Maria Mustermann, als das passierte.	Ich war (-) bei Maria Mustermann, als das passierte.	Ich war (-) bei Maria Mustermann, als das passierte.
(--)	Sprechpausen werden mit der Länge in Sekunden gekennzeichnet	Ich war (--) bei Maria Mustermann, als das passierte.	Ich war bei Maria Mustermann, als das passierte.	Ich war (--) bei Maria Mustermann, als das passierte.	Ich war (--) bei Maria Mustermann, als das passierte.
(---)	Sprechpausen werden mit der Länge in Sekunden gekennzeichnet	Ich war (---) bei Maria Mustermann, als das passierte.	Ich war bei Maria Mustermann, als das passierte.	Ich war (---) bei Maria Mustermann, als das passierte.	Ich war (---) bei Maria Mustermann, als das passierte.
(4), (5), (6) usw.	Sprechpausen werden mit der Länge in Sekunden gekennzeichnet	Ich war (4) bei Maria Mustermann, als das passierte.	Ich war bei Maria Mustermann, als das passierte.	Ich war (4) bei Maria Mustermann, als das passierte.	Ich war (4) bei Maria Mustermann, als das passierte.
(unverständlich, 1 Wort)	Unverständliche Passagen werden mit „unverständlich“ und ihrer Dauer in Wörtern markiert	wir hatten damals Rinder (unverständlich, 1 Wort) und ich ging	wir hatten damals Rinder (…?) und ich ging	wir hatten damals Rinder (unverständlich, 1 Wort) und ich ging	wir hatten damals Rinder (unverständlich, 1 Wort) und ich ging
(Text)	Unsichere Passagen werden in Klammern gesetzt	Wirklich (sie haben ihnen noch gesagt): "Geht und holt, was ihr wollt."	Wirklich (sie haben ihnen noch gesagt): "Geht und holt, was ihr wollt."	Wirklich (sie haben ihnen noch gesagt): "Geht und holt, was ihr wollt."	Wirklich (sie haben ihnen noch gesagt): "Geht und holt, was ihr wollt."
{abcde}	Jeder Text in geschweiften Klammern wird in Plattform und PDF angezeigt, nicht aber im Untertitel. Häufig befinden sich darin eckige Klammern. Manchmal geht es um nach dem Audio transkribierten Text, der nicht auf dem Video ist.	{[laughs silently]}		abcde	abcde
~en este tiempo~	Fremdsprachige Begriffe werden mit ~ davor und danach gekennzeichnet. Ein Beispiel ist „There was the ~Pisspott~ in the corner“.	Wo waren Sie ~en este tiempo~?	Wo waren Sie en este tiempo?	Wo waren Sie en este tiempo?	Wo waren Sie en este tiempo ?
…	… kennzeichnet abgebrochenes Wort oder abgebrochener Satz	Ich wollte arbeiten, aber.... Können Sie mir bitte etwas zu trinken geben?	Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?	Ich wollte arbeiten, aber_. Können Sie mir bitte etwas zu trinken geben?	Ich wollte arbeiten, aber_, Können Sie mir bitte etwas zu trinken geben?
[---]	langes Schweigen der Interviewpartnerin / des Interviewpartners (ohne Unterbrechung durch den Interviewer / die Interviewerin)	Ich war [---] bei Maria Mustermann, als das passierte.	Ich war bei Maria Mustermann, als das passierte.	Ich war <p> bei Maria Mustermann, als das passierte.	Ich war <p> bei Maria Mustermann, als das passierte.
(???)	unverständliche Aussage	Nice grandparents, we played football, (???) it’s	Nice grandparents, we played football, (…?) it’s	Nice grandparents, we played football, <?> it’s	Nice grandparents, we played football, <?> it’s
(Wort ?)	unsichere Transkription eines Wortes	(By now?) it's the next generation	(By now?) it's the next gene-ration	<? By now> it's the next gene-ration …	<? By now> it's the next generation
<***>	Bandende	<***>		<i(Bandende)>	<i(Bandende)>

Liste verwendeter Phänomene in den Projekten der Digitalen Interview-Sammlungen

Typ	Markierung in DIS-Projekten	Phänomenbezeichnung
Sprechweise (shift in vocal quality)	<s(Sprechweise)>	leise
		flüsternd
		laut
		hoch
		tief
		lächelnd
		stockend
		betont
Nonverbale, lautliche Kommunikation (vocal, but non-lexical phenomenon)	<v(lautliche, nonverbale Äußerung)>	Lachen
		Weinen
		Seufzen
		Räuspern
		Husten
		Gähnen
Ereignisse und Geräusche (non-linguistic incidents)	<nl(Ereignis/Geräusch)>	Störende Innengeräusche: Telefonklingeln, Türklingeln
		Handlungen des Interviewten, z.B.: gießt sich ein Glas Wasser ein, trinkt, putzt sich die Nase, zeigt einzelne Fotos
		Störende Außengeräusche, z.B.: Flugzeuggeräusche, Straßengeräusche, Gesprächsgeräusche
		Wechsel des Interviewsettings, z.B.: Durchblättern eines Fotoalbums, Fortsetzung des Interviews als Spaziergang
Gestiken (gestures)	<g(Gestikart)>	Kopfschütteln
		Kopfnicken
		Achselzucken
		Anführungszeichengebärde

Seitenhierarchie

Vorteile der Nutzung der hier vorgeschlagenen Transkriptionszeichen

Transkriptionszeichen und Angaben für die Anzeige im Untertitel, auf der Plattform, im PDF und im TEI-Export

Liste verwendeter Phänomene in den Projekten der Digitalen Interview-Sammlungen

Weiterführende Seiten