...
Die Sprachaufnahmen sind sowohl als Audiofiles als auch als transkribierte Textdateien (ca. 300 000 Wörter pro Sprache) verfügbar. Die Transkriptionen sind lemmatisiert und PoS-Annotiert. Zudem enthält die DVD die Metadaten der Sprecher, eine Übersicht über die diversen Kommunikationssituationen, in denen die Aufnahmen entstanden sind, Frequenzlisten sowie Software zur Analyse der Korpora.
Sprache | Italienisch, Französisch, Spanisch, Portugiesisch | |
Sprachliche Realisierung | mündlich | |
Umfang | ca. 1,2 Mio. Wörter (300.000 pro Sprache) | |
Medium | Sprachaufnahmen in diversen Kommunikationssituationen (privat und öffentlich, Nähe und Distanz, Monolog und Dialog, formell und informell) | |
Geographischer Ursprung | Italien, Frankreich, Spanien, Portugal | |
Zeitliche Einordnung | ab 1970 | |
Form der Daten | Audiofiles und transkribierte Textdateien; die DVD enthält Software zur Bearbeitung und Analyse der Daten | |
Format | WAV, CHAT, TXT, IMDI, XML | |
Annotation | prosodische Annotation ("terminal" und "non terminal breaks"), lemmatisiert, part-of-speech-annotiert | |
Mögliche Suchabfragen | Suche nach key words in context, Wortfolgen und Wortarten sowie Erstellung von Frequenzlisten möglich | |
Buch + DVD | ||
Infos online | C-ORAL-ROM Vollversion | |
Zugang im FU-NetzZugang an der FU | ||
Zum Zitieren: | Cresti, Emanuela & Massimo Moneglia (eds.). 2005. C-Oral-Rom: Integrated Reference Corpora for Spoken Romance Languages. C-ORAL-ROM. Amsterdam: Benjamins. |