Korpora der Università di Bologna zur geschriebenen italienischen Sprache
CORIS: Corpus di Riferimento dell’Italiano Scritto – repräsentatives Referenzkorpus, bestehend aus diversen Textsorten der italienischen Schriftsprache
CODIS: Corpus Dinamico dell’Italiano Scritto – enthält dieselben Daten wie CORIS; es ist eine detailliertere Selektion von Subkorpora nach Textsorte möglich
DiaCORIS: Corpus Diacronico dell'Italiano Scritto – Gliederung der Suche nach fünf verschiedenen Zeitabschnitten möglich
Sprache | Italienisch |
Varietät | Standard |
Sprachliche Realisierung | schriftlich |
Umfang | ca. 130 Mio. Wörter |
Medium | Repräsentative Texte zum geschriebenen Italienisch, aus den Bereichen Press, Fiction, Academic Prose, Legal & Administrative Prose, Miscellanea und Ephemera |
Geographischer Ursprung | Italien |
Zeitliche Einordnung | CORIS/CODIS: hauptsächlich 1980er und 1990er-Jahre; DiaCORIS: 1861-2001 |
Form der Daten | digitalisierte, online durchsuchbare Texte |
Format | HTML |
Annotation | lemmatisiert, POS-Annotiert (nur CORIS) |
Mögliche Suchabfragen | Suche nach Wörtern, Lemmata und Wortarten unter Verwendung regulärer Ausdrücke möglich. Anzeige von Konkordanzen und Kollokationen. |
Quelle/Herausgeber | R. Rossini Favretti, Università di Bologna |
Nutzungsvoraussetzungen | Zugang frei |
Link | |
Zum Zitieren: | CORIS/CODIS: Rossini Favretti, R. 2001. Corpus di italiano scritto contemporaneo. CORIS/CODIS. Bologna: Centro di interfacoltà di linguistica teorica ed applicata “Luigi Heilmann”. DiaCORIS: Onelli, C., Domenico Proietti, C. Seidenari & F. Tamburini. 2006. The DiaCORIS Project: A Diachronic Corpus of Written Italian. In Nicoletta Calzolari, Khalid Choukri, Aldo Gangemi, Bente Maegaard, Joseph Mariani, Jan Odijk & Daniel Tapias (eds.), Proceedings of the Fifth International Conference on Language Resources and Evaluation. (LREC'06), 1212–1215. Genova: European Language Resources Association (ELRA). |