Korpora der Università di Bologna zur geschriebenen italienischen Sprache

 

CORIS: Corpus di Riferimento dell’Italiano Scritto – repräsentatives Referenzkorpus, bestehend aus diversen Textsorten der italienischen Schriftsprache

CODIS: Corpus Dinamico dell’Italiano Scritto – enthält dieselben Daten wie CORIS; es ist eine detailliertere Selektion von Subkorpora nach Textsorte möglich

DiaCORIS: Corpus Diacronico dell'Italiano Scritto – Gliederung der Suche nach fünf verschiedenen Zeitabschnitten möglich

 

Sprache

Italienisch

Varietät

Standard

Sprachliche Realisierung

schriftlich

Umfang

ca. 130 Mio. Wörter

Medium

Repräsentative Texte zum geschriebenen Italienisch, aus den Bereichen Press, Fiction, Academic Prose, Legal & Administrative Prose, Miscellanea und Ephemera

Geographischer Ursprung

Italien

Zeitliche Einordnung

CORIS/CODIS: hauptsächlich 1980er und 1990er-Jahre; DiaCORIS: 1861-2001

Form der Daten

digitalisierte, online durchsuchbare Texte

Format

HTML

Annotation

lemmatisiert, POS-Annotiert (nur CORIS)

Mögliche Suchabfragen

Suche nach Wörtern, Lemmata und Wortarten unter Verwendung regulärer Ausdrücke möglich. Anzeige von Konkordanzen und Kollokationen.

Quelle/Herausgeber

R. Rossini Favretti, Università di Bologna

Nutzungsvoraussetzungen

Zugang frei

Link

http://corpora.dslo.unibo.it/coris_eng.html

Zum Zitieren:

CORIS/CODIS: Rossini Favretti, R. 2001. Corpus di italiano scritto contemporaneo. CORIS/CODIS. Bologna: Centro di interfacoltà di linguistica teorica ed applicata “Luigi Heilmann”.

DiaCORIS: Onelli, C., Domenico Proietti, C. Seidenari & F. Tamburini. 2006. The DiaCORIS Project: A Diachronic Corpus of Written Italian. In Nicoletta Calzolari, Khalid Choukri, Aldo Gangemi, Bente Maegaard, Joseph Mariani, Jan Odijk & Daniel Tapias (eds.), Proceedings of the Fifth International Conference on Language Resources and Evaluation. (LREC'06), 1212–1215. Genova: European Language Resources Association (ELRA).