Umfangreiches Korpus zum Web-Spanisch
Sprache | Spanisch |
Varietät | nicht erfasst |
Sprachliche Realisierung | schriftlich/web |
Umfang | Basiskorpus ~7,3 Mrd. Token/~330 Mio. Sätze; offen zugängliches Subkorpus ~3,7 Mrd. Token/~150 Mio. Sätze |
Universität | Freie Universität Berlin, Deutschland |
Form der Daten | XML mit inline VRT, UTF-8 |
Format | Colibri2 User-Interface, Export möglich |
Annotation | Wort/Token, Lemma, Morphologie (FreeLing automatische Annotation) |
Quelle/Herausgeber | Roland Schäfer, 2015 |
Link |