...
Ein Kodierungsstandard macht es möglich, große Datenmengen automatisiert und schnell zu durchsuchen und zu analysieren, da er bewirkt, dass sprachliche Merkmale computerlesbar und dadurch zählbar gemacht werden. Sind die Textdaten mit linguistisch orientierten Annotationen oder Metadaten versehen, so können Sprachregister, Varietäten, Sprachwandel, Sprachkontakt usw. bei der Analyse der Frequenzen charakteristischer Merkmale berücksichtigt werden. Auf diese Weise wird dem Zusammenhang zwischen außersprachlichen Faktoren (Alter, Herkunft, Bildung…) und sprachlichen Phänomenen (Soziolinguistik) die notwendige Aufmerksamkeit zuteil.
Korpora im TdR-Wiki
##Hier: VPN, Infos, Darstellung###
Ein Beispiel für die Korpusarbeit
Anhand des FRANTEXT-Korpus soll hier exemplarisch die Frage nach der diachronischen Unterschiede in der Verwendung von fin de semaine vs. week-end beantwortet werden. Zugang zum Korpus erhält man mithilfe des VPN-Tunnels über den Frantext-Eintrag im TdR-Wiki:
Die "Recherche simple" ermöglicht es, nach exakten Wortfolgen zu suchen:
Im Sinne einer Darstellung diachronischer Abweichungen sollte im nächsten Schritt die chronologische Ebene als Grundlage der Sortierung vermerkt werden:
Die Suche nach fin de semaine zeigt unter anderem folgende Ergebnisse an:
Die chronologische Sortierung macht es möglich, die Verwendung von fin de semaine bis auf das Jahr 1654 zurückzuführen. Dies bedeutet nicht, dass das Syntagma dort zum ersten mal verwendet wurde, sondern lediglich, dass der erste Text in dem FRANTEXT-Korpus, der fin de semaine enthält, sich auf dieses Jahr datieren lässt. Für die letzte Verwendung im FRANTEXT-Korpus lässt sich das Jahr 2009 feststellen:
##
##
##Folien:
Ergebnis:
Aus dem in FRANTEXT untersuchten Datensatz ergibt sich:
Achtung:
Die Aussagekraft des Ergebnisses ist beschränkt. Es lässt regionale und stilistische Besonderheiten (Québécois, Anglizismen…) sowie jeglichen nicht-literarischen Sprachgebrauch außen vor
à Beschränktheit eines jeden Korpus auf seinen individuellen Referenzbereich! ##