Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

In diesem Bereich ist eine thematisch gegliederte Liste mit hilfreicher Literatur zum Thema Korpora und Korpuslinguistik zu finden.

Inhalt

 

Korpora und Korpuslinguistik: Überblick, Einführungen, Methodik

...


Bilger, Mireille (1996): „Corpus de Portugais et d‘Espagnol“. In: Recherches sur le français parlé 1/2, 124-130.

...


Habert, Benoît (2009): Construire des bases de données pour le français. Paris: Ophrys (Col-lection Collection L'essentiel français).


HSK 29.1 = Lüdeling, Anke / Kytö, Merja (eds.) (2008): Corpus Linguistics. An International Handbook. Berlin / New York: De Gruyter.


Kilgarriff, Adam (2012): „Getting to know your corpus“. In: Petr Sojka, Ales Horák, Ivan Ko-pecekKopecek, Karel Pala (eds.): Text, Speech and Dialogue. 15th International Conference, TSD 2012, Brno, Czech Republic, September 3-7, 2012, Proceedings. Berlin / Heidelberg: Springer (Lec-ture Lecture Notes in Computer Science, 7499), 3–15.

 

Krefeld, Thomas / Lücke, Stephan / Von Ehrlich, Isabel (2014): „Digitalianistica. Die italienische Philologie unterwegs in die digital humanities". In: Italienisch 72, 52-70. Download


Lemnitzer, Lothar / Zinsmeister, Heike (eds.) (2006): Korpuslinguistik. Eine Einführung. Tübingen: Narr.


O'Keeffe, Anne / McCarthy, Michael (eds.) (2010): The Routledge handbook of corpus linguis-ticslinguistics. New York: Routledge.


Pusch, Claus D. (2007): „Les corpus de linguistique romane en pays germanophones. Bilan et perspectives“. In: Revue Française de Linguistique Appliquée 12/1, 111-124.


Pusch, Claus D. (2014): „Les corpus romans contemporains“. In: Klump, A. / Kramer, J. / Willems, A. (eds.): Manuel des langues romanes. Berlin: De Gruyter (Manuals of Romance Linguistics, 1), 173-195.

 

Schmidt, Thomas / Wörner, Kai (eds.) (2012): Multilingual corpora and multilingual corpus analysis. Amsterdam / Philadelphia: Benjamins (Hamburg studies on multilingualism, 14).

...


Perkuhn, Rainer / Keibel, Holger / Kupietz, Marc (2012): Korpuslinguistik. Paderborn: Fink (LIBAC, 3433).

 

Publikationen zu bekannten Korpora

...


Al, Bernard P. F. (1980): „Sur la richesse lexicale du Corpus d'Orléans. Contribution à l'analyse sociolinguistique d'un vocabulaire oral“. In: Alkemade, Dick J. van (ed.): Linguistic studies offered to Berthe Siertsema. Unter Mitarbeit von Berthe Siertsema. Amsterdam: Rodopi (Coste-rusCosterus, New series, 25), 315–321.


Baroni, Marco / Bernardini, Silvia / Ferraresi, Adriano / Zanchetta, Eros (2009): „The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora”. In: Language Resources and Evaluation 43, 209–226. Download

 

Bacelar do Nascimento, M. F. (2000): "Corpus de Référence du Portugais Contemporain". In: BILGER, M. (ed.) Corpus, Méthodologie et Applications Linguistiques, Paris, H. Champion et Presses Universitaires de Perpignan (2000), 25-30. Download


Bellini, Daniele / Schneider, Stefan (2006): „Spoken Italian online: The Banca dati dell'italiano parlato (BADIP)”. In: Bernhard Kettemann, Georg Marko (eds.). Planing, Gluing and Painting Corpora. Inside the Applied Corpus Linguist's Workshop. Frankfurt am Main: Lang, 13-26.


Cresti, Emanuela/Moneglia, Massimo (eds.) (2005): C-ORAL-ROM. Integrated Reference Cor-pora Corpora for Spoken Romance Languages. Amsterdam / Philadelphia: Benjamins.


De Mauro, Tullio / Mancini, F. / Vedovelli, M. / Voghera, M. (1993): Lessico di frequenza dell’italiano parlato. Mailand: ETAS.

 

Durand, Jacques / Laks, Bernard / Lyche, Chantal (2009).Le projet PFC: une source de données primaires structurées. In: Iid. (eds): Phonologie, variation et accents du français. Paris: Hermès, 19-61.

 

Eisele, Andreas / Chen, Yu (2010): "MultiUN: A Multilingual Corpus from United Nation Documents".In: Tapias, Daniel et al. (eds.): Proceedings of the Seventh conference on International Language Resources and Evaluation. La Valletta, Malta, European Language Resources Association (ELRA), 2868-2872. Download

 

Généreux, Michel, Iris Hendrickx, Amália Mendes (2012): "Introducing the Reference Corpus of Contemporary Portuguese On-Line". In: Proceedings of the Eighth International Conference on Language Resources and Evaluation - LREC 2012, Istanbul, 21-27 de Maio de 2012, 2237-2244.


Kaminskaia, Svetlana / Poiré, François (2012): „Prosodie du français laurentien en milieu minoritaire : le corpus Windsor“. In: Anne Catherine Simon (ed.): La variation prosodique régionale en français. Louvain-La-Neuve: De Boeck (Champs linguistiques: Recueils), 159–178.

 

Koehn, Philipp (2005): Europarl: A Parallel Corpus for Statistical Machine Translation, MT Summit 2005. Download


MacWhinney, B. (1994): The CHILDES Project: Tools for analyzing Talk. Hillsdale, NJ: La-wrence Lawrence Erlbaum Associates.


Pusch, Claus D. (2000): „Das Corpus Occitano-Gascon als Beispiel multimedialer Sprachda-tenaufbereitung“Sprachdatenaufbereitung“. In: Rieger, A. (ed.): Okzitanistik, Altokzitanistik und Provenzalistik. Geschichte und Auftrag einer europäischen Philologie. Frankfurt a. M. et al.: Lang, 43-56.

 

Reese, Samuel et al. (2010): "Wikicorpus: A Word-Sense Disambiguated Multilingual Wikipedia Corpus". In: Proceedings of 7th Language Resources and Evaluation Conference (LREC'10). La Valleta, Malta. Download

 

Rossini Favretti, Rema (1998): "Using multilingual parallel corpora for the analysis of legal language: the Bononia Legal Corpus". In: Translation Equivalence. Proceedings of the Third European Seminar, (W .Teubert., E. Tognini Bonelli , N. Volz eds.), The TELRI Association -. V., Institut für Deutsche Spräahe, The Tuscan Word Centre, 57-68. Download

 

Rossini Favretti, R. / Tamburini, F. / Martelli, E. (2007): "Words from Bononia Legal Corpus". In: Text Corpora and Multilingual Lexicography (W.Teubert ed.), John Benjamins, 11-30. Download

 

Schäfer, Roland (2015): "Processing and querying large web corpora with the COW14 architecture". In: Proceedings of Challenges in the Management of Large Corpora (CMLC-3). Download

 

Wäschle, K., Simianer, P., Bertoldi, N., Riezler, S., and Federico, M. (2013). "Generative and Discriminative Methods for Online Adaptation in SMT". In: Proceedings of Machine Translation Summit XIV. Nice, France. Download / PatTR-Korpus

 

Zampieri, M. / Becker, M. (2013): Colonia: Corpus of Historical Portuguese. In: ZSM Studien, Special Volume on Non-Standard Data Sources in Corpus-Based Research. Vol. 5. Shaker. Download


Korpora und gesprochene Sprache

...


Bellini, Daniele / Schneider, Stefan (2006): „Spoken Italian online: The Banca dati dell'italiano parlato (BADIP)”. In: Bernhard Kettemann, Georg Marko (eds.). Planing, Gluing and Painting Corpora. Inside the Applied Corpus Linguist's Workshop. Frankfurt am Main: Lang, 13-26.


Baude, Olivier (2006): Corpus Oraux. Guide des bonnes pratiques. Orléans: Presses Universi-taires Universitaires d’Orléans / CNRS Éditions.


Boisvert, Lionel / Laurendeau, Paul (1988): „Répertoire des corpus québécois de langue orale“. In: Revue québécoise de linguistique 17/2, 241–261. Online verfügbar unter: http://www.eru-diterudit.org/revue/rql/1988/v17/n2/602634ar.pdf.

...


Carruthers, Janice (2008): „Annotating an oral corpus using the Text Encoding Initiative. Meth-odologyMethodology, problems, solutions”. In: Journal of French Language Studies 18/1, 103–119.

 

Durand, Jacques / Laks, Bernard / Lyche, Chantal (2002): La phonologie du français contemporain: usages, variétés et structure. In: Pusch, Claus / Raible, Wolfgang (eds.): Romanistische Korpuslinguistik- Korpora und gesprochene Sprache. Tübingen: Narr, 93-106.


MacWhinney, B. (1994): The CHILDES Project: Tools for analyzing Talk. Hillsdale, NJ: Law-rence Lawrence Erlbaum Associates.


Murphy, Bróna (2010): Corpus and sociolinguistics. Investigating age and gender in female talk. Amsterdam: Benjamins (Studies in corpus linguistics, 38).

...


Pusch, Claus D. / Raible, Wolfgang (2002): Romanistische Korpuslinguistik: Korpora und ge-sprochene gesprochene Sprache. Tübingen: Narr (ScriptOralia, 126).


Rühlemann, Christoph (2013): Narrative in English Conversation. A Corpus Analysis of Story-tellingStorytelling. Cambridge: Cambridge University Press.

 

Korpora und Varietätenlinguistik

...


Boisvert, Lionel / Laurendeau, Paul (1988): „Répertoire des corpus québécois de langue orale“. In: Revue québécoise de linguistique 17/2, 241–261. Online verfügbar unter: http://www.eru-diterudit.org/revue/rql/1988/v17/n2/602634ar.pdf.

...


Kaminskaia, Svetlana / Poiré, François (2012): „Prosodie du français laurentien en milieu mi-noritaire minoritaire : le corpus Windsor“. In: Anne Catherine Simon (ed.): La variation prosodique régio-nale régionale en français. Louvain-La-Neuve: De Boeck (Champs linguistiques: Recueils), 159–178.


Pusch, Claus D. (2000): „Das Corpus Occitano-Gascon als Beispiel multimedialer Sprachda-tenaufbereitung“Sprachdatenaufbereitung“. In: Rieger, A. (ed.): Okzitanistik, Altokzitanistik und Provenzalistik. Geschichte und Auftrag einer europäischen Philologie. Frankfurt a. M. et al.: Lang, 43-56.


Korpora und Soziolinguistik

...


Baker, Paul (2010): Sociolinguistics and Corpus Linguistics. Edinburgh: Edinburgh University Press (Edinburgh Sociolinguistics).


Murphy, Bróna (2010): Corpus and sociolinguistics. Investigating age and gender in female talk. Amsterdam: Benjamins (Studies in corpus linguistics, 38).


Korpora und Morphologie

...


Baayen, Rolf H. (2009): „Corpus Linguistics in Morphology: Morphological Productivity”. In: Lüdeling, Anke / Kytö, Merja (eds.): Corpus Linguistics. An International Handbook. HSK 29.2. Berlin / New York: De Gruyter, 899–919.


Fradin, Bernard / Dal, Georgette / Grabar, Natalia / Lignon, Stéphanie / Namer, Fiametta / Tri-boutTribout, Delphine / Zweigenbaum, Pierre (2008): „Remarques sur l'usage de corpus en morphologie“. In: Langages 171 (3), 34–59.

...


von der Grün, Angela (1999): Wort-, Morphem- und Allomorphhäufigkeit in domänenspezifi-schen domänenspezifischen Korpora des Deutschen. Friedrich-Alexander-Universität Erlangen-Nürnberg. Erlangen (CLUE-Arbeitsberichte, 2/1).

 

Korpora und Syntax

...

 

Mensching, Guido (2005): „Variación sintáctica, lingüística de corpus y gramática generativa: Teorías, métodos y problemas“. In: Gabriele Knauer (ed.): Variación sintáctica en español. Tübingen: Niemeyer, S. 13–33.

...

Selig, Maria (2008): „Geschichte, Variation, Wandel. Sprachwandel und historische Corpora“. In: Elisabeth Stark, Roland Schmidt-Riese, Eva Stoll, Wulf Oesterreicher (eds.): Romanische Syntax im Wandel. Tübingen: Narr, 67–86.

 

Korpora und Sprachwandel

...


Selig, Maria (2008): „Geschichte, Variation, Wandel. Sprachwandel und historische Corpora“. In: Elisabeth Stark, Roland Schmidt-Riese, Eva Stoll, Wulf Oesterreicher (eds.): Romanische Syntax im Wandel. Tübingen: Narr, 67–86.


Taavitsainen, Irma / Jucker, Andreas H. / Tuominen, Jukka: Diachronic corpus pragmatics (Pragmatics & beyond new series, 243).

Korpora und Sprachenlernen

...


Aston, Guy (ed.) (2001): Learning with corpora. Bologna, Houston, TX: CLUEB (Biblioteca della Scuola superiore di lingue moderne per interpreti e traduttori, Forlì, 29).

 

Korpora und Internetkommunikation

...


Barbera, Manuel / Corino, Elisa / Onesti, Cristina (eds.) (2007): Corpora e linguistica in rete. Perugia: Guerra.

...


Hathout, Nabil / Montermini, Fabio / Tanguy, Ludovic (2008): „Extensive data for morphology: using the World Wide Web“. In: French Language Studies 18, 67–85.


Korpora und kognitive Linguistik

...


Stefanowitsch, Anatol (2006): Corpus-based approaches to metaphor and metonymy. Berlin: De Gruyter.


Stefanowitsch, Anatol (2008): Corpora in Cognitive Linguistics: Corpus-Based Approaches to Syntax and Lexis. Berlin/New York: De Gruyter.


Statistische Analysemethoden für die Korpuslinguistik

...


Baayen, Rolf H. (2008): Analyzing linguistic data. A practical introduction to statistics using R. Cambridge: University Press.

...


Bergenholtz, Henning / Mugdan, Joachim (1989): „Korpusproblematik in der Computerlingu-istikComputerlinguistik: Konstruktionsprinzipien und Repräsentativität“. In: Bátori, István S. / Lenders, Winfried / Putschke, Wolfgang (eds.): Computational Linguistics. An International Handbook on Com-puter Computer Oriented Language Research and Applications. HSK 4. Berlin / New York: De Gruyter, 141–149.

...