Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Die Klammern erweisen sich als überaus hilfreich, arbeitet man mit der Ersetzfunktion eines Texteditors (Die Funktion "Ersetzen" befindet sich meist irgendwo in der Nähe der Funktion Suchen "Suchen". Bei Notepad/ Textpad sind beide unter dem Menüpunkt "Suchen"/ "Search" gelistet). Diese Funktion ist insofern sinnvoll, als dass sie die Möglichkeit eröffnet, Textdaten und ihm zugrundeliegende Muster aktiv zu manipulieren.

Image Added

Eine einfache Ersetz-Operation bestünde beispielsweise darin, alle Formen des Farbadjektivs rosso in einem Text durch die Nennform rosso zu ersetzen.Ein regulärer Ausdruck zum Auffinden aller Formen könnte dabei so lauten:

...

Ausdruckmatcht...Ersetzen durch...Ergebnis
rossross, ross, ross, rossgiallgiallo, gialla, gialli, gialle

ross([oaie])

oder (z.B. in älteren Textpad-Versionen):

ross\([oaie]\)

rosso, rossa, rossi, rossegiall\1giallo, gialla, gialli, gialle

...

Nehmen wir zur Veranschaulichung eine Textdatei, die aus der Buchstabenfolge abc zusammengesetzt ist. Der Ersetzausdruck \u& (entspricht: "Erzwungene Kleinschreibung des ersten Buchstabens, Suchstring übernommen") würde diese zu Abc umwandeln, \U zu ABC, \U&def zu ABCDEF. Genauso funktioniert es, will man die Kleinschreibung von Großbuchstaben erzwingen.

Image Added

Was soll ich damit?

Keine Idee für Anwendungsmöglichkeiten? Eventuell erfordern Tools, so wie das Annotationstool TreeTagger, dass Texte in einer bestimmten Form vorliegen. Bei TreeTagger entpräche dies der Formatierung ein Wort pro Zeile. Eine solche Form könnte zum Beispiel hergestellt werden, indem alle Leerstellen (_) durch \n ersetzt werden. Auch lassen sich Daten von überflüssigen Zeichen reinigen. Will ich beispielsweise Interpunktionszeichen aus meinem Korpus entfernen, so ist dies über eine Ersetzung von [.?:,!] durch nichts (also durch ein leeres Ersetz-Feld) zu bewerkstelligen. Auch die Anordnung von Textbausteinen lässt sich durch die Ersetzfunktion mithilfe der Verweise verändern. Dazu werden Gruppen definiert (z.B. (a)(b)(c)) und ihre Reihenfolge unter Rückgriff auf ihre Kennzahlen verändert (z.B. zu \3\2\1).