CasualConc – ein Textanalysewerkzeug für den Mac

Als ich kürzlich vor der Aufgabe stand, auf die Schnelle ein Glossar aus einer Reihe von Aufsätzen zu erzeugen, habe ich mich an ein kleines Werkzeug namens CasualConc erinnert.

Harry2Dieser sogenannte Concordancer erzeugt Häufigkeitsanalysen von Wörtern oder Mehrwortgruppen, die in einem Text vorkommen – und das in Sekundenschnelle.
Das Tool heißt CasualConc, weil es ohne großen Aufwand, quasi im Vorübergehen, statistische Auswertungen von Texten erlaubt.

Computerlinguisten nutzen solche Software seit langem, um große Textmengen (Korpora) zu analysieren – nur sind die Werkzeuge in der Regel komplex, kostenpflichtig oder nur für das Windows-Betriebssystem erhältlich.

Der Entwickler Yasu Imao stellt CasualConc seit 2008 als Freeware zur Verfügung und hat es mittlerweile für MacOS 10.11.X völlig neu aufgesetzt.

Harry1Außerdem bekam CasualConc in der Version 2.0 ein nettes neues Feature spendiert, nämlich die Visualisierung von Worthäufigkeiten: eine Anbindung an die Statistiksoftware R, die schöne Graphen-Darstellungen ermöglicht. (R ist ebenfalls kostenlos, muss man separat installieren.)

Schnell habe ich auf diese Weise eine Wortliste erstellt, aus der sich auch die bedeutungslosen „Stoppwörter“ der, die, das usw. mittels integrierter Stoppwortliste herausfiltern lassen.

3-grams

Computerlinguisten würden jetzt mittels automatisierter Bearbeitungsschritte weiter filtern und beispielsweise mit allgemeinsprachlichen Textkorpora abgleichen, um auch wirklich nur den Fachwortschatz zu „extrahieren“.

Für meine Zwecke reichen die Bordmittel von CasualConc, um auf einen Blick die erklärungsbedürftigen Begriffe zu finden – mehr war nicht bezweckt. Aber für was kann man so ein Konkordanz-Werkzeug noch eigentlich so alles einsetzen?

  • Als Lektorin könnte ich beispielsweise Lieblings-Worthülsen einer Autorin statistisch ermitteln. Wie man einen charakteristischen Autorenstil herausfindet, hat der Linguist Alexander Lasch in einem sehr lesenswerten Blogartikel beschrieben. Dort ist auch Schritt für Schritt erklärt, wie man mit Textanalyse-Werkzeugen arbeitet.
  • LehrerInnen könnten anhand von selbst erstellten “Lernerkorpora” sehen, welche Fehler beim Sprachenlernen auf einem bestimmten Niveau besonders häufig gemacht oder welche grammatischen Konstruktionen vermieden werden, um danach Unterricht auszurichten.
  • Textoptimierung für Zwecke des Contentmarketings: Man kann Wording-Listen für das eigene Produkt oder die Unternehmenskommunikation aufbauen und mit tatsächlichen Texten abgleichen.
  • Und wer mag, kann auf die Schnelle die Gesamtmenge der eigenen Tweets, die sich ja bei Twitter als Textdatei abrufen lässt, durch das Werkzeug jagen und feststellen, welche Wörter häufig auftauchen und z.B. künftig als Hashtag verwendet werden könnten …

    Harry3

    Bildquelle: CasualConc Manual