CasualConc – ein Textanalysewerkzeug für den Mac

Als ich kürzlich vor der Aufgabe stand, auf die Schnelle ein Glossar aus einer Reihe von Aufsätzen zu erzeugen, habe ich mich an ein kleines Werkzeug namens CasualConc erinnert.

Harry2Dieser sogenannte Concordancer erzeugt Häufigkeitsanalysen von Wörtern oder Mehrwortgruppen, die in einem Text vorkommen – und das in Sekundenschnelle.
Das Tool heißt CasualConc, weil es ohne großen Aufwand, quasi im Vorübergehen, statistische Auswertungen von Texten erlaubt.

Computerlinguisten nutzen solche Software seit langem, um große Textmengen (Korpora) zu analysieren – nur sind die Werkzeuge in der Regel komplex, kostenpflichtig oder nur für das Windows-Betriebssystem erhältlich.

Der Entwickler Yasu Imao stellt CasualConc seit 2008 als Freeware zur Verfügung und hat es mittlerweile für MacOS 10.11.X völlig neu aufgesetzt.

Harry1Außerdem bekam CasualConc in der Version 2.0 ein nettes neues Feature spendiert, nämlich die Visualisierung von Worthäufigkeiten: eine Anbindung an die Statistiksoftware R, die schöne Graphen-Darstellungen ermöglicht. (R ist ebenfalls kostenlos, muss man separat installieren.)

Schnell habe ich auf diese Weise eine Wortliste erstellt, aus der sich auch die bedeutungslosen „Stoppwörter“ der, die, das usw. mittels integrierter Stoppwortliste herausfiltern lassen.

3-grams

Computerlinguisten würden jetzt mittels automatisierter Bearbeitungsschritte weiter filtern und beispielsweise mit allgemeinsprachlichen Textkorpora abgleichen, um auch wirklich nur den Fachwortschatz zu „extrahieren“.

Für meine Zwecke reichen die Bordmittel von CasualConc, um auf einen Blick die erklärungsbedürftigen Begriffe zu finden – mehr war nicht bezweckt. Aber für was kann man so ein Konkordanz-Werkzeug noch eigentlich so alles einsetzen?

  • Als Lektorin könnte ich beispielsweise Lieblings-Worthülsen einer Autorin statistisch ermitteln. Wie man einen charakteristischen Autorenstil herausfindet, hat der Linguist Alexander Lasch in einem sehr lesenswerten Blogartikel beschrieben. Dort ist auch Schritt für Schritt erklärt, wie man mit Textanalyse-Werkzeugen arbeitet.
  • LehrerInnen könnten anhand von selbst erstellten „Lernerkorpora“ sehen, welche Fehler beim Sprachenlernen auf einem bestimmten Niveau besonders häufig gemacht oder welche grammatischen Konstruktionen vermieden werden, um danach Unterricht auszurichten.
  • Textoptimierung für Zwecke des Contentmarketings: Man kann Wording-Listen für das eigene Produkt oder die Unternehmenskommunikation aufbauen und mit tatsächlichen Texten abgleichen.
  • Und wer mag, kann auf die Schnelle die Gesamtmenge der eigenen Tweets, die sich ja bei Twitter als Textdatei abrufen lässt, durch das Werkzeug jagen und feststellen, welche Wörter häufig auftauchen und z.B. künftig als Hashtag verwendet werden könnten …
    Harry3

    Bildquelle: CasualConc Manual

Tag des Notizbuchs

NotizbuchAuf den 19. Mai fiel der Tag des Notizbuchs, Notebook Day, und er wurde in diesem Jahr erstmals begangen.

Nichts mitbekommen?
Hätte ich auch nicht, wenn nicht zufällig ein vielbeachteter Tweet der British Library den Hashtag #NotebookDay in meine Timeline gespült hätte.

Die BL nutzte die Gelegenheit, um auf einen ihrer Schätze aufmerksam zu machen:

Das Notizbuch gehörte William Blake (1757-1827), dem englischen Dichter, Künstler und Visionär und gewährt einen faszinierenden Einblick in seinen Schaffensprozess.
Es wird angenommen, dass Blake das Notizbuch seit Februar 1787 benutzt und ständig bei sich trägt. Zunächst füllt es es mit einer Reihe von Bleistiftskizzen unter dem Arbeitstitel „Ideen von Gut und Böse“. Als er etwa sechs Jahre später das letzte Blatt des Notizbuchs erreicht hat, dreht Blake es um und beginnt von hinten hineinzuschreiben – diesmal um ihm Gedichtentwürfe anzuvertrauen, die er später stark kommentieren wird. Einige der Illustrationen auf den schon benutzten Seiten bleiben erhalten, während andere überschrieben werden.

Die Bücher übrigens, die aus diesen Skizzen und Kritzeleien entstanden, hat Blake gesetzt, mit selbst angefertigten Radierungen versehen (das Verfahren hatte er erfunden), selber gebunden und verlegt. Ein früher Selfpublisher, als das Büchermachen noch Handwerk war – in einem ganz anderen Sinne als das digitale Schreiben heute.

Was wäre, wenn William Blake heute leben würde? Wäre er einer der allerersten Nutzer eines Smartphones gewesen? Hätte er eine Notizapp oder den 4D-Druck entwickelt? Oder doch eher Videokünstler geworden? Und hätte er seine Gedichte getwittert?

WilliamBlake Poem

Ah ja, um auf den Tag des Notizbuchs zurückzukommen: Wer sich sowas nur immer ausdenkt? Nun, es gibt eine Erklärung, die etwas mit Marketing zu tun hat …

Wie ich zu erklären versuche, was ein Makerspace ist

Filterblase ist, wenn Freunde und Familie recht verständnislos schauen – zum Beispiel wenn ich vom Makerspace auf der re:publica erzähle.
„Makerspace“? Noch nie gehört.
Ja, die heißen hier auch meistens FabLabs.
??
Da schrauben und basteln die Leute, es wird programmiert und ausprobiert und ganz viel mit 3-D Druckern gearbeitet.
„Also ein MakerSpace ist ein Hobbyraum?“
Jein, also, eine Mitmachwerkstatt …
„Aber was hat denn das alles mit dem Internet zu tun? Die republica ist doch eine Internet-Konferenz?“
Jein, es geht halt auch um Innovationen, um Hackerkultur, um Zukunftstrends
??
Also ich habe da mal was gebastelt:

Nein? Seufz. Ich gebe auf und das Wort an jemanden, der das sehr gut erklären kann:
Philip Steffan, Redakteur der Zeitschrift MAKE: und Maker-Faire-Kurator.

(Das Interview hat Anja C. Wagner für den „Arbeit 4.0“-MOOC geführt.)

Empfehlung zum Weiterstöbern: Zwei schon ältere Artikel und ein neuerer Film

Und die nächste MakerFaire? Die findet Ende Juli am Bodensee statt.

Gelesen: „Sprint – wie man in 5 Tagen große Probleme löst und neue Ideen testet“

Was tun, wenn man als Start-up kurz vor der Pleite steht? Wenn die Kundinnen das Produkt nicht verstehen? Wenn man diversifizieren und expandieren will, aber nicht sicher ist, wie der nächste Schritt aussehen soll? Antwort: Man versammelt 7 Spezialisten 5 Tage lang in einem Raum mit zwei Whiteboards und vielen Klebezetteln und lässt sie einen  Sprint durchlaufen – einen durchstrukturierten Prozess, um ambitionierte Ideen zu entwickeln und zu testen.

SprintJake Knapp, John Zeratsky und Braden Kowitz liefern in ihrem Buch Sprint: How to Solve Big Problems and Test New Ideas in Just Five Days das Rezept – Schritt für Schritt beschreiben sie, was während der fünf Tage passieren soll. Die Tage sind extrem durchgetaktet, einschließlich der Pausen, damit das bestmögliche Ergebnis in der knappsten Zeit erzielt werden kann.

„Das ist doch, was Arbeit sein sollte: Nicht Zeit in endlosen Sitzungen verschwenden und dann versuchen, in einem Team-Building-Event beim Kegeln Kameradschaft aufzubauen, sondern zusammenarbeiten, um etwas zu bauen, das den Menschen wirklich nützt. Dies ist die beste Nutzung eurer Zeit. Dies ist ein Sprint.“

Weiterlesen

Nach dem MOOC ist vor der re:publica

Wenn ich erklären soll, was die re:publica ist, fallen mir als erstes Begriffe ein wie Bloggertreffen, Versammlung der „Netzgemeinde“ – das sind ja gängige Beschreibungen, dabei lässt sie sich gar nicht so leicht erklären.
Und erklären musste ich tatsächlich öfter, weshalb ich hinreise. Es ist ja nicht so, als ob tout Berlin völlig aus dem Häuschen wäre, dass die Konferenz stattfindet, das sieht nur aus der Provinz oder Nabelschau so aus. (Berliner lachen dich aus. Es ist immer so viel los dort.)
Jenseits des Hypes kann man die Konferenz als Fortbildung betrachten, eine Art Massive Open Course, der sich insofern nahtlos an den MOOC zur Arbeit 4.0 anschließt. Die re:publica widmet dem Thema „Zukunft der Arbeit“ einen eigenen Track und verspricht es „abseits der Buzzwords“ zu beleuchten.
 Abseits dieses Tracks habe ich mir  ein paar andere „Bildungshappen“ gesucht und daraus meinen individuellen Sessionplan zusammengestellt:

Weiterlesen