Textmühle
Die Textmühle ist ein Werkzeug für die Korpuslinguistik und Textklassifikation. Texte, die in verschiedenen Formaten vorliegen (PDF, PS, RTF, HTML, ...), können per Datei-Upload online bearbeitet werden. Die Daten werden in einem ersten Schritt zu Ascii-Text umgewandelt. Dabei lassen sich Filter manuell und/oder automatisch zuschalten. Ebenso ist eine manuelle Nachbearbeitung möglich. Aus dem extrahierten Text wird eine Wortformliste erstellt sowie (optional) in einem weiteren Schritt eine Morphem- oder Grundformliste. Aus diesen können automatisch Frequenzlisten erstellt werden. Diese können dann für eine weitere Klassifikation verwendet werden.
Features:
- Der Text ist nach jedem Schritt zur manuellen Bearbeitung verfügbar.
- Jeder erreichte Status ist abspeicherbar.
In Kürze folgt:
- Textmühle starten
- Readme
- Dokumentation