Logo der Computerlinguistik


 

Diese Webseite ist veraltet. Neue Adresse: http://www.linguistik.uni-erlangen.de

Textmühle

Die Textmühle ist ein Werkzeug für die Korpuslinguistik und Textklassifikation. Texte, die in verschiedenen Formaten vorliegen (PDF, PS, RTF, HTML, ...), können per Datei-Upload online bearbeitet werden. Die Daten werden in einem ersten Schritt zu Ascii-Text umgewandelt. Dabei lassen sich Filter manuell und/oder automatisch zuschalten. Ebenso ist eine manuelle Nachbearbeitung möglich. Aus dem extrahierten Text wird eine Wortformliste erstellt sowie (optional) in einem weiteren Schritt eine Morphem- oder Grundformliste. Aus diesen können automatisch Frequenzlisten erstellt werden. Diese können dann für eine weitere Klassifikation verwendet werden.

Features:

  • Der Text ist nach jedem Schritt zur manuellen Bearbeitung verfügbar.
  • Jeder erreichte Status ist abspeicherbar.

In Kürze folgt: 

  • Textmühle starten
  • Readme
  • Dokumentation