Italienische Morphologie in JSLIM
Das Projekt basiert auf der Magisterarbeit "Implementierung eines automatischen Wortformerkennungssystems für das Italienische mit dem Programm JSLIM" von Carsten Weber aus dem Jahre 2007. Das Grundformlexikon wurde aus einer Frequenzliste des "Corpus e Lessico di Frequenza dell'Italiano Scritto (CoLFIS)" generiert.
Leistungsmerkmale:
- Behandlung von Allomorphiephänomenen
- Klassifikation des Allo-Lexikons nach Allo- und Kombiklassen
- Segmentation der Wortformoberflächen in alle Bestandteile
- Regelmäßige und unregelmäßige Flexions- und Deklinationsparadigmen für ca. 4 700 Verben, 21 000 Substantive und 10 000 Adjektive
- Derivation mit Einbindung von über 100 Präfixen, 140 Suffixen und deren Varianten
Das Projekt wurde mehrmals erneuert und ist in der aktuellen Version 2.0 für eine Erweiterung auf die Syntaxkomponente im Rahmen von JSLIM optimiert worden.
Bei Fragen, Kritik oder Verbesserungsvorschlägen bitte an cnweber@linguistik.uni-erlangen.de wenden.
Zum Testen und Download: