♦ Universität Erlangen-Nürnberg ♦ Fach Linguistische Informatik
♦ Sommer 2008


Proseminar

Grammatische Kodierung

[ Einführung in die maschinelle Sprachverarbeitung ]


Dozent : Besim Kabashi


♦ Über das Proseminar

  • Zeit / Ort / Status

    Mittwochs, 16:15 - 17:45 Uhr;
    Raum 0.320 Bismarckstr. 12;

    Proseminar; EMSV; 2 SWS;
    Schein; Benoteter Schein; ECTS: 6;
    Nur Fachstudium, Magister, Diplom, EMSV
    In der Regel nicht für Anfänger geeignet!

  • Teilnahmevoraussetzungen

    Werkzeuge und Arbeitstechniken der Computerlinguistik.

    Es werden
    (1) Kenntnisse linguistischer Grundlagen (Grundkurs(e) in Linguistik),
    (2) Kenntnisse in einer Programmiersprache (C, Java, Perl, ...), sowie
    (3) Teilnahme an "Einführung in die Grammatikentwicklung"
    empfohlen.

  • Zusammengefasste Information über den Proseminarinhalt

    Am Anfang des Kurses werden in kompakter Form die Grundlagen der maschinellen Sprachverabeitung vermittelt. Darauf folgen Beispiele der grammatischen Kodierung in verschiedenen computerlinguistischen Ansätzen, wovon unter anderem auch ihr Name induziert wird und ihr Rolle zum Ausdruck kommt. Im zweiten Teil des Kurses werden verschiedene Strategien und Modelle der Informationskodierung behandelt. Es wird natürlich auch der SLIM-Ansatz - sine qua non - unter die Lupe genommen.



♦ Themen¹

  • Kurze Einführung in die maschinelle Sprachverabeitung (MSV)

    16.04.2008 Vorbesprechung / Kurze Einführung in die MSV
    23.04.2008 Grundlagen der MSV : Die Themengebiete und Anwendungen

  • Kodierung

    30.04.2008 Praktische Beispiele der grammatischen Kodierung
    07.05.2008 Grammatische Kodierung in der DBS/SLIM-Sprachtheorie
    14.05.2008 Grammatische Kodierung in verschiedenen Sprachtheorien
    21.05.2008 Lexikalische Kodierung
    28.05.2008 Morphologische Kodierung
    04.06.2008 Referat / Syntaktische Kodierung
    11.06.2008 Referat / Semantische Kodierung (1) / Praktische Übung
    18.06.2008 Referat / Praktische Übung (2)
    25.06.2008 Referat / Praktische Übung (3)
    02.07.2008 Referat / Klausurbesprechung
    09.07.2008 Frei || Der Klausurtermin ist verschoben auf den 16.7. ||
    16.07.2008 Klausur
________
¹ Themen für die Referate werden bei der Vorbesprechung verteilt.


♦ Folien / Lektüre / Aufgaben

  • Seminarfolien

    Folien, Skripte und Programme und begleitende Lektüre in elektronischer Form sind im Verzeichnis /projects/lehre/Grammatische_Kodierung_SS-2008/ (lokal; auf CLUE-Computer) zu finden.

  • Begleitende Lektüre

    Begleitende Lektüre befindet sich im Nebenraum vor der Bibliothek. Es wird erwartet, dass die begleitende Lektüre für die jeweilige Stunde vorbereitet wird.

  • Aufgaben

    Das aktuelle Übungsblatt (Aufgabe.2008mmdd.pdf) liegt im Verzeichnis der Seminarfolien (s.o.). Lösungen zu den Übungsaufgaben bitte wie abgesprochen abgeben!



♦ Literatur

    ◊ Zur Einführung in die maschinelle Sprachverabeitung :


  • Robert DALE et al. : Handbook of Natural Language Processing. New York / Basel : Marcel Dekker, Inc. 2000.

  • Roland HAUSSER : Grundlagen der Computerlinguistik. Mensch-Maschine-Kommunikation in natürlicher Sprache. Berlin / New York : Springer 2000.

  • Daniel JURAFSKY / James H. MARTIN : Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River : Prentice Hall 2000.

  • Ralf KLABUNDE (Hrsg.) et al. : Computerlinguistik und Sprachtechnologie. 2. Auflage, München : Elsevir 2004.

  • Ruslan MITKOV (Ed.) : The Oxford Handbook of Computational Linguistics. Oxford : OUP 2003.

  • Pierre M. NUGEUS : An Introduction to Language Processing with Perl and Prolog. Berlin : Springer 2006.

    ◊ Zur grammatischen Kodierung :


  • R. Harald BAAYEN et al. : The CELEX Lexical Database (Release 2) [CD-ROM]. Philadelphia, PA: Linguistic Data Consortium, University of Pennsylvania [Distributor], 2005.

  • Kathryn BOCK / Willem LEVELT : ``Language Production - Grammatical Encoding''. 945--984. [In:] Morton Ann GERNSBACHER : Handbook of Psycholinguistics. San Diego etc. : Academic Press Inc., 1994.

  • Roland HAUSSER : A Computational Model of Natural Language Communication. Interpretation, Inference, and Production in Database Semantics. Berlin / New York : Springer 2006.

  • Fernanda FERREIRA / Paul E. ENGELHARDT : ``Syntax and Production''. 61--91. (§ 1.3) [In:] Morton Ann GERNSBACHER / Matthew J. TRAXLER : Handbook of Psycholinguistics. 2nd Ed. San Diego etc. : Elsevier / Academic Press Inc., 2006.

  • Herbert SCHRIEFERS / Jörg D. JESCHENIAK : ``Lexikalischer Zugriff und grammatische Kodierung''. 252--261. [In:] Gert RICKHEIT et al. : Psycholinguistik / Psycholinguistics. Berlin / New York : Mouton de Gruyter, 2003.

  • Antje S. MEYER / Herbert SCHRIEFERS : ``Die lexikalische Kodierung''. 483-509. [In:] Theo HERRMANN & Joachim GRABOWSKI (Hrsg.) : Enzyklopädie der Psychologie (Bereich C, Serie III, Band 1: Sprachproduktion). Göttingen : Hogrefe, 2003.

  • Gabriele DIEWALD : Grammatikalisierung, Eine Einführung in Sein und Werden grammatischer Formen. Tübingen : Niemeyer, 1997. (Germanistische Arbeitshefte 36).



♦ Links



♦ Tutorium

Die Einzelheiten und Modalitäten werden in der Vorbesprechung bekannt gemacht.



♦ Scheinerwerb

In dieser Veranstaltung kann durch die erfolgreiche Teilnahme an der Klausur ein benoteter Schein erworben werden. Die Proseminarnote trägt mit 60% zur Modulnote "Maschinelle Sprachverarbeitung" bei. Voraussetzung für das Schreiben der Klausur ist die aktive Teilnahme, die Bearbeitung einer Programmieraufgabe bzw. das erfolgreiche Halten eines Referats, sowie - nach der Klausur - die (kurze) schriftliche Ausarbeitung des Referat-Themas bzw. das schriftliche Protokoll der Programmieraufgabe. Es wird erwartet, dass die schriftliche Ausarbeitung in LaTeX abgefasst wird.



♦ Klausur

Termin war Mi., der 16.7.2008;


  • Klausurergebnisse:

    Mattr.-Nr. : 21199175 :
    Nicht bestanden ; Praktische Aufgabe nicht abgegeben ; *

    Mattr.-Nr. : 21088682 :
    Nicht Bestanden ; Klausur nicht bestanden ; Praktische Aufgabe nicht abgegeben ; *

    Mattr.-Nr. : 21249533 :
    Nicht bestanden ; Klausur nicht bestanden ;

    Bestanden : 21289992, 21319882, 21318856 **, 21297518, 21250545 ** ;


  • * Abgabetermin war Mo., 15.9.2008.
    ** Bitte Auflage berücksichtigen; Letzter Termin Mi., der 15.10.2008!
    *** Klausuransicht und -besprechung für interessierte Kandidaten findet am Fr., den 17.10.2008 von 14.00 bis 15.00 Uhr statt. Der Ort ist Bismarckstr. 6, Raum 4.000.

    Datenstand: 30.10.2008.