Computerlinguistik-Tutorium

Computerlinguistik-Tutorium
Automatische Syntaxanalyse für diachrone und synchrone Linguistik:
Vorverarbeitung, Tagging, Parsing

Leitung
PD Dr. Gerold Schneider, Universität Konstanz und Universität Zürich, gerold.schneider@uni-konstanz.de
Dr. Kyoko Sugisaki, Universität Zürich

Zeit: Dienstag, 7.3.2017, 10-17 Uhr
Ort: Gebäude A 2.2, Raum 2.14
Sprache: Englisch
Maximale Teilnehmerzahl: 40
Anmeldung erfolgt gleichzeitig mit der Anmeldung zur Jahrestagung.

Kurzbeschreibung

Nach einer kurzen Einführung in Parsingtheorie zeigen wir schrittweise, wie man Texte vorverarbeitet, und syntaktisch analysiert, und geben einen Ausblick auf Anwendungen. Wir beschränken uns auf Englisch und Deutsch als Objektsprachen.

Die Vorverarbeitung beinhaltet bei historischen Texten Standardisierung der Schreibweise (Spelling Normalisation), wozu wir die Tools VARD fürs Englische und NORMA fürs Deutsch vorstellen. Der nächste Schritt, Wortartenzuweisung mit einem Tagger, verlangt als Eingageformat z.B. ein Wort pro Zeile, so für den Tree-Tagger, den wir anwenden. Für die syntaktische Analyse stellen wir mehrere Dependenzgrammatik-Parser vor und wenden sie an. Wir diskutieren die noch junge Forschung zur Parseranwendung und -anpassung auf historische Daten. Das Parsing kann auch durch den Einsatz eines Supertaggers verbessert werden, welcher nicht nur Wortarten, sondern auch wahrscheinliche Dependenz-Markierungen vorschlägt.