Hauptnavigation

Diplomarbeiten im Themengebiet Sprache

Zurück zur Übersicht der Themengebiete.

Themenvorschläge:

Linguistische Informationsextraktion:
Es gibt eine Reihe frei verfügbarer Parser oder Tagger für das Deutsche. Untersucht werden soll deren Einsetzbarkeit für die Informationsextraktion. Zunächst soll von Hand versucht werden, Muster zu finden in den Annotation von Tagger/Parser, die einen Hinweis auf eine bestimmte zu extrahierende Information geben.
Gegeben: Eine Menge von URLs deutschsprachiger Seiten und eine Menge von Informationen, die aus den WWW-Seiten zu extrahieren sind.
Modelle der Entwicklung kindlichen Erzählens:
Maschinelles Lernen kann als Simulation für menschliches Lernen eingesetzt werden. Der Vorteil einer solchen Simulation ist, dass erschöpfende Experimente durchgeführt werden können, die bei Kindern unmöglich sind. Die Simulation formalisiert Theorien über menschliches Lernen. Empirische Daten über menschliches Lernverhalten werden dazu verwendet, die Simulation mit tatsächlichen Beobachtungen zu vergleichen.
In dieser Diplomarbeit geht es um linguistische Theorien zum kindlichen Spracherwerb. Ausgehend von den Arbeiten von Prof. Quasthoff (Institut für deutsche Sprache) sollen Gesprächsstrukturen dargestellt werden. Gibt es Stilmerkmale, die unabhängig von Merkmalen der Entwicklungsstufe sind? Wie können diese Merkmale formalisiert werden? Welche Vorhersagen können für das Gesprächsverhalten der Kinder gemacht werden, wenn Stilmerkmale unabhängig vom Entwicklungsstand eines Kindes sind? Treffen diese auf die empirischen Daten zu?
In der Diplomarbeit soll eine Repräsentation gefunden werden, die die Darstellung der Texte mit Stil- und Entwicklungsmerkmalen ermöglicht, um unterschiedliche Übergänge von einer Erzählweise zu einer späteren zu simulieren.
Gegeben:Textdaten von 30 Kindern in einer Verlaufsstudie, d.h. es gibt aufgezeichnete Gespräche desselben Kindes in verschiedenem Alter