Diplomarbeiten im Themengebiet Sprache
Zurück zur Übersicht
der Themengebiete.
Themenvorschläge:
- Linguistische Informationsextraktion:
- Es gibt eine Reihe frei verfügbarer Parser oder Tagger
für das Deutsche. Untersucht werden soll deren
Einsetzbarkeit für die Informationsextraktion. Zunächst
soll von Hand versucht werden, Muster zu finden in den Annotation
von Tagger/Parser, die einen Hinweis auf eine bestimmte zu
extrahierende Information geben.
Gegeben: Eine Menge von URLs deutschsprachiger Seiten und
eine Menge von Informationen, die aus den WWW-Seiten zu
extrahieren sind.
- Modelle der Entwicklung kindlichen Erzählens:
- Maschinelles Lernen kann als Simulation für menschliches
Lernen eingesetzt werden. Der Vorteil einer solchen Simulation
ist, dass erschöpfende Experimente durchgeführt werden
können, die bei Kindern unmöglich sind. Die Simulation
formalisiert Theorien über menschliches Lernen. Empirische
Daten über menschliches Lernverhalten werden dazu verwendet,
die Simulation mit tatsächlichen Beobachtungen zu
vergleichen.
In dieser Diplomarbeit geht es um linguistische Theorien zum
kindlichen Spracherwerb. Ausgehend von den Arbeiten von
Prof. Quasthoff (Institut für deutsche Sprache) sollen
Gesprächsstrukturen dargestellt werden. Gibt es Stilmerkmale,
die unabhängig von Merkmalen der Entwicklungsstufe sind? Wie
können diese Merkmale formalisiert werden? Welche Vorhersagen
können für das Gesprächsverhalten der Kinder
gemacht werden, wenn Stilmerkmale unabhängig vom
Entwicklungsstand eines Kindes sind? Treffen diese auf die
empirischen Daten zu?
In der Diplomarbeit soll eine Repräsentation gefunden werden,
die die Darstellung der Texte mit Stil- und Entwicklungsmerkmalen
ermöglicht, um unterschiedliche Übergänge von einer
Erzählweise zu einer späteren zu simulieren.
Gegeben:Textdaten von 30 Kindern in einer Verlaufsstudie,
d.h. es gibt aufgezeichnete Gespräche desselben Kindes in
verschiedenem Alter