Text Mining Software

Der Forschungsbereich Text Mining Software (TMS) ist auf das Fachgebiet Computerlinguistik spezialisiert. Hier werden syntaktisch-semantische Verfahren entwickelt, die zur Informationsgewinnung aus digitalisierten Fließtexten dienen. Bezogen auf anwendungsspezifische Fragestellungen werden die jeweils relevanten Aussagen automatisiert erkannt, visualisiert und in strukturierte Knowledge Bases überführt.

Im Mittelpunkt der Arbeit steht die Faktenerkennung, wobei verschiedene Informationskategorien zu den Fragestellungen „Wer – Wann – Wo – Was?“ betrachtet werden. Ziel ist es, aus den Texten möglichst komplette Ereignisbeschreibungen zu filtern. Die FuE-Tätigkeit auf dem Gebiet des Natural Language Processing (NLP) ist anwendungsorientiert, die entwickelten Verfahren werden gemeinsam mit Kooperationspartnern in marktreife Lösungen überführt.

Profil

  • Entwicklung von NLP-Basisverfahren: Part-of-Speech Tagger (POS) , Named Entity Recognizer (NE),  Dependency Parser, Phrase Chunking Methods
  • Klassifikationsverfahren auf der Basis von Supervised Machine Learning Algorithmen und Entwicklung von trainierbaren Analyse- und Parser-Modulen
  • Entwicklung von Visualisierungs- und Korrekturoberflächen für NLP-Anwendungen
  • Konzeption und Implementierung von Datenbanken (RDBMS  und Graph Datenbanken) zur Persistenz der Text Mining Ergebnisse

Projekte

Abgeschlossene Projekte aus dem Bereich Text Mining Software sind auf der Projektseite Text Mining zu finden.