Text Mining Software

Der Forschungsbereich Text Mining Software (TMS) ist auf das Fachgebiet Computerlinguistik spezialisiert. Hier werden syntaktisch-semantische Verfahren entwickelt, die zur Informationsgewinnung aus digitalisierten Fließtexten dienen. Bezogen auf anwendungsspezifische Fragestellungen werden die jeweils relevanten Aussagen automatisiert erkannt, visualisiert und in strukturierte Knowledge Bases überführt.

Im Mittelpunkt der Arbeit steht die Faktenerkennung, wobei verschiedene Informationskategorien zu den Fragestellungen „Wer – Wann – Wo – Was?“ betrachtet werden. Ziel ist es, aus den Texten möglichst komplette Ereignisbeschreibungen zu filtern. Die FuE-Tätigkeit auf dem Gebiet des Natural Language Processing (NLP) ist anwendungsorientiert, die entwickelten Verfahren werden gemeinsam mit Kooperationspartnern in marktreife Lösungen überführt.

Profil

Entwicklung von NLP-Basisverfahren: Part-of-Speech Tagger (POS) , Named Entity Recognizer (NE), Dependency Parser, Phrase Chunking Methods
Klassifikationsverfahren auf der Basis von Supervised Machine Learning Algorithmen und Entwicklung von trainierbaren Analyse- und Parser-Modulen
Entwicklung von Visualisierungs- und Korrekturoberflächen für NLP-Anwendungen
Konzeption und Implementierung von Datenbanken (RDBMS und Graph Datenbanken) zur Persistenz der Text Mining Ergebnisse

Projekte

Abgeschlossene Projekte aus dem Bereich Text Mining Software sind auf der Projektseite Text Mining zu finden.

Volmerstraße 3 D-12489 Berlin

Telefon:	+49 30 814563-300
Fax:	+49 30 814563-302
eMail:	sekretariat@gfai.de

Cookie Hinweis

Profil