TEXXAVIS
Automatisierte Extraktion und grafisch-schematische Aufbereitung von Kernaussagen in wissenschaftlich-technischen Publikationen
Projektziel
Im FuE-und Bildungsbereich erfordert die Recherche und Verarbeitung des bestehenden Wissens einen hohen Zeitaufwand. Ziel des Vorhabens TEXXAVIS war die Entwicklung von Verfahren, die die nachhaltige Wissensbereitstellung aus Publikationen aller Art unterstützen. Die Verfahren sollen die Grundlage für ein Software-Werkzeug bilden, durch das weitgehend automatisiert gut strukturierte, prägnante und schnell zu verstehende Kurzfassungen von Langtexten generiert werden können.
Projektergebnisse
Im Fokus der Entwicklung standen KI-basierte Verfahren des Natural Language Processing (NLP), mit deren Hilfe unterschiedlich geartete Wissensextrakte aus Fließtexten erschlossen werden. Die Extrakte setzen sich aus Subjekt-Prädikat-Objektphrasen zusammen. Diese werden verschiedenen Kategorien wie Begriffsdefinitionen, Erläuterungen, Abkürzungen, Übersetzungen zugeordnet. Die Wissensextrakte können durch Informationen aus externen Literaturquellen ergänzt werden. Die Rechercheergebnisse werden in einer Wissensdatenbank gespeichert, die auf einem Verbund von SQL- und NoSQL-Datenbanken basiert.
Es wurde weiterhin untersucht, wie die gewonnenen Extrakte weiter verdichtet und umgeformt werden können, um die enthaltenen Informationsketten in übergeordnete Knowledge-Graphen einspeisen zu können. Die entstandenen TEXXAVIS-Verfahren werden in eine Systemlösung eingebettet, die die interaktive Recherchetätigkeit mit Hilfe der NLP-Methoden unterstützt, nicht aber ersetzt. Die Verfahren setzen sich aus Microservices zusammen, die in eine Cloud-Umgebung eingebunden werden können. Die Bereitstellung kann durch externe Rechenzentren oder in der eigenen Hardware-Umgebung erfolgen. Gegen Ende der Projektlaufzeit entstanden in den USA KI-basierte Chatbot-Lösungen, die die Generierung von Extrakten vollständig automatisieren. Dies erforderte ein Umdenken bei der Erarbeitung des Verwertungskonzeptes. Es wurden die TEXXAVIS-Verfahren identifiziert, die im Zuge weiterer Entwicklungsarbeiten gut mit den neuartigen Chatbot-Modulen kombinierbar sind.