SKIMSON® Information Extraction

Automatisierte Sichtung, Analyse und Verwertung von Informationen aus technischen Dokumentationen

SKIMSON® ist eine Software-Familie aus Analyse-Tools, die eine automatisierte Informationsbereitstellung aus heterogenen digitalen Dokumenten ermöglicht.

Im Fokus stehen technische Dokumente, insbesondere Sammlungen von detaillierten Produktbeschreibungen und technischen Datenblättern. Solche Dokumente sind gekennzeichnet durch eine individuelle, charakteristische Layout-Gestaltung und die Verwendung firmenspezifischer Begriffe für Produkte und deren Parameter, durch eine Vielzahl von physikalischen Größen und Maßeinheiten, durch eine bunte Mischung aus Fließtexten, Aufzählungen und teilweise hochkomprimierten Tabellen sowie durch die Verwendung von Fußnoten und Querverweisen. In technischen Dokumenten werden die Gültigkeitsbereiche von Aussagen häufig flexibel gehandhabt. So können sich Bemerkungen beispielsweise auf einzelne Komponenten oder ganze Gerätegruppen beziehen.

SKIMSON® untersucht technische Dokumente als Ganzes. Die Software kombiniert systemintern KI-Basierte Verfahren zur Layout-Analyse mit verschiedenen semantischen NLP-Methoden für die unterschiedlichen Informationsblöcke und Inhalte.

Für die Anwender stehen - ausgehend von natürlichsprachlichen Recherche-Anfragen - Verfahren für die Analyse von Einzeldokumenten bereit. Das Ergebnis ist die strukturierte Darstellung der gewünschten Zielparameter und die Trefferliste aus dem Datenblattsammlung.

Außerdem werden Funktionen zur Stapelverarbeitung ganzer Datenblattsammlungen angeboten, die den automatisierten Aufbau digitaler, strukturierter Produktbibliotheken unterstützen.

In beiden Anwendungsszenarien ist die Rückverfolgbarkeit der automatisch generierten Informationen gewährleistet. Die entsprechenden Quellen innerhalb der Dokumente können jederzeit punktgenau angezeigt werden.

Die Konfiguration der Verfahren sowie deren Optimierung für verschiedene technische Anwendungsbereiche erfolgen über Verfahren zur automatisierten Ontologie-Generierung.

SKIMSON® Tools können vor Ort oder als Cloud-Anwendung genutzt werden. Das Zusammenspiel der einzelnen Systembausteine kann an die Bedürfnisse der Anwender angepasst werden.

Was leistet SKIMSON®?

SKIMSON® dient der Informationsgewinnung aus heterogenen Dokumenten und stellt Service-Bausteine bereit, die Rechercheaufgaben für technische Anwendungen maßgeblich unterstützen.

Vorteile auf einen Blick

»  Automatische Extraktion von Informationen aus einer Vielzahl detaillierter technischer Produktbeschreibungen von verschiedenen Herausgebern
»  Automatisierter Aufbau von herstellerübergreifenden Produktkatalogen
»  Analyse einzelner Dokumente auf Basis natürlichsprachlicher Anfragen
»  Übersichtliche Präsentation von Suchergebnissen auf Basis einer einheitlichen, herstellerneutralen Begriffswelt
»  Transparenz und Rückverfolgbarkeit durch automatische Referenzierung und Hervorhebung der Fundorte in den Ursprungsdaten
»  Einsatzmöglichkeit On-Premises oder kollaborativ in Cloud-Umgebungen

Wie funktioniert’s?

Sie importieren die Mailbox und starten die Verarbeitung. SKIMSON® führt dann die semantische Analyse durch. Sie sichten das Ergebnis. Die Kernaussagen können für verschiedene Kategorien automatisch identifiziert und gefiltert werden. Auch unsinnige Kontaktaufnahmen werden erkannt. Sie können die Systemergebnisse bequem mit den virtuellen Markern korrigieren und ergänzen. Sie sind der Experte, Ihr Helfer SKIMSON® wird von Ihnen trainiert. Ihre Arbeit wird immer besser unterstützt, die Software übernimmt den ermüdenden Teil. Alle Analyse-Ergebnisse werden für Ihre weitere Recherche-Arbeit strukturiert gespeichert. Die personenbezogenen Daten gemäß Datenschutz-Grundverordnung (DSGVO) können verschlüsselt und separat gesichert werden.