Startseite >> Produkte >> Dokumentenerschließung (Produkte)

RecType

Ist ein System zur Erkennung von Schreibmaschinendokumenten.

 

Die Erkennung von Schreibmaschinendokumenten wird von handelsüblicher OCR-Software nur unbefriedigend unterstützt. Insbesondere Archive von Bibliotheken, Museen etc. stellt dies beim Digitalisierungsprozess vor ein Problem.

RecType bietet eine Lösung, die vor allem die Erfassung von (historischen) Dokumenten wie Karteikarten oder Schreibmaschinen-schriften vereinfacht.

  • Bildvorverarbeitung zur Hintergrundbereinigung und besseren Schrifterkennung
  • Verwendung von Templates zur Strukturierung gleichartiger Dokumente
  • Einbindung handelsüblicher OCR-Software
  • Wörterbuchabgleich zur Korrektur fehlerbehafteter OCR-Ergebnisse

In allen Archiven lagern Dokumente, die für die Nachwelt erhalten bleiben sollen, um zum Beispiel zu Dokumentations- und Forschungszwecken zur Verfügung zu stehen.

 

Handelsübliche OCR-Software verfügt leider nur über eine sehr schlechte automatische Lesbarkeit bei Schreibmaschinen-dokumenten, Karteikarten etc., wie sie für Archive von Bibliotheken, Museen oder Gedenkstätten charakteristisch sind.

 

RecType bietet eine Lösung für typische Probleme, die bei der Erfassung (historischer) Dokumente auftreten.

 

Die Bilder der eingescannten Dokumente werden durch geeignete Bildverarbeitungsalgorithmen aufbereitet, so dass Verunreinigungen reduziert und das Schriftbild verbessert wird. Dies führt zu besseren Ergebnissen bei der nachfolgenden Schrifterkennung.

 

Gleichartige Dokumente können durch Templates strukturiert werden. So können tabellarisch erfasste Informationen, mit oder ohne sichtbare Trennlinien, inhaltlich richtig zugeordnet werden.

 

Manche Bestände weisen nach der Erkennung immer noch sehr hohe Fehlerraten auf. Für Fehlerraten bis zu 50% kann eine unscharfe Suche zur Korrektur hinzugezogen werden. Diese ermittelt in einem Wörterbuch, das auch speziell für den zu erfassenden Bestand erstellt werden kann, den besten Treffer und korrigiert das fehlerhafte Wort.

 

 

Kontakt

Silvia Schwochow
Tel.: +49 30 814563-610
eMail: schwochow@gfai.de

 

 

Weitere Unterlagen, Downloads und Links: