CS.RECANA - Verfahren zur automatisierten, zielgerichteten Datenaufbereitung in Citizen-Science-Projekten mit hoher Bürgerbeteiligung

Zielstellung des Projektes

Ziel des beantragten Projektes ist es Verfahren und Lösungen zu entwickeln, mit deren Hilfe heterogenes Beobachtungsmaterial, wie es von Teilnehmern von Großprojekten der bundesweiten Bewegung „Bürgerwissenschaften“ geliefert wird, mit hohem Automatisierungsgrad zu klassifizieren, zu analysieren, auszuwerten und aufzubereiten. Mit Hilfe der Verfahren sollen die Initiatoren von CS-Projekten unterstützt werden, die eingehenden Zuschriften (z. B. E-Mails) möglichst schnell sichten und die ausschlaggebenden Informationen extrahieren zu können, um sie dann für statistische Auswertungen nach einheitlichen Gesichtspunkten strukturiert zu sichern.

Projektergebnisse

Konkret sind im Projekt Textanalyse-Verfahren entstanden

  • zur Segmentierung der CS-Beiträge in Kopfdaten, Beobachtungsdaten und Zusatzmaterialien
  • zur automatisierten Identifizierung und Vereinheitlichung von teilweise auch unscharfen Orts- und Zeitangaben
  • zum Auffinden von Ereignisbeschreibungen

Außerdem wurde ein prototypisches Interaktionsmodul zur Visualisierung und Weiterverarbeitung der erkannten Daten unter Einbeziehung von Open Street Maps entwickelt. Die Visualisierungsmethoden für gefilterte Ortsangaben sind dem vorgefundenen Genauigkeitsgrad angepasst (Punktkoordinaten, Straßenzüge, Gebiete). Für die Interpretation unscharfer Zeitangaben wurde ein Regelmodell entworfen, das auf der Auswertung von Adverbien basiert. Die Identifikation der für das CS-Projekt relevanten Ereignisbeschreibungen erfolgt anhand freidefinierbarer Ontologien für Named Entities und S(ubjekt)P(rädikat)O(bjekt)-Tripeln. Die entwickelten Verfahren wurden anhand von Beobachtungszuschriften erfolgreich getestet, die in Eigeninitiative und unter Mithilfe Freiwilliger generiert wurden. Sie werden nach Projektende zur Marktreife überführt und in kommerziell verfügbare Software-Produkte integriert.