Mensch vs. Maschine - Texterfassungsmethoden auf dem Prüfstand

Irene Schumm,Philipp Zumstein

Mensch vs. Maschine - Texterfassungsmethoden auf dem Prüfstand

2018

Text- und Strukturerkennung sind bei Digitalisierungsvorhaben unerlasslich, um im Rahmen von Forschungsarbeiten Recherchen und Auswertungen auf effiziente Art und Weise zu ermoglichen. Eine Volltexterkennung inklusive der Erfassung von Strukturmerkmalen schreibt beispielsweise auch die DFG fur Druckwerke ab Erscheinungsjahr 1850 folgerichtig verbindlich vor. Bei digitalisierten historischen Forschungsdaten ist daruber hinaus eine moglichst fein-granulare Strukturierung sinnvoll. Die Text- und Strukturerkennung ist damit eine umfassende Herausforderung und im Zuge eines Projekts muss entschieden werden, ob eine maschinelle Texterkennung (OCR) oder ein manuelles Erfassen der Texte (i.d.R. Double Keying) durchgefuhrt werden soll. Wichtige Faktoren sind hierbei die Gute der Text- und Strukturerkennung, Kosten, Nachnutzbarkeit usw. Anhand des DFG-Digitalisierungsprojekts "Aktienfuhrer-Datenarchiv" (1870-2016) an der Universitatsbibliothek Mannheim sollen beide Methoden beleuchtet und ein Vergleich gezogen werden. In der ersten Projektphase (Erscheinungsjahre 1976-1999) wurde die Text- und Strukturerfassung mittels Double Keying-Verfahren durchgefuhrt, wahrend in der zweiten Projektphase (Erscheinungsjahre 1953-1975) die maschinelle OCR und automatische Strukturierung fur diese Aufgabe vorgezogen wird.

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations