Das DFG-Koordinierungsprojekt OCR-D ist auf die Weiterentwicklung von Verfahren der Optical Character Recognition (OCR) für historische Drucke ausgerichtet. Eines der wesentlichen Ziele ist die Konzeption und Implementierung für die vollständige Transformation des gedruckten deutschen Kulturerbes (16. bis 19. Jh.) in eine maschinenlesbare Form. Das Projekt wird von einem Koordinierungsprojekt der Herzog August Bibliothek Wolfenbüttel (HAB), der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW), der Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen (GWDG), der Staatsbibliothek zu Berlin (SBB) und der Niedersächsischen Staats- und Universitätsbibliothek Göttingen (SUB) gesteuert. In Phase III (2021–2024) wird die OCR-D-Software für die Massendigitalisierung optimiert und ein Verstetigungskonzept erarbeitet. Außerdem arbeiten vier Implementierungsprojekte daran, OCR-D in bestehende Anwendungen und Infrastrukturen zu integrieren, während drei Modulprojekte OCR-D-Werkzeuge weiter optimieren.
Auf unserer Website informieren wir über das Gesamtvorhaben, die Implementierungs- und Modulprojekte und über unsere verschiedenen Plattformen, über die alle Interessierten sich informieren sowie am Projekt teilhaben können. Außerdem finden sich dort unsere technische Dokumentation sowie Nutzungsinformationen und Anleitungen.
Veröffentlicht durch
Sprache
Land