Projekt OCR-D

OCR-D

Projektziel

Das Projekt OCR-D verfolgt das Ziel, Verfahren der automatischen Texterkennung (OCR) von historischen Drucken als Open Source Software aufzubereiten und verfügbar zu machen, um mittelfristig alle Werke in den VD (Verzeichnisse der deutschsprachigen Drucke) mit qualitativ hochwertigem Volltext zu versehen. Phase I (2016-2018) des Projekts evaluierte den Stand der Forschung und entwickelte ein Funktionsmodell für OCR-Workflows. In Phase II (2018-2020) wurden in acht Modulprojekten Lösungen für fehlende oder unterentwickelte Komponenten im OCR-Workflow entwickelt. In Phase III des Projekts (2021-2024) arbeiten neben dem Koordinierungsprojekt drei Modulprojekte an der Weiterentwicklung einzelner Komponenten des OCR-D-Workflows, während sich vier Implementierungsprojekte verschiedene Einsatzszenarien in Bibliotheken und Archiven ausarbeiten. 

Projektzeit

2016 - 2024

Projektpartner

Berlin-Brandenburgische Akademie der Wissenschaften
Herzog-August-Bibliothek Wolfenbüttel
Staats- und Universitätsbibliothek Göttingen
Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen mbh

Drittmittelgeber

Deutsche Forschungsgemeinschaft (DFG)

Kontakt

Reinhard Altenhöner
Generaldirektion
Ständiger Vertreter des Generaldirektors
Tel.: +49 30 266 431 400
reinhard.altenhoener@sbb.spk-berlin.de
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz

Mehr erfahren zum Projekt

OCR-D