OCR-D
Projektziel
Das Projekt OCR-D verfolgt das Ziel, Verfahren der automatischen Texterkennung (OCR) von historischen Drucken als Open Source Software aufzubereiten und verfügbar zu machen, um mittelfristig alle Werke in den VD (Verzeichnisse der deutschsprachigen Drucke) mit qualitativ hochwertigem Volltext zu versehen. Phase I (2016-2018) des Projekts evaluierte den Stand der Forschung und entwickelte ein Funktionsmodell für OCR-Workflows. In Phase II (2018-2020) wurden in acht Modulprojekten Lösungen für fehlende oder unterentwickelte Komponenten im OCR-Workflow entwickelt. In Phase III des Projekts (2021-2024) arbeiten neben dem Koordinierungsprojekt drei Modulprojekte an der Weiterentwicklung einzelner Komponenten des OCR-D-Workflows, während sich vier Implementierungsprojekte verschiedene Einsatzszenarien in Bibliotheken und Archiven ausarbeiten.
Projektzeit
2016 - 2024
Projektpartner
Berlin-Brandenburgische Akademie der Wissenschaften
Herzog-August-Bibliothek Wolfenbüttel
Staats- und Universitätsbibliothek Göttingen
Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen mbh
Drittmittelgeber
Deutsche Forschungsgemeinschaft (DFG)
Kontakt
Reinhard Altenhöner
Generaldirektion
Ständiger Vertreter des Generaldirektors
Tel.: +49 30 266 431 400
reinhard.altenhoener@sbb.spk-berlin.de
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz