OCR-D: Robuste Verfahren für die Layout-Analyse
Projektziel
Das Vorhaben hat zum Ziel, die Qualität und Robustheit von technischen Verfahren für die Layoutanalyse historischer Dokumente in OCR-D zu verbessern und damit deren Praxistauglichkeit für die Massendigitalisierung sicherzustellen. Dazu werden bestehende Ansätze optimiert und erweitert sowie vielversprechende neue Verfahren integriert. Den Schwerpunkt der Arbeiten stellt die Weiterentwicklung komplementärer, auf Künstlicher Intelligenz beruhender Verfahren für die Layoutanalyse dar. Begleitet werden die Entwicklungen durch eine auf wissenschaftlichen Standard-Metriken beruhende Evaluation. Nicht zuletzt gilt es sicherzustellen, dass sämtliche Verfahren mit Schnittstellen versehen und im OCR-D-Framework integriert werden. Dies erlaubt es, einerseits die Verfahren zur Erzielung bestmöglicher Ergebnisse flexibel miteinander zu kombinieren und andererseits die Anpassbarkeit und Zukunftssicherheit im Hinblick auf neue Entwicklungen zu gewährleisten.
Projektzeit
2023 - 2025 (24 Monate)
Projektpartner
- Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden (SLUB Dresden)
- Zentrum für Philologie und Digitalität “Kallimachos” - Universität Würzburg (ZPD)
Drittmittelgeber
Deutsche Forschungsgemeinschaft (DFG)
Kontakt
Clemens Neudecker
Generaldirektion
Tel.: +49 30 266 434 081
clemens.neudecker@sbb.spk-berlin.de
Mehr erfahren zum Projekt
Das Projekt ist Teil von OCR-D - Koordinierte Förderiniative zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR)