OCR-D: Robuste Verfahren für die Layout-Analyse

Projektziel

Das Vorhaben hat zum Ziel, die Qualität und Robustheit von technischen Verfahren für die Layoutanalyse historischer Dokumente in OCR-D zu verbessern und damit deren Praxistauglichkeit für die Massendigitalisierung sicherzustellen. Dazu werden bestehende Ansätze optimiert und erweitert sowie vielversprechende neue Verfahren integriert. Den Schwerpunkt der Arbeiten stellt die Weiterentwicklung komplementärer, auf Künstlicher Intelligenz beruhender Verfahren für die Layoutanalyse dar. Begleitet werden die Entwicklungen durch eine auf wissenschaftlichen Standard-Metriken beruhende Evaluation. Nicht zuletzt gilt es sicherzustellen, dass sämtliche Verfahren mit Schnittstellen versehen und im OCR-D-Framework integriert werden. Dies erlaubt es, einerseits die Verfahren zur Erzielung bestmöglicher Ergebnisse flexibel miteinander zu kombinieren und andererseits die Anpassbarkeit und Zukunftssicherheit im Hinblick auf neue Entwicklungen zu gewährleisten.

Projektzeit

2023 - 2025 (24 Monate)

Projektpartner

Drittmittelgeber

Deutsche Forschungsgemeinschaft (DFG)

Kontakt

Clemens Neudecker
Generaldirektion
Tel.: +49 30 266 434 081
clemens.neudecker@sbb.spk-berlin.de

 

Mehr erfahren zum Projekt

Das Projekt ist Teil von OCR-D - Koordinierte Förderiniative zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR)