Bereichsnavigation

Informationen zur Ausschreibung „Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke“

Die vollständige Massenvolltextdigitalisierung aller historischen Drucke aus dem Zeitraum des 16. bis 19. Jahrhunderts mit Verfahren der Optical Character Recognition (OCR) stellt eine besondere technische und organisatorische Herausforderung dar. Daher fördert die Deutsche Forschungsgemeinschaft seit 2015 ein Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren (kurz OCR-D), um in Kollaboration von Wissenschaft und Infrastruktureinrichtungen dieser Herausforderung zu begegnen. Auf der Basis der organisatorischen, technischen und inhaltlichen Vorbereitungen von OCR-D folgt nun eine Ausschreibung zur Entwicklung kreativer, innovativer, skalierbarer und optimierender Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke.

Es können Mittel für Vorhaben beantragt werden, die Lösungen für eines oder mehrere der folgenden Module im von OCR-D entwickelten Funktionsmodell anstreben: 1) Bildvorverarbeitung, 2) Layouterkennung, 3) Textoptimierung, 4) Modelltraining, 5) Langzeitarchivierung und Persistenz, oder 6) Qualitätssicherung. Voraussetzung zur Förderung ist die Bereitschaft zur abgestimmten Zusammenarbeit mit OCR-D, sodass die zu implementierenden Lösungen sich nahtlos in das von OCR-D entwickelte Funktionsmodell zur Texterfassung integrieren. Die Lösungen der Vorhaben sollen eine hochperformante, flexible, skalierbare und nachhaltige Komponente für die Massenvolltextdigitalisierung bilden.

Am Ende des Gesamtvorhabens soll ein konsolidiertes Verfahren zur OCR-Verarbeitung von Digitalisaten des gedruckten deutschen Kulturerbes des 16. bis 19. Jahrhunderts erarbeitet worden sein. Das Erreichen dieses Ziels ermöglicht dann – nach Implementierung in den Digitalisierungsworkflows der Bibliotheken und Durchführung der Volltextdigitalisierung – die Nutzung von digitalen Volltexten in vielen Wissenschaftsdisziplinen, insbesondere im Bereich der geisteswissenschaftlichen Forschung.

Interessenteninnen und Interessenten werden gebeten, bis zum 26. April 2017 eine Absichtserklärung einzureichen. Förderanträge können bis zum 31. Mai 2017 eingereicht werden.

Weitere Informationen:

Ansprechpersonen

Bei Rückfragen und zur Beratung wenden Sie sich bitte an:

  • Förderbedingungen und Förderfragen:
    Dr. Matthias Katerbow,
    Tel. +49 228 885-2358,
    Matthias.Katerbow@dfg.de
  • Inhaltliche und organisatorische Fragen:
    OCR-D Koordinierungsprojekt
    Elisa Herrmann,
    Tel. +49 5331 808-306,
    Elisa.Herrmann@hab.de

Zusatzinformationen

© 2010-2017 DFG Aktualisierungsdatum: 03.03.2017Sitemap  |  Impressum  |  Datenschutzerklärung  |  Kontakt  |  RSS Feeds

Textvergrößerung und Kontrastanpassung