|
Volltextsuche über digitalisierte Seiten
Bei der Entwicklung von arbeiterzeitung.at wurde auch
nach geeigneten Verfahren für die Volltextsuche in den
Zeitungsseiten gesucht. Das Ergebnis wird hier an einer
besonderen Ausgabe beispielhaft illustriert: Anhand der
AZ vom 22.Juni 1978, der Ausgabe mit der
Berichterstattung nach Österreichs 3:2 Sieg über
Deutschland bei der Fuball-WM.
Eine der relevantesten Fragen für gute Archivnutzbarkeit
ist jene nach der Möglichkeit zur Volltextsuche durch
OCR-Erkennung (Original Character Recogniton)
digitalisierter Daten.
Die Mitarbeiter von Kaltenbrunner Medienberatung und
scharf_net haben dazu mehrere Versuchsprojekte
beobachtet, mit internationalen Experten verschiedene
Programme und Verfahren getestet. Das derzeit mögliche
Ergebnis wird anhand der Ausgabe vom 22.6.1978
dargestellt.
Mit etwa 95 prozentiger Sicherheit werden Suchworte in
den digitalisierten Seiten tatsächlich erkannt.
Mit entsprechendem Aufwand ist eine intelligente Volltextsuche in
historischen Zeitungsbeständen möglich
Für die praktische Umsetzung anhand der
Arbeiter-Zeitung in großem Umfang fehlt aber derzeit
noch das Budget. Grundsätzlich sind die ganz neuen
Erfahrungen und Verfahren aber für jede
Nachbearbeitung von Printoriginalen (auch von Mikrofilm)
anwendbar und können dabei die Produktionskosten
drastisch reduzieren oder derartige Projekte überhaupt
erst finanzierbar - und bei kommerzieller Anwendung
rasch refinanzierbar - machen.
|