Hallo zusammen,
für das Zeitungsportal NRW (= zeit.punkt NRW) wird eine Volltextsuche installiert werden; wenn auch erst abschließend eine Volltextsuche für alle Zeitungen im Jahr 2022 erfolgen kann.
„Der Auftrag zur OCR-Erkennung ist vergeben, der Volltext wird mit der Software Transkribus Platform erzeugt werden. In diesem Jahr wird mit einer Zeitung ein Testlauf durchgeführt, um Workflows und Verfahren zu proben. Ab 2021 wird der gesamte Bestand nach und nach texterkannt. Ende 2022 werden alle Zeitungen im Volltext durchsuchbar sein. Dazu wird voraussichtlich 2022 die Suchoberfläche angepasst.“
vgl. https://www.compgen.de/2020/07/histo...esbar-gemacht/
Aber es gibt bereits eine erste Zeitung mit Volltextsuche!
Derzeit sind bei zeit.punkt NRW 236 Titel aufgelistet. Am 06.02.2019 waren bei zeit.punkt NRW 138 Zeitungen aufgeführt, so dass in 17 Monaten 98 dazu gekommen sind.
„Aus den Digitalen Sammlungen der Universitäts- und Landesbibliothek Düsseldorf hat das Zeitungsportal zahlreiche Düsseldorfer Zeitungen übernommen, die in den nächsten Wochen vorgestellt werden sollen. Die Digitalisierung dieser Blätter ist nicht vom Film erfolgt, sondern direkt vom Original. Die Qualität der Digitalisate ist damit sehr gut. Zudem sind die Zeitungen durch eine Texterkennung gelaufen, so dass sie im Volltext durchsuchbar sind.“
(vgl. Artikel vom 28.06.2020 von Michael Herkenhoff auf FACEBOOK; erreichbar über o.g. Link)
Denn am 12.07.2020 wurde aus den Digitalen Sammlungen der ULB Düsseldorf die "Düsseldorfer Zeitung" in das Portal übernommen. Eingestellt sind Ausgaben vom 1. Januar 1814, also vom Ende der französischen Herrschaft, bis zum Jahr 1848. Zeitweise erschien das Blatt auch unter dem Namen "Neue Düsseldorfer Zeitung". Wie alle aus der ULB Düsseldorf übernommenen Titel ist die Zeitung im Volltext durchsuchbar.
(vgl. Artikel vom 12.07.2020 von Michael Herkenhoff auf FACEBOOK; erreichbar über o.g. Link)
Das ist m.E. ein sehr guter Ausblick, auch wenn eine Wartezeit von bis zu 2 ½ Jahren mit viel Geduld überstanden werden muss. Aber sobald die Volltextsuche für alle Zeitungen funktioniert, können wir bestimmt auf viele neue und möglicherweise auch überraschende Funde hoffen.
Viele Grüße
Ralf
für das Zeitungsportal NRW (= zeit.punkt NRW) wird eine Volltextsuche installiert werden; wenn auch erst abschließend eine Volltextsuche für alle Zeitungen im Jahr 2022 erfolgen kann.
„Der Auftrag zur OCR-Erkennung ist vergeben, der Volltext wird mit der Software Transkribus Platform erzeugt werden. In diesem Jahr wird mit einer Zeitung ein Testlauf durchgeführt, um Workflows und Verfahren zu proben. Ab 2021 wird der gesamte Bestand nach und nach texterkannt. Ende 2022 werden alle Zeitungen im Volltext durchsuchbar sein. Dazu wird voraussichtlich 2022 die Suchoberfläche angepasst.“
vgl. https://www.compgen.de/2020/07/histo...esbar-gemacht/
Aber es gibt bereits eine erste Zeitung mit Volltextsuche!
Derzeit sind bei zeit.punkt NRW 236 Titel aufgelistet. Am 06.02.2019 waren bei zeit.punkt NRW 138 Zeitungen aufgeführt, so dass in 17 Monaten 98 dazu gekommen sind.
„Aus den Digitalen Sammlungen der Universitäts- und Landesbibliothek Düsseldorf hat das Zeitungsportal zahlreiche Düsseldorfer Zeitungen übernommen, die in den nächsten Wochen vorgestellt werden sollen. Die Digitalisierung dieser Blätter ist nicht vom Film erfolgt, sondern direkt vom Original. Die Qualität der Digitalisate ist damit sehr gut. Zudem sind die Zeitungen durch eine Texterkennung gelaufen, so dass sie im Volltext durchsuchbar sind.“
(vgl. Artikel vom 28.06.2020 von Michael Herkenhoff auf FACEBOOK; erreichbar über o.g. Link)
Denn am 12.07.2020 wurde aus den Digitalen Sammlungen der ULB Düsseldorf die "Düsseldorfer Zeitung" in das Portal übernommen. Eingestellt sind Ausgaben vom 1. Januar 1814, also vom Ende der französischen Herrschaft, bis zum Jahr 1848. Zeitweise erschien das Blatt auch unter dem Namen "Neue Düsseldorfer Zeitung". Wie alle aus der ULB Düsseldorf übernommenen Titel ist die Zeitung im Volltext durchsuchbar.
(vgl. Artikel vom 12.07.2020 von Michael Herkenhoff auf FACEBOOK; erreichbar über o.g. Link)
Das ist m.E. ein sehr guter Ausblick, auch wenn eine Wartezeit von bis zu 2 ½ Jahren mit viel Geduld überstanden werden muss. Aber sobald die Volltextsuche für alle Zeitungen funktioniert, können wir bestimmt auf viele neue und möglicherweise auch überraschende Funde hoffen.
Viele Grüße
Ralf
Kommentar