Das Zeitungsportal zeit.punkt NRW erhält eine Volltextsuche!

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Ralf-I-vonderMark
    Super-Moderator
    • 02.01.2015
    • 2879

    #61
    Hallo zusammen,

    Herr Michael Herkenhoff hat gestern nochmals auf das Webinar hingewiesen!

    Am Montag, 15.04., findet von 18:00 – 20:00 ein Webinar (Videositzung) zu zeit.punktNRW statt. Dazu sind bis jetzt über 100 Anmeldungen eingegangen, darunter auch zahlreiche Teilnehmerwünsche aus dieser Gruppe. Ihr könnt Euch immer noch anmelden. Anmeldung und Registrierung sind kostenlos. Den entsprechenden Link findet Ihr hier:
    https://lwl-org.zoom-x.de/webinar/re...R22_sVyzGCbRCg

    Wir werden im Laufe der Sitzung Eure Fragen zum Zeitungportal beantworten, die während der Sitzung mündlich oder per Chat oder vorab über eMail bei uns eingegangen sind.
    Seid neugierig!
    Beteiligt Euch!
    Stellt Fragen!
    Lasst Euch informieren!

    vgl. https://www.facebook.com/groups/186939308645008/

    Viele Grüße
    Ralf

    Kommentar

    • Ralf-I-vonderMark
      Super-Moderator
      • 02.01.2015
      • 2879

      #62
      Hallo zusammen,

      Michael Herkenhoff hat heute wieder eine neue Mitteilung zum aktuellen Stand der Digitalisierung der Zeitungen aus dem Barbarastollen gemacht:

      Die Digitalisierung der Zeitungen aus dem Barbarastollen für das Jahr 2024 ist inzwischen abgeschlossen. Die Dateien werden jetzt in das System eingespielt. Es handelt sich um Scans von 191 Masterfilmrollen mit jeweils 60 m Länge. Das Mengengerüst ist umfangreicher als vorher kalkuliert. Ich hatte mit knapp 430.000 Dateien gerechnet. Tatsächlich sind es gut 475.000 geworden. Bis wir alle Zeitungen nach Tagesausgaben strukturiert und freigegeben haben, wird es aber eine geraume Zeit dauern.

      Rheinland
      StA Emmerich
      Allgemeine politische Nachrichten 1812-1813
      Amtliches Mitteilungsblatt Kreis Rees 1945
      Bote vom Niederrhein 1915,1916, 1934
      Bürgerblatt 1848,1914-1915, 1927
      Rheinische Post
      Neuss-Grevenbroicher Zeitung 20.01.1874-30.11.1936
      StA Mönchengladbach
      Gladbacher Kreisblatt 1851, 1863-1864
      Rheydter Zeitung 01.01.1873-12.12.1874, 03.01.1877-31.12.1880,
      02.01.1912-31.07.1933, 01.08.1933-27.06.1940:

      Rheinische Frauenzeitung 19.08.1921-05.01.1922
      StA Krefeld
      Niederrheinische Volkszeitung 02.01.1878-25.05.1898
      Rheinisches Sonntagsblatt 23.09.1877-30.03.1879
      Kr StBü Gummersbach
      Gummersbacher Zeitung 02.01.1900-31.12.1917
      StA Wuppertal Täglicher Anzeiger
      01.01.1896-31.12.1905
      StA Geilenkirchen
      Geilenkirchener Zeitung 26.01.1878-30.06.1837
      Westfalen
      StA Soest
      Soester Kreisblatt 01.01.1841-29.06.1935
      Soester Wochenblatt 08.05.1819-25.12.1840
      Tag des Herrn 29.11.1859-28.12.1919
      Heimatglocken 1914-1924, 1939-1941, 1943
      Mitteilungsblatt 20.07.1945-10.08.1945
      vgl. https://www.facebook.com/groups/186939308645008/

      Voraussichtlich wird die nächste Tranche der Zeitungen, die neu durch eine Texterkennung gelaufen sind, ca. 800.000 Seiten, welche dann alle bis Ende 2023 freigegebenen Titel umfasst, im Mai eingespielt werden.

      Viele Grüße
      Ralf

      Kommentar

      • Ralf-I-vonderMark
        Super-Moderator
        • 02.01.2015
        • 2879

        #63
        Hallo zusammen,

        Michael Herkenhoff hat heute wieder eine neue Mitteilung zum Stand des Digitalisierungsprojekts veröffentlicht.

        Nachfolgend einige Neuigkeiten zum Projekt wie auch zu dieser Facebookgruppe
        1. Mit 15.048938 Seiten sind inzwischen mehr als 15 Millionen Seiten im Volltext durchsuchbar. Damit sind momentan für etwas über 92 % der freigegebenen Zeitungsseiten Volltexte verfügbar. Zeit.punktNRW ist damit nicht nur bei weitem das größte deutsche Zeitungsportal in Deutschland, sondern auch das Angebot mit den meisten Volltexten. Momentan läuft eine weitere umfangreiche Einspielung von Volltexten. Wenn diese abgeschlossen ist, werden ca. 15.600.000 Seiten im Volltext vorliegen. Darüber hinaus ist zwischenzeitlich eine weitere Ausschreibung und auch Auftragsvergabe zur OCR-Erkennung erfolgt. Den Zuschlag hat wiederum READ COOP mit der Software Transkribus erhalten. Es geht also weiter!
        2. Wir haben inzwischen eine Berechnung der noch verbleibenden Mengengerüste durchgeführt. Wir sind dabei auf ein Gesamtvolumen von gut 27 Millionen Seiten gekommen, die zu digitalisieren sind. Dies liegt deutlich über der ursprünglichen Annahme von 20 Millionen Seiten. Wir werden deshalb nach Ende der jetzigen Förderphase 2025 eine Verlängerung des Projektes um weitere drei Jahre beantragen. Wenn dieser Antrag bewilligt wird, dauert das Projekt dann insgesamt 12 Jahre (nicht 10).
        3. Wir haben im letzten Jahr bei einem Dienstleister Masterfilme Kölner Zeitungen gekauft, die wir zusammen mit anderen Filmen Kölner Zeitungen im nächsten oder übernächsten Jahr digitalisieren werden. Es handelt sich um ca. 1.000.000 Seiten, darunter auch wichtige Parteizeitungen oder parteinahe Blätter wie etwa die „Kölnische Volkszeitung“ oder die „Rheinische Zeitung“. Sind diese Zeitungen digitalisiert und online gestellt, ist eine erhebliche Lücke in unserem Angebot geschlossen.
        4. Wir haben bei unserer Lenkungskreissitzung am Freitag der letzten Woche auch über unsere Öffentlichkeitsarbeit gesprochen. Mein Kollege Andrea Ammendola und ich haben in den letzten Wochen und Monaten auch einige Vorträge gehalten. Diese findet Ihr hier:



        Am nächsten Donnerstag halten wir beide auch einen Vortrag über zeit.punktNRW auf der Bibliocon 2024 (Bibliothekartag) in Hamburg.

        Wir haben auch über das Webinar zu zeit.punktNRW gesprochen, das wir Mitte April abgehalten haben. Wir waren uns grundsätzlich einig, dass wir in regelmäßigen Abständen in Videositzungen über unser Projekt informieren wollen. Wir werden uns voraussichtlich nach den Sommerferien in einer kleinen Gruppe zusammensetzen, um zu besprechen, wie wir diese Veranstaltung mit etwas weniger Aufwand und weniger restriktiv regelmäßig wiederholen. Dazu halte ich Euch auf dem Laufen.
        5. Die Benutzungszahlen zu dem Portal sind 2024 noch einmal stark angezogen. Die Zahl der PDF-Downloads liegt nach nur fünf Monaten schon jetzt höher als 2023, und auch bei den Besuchen (unique visitors) zeichnet sich nach jetzigem Stand eine Zunahme um gut 50% ab. Dies ist zu einem großen Teil sicher auf automatisierte Besuche und Downloads zurückzuführen, daneben natürlich auch auf die ständige wachsende Benutzung des Portals durch Wissenschaftler und die allgemeine Öffentlichkeit.
        6. Ich habe noch immer erhebliche Schwierigkeiten, Beiträge in dieser Gruppe in anderen Gruppen zu teilen. Ich kann nur in einem Bruchteil der Gruppen teilen, in denen ich Mitglied bin, dazu kommen die geteilten Beiträge in den anderen Gruppen nicht an. Auf meine Beschwerden bei Facebook ist bisher keine Reaktion erfolgt. Von daher bitte ich Euch, dass Ihr meine Posts selber in allen relevanten Gruppen teilt. Das würde uns und mir sehr helfen!!
        vgl. https://www.facebook.com/groups/186939308645008/

        Demnach sind in den nächsten Jahren noch viele neue Zeitungen zu erwarten, welche nach der Digitalisierung im Volltext durchsuchbar sein werden und uns das Auffinden neuer Erkenntnisse und Spuren ermöglichen.

        Viele Grüße
        Ralf

        Kommentar

        Lädt...
        X