kostenloses (online)-Programm für altdeusche ocr-Erkennung

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Fitsch
    Benutzer
    • 09.06.2012
    • 59

    kostenloses (online)-Programm für altdeusche ocr-Erkennung

    Hallo,

    ich bin gerade dabei die diversen Ortschroniken meiner Heimatgemeinde (insg. 6 handgeschriebene Bände aus den 20iger / 40iger Jahren) abzutippen um sie danach auf der Gemeindehomepage hochzuladen.

    Neben dieser regulären Chroniken ist mir ein besonderes Büchlein in die Hände gefallen (siehe Anhang)

    Doch bevor ich dieses mühsam abtippe ist mir die Idee gekommen ob es nicht eine ocr-Software gibt die diese (Maschinenfraktur)schrift lesen kann.

    So müsste ich nur das Buch einscannen und einer Neuauflage und Veröffentlichung stände nichts mehr im Wege.

    Horrido
    Fitsch
    Angehängte Dateien
  • StefOsi
    Erfahrener Benutzer
    • 14.03.2013
    • 4066

    #2
    Moin,

    generell gilt, das Frakturschrift sehr schwer für ocr-Software ist und, zumindestens bei opensource/freeware Programmen, meist eine Nachbearbeitung erfordert.

    Ansonsten kann ich nur das Programm tesseract-ocr empfehlen, welches auch eine Trainingsdatei für deutsche Frakturschrift enthält. Damit würde die Seite 2 deiner Beispieldatei bei mir wie folgt erkannt:

    I.

    Die Teilnehmer an den lslapoleonisthen kriegen
    von 1805—15

    Wenn schon im Jahre 1830 die von höschster Stelle ange-
    ordneten Erhebungen über die Teilnehmer an d-en Napo-
    leoniskhen Kriegen großen Schwierigkeiten begegneten und
    nur sehr magere Ergebnisse lieferten, im: Gegensatz zu den
    meisten Gedenktafeln des Bezirkeg Lindau, die Gedenk-
    tafiel in der Pfarrkirche in Opfenbach nur die Namen der
    Feldzugsteilnehmer enthält, dann hat sich sich-er Herr Gugen
    Kleiner, Bauer von Mellatz, ein großes Verdienst erwor-
    ben, daß er nachi mehr als hundert Jahren zu den Fest-
    stellungen von 1830 nochs Ergänzungen zu machen sich» be-
    müht hat. Die dürftigen Ergebnisse von 1830 beweisen aber
    auch, daß ohne heimatkundliche Aufzeichnungem Helden be-
    reitg nach 15 Jahre« zum großen Heer der unbekannten
    Soldaten einriicken

    1. Die auf der Gedenktafel verewigten
    gefallenen, vermißten und- im Feldzuge
    gestorbenen Krieggteilnehmer

    Nr. 1. B e e r M a r t i n. Erhebung 1830, daß er von
    Ruhlandg gebürtig, beim 2. leichten JnfanterieVataillon
    ,,Merz« gedient hat und« seit dem» ersten französischien Feld-
    zug vermißt wird. Nähere Zeit und Ort unbekannt.
    Wie du siehst ist es schon recht gut, aber man muss doch viel nachbessern.

    Kommentar

    • StefOsi
      Erfahrener Benutzer
      • 14.03.2013
      • 4066

      #3
      Ach ja, wen es interessiert. Hier mal eine interessante Studie der Uni Würzburg zum Thema - "Analysen und Heuristiken zur Verbesserung von OCR-Ergebnissen bei Frakturtexten".

      Kommentar

      • Maschenka
        Erfahrener Benutzer
        • 01.06.2008
        • 106

        #4
        Ich habe die zweite Seite spaßeshalber (und weil ich mein Guthaben von 165 Seiten bis Juli aufbrauchen muß) mal bei Abbyy Finereader Online hochgeladen und folgendes Ergebnis erhalten:

        === schnipp ===
        Me Kampfer
        für SeutManös Eh« rmö f«HM
        I.
        Die -ellnehmer an öen Kapsleonischen Kriegen
        von 18VS—IS
        Wenn schon im Jahre 1830 die von höchster Stelle angeordneten Erhebungen über die Teilnehmer an den Napo-leonischen Kriegen großen Schwierigkeiten begegneten und nur sehr magere Ergebnisse lieferten, im Gegensatz zu den meisten Gedenktafeln des Bezirkes Lindau, die Gedenktafel in der Pfarrkirche in Opfenbach nur die Namen der Feldzugsteilnehmer enthält, dann hat sich sicher Herr Eugen Kleiner, Bauer von Mellatz, ein großes Verdienst erworben, daß er nach mehr als hundert Jahren zu den Feststellungen von 1830 noch Ergänzungen zu machen sich bemüht Hat. Die dürftigen Ergebnisse von 1830 beweisen aber auch, daß ohne heimatkundliche Aufzeichnungen, Helden bereits nach 15 Jahren zum großen Heer der unbekannten Soldaten einrücken.
        1. Die auf der Gedenktafel verewigten
        gefallenen, vermißten und im Feldzuge gestorbenen Kriegsteilnehmer
        Nr. 1. Beer Martin. Erhebung 1830, daß er von Ruhlands gebürtig, beim 2. leichten Infanterie-Bataillon „Merz" gedient hat und seit dem ersten französischen Feldzug vermißt wird. Nähere Zeit und Ort unbekannt.
        Kirchliche Handlungen in Strehlen 1834-1846 durchsuchen: http://www.gunde.de/genealogie/texte...en-zeitung.php

        Kommentar

        • henry
          Erfahrener Benutzer
          • 18.05.2014
          • 2162

          #5
          hallo zusammen,

          Frakturen?
          ich benutze gern diese Link...
          http://www.buchbinderei-koester.de/download/Knigge_digital.pdf




          Gruss henry

          Kommentar

          • tkraemer
            Erfahrener Benutzer
            • 09.01.2013
            • 491

            #6
            das klappt nicht; sinnvoller ist es, den text abzulesen und die sprache direkt in text zu wandeln. hierfür gibts programme.

            die alten schriften kann man nicht durch die OCR Erkennung laufen lassen.

            Kommentar

            • Juergen
              Erfahrener Benutzer
              • 18.01.2007
              • 6066

              #7
              ... die alten schriften kann man nicht durch die OCR Erkennung laufen lassen.
              kann man schon, nur ist das Ergebnis sehr Fehler behaftet.
              Habe ich vor Jahren mit Abby Finereader Tage lang getestet und zwar mit
              Adressbüchern der Stadt Posen. Einen Lernmodus gibt es bei dem Programm auch.

              So ein Adressbuch will man sicher nicht ablesen und in Text umwandeln.

              Ausserdem verwendet Google-Books ebenfalls eine OcR-Software für die alten Bücher.

              Und erst dadurch finden wir auch Suchtreffer in den alten historischen Büchern in dt. Fraktur Druckschrift.
              Fehlerate weiß ich nicht? Mir hat das schon geholfen etwas in den Büchern zu finden

              Beispiel: Suche Napoleon.
              --> https://www.google.de/search?q=Napol...B&ved=0CA8QpwU

              Und String "Napoleon" im Buch:
              --> https://books.google.de/books?id=p0J...poleon&f=false

              Ich wäre begeistert, wenn alle Archive die historische Bücher und Zeitungen digitalisieren, solche zwar fehlerbehaftete OCR-Software einsetzen würden. Das wäre schon sehr nützlich, wenn man z.B. nach Familiennamen oder Orten in
              z.B. Zeitungen sucht.

              Vorbildlich ist Anno mit Volltext-Suche:
              --> http://anno.onb.ac.at/anno-suche/#se...de=list&from=1

              Bei dem ZEFS keinerlei OcR Einsatz obwohl meist nicht in Fraktur gedruckt wurde (außer DDR-Presse, trotzdem viele Fehler)
              --> http://zefys.staatsbibliothek-berlin.de/list/

              Aber wenn es um komplette fehlerfreie Bücher geht, würde ich auch keine OCR Software verwenden. Die Profi-Software ist sehr teuer.
              Außerdem viel zu viel Nacharbeit und Kontrolle nötig.

              Ob hier Umwandlung von Sprache in Text schneller geht als abschreiben?

              Gruß Juergen
              Zuletzt geändert von Juergen; 01.05.2015, 20:26.

              Kommentar

              Lädt...
              X