Meine Erfahrung mit einem Buch-Scanner inkl. OCR-Texterkennung

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Ilja_CH
    Erfahrener Benutzer
    • 05.11.2016
    • 1030

    Meine Erfahrung mit einem Buch-Scanner inkl. OCR-Texterkennung

    Ich habe seit Jahren zu Hause einen Flachbrettscanner und nutze diesen sehr oft. Meistens scanne ich die Sachen in 600 DPI und speichere diese als JPG.

    Um jedoch ganze Bücher einzuscannen, ist der Flachbrettscanner jedoch aus diversen Gründen nicht geeignet:

    - Das Scannen mit einer guten Auflösung eines Flachbrettscanners braucht seine Zeit, mit der Anzahl Seiten multipliziert ergibt sich ein enormer Aufwand
    - Die meisten Flachbrettscanner sind für Format A4 geeignet, nicht jedoch für A3
    - Flachbrettscanner haben nicht zwingend eine OCR-Erkennung integriert
    - Möchte man ein Buch, ein Heft o. Ä. einscannen, muss man dieses nach jedem Scan mühsam rausnehmen, umblättern und wieder hinlegen, noch mehr Zeitaufwand
    - Bei dicken Büchern wird es schwierig, die Seite gut bis zur Buchmitte zu scannen
    - Bei alten Büchern gibt es ein Risiko, das Buch zu beschädigen, wenn man es flach drückt
    - Die meisten Flachbrett-Scanner sind nicht mobil


    Ich hatte meine Gründe, mir einen Buch-Scanner zu zulegen.

    Gründe, um ein Buch einzuscannen, könnten sein:

    - ihr habt ein altes Buch, das im Zusammenhang mit eurer Familiengeschichte steht, es steht aber in den Antiquariaten nicht mehr zur Verfügung, der Scan des Buches ist als Schutz gedacht, falls euer Exemplar eines Tages wegen welchen Gründen auch immer kaputt gehen sollte (besser eine digitale Kopie als gar kein Exemplar)
    - ihr habt ein altes Buch, das im Zusammenhang mit eurer Familiengeschichte steht, und ein anderes Familienmitglied hätte das Buch auch gerne. Ihr prüft zwar ein paar Mal pro Jahr Antiquariate, aber bis ihr vom Buch ein weiteres Exemplar findet, könnt ihr dem anderen Familienmitglied zumindest eine digitale Kopie geben
    - Ihr wollt in ein Archiv, reist ins Ausland, oder einfach in eine andere Stadt und wollt einige Bücher im Zusammenhang mitnehmen. So könnt ihr die Scans der Bücher mitnehmen (z. B. auf dem Tablett), anstatt echte Bücher mitschleppen zu müssen (spart Platz und Gewicht)
    - Ihr habt einen riesigen Band (z. B. Archivführer) mit vielen Infos und wollt euch die OCR-Erkennung zu nutze machen, schnell im PDF nach einem Namen, Orten, Beruf, Stadt, Verein o. Ä. Schlüsselbegriffen zu suchen. So könnt ihr viel schneller überprüfen, ob es für euch ev. wichtige Bestände gibt, als nur anhand vom Inhaltsverzeichnis. Je nach PDF-Software könnt ihr auch ohne Probleme mehrere PDFs gleichzeitig nach Wörtern durchsuchen mit verschiedenen Optionen (ganze Wörter, Teil vom Wort usw.).
    - Der Buch-Scanner ist zudem mobil und kann besser als ein Flachbrettscanner eingepackt und z. B. zu einem Bekannten mitgenommen werden, um dort Sachen einzuscannen.

    Es gibt viele verschiedene Buch-Scanner. Ich muss gestehen, ich habe mir nicht die Mühe gemacht, Bewertungen zu lesen oder Produkte zu vergleichen. Als Schweizer habe ich direkt auf Digitec nach einem Buch-Scanner gesucht und ein Produkt von der Firma Czur gekauft. Von der Firma habe ich noch nie vorher gehört, es scheint verschiedene Typen Buch-Scanner von dieser Firma zu geben. Teure um ca. 800 Franken und auch preiswertere. Ich habe mich für das Mittelfeld entschieden, weil ich nicht das teuerste brauche, aber auch nicht das billigste Produkt möchte. Ich habe nur darauf geachtet, ein Produkt zu bestellen, das schon ein, zwei Bewertungen aufweist (kurioserweise ist der Preis nach meinem Kauf direkt etwas angestiegen, anscheinend gibt es auf dem IT-Markt aktuell starke Schwankungen).


    Der Buch-Scanner kommt daher mit:
    - einer schwarzen Matte, die man auf den Tisch legt
    - Allen notwendigen Kabeln (Strom, Verbindung zum PC)
    - Ein Fuss-Auslöser (Kabel vom Gerät zu einem Kipp-Schalter, der auf dem Boden steht und mit dem Fuss bedient werden kann)
    - CD (oder DVD) mit Software
    - Kurze Anleitung
    - „Seiten-Halter“

    Falls jemand ein Gerät ohne DVD/CD-Laufwerk besitzt, kann die Software vermutlich auch im Internet runtergeladen werden. Auf dem Scanner gibt es eine Seriennummer, diese wird benötigt, um die Software zu installieren.

    Sobald die Software installiert ist, den Scanner einschalten. Dazu mehr als drei Sekunden den Knopf drücken. Danach kann zwischen einem Licht- und Scan-Modus gewechselt werden. Im Lichtmodus kann man die Helligkeit des Hauptlichtes einstellen. Sobald das passt, wechselt man in den Scanner-Modus. Befindet man sich in diesem Modus, ist es Zeit, die Software zu starten und den Scan zu starten (rechts unten das Symbol anklicken).

    Im Scan-Modus:
    Ganz rechts kann man einstellen, ob man z. B. eine Seite einscannen möchte (gut um das Cover vorne einzuscannen) oder eine gebogene Doppelseite (gut für den Rest des Buches). Dabei sieht man auf dem Bildschirm vom PC oder Laptop immer die Live-Vorschau des auf der schwarzen Matte liegenden Buches. Selbst wenn das Buch wie im Demo-Video etwas schräg liegt und nicht genau der Falt dort ist wie im Hilfsraster, wird die Software dies trotzdem in 99% gut erkennen.


    Da nicht alles in einem Beitrag Platz hat, wird der Beitrag in zwei Teile aufgeteilt.
    Angehängte Dateien
    Zuletzt geändert von Ilja_CH; 01.05.2023, 21:04.
  • Ilja_CH
    Erfahrener Benutzer
    • 05.11.2016
    • 1030

    #2
    Auslöser:
    Entweder man klickt mit der Maus rechts unten auf das Scan-Symbol (noch nie so gemacht), oder man nutzt den Fussauslöser (sehr praktisch). Das “Pedal“. Der Vorteil liegt auf der Hand: man muss die Seiten vom Buch nicht loslassen, weil man die Hände frei hat. So kann man ein Buch sehr schnell einscannen.

    Buchseiten halten:
    Mitgeliefert werden zwei „Seiten-Halter“. Diese kann man gut nutzen, um das Buch offen zu halten, sollte es sich schliessen wollen. Nutzt man die Halter korrekt, werden diese aus dem Scan entfernt und man sieht auch nicht die Finger, Hände, Handgelenke. Wenn man nur weisse Handschuhe anhat und versucht, die Seiten mit den Fingern zu halten, sieht man immer die Fingerspitze auf dem Scan, je nach dem auch mehr vom Arm, was störend aussehen kann. Daher ist es ratsam, die „Seiten-Halter“ zu nutzen.

    Glänzende Seiten:
    Befindet man sich im Scanner-Modus, kann zwischen dem Hauptlicht und dem indirekten Licht umgeschaltet werden. So können auch Hochglanz-Seiten eingescannt werden. Zudem kann im Licht-Modus (nicht im Scan-Modus) die Lichtstärke reduziert werden. Für Fotos oder einzelne A4 würde ich weiterhin zum Flachbrett-Scanner greifen.

    Umgebung:
    Die Umgebung muss dunkel sein. Am helllichten Tag am Fenster oder mit eingeschaltetem Licht im Zimmer kann der Scan gestört werden. Beim Demo-Video (unten temporär verlinkt) habe ich vorhin die Vorhänge zugezogen, das Licht ausgemacht und die Türe geschlossen. Es war draussen noch nicht ganz dunkel. Aber meiner Meinung nach war es dunkel genug, um einen guten Scan zu machen.

    Scan-Qualität:
    Die Scan-Qualität hat im direkten Vergleich mit einem Flachbrett-Scanner keine Chance. Wenn ich eine Seite mit 600 DPI einscanne, als JPG speichere und den grossen Scan mit IrfanView zweimal verkleinere (danach immer noch gut lesbar und druckbar), habe ich eine viel schönere Qualität, als die mit dem Buch-Scanner eingescannten Bücher. Die Qualität der eingescannten Bücher ist jedoch meiner Meinung nach absolut ausreichend. Im Anhang ein Vergleich-Bild vom Flachbrett-Scanner. Zugegeben gibt es bei der Software vom Buch-Scanner zahlreiche Symbole, die ich bis jetzt nicht ausprobiert habe.

    Gebogene Seiten:
    Die Software vom Buch-Scanner begradigt die eingescannten Seiten so gut es geht.

    Geschwindigkeit:
    Pro Doppelseite dauert der Scan ca. 2 Sekunden. Danach blättert man zur nächsten Seite, während diese verarbeitet werden und kann sofort danach mit dem Fussauslöser den nächsten Scan auslösen. Hat man das ein paar Mal gemacht, hat man Übung und alle Arbeitsschritte gehen flüssig. Der Export als PDF mit der OCR-Verarbeitung dauert dabei natürlich auch seine Zeit.
    Beispiel: Für das Scannen, Export als OCR-PDF und Überprüfung mit PDF-Viewer (jede Seite durchgehen) für ein fast 500-seitiges Buch habe ich eineinhalb Stunden gebraucht.

    PDF-Bearbeitungsprogramm:
    Wer ein Programm besitzt, mit dem PDFs bearbeitet werden können (daher nicht nur ein Reader), ist klar im Vorteil. Falls man nach dem PDF-Export bemerkt, das man z. B. eine Doppelseite übersprungen hat, kann man diese nachträglich einzeln scannen und mit der PDF-Software ergänzen, ohne alles nochmals in der richtigen Reihenfolge einscannen zu müssen.
    Oder falls man während dem Scan aus Versehen die Seiten loslässt und der Scan schlecht wird, können diese beiden Seiten danach aus dem finalen PDF unkompliziert gelöscht werden.
    Bei meinen ersten Buch-Scan habe ich z. B. ein fast 800-seitiges Buch eingescannt und immer nach 150 Scans ein PDF exportiert (ich wollte vermeiden, das plötzlich nach 500 Seiten die Software abstürzt und alle Scans verloren sind). Am Ende habe ich die einzelnen PDFs mit meinem PDF-Bearbeitungsprogramm zu einem PDF zusammengesetzt.
    Bisher hat es jedoch mit dem Scaner und auch mit der Software keine Fehler oder Abstürze gegeben.

    Software:
    Bisher ist mir diese nicht abgestürzt. Ich würde jedoch während dem Scannen auf andere Aktivitäten verzichten, damit nicht Rechenleistung verloren geht. Ich schalte während dem Scannen sogar das Internet aus, damit nicht im Hintergrund irgendwelche Dienste alles langsamer machen. Bei einem Buch mit alter Schrift dauerte meiner Meinung nach alles etwas länger. Dies war ev. der alten Schrift geschuldet und/oder weil ich nebenbei im Internet war.

    Alte Schriften:
    Alte Schriften werden via OCR standardmässig nicht erkannt.



    Man muss sich gut überlegen, sich solch einen Buch-Scanner zu kaufen. Hat man nur ein Buch, das man einscannen möchte, könnte es preiswerter sein, das bei einem Scan- und Copy-Shop durch Profis einscannen zu lassen.



    Die auf den Bildern und im temporären Demo-Video gescannten Seiten dienen nur zur Demonstration!!

    Der hier vorgestellte Buch-Scanner:


    Demo-Video (temporär online, Link und Video werden später gelöscht):
    Angehängte Dateien

    Kommentar

    • Gastonian
      Moderator
      • 20.09.2021
      • 5084

      #3
      Hallo:


      Ich weiß nicht, ob dies auch in europäischen Forschungsbibliotheken angeboten wird, aber in der hiesigen Forschungsbibliothek, dem Library of Congress, wird auch so ein Buchscanner zur Eigenbenutzung im allgemeinen Lesesaal angeboten. Ich mag im besonderen die Fußpedaloperation - genau weil die Hände dadurch freigelaßen werden, kann man viel schneller einen Artikel oder Buchkapitel scannen als z.B. mit Handy abfotografieren. Auch wird der Artikel als ein Multipage-PDF gespeichert anstelle als einzelne JPEGs. Mit dem OCR habe ich hier aber keine Erfahrung.


      VG


      --Carl-Henry
      Wohnort USA

      Kommentar

      • Silvio52
        Erfahrener Benutzer
        • 17.06.2021
        • 282

        #4
        Danke für die ausführliche Beschreibung!
        Suche FN: Dülge (Stettin, Lublin) / Streich und Hintz (Großpolen, Lublin) / Seeger (Elbing, Danzig und Berlin) / Havemann, Thiede und Stolz (Breslau, Bernau und Berlin).

        Kommentar

        • GiselaR
          Erfahrener Benutzer
          • 13.09.2006
          • 2251

          #5
          Auch von mir vielen Dank für die Beschreibung. Das ist sehr hilfreich, weil ich schon länger überlege, einen Buchscanner anzuschaffen.
          Grüße
          Gisela
          Grüße Gisela

          Kommentar

          • Huber Benedikt
            Erfahrener Benutzer
            • 20.03.2016
            • 4663

            #6
            moing
            Der von Ilja verlinkte ist wohl zZ nicht lieferbar.

            Mir gehört weder Kaufland noch krieg ich eine Provision
            aber diesen Scanner find ich vom technischen her super und er ist beim K auch am preiswertesten bei kostenfreier Lieferung.
            Ursus magnus oritur
            Rursus agnus moritur

            Kommentar

            • BOR
              Erfahrener Benutzer
              • 24.06.2016
              • 2588

              #7
              Hallo,

              ist das nicht der gleiche:



              irgendwie machen mich solche immensen Preisunterschiede
              immer stutzig.
              Viele Grüße
              Torsten

              Ständige Suche:
              Büntig (Trebnitz?), Göldner (auch da?)
              Pfeiffer (Juliusburg, Kreis Öls), Hübner (auch da?)
              Lerke (Nowosolna)

              Meine Listen auf ArGeWe, (Forschung Torsten Bornheim) schaut vorbei .

              Kommentar

              • Huber Benedikt
                Erfahrener Benutzer
                • 20.03.2016
                • 4663

                #8
                Hi Bor
                von der typenbez. her müsste er identisch sein.
                Ich trau allerdings dem Laden nicht !!!
                KAMARA !!!!
                Fakeshop?

                Aha siehe da:


                klar dass man da Lockpreise macht...und dann wird aus dem Schnäppchen ein
                Griff ins Klo.
                Es wird ja ständig gepredigt, dass man bei vermeintlichen Superschnäppchen von Haus aus misstrauisch sein sollte.
                Von den realen Angeboten (auch über idealo)ist jedenfalls K am günstigsten für diesen Typ.
                Zuletzt geändert von Huber Benedikt; 03.05.2023, 11:23. Grund: Ergänzung
                Ursus magnus oritur
                Rursus agnus moritur

                Kommentar

                • Garfield
                  Erfahrener Benutzer
                  • 18.12.2006
                  • 2215

                  #9
                  Die Preisunterschiede beie Elektronik sind teilweise tatsächlich massiv, jeder Laden will halt Leute anziehen. Dafür ändern die Preise und auch die Verfügbarkeit der Artikel ständig (teilweise werden auch Artikel als lieferbar gelistet, bei denen man dann wochenlang warten muss).

                  Zum Scanner selber:
                  Danke für den ausführlichen Bericht! Ich habe mir so einen mobilen / kleinen Buchscanner auch schon überlegt. Gerade für Grossformate wie zB Kirchenbücher wäre sowas natürlich ideal.

                  Ansonsten sind meines Wissens tatsächlich immer mehr wissenschaftliche Bibliotheken (zB Universitätsbibliotheken) mit Buchscannern ausgerüstet. Ich meine aber, der Buchscanner bei uns (oder das Vorgängermodell, bin gerade nicht sicher) kann aber kein OCR. Das wäre viel teurer gewesen.
                  Nachdem mein Flachbettscanner ausgestiegen ist, habe ich mein restliches Familienarchiv (Fotos und Dokumente) am Multifunktionsdrucker in der Bibliothek gescannt. Der kann Format A3, OCR, ich bin mit der Farbausgabe zufrieden, und es sind viele weiteren Einstellungen möglich. Solche Multifunktionsdrucker (Drucken, Kopieren, Scannen in einem Gerät; sehen aus wie früher die grossen Kopiergeräte) sind bei Universitätsbibliotheken in der Schweiz und Deutschland immer mehr verbreitet. Und üblicherweise sind (grosse) Universitätsbibliotheken öffentlich .

                  Bei uns sind die Preise zum Drucken/Scannen günstiger als im Copyshop, aber das kann natürlich anderswo anders sein.
                  Viele Grüsse von Garfield

                  Kommentar

                  • Ilja_CH
                    Erfahrener Benutzer
                    • 05.11.2016
                    • 1030

                    #10
                    Wie gesagt, überlegt euch gut, ob der Kauf einen Sinn macht. Wie viele Bücher habt ihr tatsächlich, die ihr einscannen wollt? Gibt es in der Nähe eine Bibliothek, die das anbietet? Oder seid ihr in einem Ahnenforscher-Verein und das Gerät könnte euch als Gruppe dienen?

                    Im Anhang noch zwei Beispiele von altem Text, der nicht vom OCR erkennt wird. Interessanterweise sind einige Wörter oder Zahlen mit moderner Schrift verfasst und werden gefunden.


                    Es kann sein, dass es Programme gibt, die sogar alte Schrift versuchen mit OCR zu bespielen. Aber diese Software müsste man extra kaufen und vermutlich deckt sie nicht alles fehlerfrei ab.


                    Bei beiden Beispielen habe ich die Seitenhalter nicht verwendet, sondern nur mit dem Finger das Buch aufgehalten. Die Fingerspitze ist auf jeder Seite zu sehen und gelegentlich sind Nachscans nötig, wenn der halbe Arm oder die ganze Hand mitgescannt wird. Sonst sieht das beim Blättern im PDF etwas komisch aus.

                    Daher immer die Seitenhalter nutzen.
                    Angehängte Dateien

                    Kommentar

                    • Tulpenbaum
                      Erfahrener Benutzer
                      • 31.08.2021
                      • 295

                      #11
                      Nicht so komfortabel, aber bei wenigen Büchern machbar und hat Ergebnisse von sehr gute Qualität: Kamera auf Stativ, Fernauslöser, Fotosoftware zum automatischen Zuschneiden der Bilder oder manuell machen.
                      Ist allerdings teuer, wenn man keine gute Kamera hat....
                      Zuletzt geändert von Tulpenbaum; 07.05.2023, 19:50.

                      Kommentar

                      Lädt...
                      X