Texte in PDF Korrigieren

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Reiner Addams
    Benutzer
    • 17.04.2011
    • 9

    Texte in PDF Korrigieren

    Hallo,

    kennt jemand einen PDF-Editor, der in vorhandenen PDFs (Scans von alten Dokumenten mit OCR) den im Dokument hinterlegten Text ändern kann?

    Hintergrund: viele meiner als PDF vorhandenen Dokument sind von der automatischen Texterkennung fehlerbehaftet erstellt worden. Da ich bei meiner Ahnenforschung auf mein komplett indiziertes Archiv zugreife, findet der Rechner viele entsprechenden Dateien nicht. Beispiel: ich suche in einem Überordner nach dem Begriff "Gaistauden". Textstellen wie "G A I S T A U D E N" oder "Geistauden" werden natürlich nicht angezeigt.

    Es muss doch eine Möglichkeit geben, diese "unsichtbaren" weil hinter der Grafik versteckten Textstellen sichtbar zu machen, um sie dann zu verbessern.

    VG Reiner
  • Xtine
    Administrator
    • 16.07.2006
    • 28400

    #2
    Hallo Reiner,

    die kostenpflichtigen Versionen der bekannten PDF Editoren sollten es können.
    Auch manche online Editoren werben damit, daß Text bearbeitet werden kann.
    Einfach mal googeln, teilweise kann man vorher testen.
    Viele Grüße .................................. .
    Christine

    .. .............
    Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
    (Konfuzius)

    Kommentar

    • Reiner Addams
      Benutzer
      • 17.04.2011
      • 9

      #3
      Hallo Christine,


      danke für Deine Antwort. Die die ich ausprobiert habe, können nur (begrenzt) Texte verändern, nämlich in den PDFs, die von einem Textverarbeitungsprogramm heraus generiert wurden. Das ist aber bei meinen PDFs nicht der Fall. Stell Dir einen in den 50er Jahren schreibmaschinengeschriebenen Text vor. Der wird in einer PDF-Datei im Original dargestellt. Im Hintergrund nicht sichtbar, liegt der in Details falsche Text, den ich halt gerne korrigieren möchte. Google habe ich sehr lange befragt und nur Links genannt bekommen, von Programmen die o.g. PDFs korrigieren können.


      Deshalb war ja meine Hoffnung, dass es hier jemanden gibt, der/die mit dem gleichen Problem zu kämpfen und eine Lösung gefunden hat.


      Beste Grüße Reiner

      Kommentar

      • Xtine
        Administrator
        • 16.07.2006
        • 28400

        #4
        Hallo Reiner,

        Wird das nicht hier beschrieben?
        Viele Grüße .................................. .
        Christine

        .. .............
        Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
        (Konfuzius)

        Kommentar

        • rpeikert
          Erfahrener Benutzer
          • 03.09.2016
          • 2673

          #5
          Guten Tag

          Das Problem ist ja, dass die Schrift gar nicht sichtbar ist, weil das PDF zusätzlich noch das gescannte Bild enthält. Die Frage ist jetzt, verbirgt sich der Text (schwarz auf weiss) hinter dem Bild oder liegt er (in transparenter "Farbe") vor dem Bild.

          Im ersten Fall könnte man versuchen, das Bild zu löschen. Vielleicht kommt der gelesene Text dann zum Vorschein. Dann könnte man ihn editieren und am Schluss das Bild wieder hinzufügen.

          Im zweiten Fall müsste man versuchen, die Textfarbe von "transparent" z.B. auf "rot und opak" zu ändern (und nach dem Editieren wieder zurück).

          Gruss, Ronny

          Kommentar

          • ole
            Erfahrener Benutzer
            • 05.12.2014
            • 154

            #6
            Hallo,
            meines (Halb-)Wissens nach liegen Bild und Text möglicherweise in unterschiedlichen Layern (Ebenen). Man bräuchte also einen PDF-Editor, der damit klar kommt und wo man die Ebenen umschalten kann.


            Viele Grüße
            Olaf

            Kommentar

            • memo
              Erfahrener Benutzer
              • 19.01.2009
              • 315

              #7
              Hallo Reiner,

              es ist schon einige Zeit her, dass ich FlexiPDF von Softmaker benutzt habe. Vielleicht erfüllt es aber die von dir gewünschten Aufgaben. Probier's einfach mal mit der Demo-Version aus:

              Download: Kostenlose Testversion von FlexiPDF für Windows. Die Alternative zu Adobe Acrobat mit DSGVO-konformen Datenschutz.


              Gruß, memo

              Kommentar

              • Ilja_CH
                Erfahrener Benutzer
                • 05.11.2016
                • 753

                #8
                Selbst wenn es sich beim PDF um einen gescannten Text (z. B. maschinengeschriebene Buchseite von z. B. 1950) handelt, können gewisse teure PDF-Programme daraus einen OCR-Text «erkennen» lassen. So kann zumindest nach dem Text oder nach einzelnen Wörtern in der entsprechenden Datei gesucht werden. Da ist es nicht mehr weit, z. B. einzelne Wörter ggf. korrigieren zu können. Selbst wenn das Bild nicht «korrigiert» werden kann, kann mit einer Textfunktion sicher über das Wort rüber geschrieben werden. Dabei natürlich selbe Schriftart, Farbe und Grösse einstellen und einen Texthintergrund. So kann ein falsches Wort durch ein korrektes ersetzt werden. Aber das ist manuelle Arbeit.

                Kommentar

                • Reiner Addams
                  Benutzer
                  • 17.04.2011
                  • 9

                  #9
                  Hallo in die Runde,


                  erst einmal vielen Dank für die Antworten. Die Bearbeitung von bereits mit OCR versehenen PDF-Dateien scheint ein kompliziertes Feld zu sein. Ich habe zwischenzeitlich mit Adobe Acrobat Pro versucht mein Problem zu lösen; mit mäßigem Erfolg. Hier will Acrobat nur einen geringen Anteil des vorhandenen Textes erkennen und dann auch bearbeiten können. Ich denke, dass @ole da am nächsten liegt mit seiner Vermutung der "unterschiedlichen Layern". Ich bin nämlich auch mit der Vorstellung gestartet, dass Acrobat Zugriff auf alle Layer hat. Weitgefehlt.


                  Nur noch mal zur Erläuterung falls noch jemand eine Idee hat: Ich möchte


                  a) meine vorhandenen Dokumente, die mir schon als OCR-indizierte pdf-Dateien vorliegen korrigieren
                  b) nicht automatisch indizierbare PDF-Dateien (mit Kurrentschrift, Sütterlin etc) die derzeit vorhandene OCR-Programme nicht indizieren können nachträglich mit Text versehen, der quasi im Hintergrund (nicht sichtbar) in den Dokumenten an den entsprechenden Stellen hinterlegt ist.


                  Ich werde der Idee von @ole, wenn ich wieder Zeit habe, folgen und nach entsprechenden Programmen suchen. Sobald ich einen gangbaren Weg gefunden habe, melde ich mich noch mal.


                  Vielen Dank noch mal an alle


                  Reiner

                  Kommentar

                  • Sedulus
                    Erfahrener Benutzer
                    • 11.11.2018
                    • 867

                    #10
                    Hallo Reiner,

                    hast du es mal PDF24 Tools probiert?

                    Gruß
                    Peter
                    Auf der Suche nach den Familien

                    Neugebauer, Wax, Metzner, Tillmann, Neumann, Klein, Siegert und Klose

                    in Schlesien, und den Familien

                    Kral, Schulz (Sulc), Pawelka, Soboda, Tregler/Trägler, Mareček, Frisch, Heyack, Buda, Schwipp, Beyer und Titl

                    im Sudetenland.

                    Kommentar

                    • Balthasar70
                      Erfahrener Benutzer
                      • 20.08.2008
                      • 2645

                      #11
                      Hallo,
                      mit diesem Programm hier lässt sich wohl auch auf OCR-Ebene der Text korrigieren:

                      Gruß Balthasar70

                      Kommentar

                      • Reiner Addams
                        Benutzer
                        • 17.04.2011
                        • 9

                        #12
                        Heureka!

                        Ich habe einen gangbaren Weg gefunden. Der Beitrag von Ronny (@rpeikert) hat mich darauf gebracht:

                        "Das Problem ist ja, dass die Schrift gar nicht sichtbar ist, weil das PDF zusätzlich noch das gescannte Bild enthält. Die Frage ist jetzt, verbirgt sich der Text (schwarz auf weiss) hinter dem Bild oder liegt er (in transparenter "Farbe") vor dem Bild."

                        Ersteres ist der Fall!

                        "Im ersten Fall könnte man versuchen, das Bild zu löschen. Vielleicht kommt der gelesene Text dann zum Vorschein. Dann könnte man ihn editieren und am Schluss das Bild wieder hinzufügen."

                        Es ist sogar noch einfacher, wenn man Adobe Acrobat Pro nutzt. Dort hat man die Möglichkeit unter "PDF bearbeiten", das vorgelagerte Bild wie einen Vorhang zur Seite zu ziehen, den Text zu editieren und es dann wieder über den geänderten Text zurückzuziehen. Abspeichern. Fertig. Die Größe der PDF bleibt in etwa gleich. Will man einen Text hinzufügen, schreibt man den an die entsprechende Stelle und färbt ihn weiß ein, sonst erscheint der nach dem Abspeichern auf dem Bild. Das war's. Das Ganze ist schnell gemacht, insbesondere, wenn man sich auf die Korrektur der wichtigsten Wörter (Namen, Orte, Datum etc.) beschränkt, denn zumindest in meinem Fall reicht mir das, wenn ich in meinem recht umfangreichen Datenpool meinen Recherchen nachgehe.

                        Vielen Dank Ronny aber auch alle anderen. Ohne diesen Thread wäre ich wahrscheinlich nicht so flott oder vielleicht gar nicht dahinter gekommen.

                        Viele Grüße Reiner

                        Ps. Das Programm mit dem ich arbeite : Adobe Acrobat Pro Version 2023.001 für den Mac. Die anderen hier genannten Programme habe ich ausprobiert. Die konnten das nicht. Vielleicht war ich aber auch nur zu dämlich.

                        Kommentar

                        • Reiner Addams
                          Benutzer
                          • 17.04.2011
                          • 9

                          #13
                          Hallo Balthasar, sieht tatsächlich so aus. Ich hab mir das mal kurz angeschaut, kann aber auf die Schnelle keine Aussage darüber treffen, ob das Programm (Kofax Power PDF 4.2) das einfacher als Adobe Acrobat macht. Wenn sich jemand in den Thread hier verläuft, der mit dem Programm arbeitet, kann er/sie ja eine kurze Rückmeldung geben.

                          Kommentar

                          • nima
                            Benutzer
                            • 02.02.2016
                            • 73

                            #14
                            Hast Du es mal mit IrfanVIew un dem Kadmos Plugin probiert?

                            Kommentar

                            Lädt...
                            X