Registrieren | Hilfe | Chat | Benutzerliste | Team | Kalender | Suchen | Heutige Beiträge | Alle Foren als gelesen markieren |
#1
|
|||
|
|||
Texte in PDF Korrigieren
Hallo,
kennt jemand einen PDF-Editor, der in vorhandenen PDFs (Scans von alten Dokumenten mit OCR) den im Dokument hinterlegten Text ändern kann? Hintergrund: viele meiner als PDF vorhandenen Dokument sind von der automatischen Texterkennung fehlerbehaftet erstellt worden. Da ich bei meiner Ahnenforschung auf mein komplett indiziertes Archiv zugreife, findet der Rechner viele entsprechenden Dateien nicht. Beispiel: ich suche in einem Überordner nach dem Begriff "Gaistauden". Textstellen wie "G A I S T A U D E N" oder "Geistauden" werden natürlich nicht angezeigt. Es muss doch eine Möglichkeit geben, diese "unsichtbaren" weil hinter der Grafik versteckten Textstellen sichtbar zu machen, um sie dann zu verbessern. VG Reiner |
#2
|
||||
|
||||
Hallo Reiner,
die kostenpflichtigen Versionen der bekannten PDF Editoren sollten es können. Auch manche online Editoren werben damit, daß Text bearbeitet werden kann. Einfach mal googeln, teilweise kann man vorher testen. |
#3
|
|||
|
|||
Hallo Christine,
danke für Deine Antwort. Die die ich ausprobiert habe, können nur (begrenzt) Texte verändern, nämlich in den PDFs, die von einem Textverarbeitungsprogramm heraus generiert wurden. Das ist aber bei meinen PDFs nicht der Fall. Stell Dir einen in den 50er Jahren schreibmaschinengeschriebenen Text vor. Der wird in einer PDF-Datei im Original dargestellt. Im Hintergrund nicht sichtbar, liegt der in Details falsche Text, den ich halt gerne korrigieren möchte. Google habe ich sehr lange befragt und nur Links genannt bekommen, von Programmen die o.g. PDFs korrigieren können. Deshalb war ja meine Hoffnung, dass es hier jemanden gibt, der/die mit dem gleichen Problem zu kämpfen und eine Lösung gefunden hat. Beste Grüße Reiner |
#5
|
|||
|
|||
Guten Tag
Das Problem ist ja, dass die Schrift gar nicht sichtbar ist, weil das PDF zusätzlich noch das gescannte Bild enthält. Die Frage ist jetzt, verbirgt sich der Text (schwarz auf weiss) hinter dem Bild oder liegt er (in transparenter "Farbe") vor dem Bild. Im ersten Fall könnte man versuchen, das Bild zu löschen. Vielleicht kommt der gelesene Text dann zum Vorschein. Dann könnte man ihn editieren und am Schluss das Bild wieder hinzufügen. Im zweiten Fall müsste man versuchen, die Textfarbe von "transparent" z.B. auf "rot und opak" zu ändern (und nach dem Editieren wieder zurück). Gruss, Ronny |
#6
|
|||
|
|||
Hallo,
meines (Halb-)Wissens nach liegen Bild und Text möglicherweise in unterschiedlichen Layern (Ebenen). Man bräuchte also einen PDF-Editor, der damit klar kommt und wo man die Ebenen umschalten kann. Viele Grüße Olaf |
#7
|
|||
|
|||
Hallo Reiner,
es ist schon einige Zeit her, dass ich FlexiPDF von Softmaker benutzt habe. Vielleicht erfüllt es aber die von dir gewünschten Aufgaben. Probier's einfach mal mit der Demo-Version aus: https://www.softmaker.de/produkte/flexipdf/download Gruß, memo |
#8
|
|||
|
|||
Selbst wenn es sich beim PDF um einen gescannten Text (z. B. maschinengeschriebene Buchseite von z. B. 1950) handelt, können gewisse teure PDF-Programme daraus einen OCR-Text «erkennen» lassen. So kann zumindest nach dem Text oder nach einzelnen Wörtern in der entsprechenden Datei gesucht werden. Da ist es nicht mehr weit, z. B. einzelne Wörter ggf. korrigieren zu können. Selbst wenn das Bild nicht «korrigiert» werden kann, kann mit einer Textfunktion sicher über das Wort rüber geschrieben werden. Dabei natürlich selbe Schriftart, Farbe und Grösse einstellen und einen Texthintergrund. So kann ein falsches Wort durch ein korrektes ersetzt werden. Aber das ist manuelle Arbeit.
|
#9
|
|||
|
|||
Hallo in die Runde,
erst einmal vielen Dank für die Antworten. Die Bearbeitung von bereits mit OCR versehenen PDF-Dateien scheint ein kompliziertes Feld zu sein. Ich habe zwischenzeitlich mit Adobe Acrobat Pro versucht mein Problem zu lösen; mit mäßigem Erfolg. Hier will Acrobat nur einen geringen Anteil des vorhandenen Textes erkennen und dann auch bearbeiten können. Ich denke, dass @ole da am nächsten liegt mit seiner Vermutung der "unterschiedlichen Layern". Ich bin nämlich auch mit der Vorstellung gestartet, dass Acrobat Zugriff auf alle Layer hat. Weitgefehlt. Nur noch mal zur Erläuterung falls noch jemand eine Idee hat: Ich möchte a) meine vorhandenen Dokumente, die mir schon als OCR-indizierte pdf-Dateien vorliegen korrigieren b) nicht automatisch indizierbare PDF-Dateien (mit Kurrentschrift, Sütterlin etc) die derzeit vorhandene OCR-Programme nicht indizieren können nachträglich mit Text versehen, der quasi im Hintergrund (nicht sichtbar) in den Dokumenten an den entsprechenden Stellen hinterlegt ist. Ich werde der Idee von @ole, wenn ich wieder Zeit habe, folgen und nach entsprechenden Programmen suchen. Sobald ich einen gangbaren Weg gefunden habe, melde ich mich noch mal. Vielen Dank noch mal an alle Reiner |
#10
|
||||
|
||||
|
Lesezeichen |
Stichworte |
dokumente , korrektur , korrigieren , pdf , verbessern |
Themen-Optionen | Thema durchsuchen |
Ansicht | |
|
|