Zurück   Ahnenforschung.Net Forum > Software und Technik > Genealogie-Programme
Hier klicken, falls Sie Ihr Kennwort vergessen haben.

Hinweise

Antwort
 
Themen-Optionen Thema durchsuchen Ansicht
  #1  
Alt 05.03.2024, 20:47
Reiner Addams Reiner Addams ist offline
Benutzer
 
Registriert seit: 17.04.2011
Beiträge: 8
Beitrag Texte in PDF Korrigieren

Hallo,

kennt jemand einen PDF-Editor, der in vorhandenen PDFs (Scans von alten Dokumenten mit OCR) den im Dokument hinterlegten Text ändern kann?

Hintergrund: viele meiner als PDF vorhandenen Dokument sind von der automatischen Texterkennung fehlerbehaftet erstellt worden. Da ich bei meiner Ahnenforschung auf mein komplett indiziertes Archiv zugreife, findet der Rechner viele entsprechenden Dateien nicht. Beispiel: ich suche in einem Überordner nach dem Begriff "Gaistauden". Textstellen wie "G A I S T A U D E N" oder "Geistauden" werden natürlich nicht angezeigt.

Es muss doch eine Möglichkeit geben, diese "unsichtbaren" weil hinter der Grafik versteckten Textstellen sichtbar zu machen, um sie dann zu verbessern.

VG Reiner
Mit Zitat antworten
  #2  
Alt 05.03.2024, 22:26
Benutzerbild von Xtine
Xtine Xtine ist offline weiblich
Administrator
 
Registriert seit: 16.07.2006
Ort: z' Minga [Mail: chatty1@gmx.de]
Beiträge: 28.267
Standard

Hallo Reiner,

die kostenpflichtigen Versionen der bekannten PDF Editoren sollten es können.
Auch manche online Editoren werben damit, daß Text bearbeitet werden kann.
Einfach mal googeln, teilweise kann man vorher testen.
__________________
Viele Grüße .................................. .
Christine
.. .............
Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
(Konfuzius)

Mit Zitat antworten
  #3  
Alt 05.03.2024, 23:08
Reiner Addams Reiner Addams ist offline
Benutzer
Themenstarter
 
Registriert seit: 17.04.2011
Beiträge: 8
Standard

Hallo Christine,


danke für Deine Antwort. Die die ich ausprobiert habe, können nur (begrenzt) Texte verändern, nämlich in den PDFs, die von einem Textverarbeitungsprogramm heraus generiert wurden. Das ist aber bei meinen PDFs nicht der Fall. Stell Dir einen in den 50er Jahren schreibmaschinengeschriebenen Text vor. Der wird in einer PDF-Datei im Original dargestellt. Im Hintergrund nicht sichtbar, liegt der in Details falsche Text, den ich halt gerne korrigieren möchte. Google habe ich sehr lange befragt und nur Links genannt bekommen, von Programmen die o.g. PDFs korrigieren können.


Deshalb war ja meine Hoffnung, dass es hier jemanden gibt, der/die mit dem gleichen Problem zu kämpfen und eine Lösung gefunden hat.


Beste Grüße Reiner
Mit Zitat antworten
  #4  
Alt 06.03.2024, 07:55
Benutzerbild von Xtine
Xtine Xtine ist offline weiblich
Administrator
 
Registriert seit: 16.07.2006
Ort: z' Minga [Mail: chatty1@gmx.de]
Beiträge: 28.267
Standard

Hallo Reiner,

Wird das nicht hier beschrieben?
__________________
Viele Grüße .................................. .
Christine
.. .............
Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
(Konfuzius)

Mit Zitat antworten
  #5  
Alt 06.03.2024, 10:42
rpeikert rpeikert ist offline
Erfahrener Benutzer
 
Registriert seit: 03.09.2016
Ort: Kt. Aargau, Schweiz
Beiträge: 2.634
Standard

Guten Tag

Das Problem ist ja, dass die Schrift gar nicht sichtbar ist, weil das PDF zusätzlich noch das gescannte Bild enthält. Die Frage ist jetzt, verbirgt sich der Text (schwarz auf weiss) hinter dem Bild oder liegt er (in transparenter "Farbe") vor dem Bild.

Im ersten Fall könnte man versuchen, das Bild zu löschen. Vielleicht kommt der gelesene Text dann zum Vorschein. Dann könnte man ihn editieren und am Schluss das Bild wieder hinzufügen.

Im zweiten Fall müsste man versuchen, die Textfarbe von "transparent" z.B. auf "rot und opak" zu ändern (und nach dem Editieren wieder zurück).

Gruss, Ronny
Mit Zitat antworten
  #6  
Alt 06.03.2024, 11:56
ole ole ist offline
Erfahrener Benutzer
 
Registriert seit: 05.12.2014
Beiträge: 152
Standard

Hallo,
meines (Halb-)Wissens nach liegen Bild und Text möglicherweise in unterschiedlichen Layern (Ebenen). Man bräuchte also einen PDF-Editor, der damit klar kommt und wo man die Ebenen umschalten kann.


Viele Grüße
Olaf
Mit Zitat antworten
  #7  
Alt 06.03.2024, 13:26
memo memo ist offline weiblich
Erfahrener Benutzer
 
Registriert seit: 19.01.2009
Beiträge: 315
Standard

Hallo Reiner,

es ist schon einige Zeit her, dass ich FlexiPDF von Softmaker benutzt habe. Vielleicht erfüllt es aber die von dir gewünschten Aufgaben. Probier's einfach mal mit der Demo-Version aus:

https://www.softmaker.de/produkte/flexipdf/download

Gruß, memo
Mit Zitat antworten
  #8  
Alt 06.03.2024, 14:33
Ilja_CH Ilja_CH ist offline
Erfahrener Benutzer
 
Registriert seit: 05.11.2016
Beiträge: 739
Standard

Selbst wenn es sich beim PDF um einen gescannten Text (z. B. maschinengeschriebene Buchseite von z. B. 1950) handelt, können gewisse teure PDF-Programme daraus einen OCR-Text «erkennen» lassen. So kann zumindest nach dem Text oder nach einzelnen Wörtern in der entsprechenden Datei gesucht werden. Da ist es nicht mehr weit, z. B. einzelne Wörter ggf. korrigieren zu können. Selbst wenn das Bild nicht «korrigiert» werden kann, kann mit einer Textfunktion sicher über das Wort rüber geschrieben werden. Dabei natürlich selbe Schriftart, Farbe und Grösse einstellen und einen Texthintergrund. So kann ein falsches Wort durch ein korrektes ersetzt werden. Aber das ist manuelle Arbeit.
Mit Zitat antworten
  #9  
Alt 14.03.2024, 12:05
Reiner Addams Reiner Addams ist offline
Benutzer
Themenstarter
 
Registriert seit: 17.04.2011
Beiträge: 8
Standard

Hallo in die Runde,


erst einmal vielen Dank für die Antworten. Die Bearbeitung von bereits mit OCR versehenen PDF-Dateien scheint ein kompliziertes Feld zu sein. Ich habe zwischenzeitlich mit Adobe Acrobat Pro versucht mein Problem zu lösen; mit mäßigem Erfolg. Hier will Acrobat nur einen geringen Anteil des vorhandenen Textes erkennen und dann auch bearbeiten können. Ich denke, dass @ole da am nächsten liegt mit seiner Vermutung der "unterschiedlichen Layern". Ich bin nämlich auch mit der Vorstellung gestartet, dass Acrobat Zugriff auf alle Layer hat. Weitgefehlt.


Nur noch mal zur Erläuterung falls noch jemand eine Idee hat: Ich möchte


a) meine vorhandenen Dokumente, die mir schon als OCR-indizierte pdf-Dateien vorliegen korrigieren
b) nicht automatisch indizierbare PDF-Dateien (mit Kurrentschrift, Sütterlin etc) die derzeit vorhandene OCR-Programme nicht indizieren können nachträglich mit Text versehen, der quasi im Hintergrund (nicht sichtbar) in den Dokumenten an den entsprechenden Stellen hinterlegt ist.


Ich werde der Idee von @ole, wenn ich wieder Zeit habe, folgen und nach entsprechenden Programmen suchen. Sobald ich einen gangbaren Weg gefunden habe, melde ich mich noch mal.


Vielen Dank noch mal an alle


Reiner
Mit Zitat antworten
  #10  
Alt 14.03.2024, 14:07
Benutzerbild von Sedulus
Sedulus Sedulus ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 11.11.2018
Ort: Haibach/Unterfranken
Beiträge: 859
Standard

Hallo Reiner,

hast du es mal PDF24 Tools probiert?

Gruß
Peter
__________________
Auf der Suche nach den Familien

Neugebauer, Wax, Metzner, Tillmann, Neumann, Klein, Siegert und Klose

in Schlesien, und den Familien

Kral, Schulz (Sulc), Pawelka, Soboda, Tregler/Trägler, Mareček, Frisch, Heyack, Buda, Schwipp, Beyer und Titl

im Sudetenland.
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
dokumente , korrektur , korrigieren , pdf , verbessern

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.

Gehe zu

Alle Zeitangaben in WEZ +1. Es ist jetzt 08:19 Uhr.