Ahnenforschung.Net Forum

Ahnenforschung.Net Forum (https://forum.ahnenforschung.net/index.php)
-   Genealogie-Programme (https://forum.ahnenforschung.net/forumdisplay.php?f=11)
-   -   Datensätze abgleichen (Dubletten finden beim Zusammenfügen) (https://forum.ahnenforschung.net/showthread.php?t=55035)

Barby 03.07.2011 10:43

Datensätze abgleichen (Dubletten finden beim Zusammenfügen)
 
Hallo,

hab folgendes Problem, wahrscheinlich nicht so selten:

Ich hab zwei Datensätze (Brother's Keeper, gedcomfähig), die weitgehend gleich sind, aber bei beiden sind beträchtliche Erweiterungen, die nicht im anderen Satz sind. Wenn ich die beiden einfach zusammenfüge, hab ich natürlich viele Dubletten.

Wie krieg ich am besten die Dubletten raus, und was schwieriger ist, wie krieg ich jeweils eine von zweien raus, wenn sie nicht ganz identisch sind? Das heißt, es ist schon dieselbe Person, aber bei der einen ist der Geburtsort drin und bei der anderen das Datum, als einfaches Beispiel.

memo 03.07.2011 18:52

Hallo Barby,

genau diese Frage beschäftigt mich auch schon lange. Abgleichen kann man anscheinend nicht.

Was in der 'Hilfe' unter 'Datensätze vereinen' steht, kann man nur machen, wenn es sich im Prinzip um unterschiedliche Datensätze handelt und nur wenige Personen identisch sind. Die da beschriebene Vorgehensweise ist auch Fehler-behaftet und umständlich.

Wahrscheinlich ist die zwar nicht weniger umständliche aber sichere Option, einen Datensatz als Nachkommensliste/Buch oder als Familienblätter in eine pdf-Datei zu drucken, mit dem anderen zu vergleichen und mittels copy & paste zu ergänzen.

Alles unbefriedigend. Schade bei einem sonst so guten Programm. Vielleicht weiß ja jemand eine bessere Lösung ...

Gruß, Mechthild

Barby 04.07.2011 09:39

Gibts vielleicht ein anderes Programm, das das kann, sei es ein vollständiges Genealogieprogramm oder ein spezielles Tool? Möglichst Freeware, da ich es im Moment nur für diesen Zweck brauch.

(Ich kann mir vorstellen, dass das Problem sehr häufig ist, wenn zwei Leute am ursprünglich gleichen Datensatz arbeiten.)

memo 04.07.2011 18:57

Hallo Barby,

in der Genealogie Programme Übersicht http://forum.ahnenforschung.net/showthread.php?t=21559 hat Xtine GedTool http://www.gedtool.de/ aufgelistet. Damit scheint es möglich zu sein, Datensätze im gedcom-Format abzugleichen, sofern man Excel auf dem Computer hat. Ich probiere es mal.

Gruß, Mechthild

Barby 04.07.2011 23:58

Danke, sieht hilfreich aus. Wenn ich schon im Bereich von nicht kostenloser Software bin, welche Vollprogramme können sowas denn gut?

Christian Benz 05.07.2011 17:37

Hallo,

eine persönliche Wertung kann und möchte ich hierzu nicht abgeben, da mir schlicht und einfach auch dafür nötige eigene Vergleichswerte fehlen. Als Tipp zum Thema möchte ich aber auf folgende Artikel in der Zeitschrift "Computergenealogie" hinweisen:
  • Ausgabe 3/2009: "Daten prüfen - Duplikate finden leicht gemacht". Hierbei wird das Programm "Gedcom Validierung" vorgestellt.
  • Ausgabe 1/2010: "Dublettenbereinigung". Es findet sich darin ein Vergleich der Programme
    • Ahnenforscher,
    • Gedcom-Validierung,
    • Genmatcher,
    • Ages,
    • FamilyInsight,
    • Legacy und
    • PAF.
Für unsere Vereinsdatenbank (BLF) die ich mitbetreue benutzen wir für die Verschmelzung u.a. PAF (Version 5.2), vor allem auch deshalb weil das Programm Freeware ist. Falls die Daten einzelner Ereignisse nicht ganz identisch sind bzw. unterschiedlich vollständig sind, kann man festlegen welche Daten jeweils in den verschmolzenen Datensatz zu übernehmen sind. Der Zeitaufwand für die Verschmelzungsarbeiten ist gerade bei umfangreichem Datenbestand allerdings schon recht hoch (unabhängig vom Programm), da man aus Sicherheitsgründen die Entscheidung, ob zwei Datensätze zu verschmelzen sind oder nicht, in der Regel dem Menschen überlassen wird (und keinem Programmautomatismus). Die Entscheidung ob es sich bei zwei Datensätzen um die gleiche Person handelt, kann aber z.B. dadurch erleichtert sein, wenn die Personen (in der Gedcomdatei) mit einem gleichbleibenden "Fingerabdruck" (bei PAF die UID) versehen sind. Beispiel: Forscher A gibt die von PAF erzeugte Gedcom-Datei an einen Forscherkollegen B weiter. Dieser führt darin eigene Änderungen und Ergänzungen durch und liefert die Gedcom-Datei später wieder an A zurück. Forscher A importiert nun in seine eigene Datei, die von B. Naturgemäß sind nun viele doppelte Datensätze enthalten, PAF kann diese aber Anhand der erhalten gebliebenene UIDs sicher identifizieren.

Gruß,
Chris

Barby 05.07.2011 17:47

Super, vielen Dank, werd mal einen genaueren Blick drauf werfen.

Dass man bei zwei Sätzen entscheiden muss, ergibt sich ja aus praktischen Gründen, wie Du schreibst. Das ist aber deutlich weniger Aufwand, als alles per Hand neu einzutragen.

Barby 06.07.2011 13:10

Hab gerade die erste Gedcom in PAF importiert und die Hälfte der Informationen ist nicht übernommen worden ("unexpected tag AKAN" oder "unexpected tag ADDR"). Sehr ärgerlich. Ganz normale Standard-Gedcom - verstehe nicht, was ungewöhnlich an alternativen Namen oder an Adressen sein soll. Ich versuch mal, zu googlen, ob das ein bekanntes PAF-Problem ist.

memo 13.01.2012 19:52

Hallo Barby,

ich habe gestern ein Brother's Keeper-Update durchgeführt und siehe da: Nun gibt es unter 'Datei/Utilities' den Punkt: 2 Datensätze vergleichen. Es sieht sehr komfortabel aus, man hat Haupt- und Vergleichsdatensatz in 2 nebeneinander liegenden Fenstern und man kann in den Hauptdatensatz kopieren, was ergänzend im anderen steht. Allerdings muss man sich anscheinend auch von Person zu Person durchklicken, die möglichen Einstellungen habe ich noch nicht angeschaut. Für meine Bedürfnisse ist dies aber ausreichend.

Gruß, Mechthild

Barby 13.01.2012 20:41

Vielen Dank, hab ich auch gestern gesehen und war schon sehr gespannt. Leider ist bei mir dieser Punkt deaktiviert ("greyed out"). Vielleicht ist das eins der Features, die in der Testversion nicht funktionieren.


Alle Zeitangaben in WEZ +1. Es ist jetzt 21:39 Uhr.

Powered by vBulletin® Version 3.8.8 (Deutsch)
Copyright ©2000 - 2024, vBulletin Solutions, Inc.