Gedcom mit 1.4 Mio Personen zu CSV konvertieren?

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Steinfeld
    Erfahrener Benutzer
    • 06.08.2016
    • 143

    Gedcom mit 1.4 Mio Personen zu CSV konvertieren?

    Hallo,

    ich habe eine ged-Datei mit 1.4 Millionen Personen. Dieses Ganze möchte ich nun in eine Excel- oder CSV-Datei konvertieren. Kennt jemand irgendeine Software die das schaffen kann?

    Ahnenblatt kann diese Menge an Daten nicht einlesen,
    oxy-gen_light auch nicht,
    Brother's Keeper kann die Datei locker einlesen, exportiert aber die Datensätze nicht in eine Excel- oder CSV-Datei.

    Was könnte man da noch ausprobieren?

    Vielen Dank für die Tipps!
    Zuletzt geändert von Steinfeld; 25.05.2019, 14:32.
  • offer
    Erfahrener Benutzer
    • 20.08.2011
    • 1731

    #2
    Hallo Steinfeld!

    Zitat von Steinfeld Beitrag anzeigen
    Hallo,

    ich habe eine ged-Datei mit 1.4 Millionen Personen. Dieses Ganze möchte ich nun in eine Excel- oder CSV-Datei konvertieren.
    ...
    Darf man fragen, wie die Excel- resp. CSV(Text)-Datei organisiert sein soll?
    Welche Tags gibt es in der GEDCOM-Datei, welche sollten in welcher Form übernommen werden?
    Sollen nur Personen- oder auch Familieninformationen und Verknüpfungen übernommen werden?
    Mit welchem Programm wurde die GECOM-Datei erstellt?
    This is an offer you can't resist!

    Kommentar

    • ReReBe
      Erfahrener Benutzer
      • 22.10.2016
      • 2532

      #3
      Zitat von offer Beitrag anzeigen
      Hallo Steinfeld!

      Darf man fragen, wie die Excel- resp. CSV(Text)-Datei organisiert sein soll?
      Welche Tags gibt es in der GEDCOM-Datei, welche sollten in welcher Form übernommen werden?
      Sollen nur Personen- oder auch Familieninformationen und Verknüpfungen übernommen werden?
      Mit welchem Programm wurde die GECOM-Datei erstellt?
      Hallo Steinfeld,
      … und darf man bzw. ich fragen, welchen Sinn das Ganze haben soll ?
      Gruß
      Reiner

      Kommentar

      • OliverS
        Erfahrener Benutzer
        • 27.07.2014
        • 2938

        #4
        Zitat von Steinfeld Beitrag anzeigen
        Hallo,

        ich habe eine ged-Datei mit 1.4 Millionen Personen.

        Darf man fragen, ist das eigene Familie (? unvorstellbar)

        oder was ist das für eine Dateiherkunft, hast du ganze Ortsfamilienbpcher/Kirchenbücher darin?.

        Zur Frage selbst, es dürfte ein zu großer Datensatz sein.
        gruss
        Zuletzt geändert von OliverS; 25.05.2019, 19:21.
        Dauersuchen:

        1) Frau ?? verwitwerte WIECHERT, zwischen 1845 und 1852 neu verheiratete SPRINGER, wohnhaft 1852 in Leysuhnen/Leisuhn
        2) GESELLE, geboren ca 1802, Schäfer in/aus Kiewitz bei Schwerin a.d. Warthe und seine Frau Henkel
        3) WIECHERT, geboren in Alikendorf (Großalsleben) später in Schönebeck

        Kommentar

        • Xtine
          Administrator
          • 16.07.2006
          • 28326

          #5
          &Hallo,

          also theoretisch kann es GedTool
          GedTool Sammlung von Excel-Makros zur Bearbeitung von GEDCOM-Dateien (Shareware, Versand nur per mail)
          Ob es allerdings diese große Personenzahl schafft, weiß ich nicht!

          Vielleicht fragst Du erstmal über Kontakt beim Entwickler an.
          Viele Grüße .................................. .
          Christine
          sigpic .. .............
          Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
          (Konfuzius)

          Kommentar

          • 1975reinhard
            Erfahrener Benutzer
            • 30.10.2008
            • 324

            #6
            Hallo,

            mit Gramps kann man csv-Dateien exportieren.

            Viele Grüße
            Reinhard
            Forschungsgebiete:

            waldviertel-genealogie.jimdo.com/
            • NÖ (Waldviertel): Region Gmünd, Weitra, Schrems, Döllersheim

            suedmaehren-genealogie.jimdo.com/
            • Südmähren: Gebiet um Joslowitz

            traunviertel-genealogie.jimdo.com/
            • OÖ: Traunseeregion, Ampflwang, Ottnang,...

            http://sudeten-genealogie.jimdo.com/
            • Böhmen: Beneschau (bei Prag), Königgrätz, Nechanitz, Winterberg/Prachatitz
            • Schlesien: Gebiet um Wigstadtl
            • (Süd-)Mähren: Lispitz

            Kommentar

            • offer
              Erfahrener Benutzer
              • 20.08.2011
              • 1731

              #7
              Nicht nett.

              Hm, keine Antwort vom Themenersteller, obwohl er fast täglich im Forum ist?
              This is an offer you can't resist!

              Kommentar

              • Xtine
                Administrator
                • 16.07.2006
                • 28326

                #8
                Vielleicht sucht er noch nach dem Sinn
                Viele Grüße .................................. .
                Christine
                sigpic .. .............
                Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
                (Konfuzius)

                Kommentar

                • offer
                  Erfahrener Benutzer
                  • 20.08.2011
                  • 1731

                  #9
                  Hallo!

                  Zitat von Xtine Beitrag anzeigen
                  Vielleicht sucht er noch nach dem Sinn
                  Einen Sinn könnte ich schon finden.

                  Zitat von OliverS Beitrag anzeigen
                  ...
                  Zur Frage selbst, es dürfte ein zu großer Datensatz sein.
                  ...
                  Das sehe ich nicht unbedingt so.

                  Es geht ja erstmal "nur" darum, GEDCOM nach CSV zu konvertieren.
                  Eine Excel-Tabelle schließe ich erstmal aus. Das muß aber nicht be-
                  deuten, daß es nicht auch geht.

                  Ich sähe den Sinn in der Herausforderung, ein entsprechendes Pro-
                  gramm zu erstellen. Ob man etwas mit dem Ergebnis anfangen kann
                  ist eine ganz andere Frage.

                  Aber wenn dafür doch kein Bedarf ist....
                  This is an offer you can't resist!

                  Kommentar

                  • offer
                    Erfahrener Benutzer
                    • 20.08.2011
                    • 1731

                    #10
                    Hallo!

                    Zitat von offer Beitrag anzeigen
                    ...
                    Eine Excel-Tabelle schließe ich erstmal aus. Das muß aber nicht be-
                    deuten, daß es nicht auch geht.
                    ...
                    Ein Nachtrag:
                    Bei Excel hat sich seit 2007 wohl doch nichts mehr getan in Hinblick auf die
                    Tabellengröße.
                    Zitat von Wikipedia
                    Seit Excel 2007 kann ein Tabellenblatt 1.048.576 Zeilen und 16.384 Spalten (A bis XFD), also 17.179.869.184 Zellen umfassen.
                    Davor war die Größe auf 65.536 Zeilen und 256 Spalten (A bis IV), also 16.777.216 Zellen, begrenzt.
                    Von der Spaltenzahl her wäre es demnach kein Problem: 16384 Spalten für 3940 GEDCOM-Tags,
                    wenn alle GEDCOM-Tags benutzt und übernommen werden.

                    Die Zeilenzahl von 1.048.576 ist da bei 1.4 Millionen Personen das Problem.
                    Es gibt dann ja nicht nur 1.4Mio INDI-Tags, sondern auch viele FAM-Tags (theoretisch 2 pro Person)
                    zu schweigen von SOUR- und NOTE-Tags.
                    Dieses Problem könnte umgangen werden, wenn die Tag-Arten in separaten Tabellen angelegt werden.
                    Nur reicht es bei 1.4Mio Personen doch nicht.
                    Über die entstehende Dateigröße bei nur einem Tabellenblatt kann man ohne weitere Informationen
                    auch nur spekulieren.
                    Der INDI-Tag hat ca. 60 Unter-Tags, welche wiederum Unter-Tags haben.
                    Die meistbenutzten werden sicherlich
                    NAME mit GIVN, SURN, NOTE und deren Unter-Tags
                    SEX
                    BIRT mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
                    CHR mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
                    DEAT mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
                    BURi mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
                    FAMC
                    FAMS
                    NOTE mit den Unter-Tags
                    SOUR mit den Unter-Tags

                    Es kommen also sehr schnell sehr viele Daten zusammen, die in den Arbeitsspeicher passen müssen.

                    Meiner Meinung nach ist Excel bei dieser GEDCOM-Dateigröße raus.

                    Nur welchen Sinn macht dann noch eine Text-Datei im CSV-Format?
                    Man hat ja die Daten im Klartext in der GEDCOM-Datei vorliegen.
                    Womit soll eine CSV-Datei weiterverarbeitet werden?
                    Da kann man auch die GEDCOM direkt nehmen und auslesen.
                    This is an offer you can't resist!

                    Kommentar

                    • Steinfeld
                      Erfahrener Benutzer
                      • 06.08.2016
                      • 143

                      #11
                      Hallo Leute, ich melde mich bald, und antworte auf alle Fragen.

                      Kommentar

                      • offer
                        Erfahrener Benutzer
                        • 20.08.2011
                        • 1731

                        #12
                        Zitat von Steinfeld Beitrag anzeigen
                        Hallo Leute, ich melde mich bald, und antworte auf alle Fragen.
                        Viel heiße Luft hier in Deutschland.
                        This is an offer you can't resist!

                        Kommentar

                        • Steinfeld
                          Erfahrener Benutzer
                          • 06.08.2016
                          • 143

                          #13
                          Hallo Leute,
                          ich bin's wieder. Habe mich so lange nicht gemeldet, da ich das Projekt noch nicht abgeschlossen habe.

                          Also ich habe eine Gedcom-Datei mit 1,4 Mio Personen, es handelt sich dabei um eine Ethnie in der meine Vorfahren voll aufgehen. Ich möchte die DB durch eine Pivot-Tabelle jagen, um zu schauen wie die Schreibweise meines Nachnamens durch die letzten Jahre hindurch geschrieben wurde. Und dabei habe ich, wie auch gehofft, eine sehr wichtige Entdeckung gemacht.


                          Vielen Dank an alle für eure Beiträge. )))
                          Gruß

                          Kommentar

                          • ReReBe
                            Erfahrener Benutzer
                            • 22.10.2016
                            • 2532

                            #14
                            … und die Luft ist immer noch heiß und nur eine einzige Frage in diesem Zusammenhang halbwegs beantwortet ...



                            Reiner
                            Zuletzt geändert von ReReBe; 31.08.2019, 18:59.

                            Kommentar

                            • Mismid
                              Erfahrener Benutzer
                              • 21.02.2009
                              • 984

                              #15
                              Wie sich die Schreibweise geändert hat kann man kaum durch eine Datenbank erfahren, da man ja nicht weiß ob der Name so eingegeben wurde wie der Pfarrer ihn geschrieben hat oder der einfachheithalber so wie er aktuell geschrieben wird oder eine Kombination daraus, wie der Ersteller es für am geeignesten fand. Toll dass du eine wichtige Entdeckung gemacht hast, die du uns auch nicht mitteilst.

                              Kommentar

                              Lädt...
                              X