Zurück   Ahnenforschung.Net Forum > Software und Technik > Genealogie-Programme
Hier klicken, falls Sie Ihr Kennwort vergessen haben.

Antwort
 
Themen-Optionen Thema durchsuchen Ansicht
  #1  
Alt 25.05.2019, 14:29
Steinfeld Steinfeld ist offline
Benutzer
 
Registriert seit: 06.08.2016
Beiträge: 76
Standard Gedcom mit 1.4 Mio Personen zu CSV konvertieren?

Hallo,

ich habe eine ged-Datei mit 1.4 Millionen Personen. Dieses Ganze möchte ich nun in eine Excel- oder CSV-Datei konvertieren. Kennt jemand irgendeine Software die das schaffen kann?

Ahnenblatt kann diese Menge an Daten nicht einlesen,
oxy-gen_light auch nicht,
Brother's Keeper kann die Datei locker einlesen, exportiert aber die Datensätze nicht in eine Excel- oder CSV-Datei.

Was könnte man da noch ausprobieren?

Vielen Dank für die Tipps!

Geändert von Steinfeld (25.05.2019 um 14:32 Uhr)
Mit Zitat antworten
  #2  
Alt 25.05.2019, 17:36
offer offer ist offline
Erfahrener Benutzer
 
Registriert seit: 20.08.2011
Beiträge: 1.327
Standard

Hallo Steinfeld!

Zitat:
Zitat von Steinfeld Beitrag anzeigen
Hallo,

ich habe eine ged-Datei mit 1.4 Millionen Personen. Dieses Ganze möchte ich nun in eine Excel- oder CSV-Datei konvertieren.
...
Darf man fragen, wie die Excel- resp. CSV(Text)-Datei organisiert sein soll?
Welche Tags gibt es in der GEDCOM-Datei, welche sollten in welcher Form übernommen werden?
Sollen nur Personen- oder auch Familieninformationen und Verknüpfungen übernommen werden?
Mit welchem Programm wurde die GECOM-Datei erstellt?
__________________
This is an offer you can't resist!
Mit Zitat antworten
  #3  
Alt 25.05.2019, 18:43
ReReBe ReReBe ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 22.10.2016
Ort: Berlin
Beiträge: 826
Standard

Zitat:
Zitat von offer Beitrag anzeigen
Hallo Steinfeld!

Darf man fragen, wie die Excel- resp. CSV(Text)-Datei organisiert sein soll?
Welche Tags gibt es in der GEDCOM-Datei, welche sollten in welcher Form übernommen werden?
Sollen nur Personen- oder auch Familieninformationen und Verknüpfungen übernommen werden?
Mit welchem Programm wurde die GECOM-Datei erstellt?
Hallo Steinfeld,
… und darf man bzw. ich fragen, welchen Sinn das Ganze haben soll ?
Gruß
Reiner
Mit Zitat antworten
  #4  
Alt 25.05.2019, 19:19
OliverS OliverS ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 27.07.2014
Ort: Süddeutschland
Beiträge: 2.260
Standard

Zitat:
Zitat von Steinfeld Beitrag anzeigen
Hallo,

ich habe eine ged-Datei mit 1.4 Millionen Personen.

Darf man fragen, ist das eigene Familie (? unvorstellbar)

oder was ist das für eine Dateiherkunft, hast du ganze Ortsfamilienbpcher/Kirchenbücher darin?.

Zur Frage selbst, es dürfte ein zu großer Datensatz sein.
gruss

Geändert von OliverS (25.05.2019 um 19:21 Uhr)
Mit Zitat antworten
  #5  
Alt 25.05.2019, 20:20
Benutzerbild von Xtine
Xtine Xtine ist offline weiblich
Administrator
 
Registriert seit: 16.07.2006
Ort: z' Minga [Mail: chatty1@gmx.de]
Beiträge: 21.792
Standard

&Hallo,

also theoretisch kann es GedTool
Zitat:
GedTool Sammlung von Excel-Makros zur Bearbeitung von GEDCOM-Dateien (Shareware, Versand nur per mail)
Ob es allerdings diese große Personenzahl schafft, weiß ich nicht!

Vielleicht fragst Du erstmal über Kontakt beim Entwickler an.
__________________
Viele Grüße .................................. .
Christine
.. .............
Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
(Konfuzius)

Mit Zitat antworten
  #6  
Alt 25.05.2019, 21:26
1975reinhard 1975reinhard ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 30.10.2008
Beiträge: 239
Standard

Hallo,

mit Gramps kann man csv-Dateien exportieren.

Viele Grüße
Reinhard
__________________
Forschungsgebiete:

waldviertel-genealogie.jimdo.com/
  • NÖ (Waldviertel): Region Gmünd, Weitra, Schrems, Döllersheim
suedmaehren-genealogie.jimdo.com/
  • Südmähren: Gebiet um Joslowitz
traunviertel-genealogie.jimdo.com/
  • OÖ: Traunseeregion, Ampflwang, Ottnang,...
http://sudeten-genealogie.jimdo.com/
  • Böhmen: Beneschau (bei Prag), Königgrätz, Nechanitz
  • Schlesien: Gebiet um Wigstadtl
  • (Süd-)Mähren: Lispitz
Mit Zitat antworten
  #7  
Alt 28.05.2019, 16:37
offer offer ist offline
Erfahrener Benutzer
 
Registriert seit: 20.08.2011
Beiträge: 1.327
Unglücklich Nicht nett.

Hm, keine Antwort vom Themenersteller, obwohl er fast täglich im Forum ist?
__________________
This is an offer you can't resist!
Mit Zitat antworten
  #8  
Alt 28.05.2019, 16:48
Benutzerbild von Xtine
Xtine Xtine ist offline weiblich
Administrator
 
Registriert seit: 16.07.2006
Ort: z' Minga [Mail: chatty1@gmx.de]
Beiträge: 21.792
Standard

Vielleicht sucht er noch nach dem Sinn
__________________
Viele Grüße .................................. .
Christine
.. .............
Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
(Konfuzius)

Mit Zitat antworten
  #9  
Alt 28.05.2019, 19:43
offer offer ist offline
Erfahrener Benutzer
 
Registriert seit: 20.08.2011
Beiträge: 1.327
Standard

Hallo!

Zitat:
Zitat von Xtine Beitrag anzeigen
Vielleicht sucht er noch nach dem Sinn
Einen Sinn könnte ich schon finden.

Zitat:
Zitat von OliverS Beitrag anzeigen
...
Zur Frage selbst, es dürfte ein zu großer Datensatz sein.
...
Das sehe ich nicht unbedingt so.

Es geht ja erstmal "nur" darum, GEDCOM nach CSV zu konvertieren.
Eine Excel-Tabelle schließe ich erstmal aus. Das muß aber nicht be-
deuten, daß es nicht auch geht.

Ich sähe den Sinn in der Herausforderung, ein entsprechendes Pro-
gramm zu erstellen. Ob man etwas mit dem Ergebnis anfangen kann
ist eine ganz andere Frage.

Aber wenn dafür doch kein Bedarf ist....
__________________
This is an offer you can't resist!
Mit Zitat antworten
  #10  
Alt 29.05.2019, 09:50
offer offer ist offline
Erfahrener Benutzer
 
Registriert seit: 20.08.2011
Beiträge: 1.327
Standard

Hallo!

Zitat:
Zitat von offer Beitrag anzeigen
...
Eine Excel-Tabelle schließe ich erstmal aus. Das muß aber nicht be-
deuten, daß es nicht auch geht.
...
Ein Nachtrag:
Bei Excel hat sich seit 2007 wohl doch nichts mehr getan in Hinblick auf die
Tabellengröße.
Zitat:
Zitat von Wikipedia
Seit Excel 2007 kann ein Tabellenblatt 1.048.576 Zeilen und 16.384 Spalten (A bis XFD), also 17.179.869.184 Zellen umfassen.
Davor war die Größe auf 65.536 Zeilen und 256 Spalten (A bis IV), also 16.777.216 Zellen, begrenzt.
Von der Spaltenzahl her wäre es demnach kein Problem: 16384 Spalten für 3940 GEDCOM-Tags,
wenn alle GEDCOM-Tags benutzt und übernommen werden.

Die Zeilenzahl von 1.048.576 ist da bei 1.4 Millionen Personen das Problem.
Es gibt dann ja nicht nur 1.4Mio INDI-Tags, sondern auch viele FAM-Tags (theoretisch 2 pro Person)
zu schweigen von SOUR- und NOTE-Tags.
Dieses Problem könnte umgangen werden, wenn die Tag-Arten in separaten Tabellen angelegt werden.
Nur reicht es bei 1.4Mio Personen doch nicht.
Über die entstehende Dateigröße bei nur einem Tabellenblatt kann man ohne weitere Informationen
auch nur spekulieren.
Der INDI-Tag hat ca. 60 Unter-Tags, welche wiederum Unter-Tags haben.
Die meistbenutzten werden sicherlich
NAME mit GIVN, SURN, NOTE und deren Unter-Tags
SEX
BIRT mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
CHR mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
DEAT mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
BURi mit DATE, PLAC, RELI, NOTE, SOUR und deren Unter-Tags
FAMC
FAMS
NOTE mit den Unter-Tags
SOUR mit den Unter-Tags

Es kommen also sehr schnell sehr viele Daten zusammen, die in den Arbeitsspeicher passen müssen.

Meiner Meinung nach ist Excel bei dieser GEDCOM-Dateigröße raus.

Nur welchen Sinn macht dann noch eine Text-Datei im CSV-Format?
Man hat ja die Daten im Klartext in der GEDCOM-Datei vorliegen.
Womit soll eine CSV-Datei weiterverarbeitet werden?
Da kann man auch die GEDCOM direkt nehmen und auslesen.
__________________
This is an offer you can't resist!
Mit Zitat antworten
Antwort

Lesezeichen

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.

Gehe zu

Alle Zeitangaben in WEZ +2. Es ist jetzt 04:37 Uhr.