Stammbaum-Statistiken

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • DerFalke
    Erfahrener Benutzer
    • 26.02.2021
    • 177

    Stammbaum-Statistiken

    Ich hab mir gedacht, dass es ganz cool wäre wenn man über seine Vorfahren ein paar Statistiken errechnen könnte. (Lebenserwartung, Heiratsalter, häufigste Namen, Orte etc.)

    Jetzt kenne ich mich mit Geneanologieprogrammen überhaupt nicht aus und weiß nicht welche Features die schon haben aber ich wette keins hat alle Features, die ich möchte.

    Da hab ich mir gedacht, ich kann mir auch selber ein kleines Programm schreiben, dort meine Gedcom-Datei reinschmeißen und mir dann alles berechnen lassen was ich möchte.

    Das funktioniert ungefähr so:
    1. Ich sag dem Programm was der Wurzelknoten ist
    2. Das Programm rennt alle direkten Vorfahren der Reihe nach durch und sammelt Daten (Personen, wo die benötigten Daten nicht vorliegen werden übersprungen)
    3. Am Ende spuckt es die Daten aus (als Text)


    Was für Daten will ich anzeigen/berechnen:
    1. Nummerierung und Auflistung aller Vorfahren gemäß der gängigen Stammbaumnummerierung (Knoten ist die 1, Vater die 2, Mutter die 3, Großväter die 4 und 6, Großmütter 5 und 7, etc.)
    2. Erkennen von Dopplungen, Mehrfachvorfahren bekommen mehrere Nummern
    3. Anzahl individueller Vorfahren und Anzahl von Dopplungen
    4. Durchschnitt Lebensdauer (männlich, weiblich, gesamt)
    5. Durchschnitt Heiratssalter (männlich, weiblich, gesamt)
    6. Durchschnitt Lebensdauer pro Jahr (damit man damit in Excel oder so eine Diagramm über die Jahrhunderte draus machen kann)
    7. Durchschnitt Heiratsalter pro Jahr
    8. häufigste Vornahmen (männlich, weiblich) => der Teil ist schwierig, weil hier verschiedene Schreibweisen gruppiert werden müssen, das geht nur manuel
    9. analog häufigste Nachnamen


    Die meisten Punkte hab ich testweise schon umgesetzt, das ist nicht super kompliziert.

    Weitere Ideen, was man evtl. machen könnte, wo ich mir aber noch nicht sicher bin ob das einen Wert hat
    1. Auflistung (oder häufigste) Geburts-, Heiratsorte-, Sterbeorte
    2. Altersunterschiede der Ehepartner
    3. Anzahl Geburts- Heirats-, Todestag damit man sich das als Jahres-Diagramm anzeigen lassen kann wer an welchem Tag Geburtstag hat etc.
    4. jüngste, älteste Person/Heirat

    Die Frage ist, was ist noch interessant?

    Das Tool würde ich am Ende bei Bedarf zur freien Verfügung stellen, kann es aber nicht versprechen.

    Trau-Schnellindex für Dresden-Meißen-Freiberg-Dippoldiswalde:
    https://tintenfrass.github.io/simplechurchbookindexes/

    Karte Kirchenbücher Sachsen:

    https://www.google.com/maps/d/viewer...561152344&z=10

    Karte Kirchenbücher Thüringen:
    https://www.google.com/maps/d/viewer...5763605578&z=9
  • Lock
    Erfahrener Benutzer
    • 07.04.2016
    • 452

    #2
    Hallöchen

    Ich denke das Thema Statistiken ist vielfältig. Jeder wird für sich einen anderen Schwerpunkt setzen. Es gibt da x Möglichkeiten.
    Mich hat beispielsweise einmal die regionale Verteilung bestimmter Vornamen interessiert. Also ein Vorname verknüpft mit dem Geburts- und Tauforten.
    In einer Linie waren die "Andreas" gehäuft und in der anderen gab es die nur vereinzelt. Zweck war eigentlich den Suchbereich einzugrenzen um diejenigen, welche sozusagen in der Luft hingen zuordnen zu können.

    v.G. Gerhard

    Kommentar

    • offer
      Erfahrener Benutzer
      • 20.08.2011
      • 1731

      #3
      Hallo DerFalke!

      Zitat von DerFalke Beitrag anzeigen
      Ich hab mir gedacht, dass es ganz cool wäre wenn man über seine Vorfahren ein paar Statistiken errechnen könnte. (Lebenserwartung, Heiratsalter, häufigste Namen, Orte etc.)

      Jetzt kenne ich mich mit Geneanologieprogrammen überhaupt nicht aus und weiß nicht welche Features die schon haben aber ich wette keins hat alle Features, die ich möchte.
      ...
      Hast Du dir mal mein Programm KAum angesehen?
      Da kannst Du dir ja vielleicht einige Anregungen holen und vieles besser machen.

      Viel Erfolg bei der Erstellung des Programms. Ich bin schon gespannt auf Dein Ergebnis.
      This is an offer you can't resist!

      Kommentar

      • Mismid
        Erfahrener Benutzer
        • 21.02.2009
        • 987

        #4
        Ich denke, die genannten Statisken gibt es bei vielen Programmen.
        Die Frage ist aber, was man mit der jeweiligen Statistik bezwecken will und welche Aussagekraft diese besitzt.
        Man kann natürlich alle möglichen Zahlenwerte irgendwie zusammenstellen.
        Man mußt sich dabei auch bewußt sein, wie man die Werte überhaupt ermitteln will. Bildet man einen einfachen Durchschnitt?
        Dann sind auch alle Extremwerte (früher Tod durch Unfall, Mord, Krieg usw., falsches Lebensalter durch fehlendes genaues Geburts oder Todesdatum) enthalten.
        Das könnte man wiederum durch diverse Statistische Auswertungen anders betrachten (Elimination aus Ausreissern ab einer bestimmten Abweichung). Dafür gibt es auch unzählige Methoden.
        Auf der anderen Seite sollte man Daten auch nicht zu wichtig nehmen, denn meistens ist die Aussagekraft sowieso beschränkt. Wahrscheinlich wirst du herausfinden, dass die tatsächliche Lebenswertung irgendwo zwischen 0 und 110 Jahren liegt und steigt je älter man aktuell schon ist ;-)

        Kommentar

        • Steinfeld
          Erfahrener Benutzer
          • 06.08.2016
          • 143

          #5
          Hallo @DerFalke
          Wie groß ist Ihre Gedcom-Datei, wie viele Personen beinhaltet sie?

          Kommentar

          • DerFalke
            Erfahrener Benutzer
            • 26.02.2021
            • 177

            #6
            Mir hat mein Tool schon geholfen (und war auch mal wieder eine nette Programmierübung), gerade die Auflistung der Personen mit der Kekula-Zahl und Berechnung des Alters habe ich vorher alles per Hand gemacht, aber bei vielen hundert Vorfahren und diversen Ahnenschwund macht man irgendwann auch Fehler.



            Hier im Anhang ist das Tool für Windows, kann gerne getestet werden.
            Es ist sehr primitiv aber tut genau das wofür es gedacht war.



            @Steinfeld
            Meine Datei hat ca. 2800 Personen aber das spielt keine Rolle, das Programm sollte auch wesentlich größere Dateien schaffen, ich seh keinen Grund der dagegen spricht.
            Angehängte Dateien
            Trau-Schnellindex für Dresden-Meißen-Freiberg-Dippoldiswalde:
            https://tintenfrass.github.io/simplechurchbookindexes/

            Karte Kirchenbücher Sachsen:

            https://www.google.com/maps/d/viewer...561152344&z=10

            Karte Kirchenbücher Thüringen:
            https://www.google.com/maps/d/viewer...5763605578&z=9

            Kommentar

            • Steinfeld
              Erfahrener Benutzer
              • 06.08.2016
              • 143

              #7
              Ich habe meine Gedcom in eine DB gepackt und mittels SQL kann ich alles mögliche auslesen, ohne zu programmieren. Bei 1,4 Mio. Personen packt das außer der DB keine Software.

              Kommentar

              • DerFalke
                Erfahrener Benutzer
                • 26.02.2021
                • 177

                #8
                Nagut, das ist eine andere Hausnummer und auch ein anderer Anwendungsfall.

                Grob geschätz sind deine 1,4Mio Datensätze wenige GB an Daten. Das ist eine Menge, die eine vernünftig programmierte Software auch alles im Speicher bearbeiten könnte, das Einlesen der Daten könnte nur paar min dauern...


                Aber eine SQL-DB ist da nicht verkehrt, würde ich an deiner Stelle sicher auch so machen. Nur SQL-Queries schreiben ist irgendwo genauso anstrengen wie Code schreiben, das nimmt sich nicht viel.
                Trau-Schnellindex für Dresden-Meißen-Freiberg-Dippoldiswalde:
                https://tintenfrass.github.io/simplechurchbookindexes/

                Karte Kirchenbücher Sachsen:

                https://www.google.com/maps/d/viewer...561152344&z=10

                Karte Kirchenbücher Thüringen:
                https://www.google.com/maps/d/viewer...5763605578&z=9

                Kommentar

                Lädt...
                X