KI-generierte Stammbäume bei FamilySearch

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Xtine
    Administrator
    • 16.07.2006
    • 28395

    KI-generierte Stammbäume bei FamilySearch

    Bei CompGen erschien ein interessanter Artikel


    Eine Künstliche Intelligenz hat für FamilySearch einen Stammbaum mit über 9,3 Millionen Menschen automatisch erstellt. Dazu wurden von der KI mehr als 35 Millionen Quellen-Datensätze interpretiert, die Ereignisse zu Personen enthalten, die in Argentinien lebten. Dieser Baum wurde am 20. Mai 2023 veröffentlicht. Doch bereits zuvor gab es KI-generierte Stammbäume bei FamilySearch. Nun kann man sie nach Informationen über Vorfahren durchsuchen und darin navigieren .....
    Weiterlesen könnt ihr hier
    Viele Grüße .................................. .
    Christine

    .. .............
    Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
    (Konfuzius)
  • ofb-dühringshof
    Erfahrener Benutzer
    • 26.12.2015
    • 337

    #2
    Ja, wirklich spannend, wobei ich das Konzept dieses "Weltbaumes" noch nicht ganz verstanden habe. Ist das einfach nur eine Verknüpfung von weltweit verfügbaren Daten, oder will man den Beweis antreten, dass wir alle irgendwie miteinander verwandt sind, wenn man nur weit genug zurückgeht?

    Sobald OpenAI auch Paypal als Bezahlmöglichkeit anbietet und die Entwickler die Bedeutung von Gedcom-Dateien erkennen, bleibt die automatische Erstellung von Stammbäumen sicherlich kein Privileg von FamilySearch.
    Familienforschung Voigt
    https://silviadiessner.de/


    Gesuche:
    Krs. Landsberg/Warthe: Bläsing Bölke Diekmann Frohloff Hanf Menge Meyer Pahl Voß
    Sa-Anhalt: Bauermeister Bettzüche Bohnenstein Brix Dähne Danker Eckart Gallas Hillens Höpner Hundt Kähne Karting Kiesewetter Kissauer Kutz Osterland Philipp Reinsdorf Schritte Schwager Schweitzer Stranz Weider Wirnicke Wüstener
    Sachsen: Pichel Weitsch
    Thüringen: Penner
    Überall: Bobbe Deter Hölzke Hortich Karstedt (Carstädt) Kind Lob Schley

    Kommentar

    • katla
      Erfahrener Benutzer
      • 28.01.2023
      • 242

      #3
      Es bleibt die Frage der Zuverlässigkeit solcher per KI zusammengestellter Stammbäume. Ich wäre da skeptisch, angesichts der automatisch gefundenen „Matches“, die einem auf den verschiedenen Plattformen angeboten werden.
      viele Grüße
      Katharina

      Kommentar

      • ofb-dühringshof
        Erfahrener Benutzer
        • 26.12.2015
        • 337

        #4
        Zweifellos richtig. Ich halte die KI-generierten Stammbäume für genauso zuverlässig bzw. unzuverlässig wie die von Menschen erstellten Stammbäume, die im Internet verfügbar sind.
        Wie gut die Qualität der Daten ist, sieht man erst, wenn man selbst einzelne Einträge mit Quellen gegenprüft. Das wird im Artikel ja auch explizit empfohlen bzw. dringend angeraten.
        Familienforschung Voigt
        https://silviadiessner.de/


        Gesuche:
        Krs. Landsberg/Warthe: Bläsing Bölke Diekmann Frohloff Hanf Menge Meyer Pahl Voß
        Sa-Anhalt: Bauermeister Bettzüche Bohnenstein Brix Dähne Danker Eckart Gallas Hillens Höpner Hundt Kähne Karting Kiesewetter Kissauer Kutz Osterland Philipp Reinsdorf Schritte Schwager Schweitzer Stranz Weider Wirnicke Wüstener
        Sachsen: Pichel Weitsch
        Thüringen: Penner
        Überall: Bobbe Deter Hölzke Hortich Karstedt (Carstädt) Kind Lob Schley

        Kommentar

        • Mismid
          Erfahrener Benutzer
          • 21.02.2009
          • 987

          #5
          Sobald OpenAI auch Paypal als Bezahlmöglichkeit anbietet und die Entwickler die Bedeutung von Gedcom-Dateien erkennen, bleibt die automatische Erstellung von Stammbäumen sicherlich kein Privileg von FamilySearch.
          OpenAI kann ja auf Grund geschützter Archive, die nicht öffentlich sind, nicht auf alle Archive zugreifen. Auf sämtliche Bezahlarchive kann die KI nicht zugreifen, ebenso wenig auf andere zugangsbeschränkte Daten.Soltte es sich doch Zugriff verschaffen, wird es das jeweilige KI System auf Grund von Schadensersatzklagen bald nicht mehr geben.




          Zitat von ofb-dühringshof Beitrag anzeigen
          Ich halte die KI-generierten Stammbäume für genauso zuverlässig bzw. unzuverlässig wie die von Menschen erstellten Stammbäume, die im Internet verfügbar sind.



          Da die KI sich auf die Daten aus von Menschen unvollständig und eventuell fehlerhaften erfassten Daten stützt, kann es auch nie wirklich sehr gut werden. Dazu müßte es erstmal eine einigermaßen fehlerfreie automatische und vollständige Auslesung des Originals geben. Das werden Maschinen aber in den nächsten 50 Jahren niemals schaffen. Dafür sind die Einträge innerhalb eines Kirchenbuches oft viel zu unterschiedlich, so dass ein Automat nicht wissen kann, wie er die Daten interpretieren soll. Und vorallem bei schlechten Vorlagen mit Störungen/Überschreibungen/Überlagerungen usw. ist die fehlerhafte Auswertung vorprogramiert.
          Zuletzt geändert von Mismid; 20.06.2023, 08:28.

          Kommentar

          • Genialoge
            Erfahrener Benutzer
            • 29.10.2020
            • 221

            #6
            Die Vision, EINEN (weltweiten) Stammbaum zu erstellen, habe ich schon länger, denn jeden Menschen gab es definitiv nur 1x. Es ist daher nicht richtig, dass bestimmte Menschen in großen Plattformen mehrfach oder vielfach und mit teils sehr unterschiedlichen oder falschen Daten oder Verknüpfungen mit Verwandten erfasst werden.
            Das erfordert im Grunde einen neuen Denkansatz bei den großen digitalen Plattformen. Statt Massendaten zu sammeln und identische Personen in vielen separaten Stammbäumen zu vervielfältigen, müsste im Grunde (im Hintergrund) auf Basis valider Quellenangaben EIN Stammbaum gebildet und dokumentiert werden, und die Kunst der vielen Familienforscher bestünde dann darin, Zugang oder Verbindungen zu bestehenden und validen Daten zu finden.
            Mich interessieren derzeit primär Nachweise (Links) zu den von Papenheim zwischen 1330 und 1450, insbesondere zu Catharina von Papenheim oo Johann III von Schultete

            Kommentar

            • Andre_J
              Erfahrener Benutzer
              • 20.06.2019
              • 1911

              #7
              Zitat von Genialoge Beitrag anzeigen
              Die Vision, EINEN (weltweiten) Stammbaum zu erstellen, habe ich schon länger, denn jeden Menschen gab es definitiv nur 1x.
              Den Ansatz gibt es schon bei Wikitree. Das soll besser organisiert und gegengeprüft werden als der eine Stammbaum bei FamilySearch.
              Gruß,
              Andre

              Kommentar

              • ofb-dühringshof
                Erfahrener Benutzer
                • 26.12.2015
                • 337

                #8
                Zitat von Genialoge Beitrag anzeigen
                Die Vision, EINEN (weltweiten) Stammbaum zu erstellen, habe ich schon länger, denn jeden Menschen gab es definitiv nur 1x.
                Interessanter Ansatz.

                Unter wessen Federführung sollte das Projekt laufen? Wer entscheidet, wann ein Eintrag valide ist? Wann sind zwei Personen identisch (wieviele Merkmale müssen übereinstimmen)? Wenn es unlösbare Widersprüche gibt, welcher Eintrag ist der Richtige? usw. Eine KI kann das vermutlich am ehesten bewältigen. Manuell, wie es der Ansatz von Wikitree ist, ist es m.E. immer noch fehleranfällig und nicht der Weisheit letzter Schluss.

                Für eines meiner Projekte suche ich weltweit Nachfahren. Wie vorgehen? Die Datenbank auf diversen Plattformen hochladen und mich mit vielen unzutreffenden Matches beschäftigen? Noch dazu kostenpflichtig? Selbst jeden Familiennamen einzeln recherchieren und das am besten im Abstand von einigen Monaten (es könnten ja neue Daten dazu gekommen sein)? Das ist auch nicht machbar.

                So ein Weltbaum verknüpft mit einer sinnvollen Benachrichtigung wäre schon reizvoll. Also bspw. benachrichtige mich, wenn zu Person xy geb. 1500 neue Nachfahren hinzugekommen sind. Das kann wohl nur eine KI leisten.

                Fertiggeträumt.
                Familienforschung Voigt
                https://silviadiessner.de/


                Gesuche:
                Krs. Landsberg/Warthe: Bläsing Bölke Diekmann Frohloff Hanf Menge Meyer Pahl Voß
                Sa-Anhalt: Bauermeister Bettzüche Bohnenstein Brix Dähne Danker Eckart Gallas Hillens Höpner Hundt Kähne Karting Kiesewetter Kissauer Kutz Osterland Philipp Reinsdorf Schritte Schwager Schweitzer Stranz Weider Wirnicke Wüstener
                Sachsen: Pichel Weitsch
                Thüringen: Penner
                Überall: Bobbe Deter Hölzke Hortich Karstedt (Carstädt) Kind Lob Schley

                Kommentar

                • Altmark-Forscher-2020
                  Benutzer
                  • 26.05.2020
                  • 60

                  #9
                  FamilySearch

                  Da die KI nur mit den Datensätzen arbeitet die bereits eingestellt wurden, kann der derzeitige Unsinn nur verstärkt werden. Beim Abgleich meiner Daten mit den Stammbäumen bei FamilySearch habe ich noch nie etwas Brauchbares gefunden, die Fehlerquote lag immer über 50 %. Selbst bei einem Kind, dass erst Jahre den Tod des angeblichen Vaters geboren wurde geht der Stammbaum weiter zurück. Meistens wurden fehlerhafte Daten abgeschrieben und mit passenden Namen in Verbindung gesetzt. Das ist bei anderen Datenbanken nicht ganz so schlimm, aber alles was im Internet zu finden ist, wird kopiert und irgendwie zusammengebastelt. Dadurch wird nichts wirklich besser.
                  Mit Familienforschung hat das eigentlich nichts zutun, da bleibt nur in den Archiven gründlich zu suchen und wenn es nicht weitergeht dann ist es ebenso.

                  Kommentar

                  • DerFalke
                    Erfahrener Benutzer
                    • 26.02.2021
                    • 177

                    #10
                    Ich kann auch nur sagen, dass von meinen vielen Matches zu familysearch sehr sehr viel Unsinn dabei ist und man damit oft nicht viel anfangen kann, manchmal korrigiere ich die Sachen aber meist geb ich irgendwann auf.
                    Wenn diese Stammbaumerstellung nun eine KI übernimmt, ist das zwar technisch beeindruckend aber von den Daten genauso wertlos wie vorher.

                    Auf der anderen Seite ist die Idee des Weltstammbaumes schon ziemlich gut und da gefällt mir WikiTree deutlich besser als familysearch.
                    Trau-Schnellindex für Dresden-Meißen-Freiberg-Dippoldiswalde:
                    https://tintenfrass.github.io/simplechurchbookindexes/

                    Karte Kirchenbücher Sachsen:

                    https://www.google.com/maps/d/viewer...561152344&z=10

                    Karte Kirchenbücher Thüringen:
                    https://www.google.com/maps/d/viewer...5763605578&z=9

                    Kommentar

                    • OlliL
                      Erfahrener Benutzer
                      • 11.02.2017
                      • 4598

                      #11
                      Nunja - aller Anfang ist schwer. Das gute an künstlicher Intelligenz ist ja, das sie je nachdem wie intelliegent sie schon ist halt auch selber aus Fehlern lernt - bzw. halt neu trainiert werden kann was am Ende aufs gleiche rauskommt.
                      Ich denke mit den Datensätzen aus den letzten vielleicht 100 Jahren kommt man schon recht gut voran.... danach wird es halt immer schwerer und setzt immer mehr "Intelligenz" voraus weil die Datensätze halt immer weniger Inhalt haben (keine Mütter bei taufen, nur "Töchterlein" beim Tod usw.). Am Ende des Tages wird es an der zuverlässigen Indizierung vorhandener Daten mit möglichst allen Merkmalen des Datensatzes (also z.B. inkl. Taufpaten, deren Berufe, deren Herkunftsorte usw....) liegen. Umso weniger erfasst ist, umso schlechter wird die KI sein - sie kann ja (noch?) nicht wie wir in das Originaldokument schauen sondern ist halt von den digital vorliegenden Indizierungen abhängig. Wenn die schon Schrott sind.... shit in, shit out.....


                      Viele Grüße,
                      OlliL
                      Zuletzt geändert von OlliL; 21.06.2023, 16:19.
                      Mein Ortsfamilienbuch Güstow, Kr. Randow: https://ofb.genealogy.net/guestow/
                      Website zum Familienname Vollus: http://www.familie-vollus.de/

                      Kommentar

                      • robotriot
                        Erfahrener Benutzer
                        • 20.02.2009
                        • 690

                        #12
                        Ich bin schon gespannt, was mit KI-Technologien mal möglich sein wird. Die KI könnte recht gut große (fehlerhafte) Datensätze erfassen, versuchen wahrscheinliche Fehler zu korrigieren (z.B. falsche Ortsangaben richtig zuordnen durch geographische Nähe, Wahrscheinlichkeiten, oder Identifizierung abweichender, eher als korrekt einzustufenden Ortsangaben), Verknüpfungen finden die man als Mensch nicht so leicht sieht und dann daraus einen Baum basteln, der einem selbst vielleicht neue Ansätze zur Forschung und Verifizierung bietet. Besonders beim Zusammenpuzzeln von DNA Matches wäre es hilfreich, wenn diese automatisch untereinander verknüpft werden könnten, auch wenn sie nur wenige Personen in ihren Stammbäumen haben.

                        Richtig spannend wäre sicher, wenn KI das Lesen lernt. Daran wird ja schon gearbeitet. Das würde natürlich ganz neue Möglichkeiten bieten, wenn es automatische Indizes gäbe für alle Bücher. Andererseits ist natürlich schon auch ein spaßiger Teil der Forschung, dass man sich da mühsam durchkämpfen muss, viel rumrätselt um dann ein Erfolgserlebnis zu bekommen. Das würde natürlich verloren gehen. Wahrscheinlich würde ich so eine Technologie eher für die hoffnungslosen Fälle verwenden (z. B. unbekannte Herkunft einer Person, bei der man alle Pfarreien im Umkreis absuchen muss).

                        Aktuell verwende ich ChatGPT schon zum Übersetzen von Latein aus Kirchenbucheinträgen - das funktioniert richtig gut, jedenfalls wesentlich besser als Google Translate.

                        Kommentar

                        • Genialoge
                          Erfahrener Benutzer
                          • 29.10.2020
                          • 221

                          #13
                          Zitat von ofb-dühringshof Beitrag anzeigen
                          Unter wessen Federführung sollte das Projekt laufen? Wer entscheidet, wann ein Eintrag valide ist? Wann sind zwei Personen identisch (wieviele Merkmale müssen übereinstimmen)? Wenn es unlösbare Widersprüche gibt, welcher Eintrag ist der Richtige?

                          ...
                          Fertiggeträumt.
                          Hallo,
                          im Grunde müssten die Plattformen 2 Datenbestände pflegen. DB1 mit allen Daten und Mehrfachnennungen (wie bislang), und DB2, in der alle Personen nur einmal vorkommen, und die sich aus DB 1 ergeben. Quellenangaben sind z.B. immer gut.
                          Karl den Großen gibt es allein in deutschen Stammbäumen über 5000x z.B. in MyHeritage/familysearch, obwohl es m.E. gesichert ist, dass es sich in allen über 5000 Fällen um die gleiche Person handelt. Klar kann es Luise Müller auch mehrfach geben, aber nicht mehrfach bei gleichen Eltern. Im Zweifel muss die Verbindung zu Verwandten gekappt werden und dann hängen die Luisen eben allein im Baum.
                          LG
                          Lothar
                          Mich interessieren derzeit primär Nachweise (Links) zu den von Papenheim zwischen 1330 und 1450, insbesondere zu Catharina von Papenheim oo Johann III von Schultete

                          Kommentar

                          • ofb-dühringshof
                            Erfahrener Benutzer
                            • 26.12.2015
                            • 337

                            #14
                            Zitat von Genialoge Beitrag anzeigen
                            Hallo,

                            Karl den Großen gibt es allein in deutschen Stammbäumen über 5000x z.B. in MyHeritage/familysearch, obwohl es m.E. gesichert ist, dass es sich in allen über 5000 Fällen um die gleiche Person handelt.
                            Das sehe ich auch als Problem, selbst schon "im Kleinen" bei der Metasuche auf genealogy.net.
                            Der Datenumfang ist Fluch und Segen zugleich. Wenn ich nach Anschluss eines Johann Müller suche, bin ich verloren.

                            Vielleicht ist es irgendwann denkbar, dass bspw. auch in kleineren Datenbanken (der Metasuche) eine KI eingebaut wird, so dass a) alle Johann Müller, die wahrscheinlich(!) identisch sind zu einem Ergebnis zusammengefasst werden oder b) eine Abfrage, eingegrenzt nach Datum möglich ist. Das würde die Zahl der Treffer auch deutlich reduzieren.

                            Oder - Deinen Gedanken weiter gedacht - eine KI generiert aus allen verfügbaren Online-OFB ein "Welt-OFB". Die Anfänge sind ja jetzt schon vorhanden mit der Anzeige, dass es weitere Personen in anderen OFB gibt, sofern bestimmte Daten annährend übereinstimmen.

                            Grüße
                            Silvia
                            Familienforschung Voigt
                            https://silviadiessner.de/


                            Gesuche:
                            Krs. Landsberg/Warthe: Bläsing Bölke Diekmann Frohloff Hanf Menge Meyer Pahl Voß
                            Sa-Anhalt: Bauermeister Bettzüche Bohnenstein Brix Dähne Danker Eckart Gallas Hillens Höpner Hundt Kähne Karting Kiesewetter Kissauer Kutz Osterland Philipp Reinsdorf Schritte Schwager Schweitzer Stranz Weider Wirnicke Wüstener
                            Sachsen: Pichel Weitsch
                            Thüringen: Penner
                            Überall: Bobbe Deter Hölzke Hortich Karstedt (Carstädt) Kind Lob Schley

                            Kommentar

                            • Andre_J
                              Erfahrener Benutzer
                              • 20.06.2019
                              • 1911

                              #15
                              Zitat von Altmark-Forscher-2020 Beitrag anzeigen
                              Da die KI nur mit den Datensätzen arbeitet die bereits eingestellt wurden, kann der derzeitige Unsinn nur verstärkt werden.
                              Jein. soweit ich das mitbekommen habe, bekam die KI einen fest abgegrenzte Menge an Original-Dokumenten aus einer festgelegten Region zum Fraß vorgesetzt. Sie schaut also nicht in den bekannten FS-Stammbaum.

                              Sonst würde sie sich wundern, dass Jesus Christus jede Menge Nachfahren haben soll, unter anderem französiche Könige und mich
                              Gruß,
                              Andre

                              Kommentar

                              Lädt...
                              X