Transkription von KB mittels Spracherkennung

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • Wilniewski
    Benutzer
    • 14.02.2014
    • 18

    Transkription von KB mittels Spracherkennung

    Moin an alle,

    wie würdet ihr die technische Umsetzbarkeitvon folgendem Vorschlag beurteilen:

    Wenn man ein Kirchenbuch nimmt, dass z.B. im Original oder demnächst bei archion zugänglich ist und eine Software zur Spracherkennung installiert hat, die es ermöglicht verbal z.B. eine Datenbank bei MS Access zu steuern und zu füllen, dann müsste man in der Lage sein Transkriptionen, bzw. digitale Suchregister anzufertigen.

    Man benötigt dafür natürlich Regeln, wie man transkribiert (z.B. einheitliche Namensschreibweise, was eigentlich nur Ortskundige mit dem nötigen Wissen festlegen können, z.B. dass "Duselmann" und "Thusselman" heute "Tüselmann" ist, etc etc). Ebenso muss das Programm ermöglichen, dass man Eigennamen "einspricht", also dass es lernfähig ist, solange es der gleiche Benutzer bleibt.

    Eintragsbeispiel:
    "In dem Jahre des Herrn 1728 am III. Martii is dem Hannß Friederich op dem Boel von siene Fraue Trine Nottenboome ein Son getaufet un Hinricus mit Namen genandt. Testes: Evert op dem Nedernboel, Gorgen Eickholt"

    Dass man dann quasi sagen kann "Nächste Zeile" und zellenweise ansagt:
    03.03.1728 -> Beulmann, Heinrich -> Beulmann, Hans Friedrich -> Nottebaum, Catharina -> Beulmann, Niederste, Eberhard -> Eichholz, Jorgen.
    Wobei die Pfeile z.B. ein Kommando "next" oder so darstellen sollen. Und wenn das Programm z.B. Eicholz statt Eichholz schreibt, dann müsste es das nach einmaliger Korrektur lernen.

    Fragen: Gibt es so ein Programm? Was kommt dem nahe? Wenn es sowas nicht gibt: Was kann man tun?

    Wenn sowas funktionieren würde, dann wäre es eine tolle Alternative. Oder nicht? Ich würde mir das Headset aufschnallen, mich ein paar Tage abmühen mit den Korrekturen und dann dürfte es eigentlich eine Erleichterung sein und schneller gehen.

    Mit besten Grüßen,

    Wilniewski
  • Xtine
    Administrator
    • 16.07.2006
    • 28378

    #2
    Hallo Wilniewski,

    eine Übertragung eines Kirchenbuches ist für mich eher Transliteration als Transkription.

    Von der Transkription im engeren Sinne ist die Transliteration als schriftbasierte, buchstabengetreue, bei Bedarf wieder umkehrbare Umsetzung eines Wortes aus einer Schrift in eine andere zu unterscheiden. Dem Fachmann soll die genaue Schreibweise des Wortes in der anderen Schrift dargestellt werden.
    Die unterschiedliche Schreibweise der Namen darf dabei, meiner Meinung nach, nicht verloren gehen.
    Ich bezweifle daher, daß es ein Programm geben kann, dem Du die alten Schreibweisen der Wörter mittels Sprache eingeben kannst, genausowenig wird es auch Lateinisch verstehen.

    Ob sich jemand die Einträge dann auch in heutiges Deutsch "übersetzt", bleibt jedem selbst überlassen.
    Viele Grüße .................................. .
    Christine

    .. .............
    Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
    (Konfuzius)

    Kommentar

    • Wilniewski
      Benutzer
      • 14.02.2014
      • 18

      #3
      @Christine:
      Danke für die Meinung . Die Problematik der technischen Umsetzbarkeit einer Transliteration habe ich beachtet. Deshalb der Vorschlag eine solche Datenbank in Standarddeutsch mit den entsprechenden heutigen, festgeschriebenen Nachnamen zu machen, bzw. für ausgestorbene Namen eines Kirchspiels sich auf einheitliche Schreibweisen zu einigen.

      Der Vorteil einer solchen Datenbank ist der eines jeden Findbuchs (z.B. für Standesamtsunterlagen, wie sie einige Städte mittlerweile veröffentlichen, z.B. Bochum). Man könnte nach verschiedenen Merkmalen sortieren und quasi "basteln", bevor man dann die für sich relevanten Stellen in den Digitalisaten oder Originalunterlagen aufsucht und markiert. Aufgrund verschiedener Sprachen oder Schreibweisen wäre das bei einer digitalen Transliteration schwieriger. Was nicht heißt, dass es nicht auch wunderbar wäre, die KB im Wortlaut digital verfügbar zu haben. Das ist eine normative Frage, die ich nicht beantworten kann, da ich beide Herangehensweisen als komplementär ansehe und nicht als Substitute.

      Deshalb frage ich nach Ideen und Meinungen zur technischen Umsetzbarkeit einer im Anfangspost beschriebenen Datenbank, da eine solche Digitalisierung enorme Zeitersparnisse erlauben würde und für Suchen und für andere Datenbankoperationen nutzbar wäre.

      Würde mich freuen, wenn es sowas vielleicht schon gibt, bzw. man ein bestehendes Programm dafür "umnutzen" könnte. Vielleicht weiß jemand mehr?

      LG, Wilniewski

      Kommentar

      • Xtine
        Administrator
        • 16.07.2006
        • 28378

        #4
        Hallo Wilniewski,

        was ist aber, wenn ich erst, sagen wir um 1750, auf den Namen Thüsselman stoße? Nach diesem suche aber nichts finden werde, da er nach der heutigen(?) Schreibweise Duselmann einsortiert ist?

        Wenn, dann sollten alle alten Schreibweisen eines Namens, die in einer Linie nachgewiesen sind, in solch einer Datenbank enthalten sein.

        Außerdem kann es durchaus sein, daß sich die Schreibweise eines Namens in verschiedenen Linien auch verschieden entwickelt.
        Viele Grüße .................................. .
        Christine

        .. .............
        Wer sich das Alte noch einmal vor Augen führt, um das Neue zu erkennen, der kann anderen ein Lehrer sein.
        (Konfuzius)

        Kommentar

        • hagggi
          Erfahrener Benutzer
          • 19.08.2012
          • 721

          #5
          Der Gedanke ist gut.
          Aber ich würde lieber die Namen im original belassen. Grund dafür z.B. In Erxleben FN Uhlenhuth (Heiratseintrag), 20 km weiter in Oebisfelde Uhlenhuth (Geburtseintrag) wird zu Uhlenhaut im Ehe- und Sterbeeintrag der Eltern. Beide FN sind In der Gegend heute noch zu finden.
          Viele Grüße Hagggi

          Ich suche:im Raum Wanzleben, Haldensleben, nordwestliches Magdeburg
          Kinder( 19 von 21!!! schon gefunden) von Carl August Friedrich PLATE *:15 Jan 1863 Erxleben, Ohrekreis +:22 November 1945 Groß Ottersleben, Magdeburg
          °° 20 Oktober 1887 Olvenstedt, Magdeburg
          mit: Henriette Emma Bertha SCHÖNEBERG *:11 April 1866 Olvenstedt, Magdeburg +:09 May 1939 Groß Ottersleben, Magdeburg

          Kommentar

          • Mats
            Erfahrener Benutzer
            • 03.01.2009
            • 3391

            #6
            Hallo Wilniewski,

            die Idee ist klasse. Da habe ich auch schon mehrfach drüber nachgedacht, allerdings bin auch ich dafür, die Namensvarianten und unterschiedlichen Schreibweisen zu erhalten. Seine Schlüsse kann dann jeder Forscher selbst draus ziehen.

            Im Bereich Spracherkennungssoftware gibt es ja schon einiges, ich fürchte allerdings, daß die Technik eher auf das Erkennen unserer heutigen Sprachmuster ausgelegt ist und mit einem Taufeintrag von 1760 so seine Probleme hätte. Eine wortgetreue bzw. buchstabengetreue Erfassung mittels Spracherkennung wird also vermutlich nicht möglich sein - zumindest nicht mit dem derzeitigen Stand der Technik.

            Bleibt also noch die Möglichkeit einer Datenbank.
            Zunächst einmal braucht man eine entsprechende Datenbank, wo die am häufigsten benötigten Felder für die Eingabe definiert sind. Das ganze müsste mit der Spracherkennung gekoppelt werden, so daß Befehle per Sprachsteuerung ausgewählt werden können. Das größte Problem wird die Erkennung der Eigennamen sein. Bei etlichen Namen fällt mir das Aussprechen schon reichlich schwer, umso schwerer muß für das Programm die Erkennung sein. Dazu kommen die ganzen Namensvarianten, die sich sprachlich nicht unterscheiden. Wenn normale Spracherkennungssoftware schon zwischen "mehr Salz" und "Meersalz" nicht unterscheiden kann, wird es mit "Beiderbeke", "Bei der Beeke" oder "Meyer", "Meier", "Mayr" und sonstigen Varianten auch Probleme haben. Von so schmutzigen Dingen wie "Dehnungs-e" und "-i", die nicht mitgesprochen werden ganz zu schweigen.

            Vermutlich wird das auf Jahre Zukunftsmusik bleiben weil nicht genug Geld damit zu verdienen ist.

            Grüße aus OWL
            Anja
            Es gibt nur 2 Tage im Jahr, an denen man so gar nichts tun kann:
            der eine heißt gestern, der andere heißt morgen,
            also ist heute der richtige Tag
            um zu lieben, zu handeln, zu glauben und vor allem zu leben.
            Dalai Lama

            Kommentar

            Lädt...
            X