Software zur Transkription von Dokumenten

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • TempusFugit
    Erfahrener Benutzer
    • 14.11.2021
    • 132

    Software zur Transkription von Dokumenten

    Ich habe erst kürzlich mit der Ahnenforschung angefangen und arbeite mich gerade in die altdeutsche Schrift ein, damit ich einige der Familiendokumente übersetzen kann.

    Bisher mit Papier und Bleistift, aber da ich mir die Vorgabe gemacht habe, alles digital zu verwalten, suche ich nach einer Lösung hierfür.

    Gefunden habe ich bisher Transkribus, was zwar einen sehr guten Eindruck macht, aber offline nicht zu verwenden ist, da alle Dokumente hochgeladen werden müssen. Für mich daher aus Datenschutzgründen nicht nutzbar.

    Dann gibt es noch Diptychon, was auch brauchbar aussieht, aber nicht öffentlich zum Download steht; außerdem scheint es seit 2016 ungepflegt.

    Wichtig wäre für mich gute Zuordnung der Wörter (evtl sogar Buchstaben) zum Original, zB nebeneinander.

    Das mit einer Textverarbeitung zu machen geht bei kürzeren Dokumenten, aber ich habe hier auch alte Verträge mit 8-10 Seiten, und da nervt es, immer herumscrollen zu müssen, um das Bild dem Text zuzuordnen.

    Super wäre es, wenn das unter Linux laufen würde.
  • kkhno
    Erfahrener Benutzer
    • 15.07.2011
    • 384

    #2
    Hallo,

    schau dir mal GenSciber an. Das Programm ist für nicht-kommerzielle Nutzung kostenlos und es gibt es für Linux und Windows. Es ist recht mächtig, mit Template-Verwaltung und recht großem Funktionsumfang.

    Grüße, kkhno
    Lg. kkhno

    Kommentar

    • kkhno
      Erfahrener Benutzer
      • 15.07.2011
      • 384

      #3
      Ach ja,
      da gibt es auch noch Transcript, allerdings nur für Windows. Die letzte Beta-Version von 2020.

      Grüße,
      kkhno
      Lg. kkhno

      Kommentar

      • LutzM
        Erfahrener Benutzer
        • 22.02.2019
        • 3036

        #4
        Moin,
        Transkribus hab ich auch mal versucht. Es ist aber so seltsam in der Bedienung, dass es mit der Einarbeitung sehr mühsam ist. Und für das Gekrakel in den Kirchenbüchern ist es m.M.n. auch nicht zu gebrauchen. Schön geschriebene Briefe mit ausreichendem Zeilenabstand, können ganz gut funktionieren, aber für unsere Zwecke ist es eher nicht zu gebrauchen.

        Ich mache aus den Bildern eine pdf und schreibe dann, in anderer Farbe, das über die Wörter, was ich lesen konnte. Sicher nicht das hohe C, aber was besseres ist mir noch nicht eingefallen. Beispiel.
        Lieben Gruß

        Lutz

        --------------
        mein Stammbaum
        suche Eising * um 1880 aus/bei Creuzburg/Ostpreußen, sowie (August & Hellmut) Wegner und (Friederike) Lampe * um 1840 aus/bei Kleinzerlang/Prignitz

        Kommentar

        • kkhno
          Erfahrener Benutzer
          • 15.07.2011
          • 384

          #5
          Zu dem Thema gab es übrigens in 2016 bereits einen Thread.

          kkhno
          Lg. kkhno

          Kommentar

          • TempusFugit
            Erfahrener Benutzer
            • 14.11.2021
            • 132

            #6
            Na da habe ich ja ein paar Sachen zum Testen, danke.
            Vielleicht kommt ja was an den Umfang der Erstgenannten heran.

            Kommentar

            • KarOrl
              Erfahrener Benutzer
              • 18.10.2020
              • 119

              #7
              Zitat von TempusFugit Beitrag anzeigen
              Na da habe ich ja ein paar Sachen zum Testen, danke.
              Vielleicht kommt ja was an den Umfang der Erstgenannten heran.
              @TempusFugit: Das Ergebnis würde mich interessieren, wie alles, was die Arbeit vereinfacht. Ich kann mir allerdings nicht vorstellen, daß ein Programm die "Klauen" so mancher Standesbeamten bzw. Pfarrer entziffern kann. Aber wer weiß.


              Gruß

              Kommentar

              • TempusFugit
                Erfahrener Benutzer
                • 14.11.2021
                • 132

                #8
                Zitat von KarOrl Beitrag anzeigen
                @TempusFugit: Das Ergebnis würde mich interessieren, wie alles, was die Arbeit vereinfacht. Ich kann mir allerdings nicht vorstellen, daß ein Programm die "Klauen" so mancher Standesbeamten bzw. Pfarrer entziffern kann. Aber wer weiß.


                Gruß
                Mir geht es nicht um eine automatische Texterkennung. Transkribus scheint das nach einem Training zu können, aber dafür habe ich (noch) zu wenige und zu verschiedene Dokumente. Und dann habe ich immer noch Datenschutzbedenken. Mein Ziel wäre es, Zeilen/Wörtern eine Transkription zuzuordnen.
                Für alle die Webtrees nutzen: ähnlich dem Faces Plugin, mit dem man Bereiche auf einem Foto einer Person zuordnet.

                Mein Testdokument ist ein Protokoll, da es so ziemlich alles abdeckt: teils ein-, teils zweispaltig, verschiedene Schriftgrößen, Druck- und Handschrift, Normal- und Fettschrift und in den Spalten verschieden ausgerichtete Textblöcke.

                Das mag etwas zu ambitioniert erscheinen, aber schlechter wäre es nun ein Program zu wählen, und später herauszufinden was nicht geht.

                Probiert habe ich (auf die Schnelle) mal GenScriber und Transcript. Bei beiden kann ich den Text nur ein bisschen formatieren, aber richtig zuordnen geht nicht. Zugegeben, eine Zuordnung per Buchstaben wie bei Diptychon ist vielleicht überzogen, aber etwas in die Richtung wäre nett. Andererseits ist das eine Software speziell für die Paläographie; da spielen Details eine wichtige Rolle.

                Omeka-S mit Scripto steht noch aus. Da muß ich mir erst eine Test-VM aufsetzen wenn ich wieder ein paar Tage frei habe.

                Notfalls kann ich das auch in einem Wiki machen, das ist im Prinzip ähnlich zu GenScriber und Transcript wie ich finde.

                Kommentar

                • gki
                  Erfahrener Benutzer
                  • 18.01.2012
                  • 4852

                  #9
                  Hallo,

                  such mal nach "xournal". Damit kann Text "auf" bestehenden PDF speichern. Hab ich mal verwendet. Hat auch funktiniert, aber ich bin dazu übergegangen, kurze Textzusammenfassungen zu erstellen. Weniger Aufwand.
                  Gruß
                  gki

                  Kommentar

                  • TempusFugit
                    Erfahrener Benutzer
                    • 14.11.2021
                    • 132

                    #10
                    So, ich habe mich heute doch noch an Omeka-S mit Scripto versucht und dafür schnell einen Server aufgesetzt.

                    Leider schlug die Testmöglichkeit fehl, da bei der Konfiguration des Scripto Moduls in Omeka-S die API URL des MediaWikis nicht akzeptiert wurde, obwohl diese korrekt ist. Damit ist das erst mal auf Eis.

                    Kommentar

                    Lädt...
                    X