Raum HZ5
Die maschinelle Kollationierung von Texten in verschiedenen Sprachen ist eine offene Forschungsfrage der Digital Humanities. Verschiedene Ähnlichkeitsmaße der DH-Methoden gehen von einer Kollationierung innerhalb einer Sprache aus, während industriell erprobte Methoden, etwa aus dem Bereich Machine Translation, nicht mit historischem Wandel in Rechtschreibung und Typographie umgehen können.
Das Forschungsprojekt „Das Beichthandbuch des Azpílcueta“ untersucht die Entwicklung eines Werks in knapp 60 portugiesischen, spanischen und lateinischen Druckeditionen des 16. Jahrhunderts. In diesen Editionen sorgte der Autor z.T. selbst für die Übersetzung und er modifizierte das Werk allmählich wesentlich. Um die Untersuchung dieser Entwicklung zu erleichtern, evaluieren wir verschiedene Ansätze, korrespondierende Passagen zwischen jeweils zwei Editionen zu identifizieren. Sie greifen in ganz verschiedenen Modi auf die Daten zu und lassen sich grob in statistische, linguistische sowie wissensbasierte Ansätze unterteilen. Der Vortrag wird das Verfahren und die Ergebnisse dieser Evaluation vorstellen, und dabei auch die Faktoren und Auswirkungen der nötigen manuellen Zuarbeit benennen.
Diese Visualisierung basiert auf der Einreichung
Multimodale Versuche der Alignierung historischer Texte und setzt sich aus Werten für Flesch-Reading-Ease (69) und Sentimentanalyse (29) zusammen.