Poster

UPB-Annotate: Ein maßgeschneidertes Toolkit für historische Texte

Nina Seemann

Universität Paderborn, Deutschland

Marie-Luis Merten

Universität Paderborn, Deutschland

Das interdisziplinäre Projekt InterGramm geht dem literaten Ausbau des Mittelniederdeutschen bis hin zum Schriftsprachenwechsel zum Frühneuhochdeutschen nach. Im Zuge von Sprachausbauprozessen wandeln sich (häufig) bereits existierende Konstruktionen und neue literate Konstruktionen entstehen (Traugott / Trousdale 2013). Unser Ziel ist es, diese Wandelphänomene durch die Analyse historischer Rechtstexte und Arzneibücher zu erfassen. Insbesondere interessiert uns die Entwicklung komplexer Satztypen (subordinierende Konstruktionen), attributiver Techniken, die in komplexen Nominalphrasen resultieren, und textstrukturierender Elemente. Voraussetzung zur Erfassung dieser Elemente ist es, unser Korpus mit Part-of-Speech-Tags sowie mit Konstruktionstags zu versehen.

Im Hinblick auf unsere graphematisch stark variierenden Texte und die herausfordernde Grammatikanalyse benötigen wir ein maßgeschneidertes Toolkit, das das Layout der historischen Texte 1:1 abbildet, das Editieren von Primärdaten erlaubt sowie morphologische und konstruktionale Annotationen unterstützt.

Diese Visualisierung basiert auf der Einreichung UPB-Annotate: Ein maßgeschneidertes Toolkit für historische Texte und setzt sich aus Werten für Flesch-Reading-Ease (28) und Sentimentanalyse (65) zusammen.