Vortrag

Das Redewiedergabe-Korpus

Raum HZ5

Annelen Brunner

Institut für Deutsche Sprache, Mannheim, Deutschland

Lukas Weimer

Julius-Maximilians-Universität Würzburg, Deutschland

Ngoc Duyen Tanja Tu

Institut für Deutsche Sprache, Mannheim, Deutschland

Stefan Engelberg

Institut für Deutsche Sprache, Mannheim, Deutschland

Fotis Jannidis

Julius-Maximilians-Universität Würzburg, Deutschland

In diesem Beitrag wird das Redewiedergabe-Korpus (RW-Korpus) vorgestellt, ein historisches Korpus fiktionaler und nicht-fiktionaler Texte, das eine detaillierte manuelle Annotation mit Redewiedergabeformen enthält. Das Korpus entsteht im Rahmen eines laufenden DFG-Projekts und ist noch nicht endgültig abgeschlossen, jedoch ist für Frühjahr 2019 ein Beta-Release geplant, welches der Forschungsgemeinschaft zur Verfügung gestellt wird. Das endgültige Release soll im Frühjahr 2020 erfolgen. Das RW-Korpus stellt eine neuartige Ressource für die Redewiedergabe-Forschung dar, die in dieser Detailliertheit für das Deutsche bisher nicht verfügbar ist, und kann sowohl für quantitative linguistische und literaturwissenschaftliche Untersuchungen als auch als Trainingsmaterial für maschinelles Lernen dienen.

Diese Visualisierung basiert auf der Einreichung Das Redewiedergabe-Korpus und setzt sich aus Werten für Flesch-Reading-Ease (63) und Sentimentanalyse (59) zusammen.