Der TextImager als Front- und Backend für das verteilte NLP von Big Digital Humanities Data

Wahed Hemati

Johann Wolfgang Goethe-Universität Frankfurt am Main, Deutschland

Alexander Mehler

Johann Wolfgang Goethe-Universität Frankfurt am Main, Deutschland

Tolga Uslu

Johann Wolfgang Goethe-Universität Frankfurt am Main, Deutschland

Giuseppe Abrami

Johann Wolfgang Goethe-Universität Frankfurt am Main, Deutschland

Wir stellen ein Konzept zur flexiblen Erweiterung des Bereichs des Natural Language Processing (NLP) auf Basis von TextImager vor. Zu diesem Zweck stellen wir eine UIMA-basierte Serverarchitektur vor, die im Grundsatz offen ist: Wissenschaftler können teilnehmen und dazu beitragen.

Diese Architektur kann helfen, NLP-Tools oder -Pipelines, die proprietär oder geschützt sind, der gesamten Digital Humanities Gemeinschaft zugänglich zu machen.

Der Beitrag erörtert die Möglichkeiten und Grenzen des NLP von Big Data, stellt den TextImager als Werkzeug für diesen Bereich zur Diskussion und zeigt anhand von drei Nutzungsszenarien Einsatzmöglichkeiten in den DH auf.

Diese Visualisierung basiert auf der Einreichung Der TextImager als Front- und Backend für das verteilte NLP von Big Digital Humanities Data und setzt sich aus Werten für Flesch-Reading-Ease (57) und Sentimentanalyse (67) zusammen.