Wir stellen ein Konzept zur flexiblen Erweiterung des Bereichs des Natural Language Processing (NLP) auf Basis von TextImager vor. Zu diesem Zweck stellen wir eine UIMA-basierte Serverarchitektur vor, die im Grundsatz offen ist: Wissenschaftler können teilnehmen und dazu beitragen.
Diese Architektur kann helfen, NLP-Tools oder -Pipelines, die proprietär oder geschützt sind, der gesamten Digital Humanities Gemeinschaft zugänglich zu machen.
Der Beitrag erörtert die Möglichkeiten und Grenzen des NLP von Big Data, stellt den TextImager als Werkzeug für diesen Bereich zur Diskussion und zeigt anhand von drei Nutzungsszenarien Einsatzmöglichkeiten in den DH auf.
Diese Visualisierung basiert auf der Einreichung
Der TextImager als Front- und Backend für das verteilte NLP von Big Digital Humanities Data und setzt sich aus Werten für Flesch-Reading-Ease (57) und Sentimentanalyse (67) zusammen.