Mehr als 170 Universitäten lassen Roboterjournalismus über Corona berichten

Große Datenberge auf einer Seite zusammengefasst

(ddna). Natürlich haben WissenschaftlerInnen keine Probleme, ihre aus komplexen Modellen stammenden Zahlenreihen mit wenigen Blicken zu analysieren. Problematisch wird es, wenn diese Analysen auch für wissenschaftliche Laien verständlich werden sollen: für Politiker, Journalisten und ganz normale Mitmenschen.


Inzwischen haben sich weltweit rund 170 Universitäten dafür entschieden (die „Dunkelziffer“ dürfte deutlich höher sein), ihre Erkenntnisse per „automatischer Textgenerierung“ in natürlichsprachliche Zusammenfassungen zu „übersetzen“.  Der Aufwand zu Beginn ist nicht gerade gering: Wissenschaftler, Computerlinguisten, KI-Experten und Journalisten müssen den besten Weg finden, sehr komplexe Zusammenhänge in einfachen Worten zu erläutern, ohne das die wissenschaftliche Präzision auf der Strecke bleibt.


Viele Universitäten und wissenschaftliche Forschungseinrichtungen (ausgenommen deutsche Einrichtungen) sind inzwischen einen Schritt weitergegangen: sie bieten selbst Live-Ticker auf whatsapp, Twitter und auf den eigenen Websites und Blogs an. Aus einem 800 bis 2000 Wörter umfassenden Text mit zahlreichen Grafiken (automatisch generiert) enstehen in Sekundenbruchteilen weitere Inhalte, oft auch in mehreren Sprachen gleichzeitig.


Spannend und nicht immer vollständig einvernehmlich ist das Ringen um zwei unterschiedliche Ziele: die wissenschaftliche Präzision („das muss genauer erläutert werden„) auf der einen Seite und das Streben nach größtmöglicher Verständlichkeit der Texte und Grafiken („das versteht sonst kein Mensch„). Die Virusexperten sitzen oft zum ersten Mal überhaupt an einem Tisch mit

  • Computerlinguisten
  • erfahrenen Programmierern mit KI-Kompetenz
  • Spezialisten für Datenanalyse, oft Mathematikern
  • menschlichen Journalisten mit tieferer Digitalkompetenz

Kein einfacher Prozess, aber ein lohnender, denn nach der Entwicklung einer solchen „Zahle-zu-Text“-Anwendung läuft diese Maschine automatisch. Weiß, wann und warum ein neuer Text produziert werden muss und kann sogar News-Alerts nur innerhalb der Universität oder Forschungseinrichtung verschicken, wenn eineZahlrenreihe manuell überprüft werden muß. Auch als Kontrollinstanz leistet eine KI-basierte Textgenerierung viel, denn bei Abweichungen von den ursprünglich erwartenden Entwicklungen wird Alarm gegeben. Bvor ein Text nach draussen geht, natürlich.


Aber auch innerhalb des Roboterjournalismus-Teams gibt es eine große Spannbreite unterschiedlicher Arbeits- und Herangehensweisen: kreative Journalisten treffen auf zahlenfixierte Mathematiker und Analysten, Info-Grafiker mit künstlerischer Ader auf zu 100% strukturiert denkede ProgrammiererInnen.


Natürlichsprachliche Texte aus Berlin

Beim Berliner Anbieter ddna hat man die Zusammenarbeit mit vielen Corona-Interessierten dazu genutzt, bei der Textgenerierung die nächste Entwicklungsstufe zu erreichen: die Software lernt jetzt anhand vieler Tausend Beispiele einen eigenen Schreibstil. Das heisst: ohne menschliche Regeln als Grundlage zu haben schreibt der Computer bald Texte im Stil einer „New York Times“ oder einer Boulevardzeitung– je nachdem, was der Kunde und die Leser möchten. Nur die Inhalte in den Beiträgen werden immer stimmen, wenn die Daten richtig waren.


Wolfgang Zehrt, Berlin