Roboterjournalismus versorgt ungezählte Portale mit News zu Covid-19

(ddna). Es gibt zwei europäische Sprachen, in denen aktuell keine automatisch generierten Corona-Berichte bekannt sind: Finnisch und Ungarisch. Beide Sprachen sind auch für Computer-Linguisten eher sperrig und die sprachliche Zielgruppe ist zu klein, um den nötigen Aufwand zu betreiben. Ansonsten schreiben Roboterjournalisten auf Hebräisch und in Mandarin, in Englisch, Französisch, Spanisch und Deutsch sowieso.


Wieviele Berichte täglich zum Corona-Pandemie von autonom arbeitenden Softwareanwendungen für Textgenerierung verfasst werden ist schwer bezifferbar: aus einem 800 Wörter umfassenden Text mit zahlreichen Grafiken (natürlich auch automatisch generiert) enstehen in derselben Sekunde Twitter-Posts und whatsapp-Inhalte. Was kann als eigenständige News gezählt werden, was ist lediglich eine Ableitung oder eine Kurzform?


Selbst kleine Anbieter lassen täglich 30-40,000 Berichte in mehreren Sprachen verfassen, Kurz-, Mittel- und Langfassungen mitgezählt. Nach einem nervenaufreibenden Aufbau eines solchen Software-Tools können sich die Entwicklerinnen und Entwickler entspannt zurücklehnen: zwar gibt es immer wieder sprachliche Verfeinerungsmöglichkeiten, lassen sich Sachverhalte noch präziser ausdrücken, aber der Hauptteil der Arbeit ist getan, bevor der allererste Text irgendwo auf der Welt online geht. Was passiert, bevor die Texte erscheinen können?


Das typische Team für automated content setzt sich zusammen aus

  • Computerlinguisten
  • Sehr erfahrenen Programmierer, zunehmend ist KI-Kompetenz wichtig
  • Spezialisten für Datenanalyse, oft Mathematiker
  • menschlichen Journalisten mit tieferer Digitalkompetenz

Erfreulich: in allen vier Bereichen gleicht sich der Anteil von Männer und Frauen langsam an, zumindest in der Computerlinguistik ist die Männervorherrschaft am Verschwinden.

Für die Code- und KI-Experten ist die Zusammenarbeit mit oft wenig zahlenaffinen Journalisten nicht immer einfach, denn es ist der „kreative Schreiber“ oder eine Redaktion des Kunden, die das Produkt- Design definiert: der Text mit begleitenden Grafiken ist das Ziel, nicht der noch so sauber strukturierte und dokumentierte Code. Dieser Code ist lediglich das Werkzeug, um in Millisekunden und hoher Frequenz präzise redaktionelle Inhalte zu schaffen. Ist das jetzt schon künstliche Intelligenz?


Corona-News in 5 Sprachen

Ein klares Jein. Selbst eine globale Corona-Berichterstattung ist mit der unter Digitalexperten als „schwache KI“ bezeichneten „artificial intelligence“ machbar. „Schwach“ ist die KI, weil ein Großteil der Text- und Grafikinhalte noch auf Regeln basiert. Aber es ist KI, weil Fehler und Schwächen in den Ergebnissen von der Software selbst erkannt und abgestellt werden. „Machine learning“ zwar in einer noch ersten Stufe, aber „maschinelles Lernen“ ist ohne Zweifel der Einstieg in die KI.


Der Berliner Anbieter ddna zum Beispiel verabschiedet sich immer mehr von der regelbasierten Texterstellung und lässt ein Softwaretool anhand vieler Tausend Beispiele einen eigenen Schreibstil entwickeln. Noch ist dafür oft der Aufwand aus Kundensicht zu groß, denn von einem kompletten Jahresbudget müssen 90% investiert werden, bevor es überhaupt eine erste Meldung gibt – danach, siehe oben, ist der Preis für die Inhalte-Erstellung fast zu vernachlässigen.


Corona hat aber eine weitere Kundengruppe für den Roboterjournalismus gewonnen: für hunderte von Institutionen und Universitäten werden Berichte unterschiedlicher Längen und unterschiedlicher Komplexität erstellt.

Natürlich kann ein Biologe an einer Universität in Texas Forschungsergebnisse auch aus komplexen Tabellen herauslesen, aber nicht unbedingt der Beirat seiner Universiät, die Sponsoren und sicher nicht lokale und regionale Politiker, die gerne von „ihrer “ Universität oder Forschungseinrichtung aus erster Hand unterrichtet werden möchten.


Roboterjournalisten und humanoide Journalisten haben übrigens eine große Gemeinsamkeit: sie wollen wieder über andere Themen schreiben, möglichst schnell.


Wolfgang Zehrt, Berlin