De NOS laat een robot verslag doen van Statenverkiezing

Een nieuwsbericht geschreven door AI? Dat kan ook zonder ChatGPT. De NOS laat zien hoe het werkt.

Het verhaal

De NOS maakte bij de Provinciale Statenverkiezingen van 2019 voor het eerst gebruik van robotjournalistiek. Een machine schreef voor alle 355 gemeentes een kort artikel over de uitslagen. Op menskracht had de redactie nooit op één dag zoveel artikelen kunnen publiceren. Giselle van Cann, destijds plaatsvervangend hoofdredacteur van de NOS, legt uit waarom de verkiezingen uitstekend waren voor een experiment met robotjournalistiek: “Het is een afgebakend onderwerp met gestructureerde cijfers.”

De data

Om de artikelen te vullen met de juiste informatie maakte de NOS gebruik van verkiezingsdata van het ANP: de naam van elke gemeente, het percentage stemmen per partij en het opkomstpercentage. Deze data wordt door het algoritme op de juiste plek in het artikel neergezet, zodat lopende zinnen ontstaan.

De AI

Hier is geen gebruik gemaakt van ingewikkelde Machine Learning, maar van een vrij simpel sjabloon met ‘open plekken’. Je kunt het sjabloon zien als een soort standaard artikel vol gaten, die pas kunnen worden ingevuld op het moment dat de verkiezingsuitslagen bekend zijn. Een partij die minder stemmen haalde dan tijdens de vorige verkiezingen, verliest bijvoorbeeld. Als de verkiezingsdata laten zien dat er inderdaad sprake is van minder stemmen voor een partij, verbindt het systeem daar het woord ‘verlies’ aan.

In het voorbeeld hieronder zie je een ingevuld sjabloon. Alle gekleurde stukken, zijn automatisch ingevoerd nadat de verkiezingsdata bekend waren.

Bron:  https://numrush.nl/de-nos-gebruikte-de-verkiezingen-als-testcase-voor-robotjournalistiek/

Dit soort sjablonen werkt goed in situaties waarbij het aantal uitkomsten beperkt en voorspelbaar is; denk aan beurskoersen, sportverslagen en de publicatie van criminaliteitscijfers. Verkiezingsuitslagen lenen zich dan ook goed: het aantal deelnemers en hun namen zijn vooraf bekend; de variatie zit ‘m in winst, verlies of gelijk en percentages en aantallen.

In het NOS-sjabloon zaten 76 open plekken, ook wel dynamische velden genoemd. De data van het ANP (opkomstcijfers en percentage stemmen per partij) werden geautomatiseerd in deze velden gegoten.

Zo kan een voorbeeldzin uit het sjabloon zijn dat:

[naam politieke partij] [verliest/wint] [x-aantal zetels] in [naam gemeente]. Met de bijbehorende data van het ANP resulteert dit mogelijkerwijs in de zin:  “De VVD verliest één zetel in gemeente Tilburg”.

Zo genereert de NOS unieke en specifieke, lopende nieuwsberichten over de verkiezingsuitslag per gemeente.

Voorafgaand aan de verkiezingen zijn alle mogelijke constructies van zinnen opgeschreven en geprogrammeerd. Het leverde maar liefst 7200 tekstvariaties op. Op die manier kon veel voorwerk worden gedaan, zodat er op de dag van de verkiezingen snel veel artikelen klaar stonden. Om de leesbaarheid te verbeteren worden ook synoniemen gebruikt. Zo kan de VVD de ene keer bij haar naam worden genoemd, en in de volgende zin worden omschreven als  ‘de liberale partij’.

De vorm van automatisering die de NOS heeft gebruikt is rule-based. Dat wil zeggen: Mensen (journalisten en programmeurs) stellen regels op, waar de machine zich heel direct aan dient te houden. Zo’n regel kan zijn: ‘Als een partij 2% minder zetels heeft behaald dan ze had voor de verkiezingen, spreken we van een klein verlies. Omdat de machine niets anders doet dan de regels opvolgen, is dit strikt genomen geen AI. Het systeem leert immers zelf niet bij.

Ethiek en betrouwbaarheid

De genoemde werkwijze werpt voor de journalist verschillende vragen op. Bij wie ligt bijvoorbeeld de journalistieke verantwoordelijkheid als het mis gaat? En hoe kun je in de gaten houden dat er geen foutjes in het verhaal sluipen? Is er tijd om alle verhalen te dubbelchecken? Voor wie heeft het gevolgen als de berichtgeving een fout bevat? Je kan je ook afvragen hoe deze vorm van geautomatiseerde journalistiek in de praktijk moet worden gebruikt. Worden de verslagen online geplaatst en is daarmee de journalistieke taak van het nieuws brengen vervuld, of biedt deze manier van verslaggeving nieuwe mogelijkheden voor de journalistiek?

Welke kansen zie jij voor automatische nieuwsgeneratie? Welke onderwerpen zijn geschikt? En wat zouden journalisten moeten doen met de tijd die ze overhouden?

Disclaimer. De onderzoekers hebben geprobeerd alle informatie te verifiëren bij de betrokken media. Waar dit niet is gelukt, is ervoor gekozen om op basis van de beschikbare informatie een zo volledig mogelijk beeld te schetsen van de software die (zeer waarschijnlijk) gebruikt is. De onderzoekers zijn daarbij bijgestaan door AI-experts. Omdat de experts de genoemde AI-toepassingen in meer algemene termen duiden, bestaat de kans op onjuiste details of onvolledigheden. Mocht u deze aantreffen, neem dan gerust contact op.