AI helpt geheimgehouden moorden opsporen in Mexico

Het verhaal

Mexico is één van de gevaarlijkste en dodelijkste landen ter wereld om in de journalistiek te werken. Dat zorgt ervoor dat journalisten er soms voor kiezen om van bepaalde gebeurtenissen geen verslag te doen, zodat ze zelf minder gevaar lopen. Journalisten van het Mexicaanse dagblad El Universal vreesden dat hierdoor in bepaalde regio’s zelfs geen enkel nieuws naar buiten komt over dagelijks geweld, intimidatie, moord en bedreigingen. Ze besloten om, in samenwerking met Google News Initiatief, AI in te zetten om te onderzoeken waar de journalistiek stil blijft, om zo te ontdekken in hoeverre geweld en bedreigingen effect hebben op de persvrijheid in Mexico. Lees hier het hele verhaal.

De journalisten van El Universal gebruiken twee soorten data:

De Mexicaanse, officiële overheidsrapporten over ruim 300.000 moorden per datum en per stad of gemeente.
Het nieuwsarchief van Google News, met een overzicht van lokale, regionale en nationale journalistieke berichtgeving over moorden in Mexico.

De AI

Met behulp van een AI-model werden deze twee databronnen met elkaar vergeleken. Het uitgangspunt was dat er over iedere moordpartij minimaal één lokaal nieuwsbericht zou moeten zijn. Wanneer dat niet het geval was, werd aangenomen dat journalisten tot zwijgen zijn gebracht.

De onderzoekers hebben de data geanalyseerd met een methode die Entity Recognition heet. Entiteiten zijn eenvoudig gezegd ‘dingen die bestaan’, die je kunt aanraken. Denk aan mensen, plaatsen en organisaties. Een Entity Recognition-model herkent dus een persoon, bedrijf of plek in tekst.

Het model dat El Universal gebruikte, combineert entity recognition met woordanalyse (‘moord’). Daarmee maakten de onderzoekers een overzicht van de moorden die vermeld zijn in de overheidsdata, plus de plaats waar de moord gepleegd werd. Ditzelfde deden de onderzoekers met de berichtgeving in de media. Ook hier verzamelden ze alle genoemde moordzaken, samen met de genoemde plaats delict en datum. Van iedere moord werd het eerst gepubliceerde artikel geselecteerd.

Vervolgens werden de genoemde moorden in de overheidsdata vergeleken met de genoemde moorden in de media. Daar waar een moord gemeld is door de overheid, maar niet door de media, gaan de onderzoekers ervan uit dat er journalisten monddood gemaakt zijn.

Tot slot maakten El Universal visualisaties, die laten zien hoe de afwezigheid van journalistieke berichtgeving over moorden zich op verschillende plekken door de tijd heen ontwikkelt. Het blijkt dat pieken en dalen in de rapportage over moord vaak samenhangen met bijvoorbeeld politieke ontwikkelingen, zoals het aantreden van een nieuwe burgemeester of gouverneur, of het overlijden van drugsdealers.

Ethiek en betrouwbaarheid

De waarde van resultaten die met behulp van AI zijn verkregen, is voor een belangrijk deel afhankelijk van de data waarmee het model werkt. In dit geval is een valkuil dat we niet weten of de de informatie waarop El Universal haar onderzoek baseert, compleet is. Dat geldt voor zowel de overheidsdata – wellicht worden er moorden achtergehouden – als voor het archief van Google News. Als een moord actief in de doofpot is gestopt, zal hij ook niet in de statistieken terechtkomen.

Een andere vraag die belangrijk is om te stellen, is hoe het model omgaat met dubbelingen. Heeft het model door wanneer twee verhalen over dezelfde moorden gaan en wanneer niet? En hoe accuraat is die inschatting?

Verder wordt de aanname gedaan dat journalisten monddood worden gemaakt wanneer er over een moordpartij geen verslag wordt gedaan. Deze aanname is niet gecheckt bij de journalisten zelf. El Universal geeft aan dat het goed zou zijn om dit in een vervolgonderzoek te doen naar de beweegredenen van journalisten.

Hoe het ook zij, een dergelijk grootschalig onderzoek (waarin ruim 300.000 moorden werden onderzocht), was zonder behulp van AI vrijwel onmogelijk geweest voor een dagblad.

Lesmaterialen

Data verzamelen op Tiktok

Disclaimer. De onderzoekers hebben geprobeerd alle informatie te verifiëren bij de betrokken media. Waar dit niet is gelukt, is ervoor gekozen om op basis van de beschikbare informatie een zo volledig mogelijk beeld te schetsen van de software die (zeer waarschijnlijk) gebruikt is. De onderzoekers zijn daarbij bijgestaan door AI-experts. Omdat de experts de genoemde AI-toepassingen in meer algemene termen duiden, bestaat de kans op onjuiste details of onvolledigheden. Mocht u deze aantreffen, neem dan gerust contact op.