Dankzij AI doet het publiek onderzoek voor de NRC

📰 Het verhaal

‘Wat gebeurt er in tuinen in Nederland wanneer je een leeg stukje van de tuin een jaar lang niet aanraakt?’, vroeg NRC zich af.

Om die vraag te beantwoorden riep de redactie, in samenwerking met Tilburg Universiteit, haar lezers op om mee te helpen. 8500 tuin- en balkoneigenaren door heel Nederland lieten een jaar lang een vierkante meter grond verwilderen. De deelnemers maakten foto’s van het leven dat hier ontstond. Het AI-systeem Obsidentify, van waarneming.nl, herkende planten, insecten en dieren. De meest opvallende verschenen ieder uur online.

📈 De data

Op de website van het Wilde Tuin-onderzoek stond op Dag 269 van het project:

‘Tot nu toe hurkten 1.212 deelnemers met de app bij hun vierkant neer om wat er rondkruipt en bloeit te fotograferen. Samen legden zij 41.851 keer een plant of dier in hun tuin vast. De meesten van hen maakten één tot tien foto’s. Een groot deel van de foto’s werd door een kleine groep wilde-tuineigenaren gemaakt: vijf procent van de deelnemers namen samen de helft van de foto’s.’

Dit alles levert de data voor het AI-systeem op.

🦾 De AI

Alle data kwamen dus van tuin- en balkoneigenaren, die plant, bloem, dier, insect of paddestoel op de foto zetten. Om die foto’s te analyseren, werkte NRC samen met de app Obsidentify van waarneming.nl. Deze app herkent soorten op foto’s. Obsidentify gebruikt acht verschillende Machine Learning modellen om de meer dan 25.000 soorten te herkennen. Dat is te veel om hier allemaal uit te leggen.

Wat belangrijk is om te weten, is dat Obsidentify gebruikmaakt van beeldherkenning, ook wel Computer Vision genoemd, vaak afgekort tot CV. Daarmee worden objecten, mensen of in dit geval planten en dieren op beeld herkend. Het is een optie die je misschien ook wel gebruikt binnen de foto-app op je smartphone. Deze herkent automatisch een vriend of familielid op foto’s wanneer je die persoon op eerdere foto’s een naam hebt gegeven. (Je hebt daarmee een AI-systeem getraind!).

CV-modellen kunnen op drie manieren getraind worden:
1. Supervised: mensen bieden het systeem voorbeeldfoto’s aan met daarbij de juiste labels (bijvoorbeeld foto’s van paardenbloemen, egels, pissenbedden of vlinderstruiken, met daarbij de vermelding om welke soort bloem, dier, insect of plant het gaat).
2. Unsupervised: mensen bieden het systeem alleen voorbeeldfoto’s aan zonder labels (dus foto’s van allerlei soorten leven in de tuin, zonder vermelding van de naam ervan). Het systeem leert in dit geval niet van de labels die mensen doorgeven, maar gaat zelf op de foto’s op zoek naar patronen. Dit gebeurt maar zelden.
3. Reinforced: In dat geval geven mensen het systeem feedback, zodat het zich kan verbeteren. Ziet het systeem een kat aan voor een egel? In sommige gevallen kun je als mens dan aangeven dat dit niet klopt. Als het model die informatie gebruikt om zichzelf te verbeteren, spreek je van Reinforcement Learning. 

⚖️ Ethiek en betrouwbaarheid

Het project van NRC is een praktijkvoorbeeld van een samenwerking tussen journalisten, academische onderzoekers, een technologie-provider (waarneming.nl) én het publiek.

Als redactie ga je uiteraard niet zomaar in zee met een (technologie)partner. Het is belangrijk om hiervoor van tevoren een samenwerkingsprotocol te hebben. Je moet opereren binnen de huidige AVG-wetten (Wat doe je met gebruikersdata? Wat deel je wel en niet? Hoe sla je data op?), maar het is als redactie ook slim om een aantal regels te hebben die helpen bij het kiezen van de juiste externe partner.

Zo kun je eisen dat de partner zich committeert aan de journalistieke codes. Of je kunt afspreken dat een engineer of ontwikkelpartij eerlijk inschat of je voor je AI-projectidee genoeg representatieve data ter beschikking hebt om tot een goed werkend model te komen. Als je te weinig data of te eenzijdige data hebt, kan het model immers niet goed werken. Om het bij het voorbeeld van NRC te blijven: stel dat je alleen maar foto’s van paardenbloemen tot je beschikking hebt, dan kan het model nooit leren om ook andere soorten planten te herkennen. Dit voorbeeld is natuurlijk overdreven, maar het geeft het belang aan van voldoende data, die ook nog eens divers moeten zijn. Als je samenwerkt met een AI-partner is het belangrijk dat deze je hierover eerlijk kan adviseren.

📚 Lesmateriaal

💡 Leerdoel: Je bedenkt AI-oplossingen voor journalistieke vraagstukken en leert deze helder presenteren aan collega’s

Toen NRC haar lezers vroeg om te helpen bij onderzoek naar biodiversiteit door een jaar lang foto’s van hun tuin te maken en in te sturen, meldden 8.500 tuin- en balkoneigenaren zich. Het Wilde Tuin-project was geboren. Ook de Volkskrant nodigt het publiek vaker uit om mee te doen, bijvoorbeeld voor een onderzoek naar inflatie. De redactie vroeg lezers daarvoor om bonnetjes van gekochte cappuccino’s in te sturen. 

Ook andere redacties, zoals die van Pointer en Follow The Money, zoeken nieuwsgebruikers steeds op, vooral regionaal en lokaal. Ze nodigen bewoners bijvoorbeeld uit om onderwerpen te pitchen waar de redacties mee aan de slag zouden moeten gaan. Zo hopen redacties blinde vlekken bij zichzelf weg te nemen. 

Het publiek krijgt zo een steeds actievere rol binnen de journalistiek. Dat levert soms twijfels op (bijvoorbeeld over professionaliteit, onafhankelijkheid en journalistieke codes), maar heeft ook voordelen. Met een betrokken publiek kun je je nieuwswaarde vergroten én heb je de mogelijkheid om meer informatie te vergaren.

Juist dat laatste brengt soms ook capaciteitsproblemen met zich mee. Want hoe bekijk, lees, beluister en verwerk je al die feedback, suggesties of foto’s en video’s als kleine redactie met weinig tijd, budget en menskracht? 

AI to the rescue.

The AI Audience Engagement Art Museum

Bedenk een project dat je over langere tijd kunt uitvoeren, waarbij je inhoud (tekst, geluid of afbeeldingen) van het publiek nodig hebt.

Om snel te starten:

1. Kies uit een van deze doelgroepen: de buren van je oudste tante, zweefvliegers, metal-festivalbezoekers of ‘gamer moms’.

2. Kies uit een van deze thema’s: sport, voedsel, gezondheid, geld verdienen of reizen.

3. Bedenk een project op voor de gekozen doelgroep rondom het gekozen thema.

In teams van drie of vier studenten visualiseer je het project met drie specifieke schetsen die je vervolgens presenteert aan de groep, alsof je werk in een museum exposeert.

Schets 1: het storyboard
Maak een storyboard met 8 vakjes (op één A3) waarin we de gebruiker zien die via een smartphone-app een bijdrage levert aan het beoogde project. Die bijdrage kan een video, foto of tekst zijn. Zorg dat in het storyboard duidelijk wordt wie de gebruiker is, wat deze bijdraagt, waarom deze bijdraagt, wat het uiteindelijke project gaat opleveren en waarom dat relevant en interessant is voor de doelgroep en het medium.

Let op: geef dit storyboard de titel van je project. Beschrijf elke scène met een korte zin. Door de titel, de 8 ‘scènes’ en de korte beschrijvingen legt het storyboard zichzelf uit en is een uitgebreide mondelinge toelichting niet nodig.

Schets 2: De App-wireframes

Werk vier schetsen (wireframes) uit die de belangrijkste schermen tonen van de app die je gaat gebruiken om de input van je gebruikers te verzamelen. De app-schermen, of wireframes, tonen:

  • Titel per scherm
  • Menu en navigatie
  • Belangrijkste knoppen
  • Iconen
  • Gevraagde invoer (tekst, audio, beeld, video, etc.)

Let op: schets GEEN inlog of profiel-/settings pagina’s

Voorbeelden van wireframes (in meer en minder detail).

Schets 3: Een AI-Flowchart – Het AI-systeem voor dataverwerking

Geef op een enkele A3 schematisch weer (in een flowchart) hoe jullie AI-systeem de gegevens van het publiek verwerkt en bruikbaar maakt voor de journalistieke toepassing.

Geef in dit AI-schema duidelijk aan:

1. Met welke type AI je werkt: Computer Vision (beeldherkenning) of Natural Language Processing (tekst- of spraakherkenning).

2. Welke bestaande software gebruikt kan worden.

3. Welke onderdelen gebouwd moet worden.

4. Wat de voorgestelde technische oplossing kost en wat het oplevert (Denk niet alleen financieel, maar ook aan bijv. een award, innovatief imago, meer traffic, nieuwe doelgroep).

Een voorbeeld van een flowchart om reacties te modereren met een AI-systeem:

Voorbeeld van een beeldherkenningsysteem:

(Bij bovenstaande flowchart moeten studenten het laatste onderdeel ‘deploy’ specifieker uitwerken: hoe krijgt dit model (dat in dit voorbeeld een kat van een hond onderscheid) een rol in het journalistieke idee dat ze presenteren?)

4. Daarna hangen alle teams hun schetsen aan de muur/borden. Vervolgens krijgen alle studenten een kwartier de tijd om het werk van de andere teams te bekijken.

Iedere student krijgt 3 stickertjes die zij/hij vervolgens toekent aan de ideeën:

1 sticker voor het beste idee – plak de sticker bij de titel van het storyboard.

1 sticker voor het beste element- kan in de AI-flowchart zijn of een element in de wireframe of storyboard.

1 sticker die overal mag: dubbelen of ergens bij ander project, ander element.

💭 Bespreking

Nadat de oplossingen zijn bestickerd, kies je samen de opvallendste uit.

  • Waarom vinden mensen dit idee sterk?
  • Zou je dit ook zonder AI kunnen doen? (denk hierbij ook aan de NRC-casus en de Volkskrant-casus. Hadden zij ook kunnen rondbellen en de prijzen zelf in een spreadsheet kunnen zetten? Wat is het voor- of nadeel?

🧰 Materiaal

⏱ Tijdsindicatie

75 minuten totaal, te verdelen in

  • 15 minuten: kies doelgroep, thema en brainstorm over het idee. Teken/schrijf dit uit.
  • 5 minuten: maak met je teamleden een taakverdeling voor de verschillende schetsen.
  • 20 minuten: werk de schetsen uit.
  • 5 minuten: stem de schetsen onderling af en pas waar nodig aan.
  • 15 minuten: museumtour – hang de schetsen op aan de muur en bekijk het werk van de anderen.
  • 5 minuten: deel stickers uit aan studenten en laat ze met de stickers stemmen op de schetsen die ze het beste vinden.
  • 10 minuten: bespreek de ideeën die jou en de studenten opvallen door de opgeplakte stickers.


Tip:
Je kunt deze opdracht verkorten door bijvoorbeeld alleen de eerste schets uit te werken.

Disclaimer.

De onderzoekers hebben geprobeerd alle informatie te verifiëren bij de betrokken media. Waar dit niet is gelukt, is ervoor gekozen om op basis van de beschikbare informatie een zo volledig mogelijk beeld te schetsen van de software die (zeer waarschijnlijk) gebruikt is. De onderzoekers zijn daarbij bijgestaan door AI-experts. Omdat de experts de genoemde AI-toepassingen in meer algemene termen duiden, bestaat de kans op onjuiste details of onvolledigheden. Mocht u deze aantreffen, neem dan gerust contact op.