We weten allemaal dat er algoritmes zijn die bepalen wat jij op sociale media te zien krijgt. Maar hoe die algoritmes dat precies beslissen, weet vrijwel niemand. De Groene Amsterdammer, Pointer en de NOS zochten het uit.
📰 Het verhaal
Politieke partijen en politici voeren steeds actiever campagne op sociale media. Maar sociale mediaplatforms zijn niet transparant over de algoritmes die bepalen welke berichten bovenaan iemands tijdlijn komen te staan, en welke juist niet. Hoeveel invloed hebben ze daarmee op het publieke, politieke debat? Pointer, de NOS en De Groene Amsterdammer besloten dit te onderzoeken door 7477 Instagram-posts van politici onder de loep te nemen.
Uit de analyse blijkt dat selfies voorrang krijgen, terwijl berichten met veel tekst juist lager op de tijdlijn belanden. “Facebook (het moederbedrijf van Instagram) laat op de tijdlijn vooral zien wat goed is voor zichzelf, en niet voor de gebruikers”, stelt Nicolas Kayser-Bril van Algorithm Watch. Zo kan het zijn dat door de voorkeur te geven aan foto’s met gezichten in beeld, het voor politici lastiger wordt om complexe, politieke boodschappen te communiceren.
Esther Crabbendam, van Bits of Freedom, ziet dat er gevaar schuilt in deze tendens: “Het grootste gevaar is dat het publieke debat wordt gedomineerd door een paar Amerikaanse technologiebedrijven. Zij hebben niet als doel om ons een gezond debat voor te schotelen, maar om data over ons te verzamelen om geld mee te verdienen.” Zowel Crabbendam als Kayser-Bril geloven dat meer transparantie over het algoritme op korte termijn kan bijdragen aan een gezondere online politieke campagne.
Lees het hele verhaal hier.
📈 De data
De NOS, Pointer en de Groene Amsterdammer verzamelden samen met de Duitse non-profitorganisatie Algorithm Watch en 675 lezers 7.477 Instagram-berichten van 124 Nederlandse politici en lijsttrekkers met een groot bereik op Instagram. Van elk van deze berichten stelden zij vast op welke plek op de tijdlijn ze te zien waren.
🦾 De AI
In dit onderzoek is AI niet alleen een middel geweest, maar voornamelijk het onderzoeksonderwerp zelf. De journalisten riepen daarvoor ook de hulp in van de lezers. Die moesten twee dingen doen: een aantal politici volgen op Instagram en een zogeheten browser-plugin installeren. Met dat laatste programma werd de nodige foto’s en metadata van Instagram verzameld voor analyse.
De verzamelde foto’s in het onderzoek werden met Google Vision van een label voorzien. Daarmee wordt elke foto ingedeeld in een categorie, zoals gezichten, natuurlandschappen, dieren of tekst.
Na een eerste analyse en bewerking van de complete verzamelde data door Algorithm Watch, analyseerden de vier partners de data handmatig om conclusies te trekken en artikelen te schrijven.Wat we weten, is dat sociale media zijn gebaseerd op Reinforcement Learning. De gebruiker verschaft Instagram continu nieuwe data in de vorm van likes, shares en reacties. Op basis van deze continue stroom aan informatie leren algoritmes gaandeweg bij. Deze informatie wordt onder andere gebruikt om te bepalen van wat er wordt getoond op je tijdlijn.
(Meer over Reinforcement Learning lees je hier).
⚖️ Ethiek en betrouwbaarheid
Een belangrijke kanttekening bij de bevindingen van de journalisten, is dat op basis hiervan niet kan worden bepaald of foto’s met selfies door de algoritmes van Instagram zélf meer bereik genereren, of dat dit komt doordat gebruikers selfies vaker en sneller liken dan bijvoorbeeld posts die veel tekst bevatten. Kortom, is dit de invloed van het platform zelf of van de gebruiker? Opnieuw lopen we aan tegen een gebrek aan transparantie, waardoor deze vraag niet beantwoord kan worden.
Over de algoritmes achter sociale media bestaan brede maatschappelijke zorgen. Het gebruik van Reinforcement Learning zorgt voor verregaande personalisatie van het berichtaanbod. Arjen Lubach omschreef dit fenomeen al eens als de ‘fabeltjesfuik’: mensen die video’s over complottheorieën keken, kregen steeds meer van dit soort video’s voorgeschoteld, waardoor ze nog meer video’s gingen bekijken. Zo kan een gebruiker ongemerkt in een filterbubbel komen en daardoor steeds eenzijdigere berichtgeving tot zich nemen.
Een andere grote zorg betreft de privacy van de gebruiker. Want de algoritmes van socialemediaplatforms (in dit geval moederbedrijf Facebook, sinds 2021 Meta genoemd) verzamelen enorme hoeveelheden informatie over haar gebruikers.
Juist daarom is het essentieel dat we als journalist in staat zijn om AI kritisch te bevragen en onderzoeken. Pointer, de NOS en De Groene Amsterdammer zetten voorzichtige eerste stappen in die richting.
📚 Lesmateriaal
Opdracht: Debat: wetgeving en transparantie
💡 Leerdoel: Je vormt een onderbouwde mening over de gewenste transparantie van AI en de invloed hiervan op de maatschappij
In deze case kon een vraag over invloed niet volledig beantwoord worden, bij gebrek aan transparantie. Dat gebrek aan transparantie is een veelgehoorde klacht over AI.
Moet er wetgeving komen die de werking van algoritmes transparant maakt? Is dit haalbaar? Zo ja, wie is hier dan verantwoordelijk voor?
Maak groepjes met voor- en tegenstanders. De docent bepaalt welke groepjes voor zijn en welke tegen. Doe online onderzoek naar het onderwerp, zodat je jouw kant van de stelling voor de klas kunt verdedigen. Zorg voor goede, betrouwbare bronnen: je bent tenslotte journalist.
Na twintig minuten research, begint het debat.
🧰 Materiaal
- Laptop
⏱ Tijdsindicatie
Vanaf 40 minuten, waarvan:
- 20 minuten research
- 20 minuten debat
Opdracht: Wie ben ik?
💡 Leerdoel: Je staat stil bij de werking van personalisering op sociale media
Let op: Minimaal twee dagen voor de les zoek je uit welke data over jou bekend zijn bij Instagram. Dat doe je als volgt:
Volg onderstaande stappen om je eigen gegevens van Instagram op te vragen:
1. Ga naar instagram.com/download/request/
2. Via deze pagina kun je de gegevens opvragen. Je krijgt onderstaande scherm te zien:

3. Vul je e-mailadres in en klik op “Volgende”
4. Vul je wachtwoord in en klik op “Download aanvragen”.
Als je een kopie aanvraagt, krijg je binnen 48 uur een zip-file toegestuurd op je e-mailadres. Daarin staan je foto’s en video’s, opmerkingen, vind-ik-leuks, volgers, mensen die je volgt enzovoorts. (Bron: VPNgids.nl)
Neem de opbrengst uitgeprint mee naar de klas, maar zorg dat je naam er niet op staat. Als je bepaalde gegevens te privé vindt om mee te nemen naar de klas, staat het je vrij om die uit je dossier te verwijderen.
De docent verzamelt ieders dossiers, en deelt ze willekeurig uit in de klas. Hij zorgt ervoor dat niemand zijn eigen dossier heeft, maar let verder niet op wiens dossier bij wie terecht komt.
Je hebt nu dus de gegevens van een studiegenoot, maar weet niet wie het is. Schrijf op basis van de gegevens een persona, waarin je vertelt:
1. Wie en wat hij of zij is. Probeer een zo gedetailleerd mogelijk beeld te schetsen van de persoonlijkheid.
2. Wat zijn of haar demografische gegevens zijn.
3. Wat zijn of haar wensen en doelen zijn.
4. Wat zijn of haar zorgen en ergernissen zijn.
5. Hoe de persoon in kwestie eruit ziet.
6. In wat voor content en advertenties de persoon in kwestie geïnteresseerd is.
Lever je persona (uitgeschreven op een A4-tje) in, samen met de Instagram-data die je ontvangen hebt. De docent legt alle documenten (de Instagramdossiers en geschreven persona’s) op een tafel.
Vervolgens is het tijd om te achterhalen wie voor jou een persona heeft geschreven. Zoek je eigen dossier op, en neem de persona die voor jou is opgesteld mee.
💭 Bespreking
Lees de persona die op basis van jouw gegevens gemaakt is en bespreek de opbrengst klassikaal.
- In hoeverre klopt deze? Wat herken je en wat niet? Wat valt je op?
- Wat betekent het als op basis van data profielen worden gemaakt? Wat betekent dat voor jou persoonlijk, en wat betekent het voor jou als journalist?
- In hoeverre verandert deze oefening de manier waarop je omgaat met sociale media?
🧰 Materiaal
- Laptops
- Uitgeprinte Instagramdossiers voor iedere student
- A4-vellen om de persona’s op te schrijven
⏱ Tijdsindicatie
Vanaf 50 minuten, waarvan:
- 15 minuten voor het bekijken van de Instagramdata van een studiegenoot
- 20 minuten voor het opstellen van een persona
- 15 minuten voor het nabespreken
Opdracht: To personalize or not to personalize?
💡 Leerdoel: Je wordt je bewust van de impact van personalisering
Veel media willen aanbod beter personaliseren. Maar is dat altijd wenselijk? Bekijk de volgende video.
In hoeverre is de fabeltjesfuik op jou van toepassing? Wanneer eindig je met alleen nog maar kattenfilmpjes? Kies een onderwerp waar je normaal geen aandacht aan besteedt, maar wat niet heel ver van je bed is. Klassiek ballet als je normaal naar hiphop kijkt, bijvoorbeeld. Video’s van kleine kinderen op de piste als je normaal naar stuntende snowboarders kijkt. Of kookvideo’s met veganistische recepten als je normaal geïnteresseerd bent in vleesgerechten. Tel in je tijdlijn hoe vaak dit voorkomt. Klik erop en bekijk het. Ga terug naar je tijdlijn. Tel hoe vaak het nu voorkomt. Klik weer, enz.
Kies nu een onderwerp wat wél heel ver van je bed is. Ajax als je normaal alleen naar dansfilmpjes kijkt, bijvoorbeeld. Of video’s over hoe je je haar kunt invlechten als normaal geïnteresseerd bent in rap.
Bespreek: wat valt je op? Hoe lang duurt het voordat je nieuwe onderwerp vanzelf op je tijdlijn verschijnt? Is er een verschil tussen onderwerpen die niet heel ver van je af staan en onderwerpen waar je helemaal niks mee hebt?
Hoe werkt personalisering door op jou als journalist? Hoe kun je daarmee omgaan?
🧰 Materiaal
- Laptops en/of telefoons
⏱ Tijdsindicatie
30 minuten, waarvan:
- 10 minuten testen met een onderwerp dat niet ver van je bed is
- 10 minuten testen met een onderwerp dat wel ver van je bed is
- 10 minuten nabespreken