ik wil…    ai begrijpen     journalistieke voorbeelden      lesmateriaal     zoeken

De push-notificaties van het AD zijn speciaal voor jou gemaakt door AI

Van het Algemeen Dagblad krijg je als gebruiker alleen pushnotificaties die voor jou interessant zijn.* Dat kan dankzij AI.

Het verhaal

Precies vier mensen ontvingen een pushnotificatie van het AD over een artikel over Spijkenisse. De algoritmes van het AD schatten in dat juist deze vier mensen dit artikel zouden willen lezen, terwijl het voor de rest van haar gebruikers niet relevant leek. Dat is vergaande personalisering!

Het AD heeft een grote redactie. Naast een landelijke redactie, zijn er meer dan 50 regionale redacties die samen honderden artikelen per dag produceren. Natuurlijk zijn niet al die artikelen voor iedereen even interessant. Daarom bestaan er pushnotificaties: als er iets gepubliceerd wordt dat specifiek interessant is voor een bepaalde gebruiker ontvangt diegene daarover een bericht op zijn telefoon.

Doordat er achter die berichten algoritmes zitten, kunnen deze notificaties veel preciezer rekening houden met de voorkeuren van gebruikers dan mensen ooit zouden kunnen. “Redacties zullen nooit in staat zijn om pushberichten te versturen op het fijnmazige niveau waarop ons algoritme werkt,” vertelt Anne Schuth van uitgeverij DPG Media aan Media Perspectives.

De data

Om te kunnen functioneren, hebben algoritmes informatie nodig – ook wel data genoemd.
Van alle gebruikers die een account hebben op de app van het AD houdt het medium de leesgeschiedenis bij. Daaruit blijkt in welke onderwerpen of regio’s een gebruiker geïnteresseerd is, maar ook of deze bijvoorbeeld vooral korte of lange artikelen leest. We noemen dat soort informatie ook wel metrics.

Ook belangrijk zijn de tijdstippen waarop een gebruiker artikelen leest en pushnotificaties opent. Zo ontstaat een profiel van de interesses en behoeften van de individuele gebruiker.

De journalisten van het AD voorzien hun artikelen ook van metadata: tags die informatie geven over onder meer de lengte, de complexiteit en het onderwerp. Door de voorkeuren van de gebruiker te koppelen aan de metadata over het artikel, kan het algoritme bepalen welke artikelen het meest relevant zijn voor elke afzonderlijke gebruiker.

De AI

Het versturen van gepersonaliseerde pushnotificaties is een voorbeeld van een aanbevelingssysteem, vaak een recommendation system genoemd. Dezelfde soort systemen geven jou aanbevelingen als je online winkelt of Netflixt.

Een recommendation system bekijkt alle mogelijke opties, bijvoorbeeld alle artikelen die de afgelopen dag geplaatst zijn. Elk journalistiek verhaal krijgt een score waarmee het algoritme, op basis van de kenmerken van de gebruiker en van het artikel, een voorspelling doet over de kans dat een gebruiker geïnteresseerd is in het betreffende verhaal. Het model beveelt de artikelen met de hoogste scores vervolgens aan de gebruiker aan.

Een aanbevelingssysteem is een clustering-vraagstuk. Hierbij probeert een AI-systeem overeenkomsten te zoeken tussen lezers en op basis daarvan groepen (clusters) te maken. De gebruikers met veel overeenkomsten worden aan elkaar gekoppeld, net als de artikelen met veel overeenkomsten. Het aanbevelingssysteem berekent vervolgens welke gebruikers het beste passen bij elk volgend artikel.

Steeds bijleren

Om goede aanbevelingen te doen, maken recommendation systems ook gebruik van reinforcement learning. Bij deze vorm van training krijgt het model steeds een terugkoppeling van de gebruikers waardoor het stap voor stap beter wordt. Als een lezer een bepaalde pushnotificatie niet opent, leert het algoritme dat de gebruiker misschien toch niet geïnteresseerd is in dit onderwerp of dit type artikel. Zo levert elke pushnotificatie nieuwe informatie om het model verder aan te scherpen.

Reinforcement learning wordt ook toegepast op social media, waarbij ingewikkelde algoritmes proberen te voorspellen wat jij wel en niet interessant vindt. Advertenties van Google gebruiken deze vorm van AI ook. Heb je wel eens meegemaakt dat je een advertentie werd voorgeschoteld met daarbij de vraag ‘Was deze advertentie nuttig?’. Als je op ‘Nee’ klikt, volgt vervolgens de vraag ‘Waarom niet?’. Ook dat is informatie die het algoritme gebruikt om zich te verbeteren.

Drie soorten Machine Learning problemen

Machine Learning modellen kun je grofweg inzetten voor drie soorten problemen. Bij de haattweets spraken we van een classificatie-vraagstuk (een tweet in de juiste categorie plaatsen: wel of geen haat). Over SmartOcto leggen we uit dat dit een regressie-vraagstuk is waarbij de uitkomst een voorspellend getal is. Het aanbevelingsmodel van het AD is wat we noemen een clusterings-vraagstuk.

Ethiek en betrouwbaarheid

Recommendation systems leren dankzij de terugkoppeling van gebruikers. Een nadeel hiervan is dat er een soort vicieuze cirkel kan ontstaan. Als een gebruiker veel artikelen over een bepaald onderwerp opent, zal het algoritme op den duur vooral deze artikelen voorschotelen waardoor deze nog meer geopend zullen worden. Hierdoor kan een lezer in een bubbel terechtkomen.

Om dit tegen te gaan, kan een redactie spelen met de balans van het recommendation system. Zo kunnen soms ook artikelen aanbevolen worden die niet per se de hoogste score hebben, maar mogelijk toch interessant genoeg zijn voor de gebruiker.

Een ander ethisch aspect van dit soort algoritmes is dat ze veel informatie over de gebruiker nodig hebben om te kunnen leren. Het verzamelen van privacygevoelige informatie kan dilemma’s met zich meebrengen.

Deze gebruikersinformatie kan ook gebruikt worden om advertenties verder te personaliseren. Sociale media-platformen als Twitter en Instagram doen dat ook: bekijk je veel video’s over wielrennen, dan krijg je waarschijnlijk ook advertenties van wielerkleding te zien.

Voor een journalistieke organisatie is dit een overweging waard: Is het verantwoord om de journalistieke en commerciële belangen van de organisatie op deze manier te vermengen?
* De gepersonaliseerde pushnotificaties van het AD waren onderdeel van een  pilot die op dit moment niet meer actief is.

Disclaimer. De onderzoekers hebben geprobeerd alle informatie te verifiëren bij de betrokken media. Waar dit niet is gelukt, is ervoor gekozen om op basis van de beschikbare informatie een zo volledig mogelijk beeld te schetsen van de software die (zeer waarschijnlijk) gebruikt is. De onderzoekers zijn daarbij bijgestaan door AI-experts. Omdat de experts de genoemde AI-toepassingen in meer algemene termen duiden, bestaat de kans op onjuiste details of onvolledigheden. Mocht u deze aantreffen, neem dan gerust contact op.