ik wil…    ai begrijpen     journalistieke voorbeelden      lesmateriaal     zoeken

Data verzamelen op Tiktok

Leerdoel: Je ontdekt hoe je data kunt inzetten om verhalen te maken en je leert kritische vragen stellen over de werking van AI en de impact ervan op de maatschappij

Opdracht

Het verhaal over moorden in Mexico laat zien hoe je met door AI verkregen data een verhaal kunt maken. Voor deze opdracht ga je dat zelf doen.

Data kun je op allerlei plekken vinden. In overheidsdocumenten of journalistieke verslaggeving (zoals in het voorbeeld), maar ook op bijvoorbeeld Tiktok. Voor deze opdracht ga je daarmee werken.

Je doet voor een journalistiek stuk (equivalent van 800 woorden / 150 seconden video) onderzoek naar de manier waarop aanstaande verkiezingen (denk gemeenteraad, landelijk of Europees) leven onder first-time stemmers in Nederland.

Als onderdeel van je journalistieke werk raadpleeg je ook TikTok. Wanneer je start bij de For You-video’s, je de *Analytics-*pagina bezoekt van TikTok en op een paar hashtags hebt geklikt, word je maar een klein beetje wijzer…

Vanwege tijdgebrek kun je ook niet elke video, alle hashtags en comments helemaal bekijken en lezen. Daarbij moet je je zoekproces en de inhoud die je tegenkomt systematisch opslaan, liefst in een spreadsheet.

Hoe ga je dit nu aanpakken?

Noteer, in tweetallen, het volgende.

1. Onderzoek – Bedenk wat je wil onderzoeken. Kies een thema, en formuleer daarbij een wie, wat, waar, waarom, wanneer en hoe-vraag. Bijvoorbeeld:

De meest actuele verkiezingen in Nederland

  • Hoe spreken TikTok-gebruikers over [kandidaat x]?
  • Wanneer worden de meeste posts over [partij x] en [partij y] geplaatst?
  • Wie zijn er actief in de discussie?
  • Welke onderwerpen leveren veel likes of comment op?
  • Welke sentimenten uiten TikTok-gebruikers over [kandidaat x]?

2. Data –  Kies één van de vragen die je geformuleerd hebt en bedenk welke data je op TikTok kunt vinden om deze vraag te beantwoorden.

3. Aanpak – Beschrijf hoe je aan deze data wil komen. Je hoeft hiervoor geen verstand te hebben van AI. Gebruik je common sense.Welke gegevens zijn er op TikTok beschikbaar die je helpen om je vraag te beantwoorden? Op welke manier zou een AI-systeem je hierbij kunnen leren? Welke keuzes zou je moeten maken om het AI-systeem aan het werk te zetten? (bijv. op welke hashtags, zoekwoorden of personen zoek je?)

4. (Let op: deze stap is optioneel, bedoeld voor de student die al iets meer van AI weet) Gebruik van AI – Leg uit hoe je de verkregen data gaat verwerken aan de hand van AI:

Met welk type Machine Learning-probleem heb je hier te maken?

Welk ML-oplossingen (en bestaande programma’s) helpen om je vragen te beantwoorden?

5.Verantwoording – Wat moet je vermelden in de verantwoording over je aanpak? Wat moeten jouw lezers, kijkers of luisteraars weten over de manier waarop je je data hebt verzameld en verwerkt? Waarom is dat belangrijk?

6. Award – Wat hoop je dat er in het juryrapport staat als je hiermee die Tegel wint?

Bespreking

Het belangrijkste bij deze oefening is niet dat studenten een waterdichte aanpak voor dataverzameling op TikTok kunnen bedenken. Belangrijker is dat ze zich bewust worden van de keuzes die je moet maken wanneer je een AI-systeem gebruikt om data te verzamelen of verwerken, en op welke manieren deze keuzes hun uitkomsten kunnen beïnvloeden.

Bovendien is het belangrijk dat ze inzien dat ze de gebruiker transparantie moeten bieden over de gemaakte keuzes. Dat de keuzes die je als journalist maakt, invloed hebben op het eindproduct, is niet nieuw. Dat is bij een vox-pop of interview net zo. Maar omdat het hier gaat om een nieuwe vorm van informatieverzameling is transparantie extra belangrijk.

Maar studenten moeten er bewust van zijn dat het gebruik van AI voor dataverzameling de suggestie kan wekken dat de inzichten volledig en objectief zijn. Dit is uiteraard niet het geval. Hoe bepaal je bijvoorbeeld welke berichten of welke afzenders wel en niet relevant zijn? Welke hashtags of zoektermen gebruik je? Hoe baken je de periode af waarin de berichten die je gebruikt, geplaatst zijn? Wanneer heb je genoeg materiaal verzameld en hoe bepaal je dat? Hoe weet je dat je niks belangrijks mist? En welke berichten zijn niet op TikTtok te vinden, omdat het platform ze verwijderd heeft? Welke informatie loop je daardoor mogelijk mis? Wanneer je een AI-systeem inzet, moet je keuzes maken. En die keuzes zijn (mede)bepalend voor je resultaten.

Materiaal

Geen TikTokaccount nodig, app hoeft niet geïnstalleerd te zijn op telefoon
url: https://ads.tiktok.com/business/creativecenter/inspiration/popular/hashtag/pc/en

Tijdsindicatie

90 minuten totaal, te verdelen in:

  • 10 minuten overleg
  • 20 minuten browsen op Tiktok: For You en Analytics
  • 30 minuten aanpak schrijven en ML-tools inventariseren
  • 30 minuten klassikaal bespreken

Voorbeeldverhaal

Disclaimer. De onderzoekers hebben geprobeerd alle informatie te verifiëren bij de betrokken media. Waar dit niet is gelukt, is ervoor gekozen om op basis van de beschikbare informatie een zo volledig mogelijk beeld te schetsen van de software die (zeer waarschijnlijk) gebruikt is. De onderzoekers zijn daarbij bijgestaan door AI-experts. Omdat de experts de genoemde AI-toepassingen in meer algemene termen duiden, bestaat de kans op onjuiste details of onvolledigheden. Mocht u deze aantreffen, neem dan gerust contact op.