Panama papers in het klein

Leerdoel: Je ontdekt hoe Named Entity Recognition in de praktijk werkt en hoe het je kan helpen in je research.

Opdracht

Je gaat vandaag aan het werk met Google Pinpoint om documenten te doorzoeken en een onderzoeksidee uit te werken.

Je kunt deze opdracht individueel uitvoeren als jullie met maximaal tien studenten zijn. Bij een grotere groep is het raadzaam om in duo’s of drietallen samen te werken.

Stap 1

Bekijk deze video met uitleg over Google Pinpoint.

Maak een account aan in Google Pinpoint. Dit doe je door een vragenlijst in Google Forms in te vullen. Je wordt daarna toegelaten tot Google Pinpoint. Daar staan documenten die journalistieke media hebben geopenbaard. Deze zijn vrij doorzoekbaar en toegankelijk voor iedereen met een Pinpoint Account.

Kies hier een dataset uit van minimaal honderd bestanden. Je wil namelijk dat de dataset zo groot is, dat je hem niet meer snel en eenvoudig handmatig kan doorzoeken. Kijk bijvoorbeeld eens naar de documenten van de New York Times of Associated Press. Verdiep je in duo’s in een van de beschikbare datasets en houd bij welke Nederlandse bedrijven, locaties of personen jullie tegenkomen. Gebruik hiervoor de zoekfunctie in Google Pinpoint en doe dit binnen één specifieke dataset.

Stap 2

Gebruik de geïdentificeerde namen, locaties of personen in de dataset en bedenk verschillende interessante invalshoeken en journalistieke ‘haakjes’ die kunnen leiden tot een verhaal voor een Nederlands nieuwsmedium. Behalve invalshoeken kan je ook al nadenken over mogelijk te interviewen bronnen.

Stap 3

Je pitcht in duo’s de geïdentificeerde Nederlandse links met de datasets en je verhaalideeën aan de rest van de aanwezigen. Leg hierbij ook uit hoe Named Entity Recognition heeft bijgedragen bij het ontstaan van dit verhaalidee en hoe AI het zoekproces heeft beïnvloed. Geef ook aan hoe je deze pitch mogelijk vervolg kan geven.

Stap 4

Bespreek klassikaal

Bespreking

  • Hoe nuttig vonden jullie het gebruik van Pinpoint?
  • Zou je dit vaker doen?
  • Zie je ook bezwaren?

Materiaal

Tijdsindicatie

60 minuten, waarvan

  • Verhaal lezen: 10 minuten
  • Introductie / Stap 1: 15 minuten
  • Stap 2: 20 minuten
  • Stap 3-4: 15 minuten
Disclaimer. De onderzoekers hebben geprobeerd alle informatie te verifiëren bij de betrokken media. Waar dit niet is gelukt, is ervoor gekozen om op basis van de beschikbare informatie een zo volledig mogelijk beeld te schetsen van de software die (zeer waarschijnlijk) gebruikt is. De onderzoekers zijn daarbij bijgestaan door AI-experts. Omdat de experts de genoemde AI-toepassingen in meer algemene termen duiden, bestaat de kans op onjuiste details of onvolledigheden. Mocht u deze aantreffen, neem dan gerust contact op.