Open data niet langer toekomstmuziek

Slechts veertig procent van het totale budget van het ministerie van Buitenlandse Handel en Ontwikkelingssamenwerking gaat naar het speerpuntenbeleid van minister Ploumen. Hoe we dat weten? Door het visualiseren van de begroting die gewoon online te vinden is. Dat vertelde Theo van de Sande, open data specialist van het ministerie van Buitenlandse Zaken, gisteren op een conferentie over open data. De niet te stoppen alsmaar groeiende hoeveelheid data op het internet is een vooralsnog onontgonnen terrein voor de meeste journalisten en ontwikkelingswerkers. Naast mogelijkheden zijn er ook kanttekeningen.

De open data conferentie georganiseerd door Utrecht Data School, Coolpolitics, Lokaalmondiaal en Vice Versa als afsluiting van de masterclass datajournalistiek trekt een gevarieerd gezelschap; studenten, NGO-medewerkers, journalisten, zelfs het bedrijfsleven blijkt vertegenwoordigd. Petra Stienen, arabiste en  zelfverklaard alfa en datanitwit, praat het programma aan elkaar.

De weg naar de toekomst

Open data, waar hebben we het dan eigenlijk over? ‘Open data is openbaar, uit publieke middelen bekostigt en dus eigendom van de burger en niet van de overheid. Daarnaast moet het computer leesbaar zijn, en bewerkbaar. Een PDFje met wat gegevens op de website telt dus niet. Tot slot moet het zonder beperkingen beschikbaar zijn, dus vrij van auteursrechten,’ legt Saskia Stuiveling, president van de algemene rekenkamer en de eerste keynote spreker ons uit.

Saskia Stuiveling wijst ons op de veranderingen die nog komen gaan. ‘We staan nog maar aan het begin, niemand heeft de waarheid in pacht. Ook de hotemetoten en instituties moeten gaan nadenken hoe ze hun waarde naar dit nieuwe tijdperk gaan immigreren.’

Het belang hiervan kan niet worden onderschat. Stuiveling noemt het zelfs een ‘levensnoodzaak,’ en ziet een opdracht voor de journalistiek in het gebruiken en openbaren van data.

Het idee dat open data het nieuwe wondermiddel is voor onderzoek wordt al snel van tafel geveegd. De beschikbare data zijn vaak niet volledig, voor sommige landen zijn geen statistieken beschikbaar, of gegevens zijn niet vergelijkbaar, vertelt Stuiveling.

Datavisualisaties

Hoe moeten we die data presenteren? Wat gebeurt er als deze gevisualiseerd wordt? Imar de Vries, onderzoeker nieuwe media: ‘In principe is dit geen nieuwe uitdaging, wat nieuw zijn alle tools waar we nu over beschikken, en ook de gigantische hoeveelheid data die ineens beschikbaar is. Een visualisatie kan hierbij helpen, mits deze goed leesbaar is en verduidelijkt.’ Hij benadrukt dat je juist het inzicht in het achterliggende maakproces niet verloren moet laten gaan in de visualisatie, en dat we de lezer moeten opleiden om kritisch te kijken.

Het panel bestaande uit Winny de Jong (datajournalist OneWorld), Hille van der Kaa, (onderzoeker datajournalistiek van de universiteit Tilburg) en Thomas Boeschoten (Utrecht Data School) krijgt een aantal visualisaties voorgeschoteld die, bewust of onbewust, een nietsvermoedende lezer op het verkeerde been zouden zetten. Al snel wordt duidelijk hoe gemakkelijk datavisualisaties te manipuleren zijn.

Van der Kaa: ‘Als er iets niet te vertrouwen is dan zijn het cijfers. Een verhaal dat enkel op cijfers gebaseerd is zou ik onmiddellijk wantrouwen.’ De Jonge laat weten hoe kritisch ze op bronnen is wanneer ze die voor een artikel gebruikt, maar uit Boeschoten’s ervaring blijkt dat de gemiddelde lezer die kritische blik ontbeert. ‘Ik heb een twitteraccount over voetbal, die ik als mijn speeltuin beschouw, er zijn immers toch geen mensenlevens mee gemoeid. Mijn 140 tekens over Ajax worden zonder commentaar  of vragen doorgetwitterd.’

Ruerd Ruben (directeur IOB) merkt vanuit het publiek op: ‘We hebben bijna nooit een dataset, zelfs niet als we die zelf maken, die we echt honderd procent betrouwbaar vinden. Hoe krijg je via visualisatie inzichtelijk of het goede of slechte data is?’ ‘Soms is de blik van een expert nodig,’ zegt Boeschoten, en Van der Kaa stelt: ‘Datajournalistiek en storytelling zijn op hun sterkst wanneer ze gecombineerd worden. Datavisualisatie wordt verheerlijkt, maar het heeft context nodig, voorbeelden die verklaren en duiden.’

Big Data

Linnet Taylor brengt verdieping, en werpt enkele prikkelende dilemma’s op. ‘99 procent van alle data is niet open. In tegenstelling tot open data is big data een ongestructureerde, alsmaar verder evoluerende ‘haarbal’. We gaan ervanuit dat het ons meer vertelt dan wat we verzameld en openbaar gemaakt hebben als open data, maar we weten niet wat het representeert. We ontvangen slechts signalen zonder het grotere plaatje te begrijpen.’

Ook gaat Taylor in op de ethische kwesties rondom privacy.  ‘Ook geanonimiseerde informatie kan gemakkelijk worden gedeanonimiseerd wanneer verschillende datasets worden gecombineerd. In ontwikkelingslanden zijn de risico’s, en daardoor het belang van anonimiteit nog veel groter.’ Taylor besluit: ‘Een sceptische houding richting data is essentieel, kwantitatief en kwalitatief onderzoek moeten gecombineerd worden.’

Gebruik in de ontwikkelingssector

In het laatste panelgesprek met Caroline Kroon (Cordaid), Rolf Kleef (Open for Change), Theo van de Sande (Ministerie van Buitenlandse Zaken) en Jasper Middendorp (Partos) over de praktische toepassingen van open data voor de ontwikkelingssector. In de nieuwe strategische partnerschappen zijn organisaties verplicht om al hun gegevens in de IATI-standaardte publiceren. Cordaid is de eerste Nederlandse ngo die zich daar al mee bezig houdt. Kroon vertelt: ‘Het is belangrijk om zowel de mensen in het Zuiden als onze donoren hier te laten zien waar we mee bezig zijn. Daar hebben ze recht op.’

Ook voor organisaties zelf kan dit heel nuttig zijn. Jasper Middendorp (Partos): ‘Wie werkt waar? Met wie? Wat doen ze daar? Dit is allemaal heel interessante informatie.’Kroon (Cordaid) vult aan: ‘We praten altijd maar over de kassa, maar het is veel interessanter om te kijken wat er in de schappen ligt. Het gaat niet enkel om het inzichtelijk maken van geldstromen, maar juist ook over projectinformatie.’

Niet alleen ngo’s, maar ook de overheid zelf is bezig steeds meer online te publiceren. ‘Het ministerie van Buitenlandse Handel en Ontwikkelingssamenwerking gaat binnenkort de gehele begroting openbaar stellen.  Uit de data bleek dat slechts veertig procent van haar uitgaven naar de vier speerpunten van haar beleid gaan. In de visualisatie van deze data viel dat enorm op en daar was de minister niet zo blij mee. Vandaar dat we deze datavisualisatie van haar niet mochten gebruiken. Maar de cijfers zijn gewoon terug te vinden’, aldus Van de Sande.