De manier waarop je ervoor kiest om je data te groeperen of in plakjes te snijden heeft een zeer sterke invloed op de resultaten. Dat is hier het geval

STEUN RO

          Met data kun je veel kanten op 

Al een paar weken

… volg ik een online training over datajournalistiek. Een van de behandelde items is de Simpson’s Paradox. Ik kende deze terminologie niet, maar wel de effecten.
Met data kun je veel bewijzen. Maar klopt het dan uiteindelijk nog wel. Dat is de hamvraag. In deze cursus diverse voorbeelden, maar de COVID19 pandemie biedt zeker ook voldoende inspiratie en materiaal.

Printscreen van de cursus (MOOC)

Citaat: “Het is erg belangrijk als datajournalist om te begrijpen dat de manier waarop je ervoor kiest om je data te groeperen of in plakjes te snijden een zeer sterke invloed heeft op de resultaten die je krijgt. Dus aannames of prioriteitenstelling bij de data-analyse zullen absoluut de resultaten beïnvloeden die er uit komen. En dat heet Simpsons paradox….

Bekijk deze korte video van Heather Krause zelf:
https://youtu.be/f5gMwGfZL3g

Screenprint University of Manchester

Groot,groter, grootst
Vroege resultaten van een onderzoek onder 2000 mensen in het VK en de VS suggereren dat aerosoltransmissie bij de COVID-19 overdracht betekenisvol is.
De gegevens, zo stellen de onderzoekers, zouden kunnen suggereren bij grotere individuen een hoger risico – iets wat niet verwacht zou worden als de transmissie uitsluitend via druppeltjes zou verlopen. Het artikel is niet door vakgenoten beoordeeld en data gegevens zijn er niet. Tja…

Reactie
Ik krijg desgevraagd commentaar van onderzoeker prof. Evangelos Kontopantelis.

Screenprint van een mailbericht op 29 juli 2020

Conclusie
Er is een associatie. Niet meer en niet minder dan dat. Dit betekent dat er nog steeds een andere verklaring mogelijk is, zegt Kontopantelis met zoveel woorden.

Screenprint van een deel van een krantenbericht

Pers
Kranten als de Telegraaf aarzelen niet om breed uit te pakken. En kritiisch volger Maurice de Hond loopt -als we deze kop mogen geloven- zonder aarzeling achter de krantenberichten aan

Screenprint website DagelijkseStandaard

Reflectie
Is dit nu een Simpsonse Paradox? Dat durf ik niet zomaar te stellen. De onderzoekers zijn te goeder trouw. Ze hebben kennelijk een databestand geanalyseerd. Uit de veelheid van indicatoren rolt dan een correlatie. Dat leidt tot een hypothese, een eronderstelling. Interessant, maar niet het einde, doch het begin van nader onderzoek. Door de haast die COVID19 kenmerkt, melden ze hun bevindingen alvast. Er moet zelfs nog een peer review plaats vinden. Die stappen slaan een aantal niet bij het onderzoek betrokken personen (die beter zouden moeten weten) meteen maar over en nemen dit nadrukkelijk op in hun campagne. Opgepast, zou ik willen benadrukken! Op social media worden ook al vraagtekens gezet. Give us the data!

Waardeer dit artikel!

Dit artikel las je gratis. Vond je het de moeite waard? Dan kun je jouw waardering laten zien door een kleine bijdrage te doen. Zie hier voor meer informatie!

Mijn gekozen waardering € -