Innovatie & Strategie

Datamanagement
Rekenmethoden

Rekenmethoden

Volgens wiskundige Chris Verhoef voorspelt de Volkskrant met zijn coronagrafieken het verleden.

© Shutterstock robert coolen
14 mei 2021

De media gaan mee met de tijd: van datajournalisten tot liveblogs, van techredacteurs tot podcasts. De drempel om iets te berekenen wordt lager en lager. Immers, de democratisering die uitgaat van open source betekent onder andere dat iedereen elke denkbare tool kan downloaden en die naar eigen inzicht kan gebruiken. 

Dat is mooi als je weet waar je mee bezig bent. Maar dat is niet altijd het geval.

Zo kreeg ik enige tijd geleden bericht dat het de goede kant opging met de coronabesmettingen. De besmettingen zouden aan het dalen zijn. Nogal verbazingwekkend, aangezien het helemaal niet goed ging en de besmettingen zeker niet daalden. De onderbouwing van het enthousiasme bleek een plaatje dat de Volkskrant elke dag in een liveblog publiceert. 

Nieuwsgiering geworden, vroeg ik het plaatje op. Er was op eerste aanblik geen hout van te begrijpen. En na enige heen en weer gemail bleek de verzender het ineens ook niet meer te begrijpen. Na enig vorsen bleek dat men weektotalen door elkaar deelde. Dus elke dag nam men de voorgaande zeven dagen opgeteld en dat deelde men door dezelfde optelsom een week ervoor.

Dat is inderdaad een heel ingewikkeld plaatje, en de vraag is: wat zegt dit eigenlijk? In dit geval net helemaal niets. Als je een weektotaal deelt door het weektotaal van vier dagen geleden, in plaats van zoals de Volkskrant doet zeven dagen geleden, dan betekent het wel weer iets: dan is het een ruwe benadering van het reproductiegetal.

Dat zit zo: stel je bent besmet met het coronavirus. Dan duurt het ongeveer vier dagen voordat het virus zich heeft kunnen reproduceren bij degenen die jij weer besmet. De hoeveelheid mensen die je besmet heet het reproductiegetal.

Omdat de gegevens over aantallen besmettingen schokkerig zijn  bijvoorbeeld door een ICT-storing, Pasen, Black Friday en meer  is het verstandig om naar een weekgemiddelde of weeksom te kijken. Dan vlak je de springerigheid uit de data, zonder dat je de data zelf hoeft uit te vlakken, waardoor je beeld onnauwkeuriger kan worden. Zie bijvoorbeeld deze paper voor wat meer uitleg.

Na analyse blijkt dus dat de Volkskrant elke dag met een slechte benadering van het reproductiegetal komt

Maar met 4 dagen is een ruwe benadering, want de generatietijd, zoals dat heet, is niet 4 dagen maar net iets minder, namelijk 3,74 dagen. Dus voor een nog betere benadering neem je de weekgroei en daar de zevendemachtswortel van. Dan heb je de dagelijkse groei. Om nu het reproductiegetal te benaderen, verhef je dat tot de macht 3,74, want dan heb je de generatiegroei, en dat is het reproductiegetal. Vervolgens moet je dan de tijd ongeveer 12 tot 13 dagen terugzetten, en dan heb je een vrij goede benadering van het reproductiegetal te pakken. 

Zie bijvoorbeeld:

In deze grafiek laat Chris Verhoef berekeningen rondom het reproductiecijfer zien.
Bron: https://www.cs.vu.nl/~x/corona.html

Nu is het volkomen zinloos om in Nederland het reproductiegetal te willen benaderen, want het RIVM publiceert deze tijdreeks inclusief betrouwbaarheidsintervallen tweemaal per week. Nederland is het enige land ter wereld dat het dagelijkse reproductiegetal publiceert. En dat is geen toeval: het RIVM is betrokken bij gezaghebbende publicaties waarin wordt uitgelegd hoe je in een vroeg stadium het reproductiegetal kunt uitrekenen. Dat was al in 2007, en het mooie is, die technieken zijn als open source verkrijgbaar.

Na analyse blijkt dus dat de Volkskrant elke dag met een slechte benadering van het reproductiegetal komt, zonder het zelf te weten, met verwarrende teksten erbij waardoor hun lezers totaal verkeerde conclusies trekken. En als het nu nog het reproductiegetal tot en met vandaag was, maar nee: dat van 12 à 13 dagen geleden. Dus de Volkskrant voorspelt het verleden, maar dan slecht. Dat is toch wel knap.

En het had niet gehoeven, als ze hun eigen krant hadden gelezen. Daarin schreef ik samen met een collega het volgende:

Epidemiologische wiskunde is dusdanig ingewikkeld dat het getuigt van grove zelfoverschatting ook maar het idee te hebben dat je daar als leek iets zinnigs over te melden zou kunnen hebben. Het is dus absoluut geen zwaktebod van het kabinet dat zij voor de te nemen maatregelen afgaat op de hoogstaande wiskundige kennis en kunde van het RIVM. 
Sterker, het RIVM is door de overheid ingesteld om hen juist over dit soort extreem ingewikkelde materie bij te staan. Zij moet blind kunnen vertrouwen op haar wetenschappers, die al decennia publiceren over de nieuwste inzichten in de mathematische modellering van infectieziekten.

Overigens heeft de Volkskrant geen ombudsman meer. Niet nodig.

Magazine AG Connect

Dit artikel is ook gepubliceerd in het magazine van AG Connect (meinummer 2021). Wil je alle artikelen uit dit nummer lezen, klik dan hier voor de inhoudsopgave.

Reactie toevoegen