In 1953 publiceerde Ernest Wynder een onderzoek over longkanker, waarbij hij het teer uit sigaretten met een borstel op 81 muizen smeerde. Het resultaat van dit onderzoek was dat 44 procent van de ingesmeerde muizen kanker had gekregen en slechts 10 procent van de totale groep was na twintig maanden nog in leven. Bij de niet-ingesmeerde muizen was er bij geen van hen kanker gevonden en 53 procent was nog in leven na twintig maanden. Vanzelfsprekend liet dit onderzoek vele mensen schrikken. Het gevolg hiervan was dat de aandelen van de tabaksindustrie flink in waarde begonnen te dalen. Daarom besloten de tabaksmagnaten met elkaar om de tafel te zitten. Hier werd besproken dat zij moesten laten zien dat de ongerustheid over sigaretten onterecht was. Op 4 januari 1954 werd de eerste stap gezet: met een advertentie in vele kranten claimde de tabaksindustrie dat hun producten niet schadelijk zouden zijn. Zij gebruikte hierbij als argument dat er te weinig bewijs zou zijn om aan te tonen dat het roken van sigaretten longkanker veroorzaakt. Verder laat de tabaksindustrie weten dat zij zullen bijdragen aan onderzoek om erachter te komen of er een samenhang tussen sigaretten en gezondheid is. Dit laatste was een zeer sluwe marketingtruc van de tabaksindustrie: er werd door henzelf miljoenen euro’s uitgegeven aan onderzoek naar het verband tussen tabak en gezondheid. Echter schreef historicus Proctor: “Het doel was eigenlijk om op zo’n manier te zoeken dat je niets kon vinden en dan te stellen dat de vele miljoenen die waren besteed aan roken en gezondheid nooit enig bewijs van nadelen hadden blootgelegd.” Hiermee vormde zij een beeld naar de buitenwereld toe dat zij het belangrijk vond om erachter te komen of tabak daadwerkelijk longkanker veroorzaakt. Een ander voordeel was dat zij hiermee een imperium aan experts opbouwde die konden getuigen voor de rechtbank als dat nodig was. In datzelfde jaar, 1954, publiceerde de journalist Darrell Huff zijn boek How To Lie with Statistics. In dit boek wilde hij waarschuwen voor cijfermisbruik. Hij schreef dit boek, omdat oplichters deze trucs al kenden en hij daarom de oprechte mensen hierover wilde informeren. Hij wilde waarschuwen voor het feit dat correlatie niet per se causaliteit betekent. Als voorbeeld gebruikte hij de bewering dat ooievaars baby’s zouden brengen. Er is wel sprake van correlatie tussen het aantal ooievaars en het aantal baby’s in een gezin, maar dat impliceert niet automatisch causaliteit. Het werkt namelijk als volgt: hoe meer mensen er in een huis wonen, hoe groter het huis is, hoe groter dus het dak is en hoe meer ooievaars er op het dak zullen zitten. Verder schrijft hij dat deze fouten vooral terugkomen in gezondheidsonderzoeken. Maar hoe kun je deze fouten herkennen? In zijn boek beschrijft Huff drie zogenoemde kulcausaliteiten: Het is toeval: Jonathan Schoenfeld en John Ioannidis besloten om een onderzoek te doen naar de samenhang tussen bepaalde ingrediënten en kanker. Er zijn namelijk veel studies die bijvoorbeeld beweren dat bepaalde ingrediënten kanker veroorzaken. Het bizarre was echter dat niet elk onderzoek op dezelfde conclusie uitkwam. Van de twintig onderzochte ingrediënten vonden Schoenfeld en Ioannidis bij zeventien hiervan tegenstrijdigheden in de conclusies. De resultaten konden natuurlijk niet allebei kloppen. Een ander voorbeeld is de octopus Paul: hij voorspelde de uitslagen van de WK-wedstrijden in 2010. Dit werd gedaan door middel van twee voedingsbakken met elk de vlag van het spelende land erop. Paul voorspelde acht wedstrijden en had het bij allemaal bij het juiste eind. Deze kans komt neer op één op de 256 (0,4 procent). Kom Paul in de toekomst kijken of was er sprake van toeval? Er ontbreekt een factor: er kan ook een factor missen die zowel de oorzaak als het gevolg beïnvloedt. Zo schreef Huff dat een onderzoek concludeerde dat rokers lagere cijfers halen. Volgens Huff mist er hier een factor. Wellicht, stelt Huff, zijn sociale types eerder geneigd om te roken en zitten diezelfde sociale types minder graag met hun neus in de studieboek. Het is (ook) andersom: Huff gebruikt hierbij het volgende voorbeeld: als het regent zie je veel mensen met een paraplu lopen. Wil dit zeggen dat paraplu’s regen veroorzaken? Natuurlijk niet. In dit geval zijn oorzaak en gevolg erg makkelijk te herkennen. Dat is echter niet altijd zo: een rijke man heeft veel aandelen. Is de man in dit geval rijk geworden door de aandelen? Of kon hij veel aandelen kopen, omdat hij rijk is? In 1964 verscheen Darrell Huff voor het Amerikaanse Congres om tijdens een hoorzitting een verklaring af te leggen over advertenties en verpakkingen van sigaretten, want wie kon er nu beter over de onderzoeken oordelen dan de man die een boek schreef over cijfermisbruik? Hij vertelde over de verschillen tussen causaliteit en correlatie aan de hand van de hiervoor besproken voorbeelden. Darrell Huff geloofde dat we niet aan mochten nemen dat roken per se longkanker veroorzaakt, ondanks de vele onderzoeken die telkens het tegenovergestelde concludeerde. Uit elk onderzoek blijkt weer dat mensen die roken vaker longkanker krijgen. Moeten we dan maar spreken van toeval bij alle duizenden onderzoeken? Waarom verdedigde Huff de tabaksindustrie? Het antwoord is schokkend en simpel tegelijkertijd: hij werd door hen betaald om zijn boek uit te brengen. Darrell Huff was een onderdeel van het imperium dat de tabaksindustrie had opgebouwd. Het plan was zelf nog dat er een vervolg op het boek zou komen met de volgende titel: How to Lie with Smoking Statistics. Zo zie je maar dat, zoals Huff benadrukte, je altijd kritisch moet kijken naar het verschil tussen correlatie en causaliteit van een conclusie, zelfs als die conclusie van Huff zelf komt.
Dit artikel is geschreven door Esther Valkonet