Homeopathische wiskunde
De verdunningen van Jacques Benveniste
door Jan Willem Nienhuys – Skepter 4.2 (1991)
OP 30 juni 1988 werd de medische wereld opgeschrikt door een publikatie van de Franse arts en immunoloog Jacques Benveniste in het gezaghebbende tijdschrift Nature. Benveniste beweerde de reactiviteit van homeopathische verdunningen van anti-IgE (een stof die het menselijke afweersysteem stimuleert) aangetoond te hebben. Benveniste, de redactie en de referees van Nature hadden echter niet in de gaten dat Benvenistes wiskunde minstens even ongeloofwaardig was als zijn biochemie. Weten wetenschappers eigenlijk wel genoeg van statistiek?
Mag ik u uitnodigen voor een eenvoudige proef? Neem een pond mooie ongebroken rijst. Kleur een eetlepel daarvan in een opvallende kleur en vermeng de gekleurde rijst weer met het pond. Neem een afgepaste portie (een eetlepel) uit het mengsel. Tel de gekleurde korrels, gooi alles terug en herhaal dit vele malen. Ik heb deze proef voor u gedaan. Achtereenvolgens vond ik: 21, 32, 27, 31, 24, 14, 25, 18 en 24. Het gemiddelde van deze getallen is 24, en de afwijkingen van dat gemiddelde zijn respectievelijk 3, 8, 3, 7, 0, 10, 1, 6 en 0. Als we de kwadraten van deze afwijkingen middelen, vinden we 29,8.
De theorie zegt dat het omstreeks diezelfde 24 moet zijn, en dat klopt aardig. In de kanstheorie heet dat gemiddelde kwadraat van de afwijkingen de variantie, en de wortel daaruit noemen we de standaardafwijking. In ons voorbeeld zou die dus ongeveer 5 zijn (de wortel uit 24). Je kunt wiskundig bewijzen dat de variantie in de buurt van het gemiddelde ligt, als tenminste bepaalde uitgangspunten kloppen. Ten eerste hoort elke gekleurde rijstkorrel een kleine kans te hebben om in mijn schepje terecht te komen, en ten tweede mogen die gekleurde korrels elkaar niet in de weg zitten. Dat wil zeggen dat de kans dat een bepaalde gekleurde korrel in mijn schepje terecht komt, niet of nauwelijks beïnvloed wordt door het aantal gekleurde korrels dat er al in zit. Als ze de neiging hebben op kluitjes bij elkaar te gaan zitten, bijvoorbeeld als je de proef herhaalt door de geverfde rijst met suiker te vermengen, dan is het al mis. Tijdens het vermengen en omscheppen rollen de rijstkorrels aan de oppervlakte van de suikermassa dan telkens naar elkaar toe, in kuiltjes, waardoor de variantie met gemak wel tweemaal zo groot kan worden. Als de gekleurde korrels elkaar zodanig zouden afstoten dat ze op regelmatige afstanden van elkaar gaan zitten, dan zou de variantie weer kleiner worden.
Tot zover deze eenvoudige statistiek zoals elke wetenschapper die al op de middelbare school geleerd zou moeten hebben. Trouwens, ook voor niet-wetenschappers is het nuttig om te weten hoe sterk toevalsaantallen kunnen fluctueren. Het aantal verkeersslachtoffers per maand of per jaar, het aantal gevallen van leukemie nabij een kerncentrale, het aantal bacteriën in zwemwater of roomijs, het zijn allemaal voorbeelden van getallen waarvan we soms willen weten of uitschieters naar boven of beneden al dan niet ‘toevallig’ zijn.
Drijvende mijnen
Nu heel wat anders, namelijk iets over allergie en het immuunsysteem. Ons lichaam verdedigt zich tegen indringers, maar voordat de indringers worden aangevallen, moeten ze eerst worden herkend. Dat gebeurt met behulp van zogeheten immuunglobulinen, onder andere IgE. Dat zijn grote moleculen, opgebouwd uit tienduizenden atomen, in de vorm van een hoofdletter Y of T. Het lichaam maakt daar miljoenen soorten van, min of meer op goed geluk. Als een van die soorten heel stevig kan blijven plakken aan een indringer, wordt er van die soort vreselijk veel bijgemaakt, zodat bij een volgende gelegenheid de indringer snel in de kraag kan worden gepakt (je bent dan ‘immuun’).
Er zijn diverse manieren om de indringer aan te vallen, en één daarvan gebeurt met behulp van een bepaald soort witte bloedlichaampjes, de basofiele granulocyten. Die heten zo omdat er kleine blaasjes in zitten. Ongeveer één procent van de witte bloedlichaampjes zijn van die basofielen. De buitenkant van basofielen is bezet met IgE-moleculen. Het zijn een soort drijvende mijnen: als ze met hun uitsteeksels blijven vastplakken aan een ongewenst object (een parasiet bijvoorbeeld) dan gaan de blaasjes open (ze degranuleren) en wordt de inhoud over de parasiet uitgestort, wat erg ongezond is voor de parasiet. De inhoud bevat onder andere histamine, wat ter plaatse een ontstekingsreactie oproept.
Men vermoedt dat het lichaam dit wapen vooral inzet tegen grote indringers, bijvoorbeeld wormen. Om te voorkomen dat deze drijvende mijnen te vlug afgaan moeten trouwens twee vlak bij elkaar zittende uitsteeksels tegelijk aan de parasiet blijven plakken, naar het schijnt. Als iemand allergisch is voor bijvoorbeeld stuifmeel van het Jacobskruiskruid, dan heeft hij of zij veel IgE dat uitsluitend aan dat stuifmeel blijft vastplakken. Iemands IgE gaat niet alleen op de basofielen zitten, maar het hecht zich ook aan zogeheten mestcellen, die niet ronddrijven in het bloed maar zich bijvoorbeeld in de slijmvliezen bevinden. Net als de basofielen kunnen ook de mestcellen krachtige afweerstoffen produceren. Bij contact met dat stuifmeel kunnen ze een sterke afweerreactie oproepen, zó sterk dat het ook voor de patiënt lastig wordt: hooikoorts.
Om na te gaan hoe erg het met iemands allergie gesteld is, kun je proberen na te gaan hoeveel IgE er op zijn of haar basofielen zit. Je kunt dat uitproberen met behulp van een specifiek allergeen (stuifmeel, huismijtenpoep, kattenharen, schimmel) of met iets dat aan alle IgE blijft plakken, namelijk anti-IgE. Die test is erg gevoelig. Als er per vijfhonderd miljoen watermoleculen één anti-IgE molecuul is, dan degranuleert al een groot deel van de basofielen. Als de concentratie anti-IgE nog eens duizend maal zo klein is, dan is in de praktijk niets meer te merken van die degranulatie.
Even opnieuw…
Hoe is die praktijk? Het komt erop neer dat je met iemands bloed twee proeven doet: je vermengt het met gedestilleerd water, en met een oplossing met een beetje allergeen erin. In beide gevallen kijk je hoeveel basofielen er niet degranuleren. De ongedegranuleerde kleuren namelijk duidelijk rood wanneer je ze met een bepaalde kleurstof vermengt. Als er met het allergeen veel meer degranuleren dan met gedestilleerd water, weet je dat de patiënt veel IgE heeft dat speciaal aan dat allergeen kan blijven plakken. Je kunt de proef ook gebruiken om na te gaan of de patiënt veel IgE heeft, door met anti-IgE te werken in plaats van een allergeen.
In wat meer detail verloopt de basofielentest als volgt. Een portie witte bloedlichaampjes van de patiënt vermeng je met anti-IgE. Een half uurtje laten staan, en dan de kleurstof toevoegen. Uit het mengsel haal je een precies afgepaste portie van drie kubieke millimeter. Daar zitten dan ruwweg honderd rode basofielen in, hoewel er ruimte is voor veel en veel meer. Dan tel je ze, en je zou dus een variantie van circa 100 (dus een standaardafwijking van 10) verwachten, als de basofielen tenminste niet klonteren voor of tijdens het afpassen van de portie. Je doet dit ook een keer met water in plaats van met anti-IgE, en je vergelijkt de uitkomsten.
Als je het netjes aanpakt, doe je het met drie identiek toebereide mengsels. Professor Jacques Benveniste van het INSERM (Institut Nationale de la Santé et de la Recherche Médicale) U200 (Immunofarmacologie van allergie en ontsteking) onderzocht bloed met behulp van anti-IgE. Echter, niet alleen in de concentratie die daar normaal voor wordt gebruikt, maar ook in zeer sterke verdunningen, zó sterk dat het beter is te spreken van op een speciale wijze bereid gedestilleerd water. De feitelijke uitvoering van de proef was in handen van dr. Elizabeth Davenas.
De variantie in de waarden van drie bij elkaar horende tellingen bleek bij haar maar een zevende van het gemiddelde. Een typische telling leverde 79, 82, 83 op, of: 44, 46, 45. Om dit feit te constateren, hoef je de computer niet aan te zetten, het staart je gewoon aan vanaf de eerste pagina van het Nature-artikel. De kans dat zoiets toevallig gebeurt, is niet nul, maar wel astronomisch klein, zeker vergeleken met de kans dat een onderzoeker zich vergist.
De verschillende soorten gedestilleerd water (‘verdunningen van anti-IgE’) gaven sterk verschillende uitkomsten, vandaar dat Davenas meende (en Benveniste met haar), dat de bereidingswijze van dat gedestilleerde water het aantal degranulaties kon beïnvloeden. De vermeende nauwkeurigheid van de metingen in drievoud speelt daarbij een rol. Twee uitkomsten 45 en 75 kunnen erg verschillend lijken, maar het maakt heel wat uit of de nauwkeurigheid van de metingen plus of min 2 is, dan wel plus of min 15. Maar als de dingen die je telt zich zo slecht aan de wetten van de kansrekening houden, wat voor conclusies kun je dan verder nog trekken?
Eén verklaring is dat Davenas er niets verkeerds in zag tellingen even opnieuw te doen als ze niet behoorlijk uitkwamen. De proef is in diverse laboratoria herhaald, maar… telkens door dr. Davenas, die zelf de materialen voor de proef meenam. In Israël, waar ook in maart 1987 de metingen gedaan zijn die in het Nature-artikel stonden afgedrukt, bleek na afloop van de proef dat de reageerbuizen met ‘oneindig’ verdund anti-IgE nog op anti-IgE gelijkende eiwitten bevatten, die er zeker niet hoorden te zijn. Zoiets geeft te denken.
Bekrompen gezeur
De ophef rond de proef heeft alles te maken met homeopathie. Allergie wordt vaak behandeld met desensibilisatie: de patiënt wordt blootgesteld aan hele lage concentraties van het allergeen, waardoor gewenning optreedt. Dit komt overeen met de ideeën van de homeopathie, en de ontdekking en behandeling van allergie komt ook uit die hoek (volgens homeopaten). Een van de weinige andere proeven die de deugdelijkheid van de homeopathische opvatting steunt, is een proef van Reilly die werkte met 10^60 maal verdund stuifmeel. Kortom, diagnose en behandeling van allergie is zo’n beetje de thuisbasis van de homeopathie.
De proef van Benveniste was heel duidelijk op het homeopathische idee geënt. Getuige daarvan zijn verdunningen telkens met factoren 10, het schudden na elke stap, verwijzingen naar Reilly en de malle verklaring dat water geheugen zou hebben, een die al jarenlang de ronde doet in homeopathische kringen. Verder blijkt uit een overzicht van homeopathisch onderzoek (uitgegeven door een Franse homeopathische firma) dat Benveniste al in 1983 dergelijk onderzoek met basofielen deed, maar dan met homeopathische verdunningen van histamine en Apis Mellifica (gemalen honingbijen, in een verdunning van 1 op honderd biljoen, een bekend homeopathisch middel).
Dr. Davenas voerde haar dupliceringen van de proef ook uit in homeopathische laboratoria, en ten minste drie mede-auteurs van het artikel waren homeopathische artsen. Genoemde Reilly schreef dat als de waarnemingen fout zouden blijken, homeopathie aan de kaak zou zijn gesteld als een van de onfortuinlijkste ondernemingen in de medische wetenschap.
Benveniste heeft flink aan de weg getimmerd en goed laten merken dat hij vond dat hij de ontdekking van de eeuw had gedaan. Vervolgens was de flamboyante manier waarop de redactie van Nature een tegenonderzoek organiseerde (overigens wel met volledige instemming van Benveniste, die tot het laatst toe op de goede uitslag vertrouwde) ook al niet bevorderlijk voor de wetenschappelijke kalmte.
De proef van Benveniste werd herhaald door ing. G.C.M. Scheepens, in het laboratorium van het Lambertusziekenhuis in Helmond, onder leiding van dr. L. Smithuis. Ook Scheepens vindt te kleine varianties, maar verder niets dat in de richting gaat van de uitkomsten van Benveniste, namelijk sterk verschillende aantallen basofielen bij verschillende sterke verdunningen’. Toen ik Scheepens’ resultaten (met tabellen en al) aan Benveniste voorlegde, reageerde hij ontstemd dat een collega zomaar zonder overleg met hem had gepoogd zijn onderzoek te dupliceren. Voorts zag hij een 10-voudige verdunning voor een 10^10-voudige aan, zodat het hem toescheen of Scheepens’ resultaten de zijne gedeeltelijk ondersteunden.
Tijdens de herhaling in Benvenistes laboratorium op initiatief van Nature, bleken zowel de statistische eigenaardigheden als het resultaat van de proef niet op te treden. Ook in het Rothschild Ziekenhuis in Parijs is de proef overgedaan. Resultaat: nihil (er werd een degranulatietest van het Pasteur Instituut gebruikt). H. Metzger, een van de referees van Davenas’ artikel, deed de proef over in een iets andere opzet (met mestcellen, anti-IgE van muizen, analyse van de bij degranulatie vrijkomende stoffen) en vond ook al niets.
Toch beweert Benveniste nog steeds dat zijn resultaten reproduceerbaar zijn. Hij schreef me op 23 maart 1990: ‘discussion about the violation of the Poisson’s Law can only take place between specialists in statistics. The anomaly… had never been noticed before.’ Statistische onmogelijkheden zijn voor hem geen aanleiding om uit te zoeken wat er aan de hand is met die basofielen. Hij klaagt alleen maar dat ze gebruikt worden om af te dingen op een revolutionaire ontdekking.
Wat we weten van het mechanisme ‘antistof + basofiel geeft degranulatie’, maakt het onaannemelijk dat door een beetje schudden in het water spontaan dingen kunnen ontstaan die de werking van de antistof kunnen nadoen, namelijk zich door hun bijzondere vorm en ladingsverdeling zo stevig vasthechten aan het IgE-molecuul dat het van vorm verandert en daardoor de basofiel laat openbreken. Als je een fiets in een betonmolen met Lego-blokjes gooit, en dan die molen een tijdje laat draaien, komen er veelal geen complete Lego-fietsen uit. Toch is dat nog veel waarschijnlijker dan dat antistoffen afdrukken in water maken.
Benveniste ziet dat anders. In het Natureartikel en ook in vermelde correspondentie verwees hij naar een stukje van een theoretisch natuurkundige. Daarin wordt uitgelegd dat de rotatieassen van watermoleculen wel eens tijdelijk (10^-14 seconde) en plaatselijk (binnen eenhonderdste millimeter) gelijkgericht kunnen worden door infraroodstraling, een soort van lasereffect. Zie je wel, denkt Benveniste, afdrukken in water bestaan, en zeuren over statistiek, dat doen bekrompen wetenschappers die zich in alle bochten wringen om iets ongewoons maar niet te hoeven geloven.
Ook verwijst Benveniste naar een artikel over de microscopische structuur van water (een los netwerk van waterstofbruggen die ook zo’n 10^-14 seconde blijven bestaan bij temperaturen boven het vriespunt) en naar artikelen met bespiegelingen over mogelijke elektrische signalen tussen levende cellen. Maar dergelijke bespiegelingen worden in Benvenistes ogen een ‘very simple fact that biological processes can be affected by unknown information transmitted by water, possibly via electromagnetic fields.’ Ik kan niet anders concluderen dan dat Benveniste (overigens een kundig onderzoeker) niets wil begrijpen van wiskunde en natuurkunde.
Statistiek als vijgeblad
De basofiele degranulatietest blijkt in handen van oprechte onderzoekers eigenaardigheden te vertonen. Opheldering daarvan is van belang voor het nut van de test (of misschien ook niet, want de test is weliswaar eenvoudig, maar ook weinig nauwkeurig; je kunt beter mestcellen dan basofielen nemen, en beter histamine meten dan degranulatie). Maar voordat de oorzaak van die eigenaardigheden is uitgezocht, is er geen reden om enig belang aan de uitslag van de proef van Benveniste te hechten. Een fysische oorzaak is niet gevonden, en zoals u gezien hebt is een menselijke oorzaak niet zo maar uit te sluiten. Ik moet zeggen, dat ik niet begrijp waarom de referees van Nature die te kleine variantie niet hebben opgemerkt. Van de zevenendertig ingezonden-brievenschrijvers van Nature over deze zaak waren er maar twee die dit opmerkten.
De hoofdredacteur, John Maddox, was in november 1989 uitgenodigd voor een lezing aan de TU Eindhoven. Bij die gelegenheid heb ik hem gevraagd hoe het toch mogelijk was dat die statistische fouten niet waren opgemerkt. Hij zei dat hij zich daar erg ongelukkig mee voelde, en dat de referees daar niets over hadden gezegd. Zij zagen geen fouten in de methode, alleen wilden ze de uitkomst niet geloven. Pas in het laboratorium van Benveniste hadden de drie onderzoekers (Maddox, de goochelaar James Randi en de Amerikaanse fraude-expert Walter Stewart) geprobeerd een en ander over statistiek uit te leggen aan Benveniste, maar deze scheen het niet te begrijpen en zei dat dat toch maar theorie was.
De uitleg van Randi in het huisblad van de Amerikaanse skeptici, de Skeptical Inquirer, was op dit punt zó wollig dat drie personen in de pen klommen om uit te leggen waarom Randi’s verhaal niet deugde. Door Randi’s onduidelijkheid kwam een interessant punt niet voldoende uit de verf. Twee opeenvolgende tellingen uit verder volkomen vergelijkbare porties basofielen horen volgens de regels van het toeval af en toe precies dezelfde uitkomst te geven. Hoewel de uitkomsten van mevrouw Davenas’ tellingen over het algemeen te dicht bij elkaar lagen, waren ze opvallend zelden exact gelijk. Een tweede, overduidelijke aanwijzing dat zij resultaten selecteerde. Kennelijk hebben menselijke beoordelingen van metingen te veel ruimte in INSERM U200. Zowel Benveniste als zijn referees misten de soepelheid in het omgaan met eenvoudige statistiek die goede schoolmeesters hun leerlingen toewensen.
Gevoel voor toeval
Een typische fout die bij het bestuderen van opvallende resultaten gemaakt wordt, is het achteraf verbanden zoeken. Dit komt op zo grote schaal voor dat het wel correlatie-kanker is genoemd. Als u of ik Mens-erger-je-niet spelen en op een beslissend ogenblik nét de benodigde dubbelzes gooien, dan komen we in de verleiding hier een hogere macht achter te zoeken die ons (maar niet onze tegenstander) gunstig gezind is. Er heeft zich immers iets voorgedaan wat op grond van het toeval maar eens per 36 keer te verwachten is.
Dit type redenering komt helaas nogal eens voor in de wetenschap (vooral gamma en medische). Na het vergaren van de gegevens vindt men iets dat maar eens per 20 keer zich toevallig zou kunnen voordoen en, presto, een significant resultaat is geboren. Het verschil met het dobbelen is dat bij het dobbelen het kansmechanisme goed bekend is, maar in de onderzoekspraktijk moet je daar maar naar raden. Bovendien wordt vaak na pas afloop van een experiment van tientallen of honderden variabelen onderzocht of hun invloed ‘significant’ is. Allicht dat je dan per twintig mogelijkheden gemiddeld één ‘significante’ vindt.
Het meest frappante voorbeeld is het zogeheten Kosmologische Antropisch Principe: de ‘kans’ dat wij mensen en het bekende universum bestaan is zo klein, dat daar wel iets achter moet zitten. Helaas is het betrokken kansmechanisme volslagen onbekend, het ‘experiment’ is maar één keer gedaan, en pas achteraf wordt bedacht wat er zo merkwaardig aan de uitslag is. Een onderzoek dat nog steeds aangehaald wordt, ‘bewees’ dat zwarte kinderen beter tegen ioniserende straling kunnen dan blanke. Voor het bewijs werd gekeken naar de sterfte ten gevolge van leukemie. De onderzoeker zag over het hoofd dat zwarte leukemie-lijdertjes ten gevolge van slechtere gezondheid meestal aan bacteriële infecties overleden waren (door hun verminderde weerstand), vóór de leukemie haar dodelijke uitwerking had gehad.
Bij de schatting van de langetermijneffecten van radioactieve straling is gebruik gemaakt van de gegevens van Japanse atoombomslachtoffers. Daarbij zag men over het hoofd dat de overlevenden een zeer sterk geselecteerde groep vormden. Deze bevatte alleen degenen die een zeer ernstige explosie overleefden, gevolgd door zware ontberingen en de psychologische klap van het verlies van vele verwanten en vrienden. Daardoor werden genoemde schattingen veel te optimistisch.
Met deze voorbeelden wil ik twee dingen toelichten: alleen als statisticus en onderzoeker zeer nauw samenwerken (of dezelfde persoon zijn) kunnen fouten worden vermeden, en: fouten kunnen maatschappelijke implicaties hebben. Het misbruik van statistiek om resultaten op te poetsen kan ongestraft plaatsvinden doordat lezers van publicaties zich gemakkelijk laten overdonderen. Zo heeft het vele jaren geduurd voordat de publicaties van Sir Cyril Burt over de erfelijkheid van IQ werden gecontroleerd op statistische aannemelijkheid, en de man die dat deed (Leon Kamin) was politiek gemotiveerd. Een groep van negentig Nederlandse coassistenten kon enkele eenvoudige meerkeuzevragen over statistiek (‘wat is standaard-afwijking?’) niet veel beter beantwoorden, dan wanneer iedereen naar de antwoorden geraden had.
Wie geen begrip voor de rol van het toeval heeft, vervalt gemakkelijk in pseudowetenschap, magisch denken en bijgeloof. Maar persoonlijk denk ik dat veel wetenschappers niet werkelijk geïnteresseerd zijn in de statistiek achter hun onderzoekswerk. Ze gebruiken haar slechts als vijgeblad om hun conclusies mooier te laten lijken of om zin uit onzin tevoorschijn te toveren. Ze willen liever niet begrijpen hoe het werkt – anders zouden hun stukjes veel te vaak op de academische schroothoop belanden.
Noten
Benvenistes onderzoek is te vinden in: E. Davenas et al. ‘Human basophil degranulation triggered by very dilute antiserum against IgE‘, Nature, vol. 333, p. 816-818 (1988). [Artikel is nu vrij toegankelijk via DigiBio]
Het eerdere werk van Benveniste staat vermeld in: Jean Sainte-LaudY, Philippe Belon, Georges Halpern, Effets de dilutions hahnemanniennes d’Histaminum 7 CH et d’Apis MelMca 7 CH sur la degranulation des basophiles de patients allergiques, opgenomen in: Aspects de la Recherche en Homeopathie, Vol. I, Jean Borron, Jacky Abecassis, Philip Belon (eds.), Editions Boiron, Lyon, 1983, p. 61-67.
Dit werk is bij mijn weten niet in Nederlandse bibliotheken te vinden, maar wel in de Bibliothèque National in Parijs. Merk op dat Belon en Sarnte-Laudy mede-auteurs zijn van Benvenistes Nature-artikel.
Het leukemie-onderzoek is: Diamond, E.L., H. Schmerler, A.M. Lilienfeld, Relationship of intra-uterine radiation to subsequent mortality and development of leukemia in children. Am. J. Epidem. 97, (1973), p. 283-313.
Over het onderzoek aan atoombomslachtoffers, zie: A.M. Stuart, G. Kneale, ‘A-bomb radiation and evidence of late effects other than cancer‘, Health Physics, vol. 58, p. 729-735 (1990).
Randi’s poging de statistiek van basofielen toe te lichten en de commentaren daarop staan in: Skeptical Inquirer, vol. 13, p. 142-146 en vol. 14, p.99-100.
De statistische onwetendheid van co-assistenten staat beschreven in: Nederlands Tijdschrift voor Geneeskunde, vol. 143, p.854-857 (1990).
[opmerking bij online publicatie (2018): Benveniste is in 2004 overleden]