Met de blik op oneindig

De wetenschap van het bidden

door Wim Betz en Jan Willem Nienhuys – Skepter 13.1 (2000)

 Bidden helpt, zeggen sommige Amerikaanse onderzoekers. Maar hun bewijzen zijn mager en getuigen van een gebrek aan wetenschappelijk inzicht.

Op 25 oktober 1999 verscheen er in een medisch tijdschrift een artikel (1) dat aangetoond zou hebben dat bidden voor zieken helpt. Het trok de aandacht van New Scientist (2) en vervolgens van het Nederlandse dagblad Trouw (3). Ook De Morgen (4) en Het Laatste Nieuws (5), lieten zich niet onbetuigd. Beide kranten waren kennelijk geïnspireerd door een bericht in het februarinummer van Test-Gezondheid (nr. 35, pagina 4) van de Belgische consumentenorganisatie Test-Aankoop.

De studie ziet er op het eerste gezicht gedegen uit. Ze was superdubbelblind opgezet. De patiënten werden verloot en behandeld zonder dat ze dat wisten, en de behandelende artsen wisten zelfs niet eens dat er een studie aan de gang was.

William Harris, van het Saint Luke’s Hospital in Kansas City, Missouri, had het onderzoek georganiseerd. Hij had gezorgd dat de voornamen van de patiënten werden doorgegeven aan teams van telkens vijf bidders. Het ging om ongeveer de helft van de patiënten die in een tijdsbestek van een jaar bij de intensive care van de hartafdeling (de Cardiac Care Unit, CCU) binnenkwamen.

De feitelijke organisatie ging zo dat de secretaresse van de ziekenhuisaalmoezenier de voornamen van de 484 patiënten met even patiëntnummers aan een bidteamleider doorgaf, die dan weer de andere teamleden op de hoogte stelde. De bidteamleden kenden elkaar niet, maar hadden beloofd 28 dagen lang dagelijks voor de betrokkenen te bidden. De bidders waren meest oudere vrouwen (gemiddelde leeftijd 56 jaar) van verschillende gezindtes, die wekelijks naar de kerk gingen en al gewend waren dagelijks te bidden. Op grond van de aantallen zullen de bidders gemiddeld 2 tot 3 doelen tegelijk onder hun hoede hebben gehad: ‘Here God maak alstublieft Joe van 18 maart en Bill van 3 april vlug beter zonder complicaties, en Ann van 8 april ook. Amen.’

De 529 patiënten met oneven nummers dienden als controle. Die moesten het uitsluitend stellen met de gebeden van familie en vrienden.

Hier spreekt natuurlijk een curieuze opvatting uit over de werking van gebed. Vrijwel alle Amerikanen zijn gelovig. Bij opiniepeilingen wordt regelmatig 80 tot 90 percent in de een of andere zin als ‘gelovig’ geteld. Nog in 1991 bleek 94% in God te geloven, was 93% lid van een kerkgenootschap en zei 92% ten minste eenmaal per jaar te bidden. (6) Voor regelmatig kerkbezoek zijn de percentages vanzelfsprekend lager, en in een ander onderzoek uit 1990 kwam ‘Geloof in een persoonlijke God’ in de VS niet hoger dan 69%, overigens nog steeds het hoogste ter wereld (zie Skepter, december 1998). Harris gaat niet verder dan de mededeling dat ten minste 50% van de patiënten van Saint Luke’s beweert een religieuze voorkeur te hebben. Zou Kansas City in de VS een broeinest van ongelovigheid zijn?

Bij een eerdere proef van Byrd (7) was wel aan de patiënten gevraagd wat ze ervan vonden dat er voor ze gebeden zou worden, en toen had ongeveer 1 op 8 geweigerd, wat aardig klopt met bovengenoemde 10% ongelovige Amerikanen. Men mag aannemen dat voor grote aantallen zieken in een CCU in de binnenlanden van de VS iemand toch wel eens een diepgemeend gebed tot een Hogere Macht richt. Het bidden door vrijwilligers zou dan alleen verschil maken voor personen met godloochenende en nimmer-biddende (of geen) familie en vrienden, tenzij men denkt dat er voor gebed ook een soort van dosis-responsrelatie geldt. Het organiseren van vijf bidders in plaats van één wijst ook al op die gedachte.

Onverklaarde uitvallers

In totaal zijn er 15 teams actief geweest. Deze teams kregen niets te horen over hoe het met hun biddoel ging. De termijn van 4 weken was zo gekozen dat binnen die termijn zo’n 95% van de patiënten het ziekenhuis dood of levend verlaten zouden hebben.

De lezer heeft zich misschien al afgevraagd of de verloting wel helemaal correct is gebeurd. Er waren minder patiënten in de bidgroep dan in de controlegroep. Dat kan gebeuren, en narekenen leert dat je een kans van 16,7% (dus 1 op 6) hebt dat de getallen zo scheef liggen. Daar zeuren we dus niet meer over, en ook niet over de paar rekenfoutjes in deze en een andere ‘niet-significante’ p-waarde.

Ernstiger is dat er in de bidgroep veel meer mensen uitvielen. Officieel waren er twee uitsluitingsgronden. Mensen die ter voorbereiding op een harttransplantatie in de CCU kwamen werden niet meegeteld (zes in totaal), en als de patiënt de CCU weer verliet binnen 24 uur na binnenkomst, dan werd deze ook niet meegeteld. Als reden geven de auteurs dat het organiseren van het bidteam vaak een dag kostte. Het is niet duidelijk of er nu wel of niet voor deze vroege uitvallers werd gebeden. Als het organiseren zo’n gedoe was, zullen ze toch wel niet gewacht hebben tot die eerste 24 uur voorbij waren voor de vrijwilligers gebeld werden. In de bidgroep verdwenen er zo 18. Uiteindelijk werd er dus maar aan 484 min 18 is 466 zieken gerekend. Op grond van dezelfde 24-uursregel vielen er 5 uit de controlegroep, die dus 529 min 5 is 524 patiënten telde.

Dit was briefschriever Nicholas Humphrey in New Scientist (8) ook al opgevallen. Volgens onze berekening is de kans op een dergelijk scheve verdeling, gegeven de groepsgroottes en gegeven een totaal van 23 uitvallers slechts 1 op 200. (Harris rept met geen woord over deze kleine kans, en in een antwoord op briefschrijvers die daar ook al over begonnen waren, zegt hij alleen dat hij ook niet weet waar het aan ligt.) Dit duidt op z’n minst op een onzorgvuldigheid in de onderzoeksopzet. Misschien is het coderingssysteem voor patiëntnummers niet helemaal random, en misschien hebben de onderzoekers (of de secretaresse van de aalmoezenier) beter opgelet bij de even nummers van de bidgroep. Deze vorm van vertekening (minder patiënten en/of meer uitval in verumgroep) komt vaker voor in zogenaamd dubbelblinde gerandomiseerde studies. Het lijkt niet meer dan fatsoenlijk dat je in zo’n geval laat zien dat de uitvallers het resultaat niet wezenlijk beïnvloeden.

Eveneens zorgelijk is dat de auteurs onder het kopje ‘Statistical analysis’ schrijven dat de analyses uitgevoerd werden op een ‘intention-to-treat’ basis. Dat betekent dat elke verlote patiënt wordt meegenomen in de berekening, ook als die patiënt om wat voor reden uitvalt. Dat klopt niet met het afvoeren van degenen die minder dan een etmaal in het ziekenhuis verbleven. ‘Intention to treat’ is een manier die in zwang gekomen is, juist om gesjoemel met uitvallers te vermijden.

De auteurs beweren dat de behandelende artsen niet op de hoogte van de studie waren. Er worden geen nadere mededelingen hierover gedaan. Toch zijn de hoofdauteur Harris en nog 5 coauteurs cardiologen aan het ziekenhuis waar de studie gedaan is. Harris werkt bij het Lipid Research Laboratory van het Mid American Heart Institute. Dat lijkt weinig te maken te hebben de dagelijkse gang van zaken op de CCU. We worden echter verondersteld te geloven dat niemand die de patiënten zag wist dat er een onderzoek aan de gang was en dat het om de patiënten met even nummers ging.

Doodgaan voor 6 punten

Een zonde die medische onderzoekers vaak begaan is die van multiple outcome: op meerdere manieren naar de resultaten kijken, en dan vervolgens eruit pikken wat in je straatje past. Als een onderzoeker dat doet is het bovendien maar de vraag of hij of zij wel al het geknutsel met en gevis in de gegevens gerapporteerd heeft.

Harris keek in essentie naar drie uitkomsten, zoals we aanstonds zullen bespreken. Als je de zogeheten significantiegrens bij 5% legt, dan hoor je voor elke afzonderlijke uitkomst de lat bij 1,7% te leggen.

Harris en de zijnen keken per patiënt naar wel 34 parameters van de meest uiteenlopende soort: complicaties, symptomen, gebruikte medicaties, alles ontleend aan een speciaal voor dit onderzoek opgestelde lijst, die ze MAHI-CCU-lijst noemden (MAHI staat voor Mid American Heart Institute). De complicaties enzovoorts werden pas meegeteld als ze zich langer dan 24 uur na binnenkomst in de CCU voordeden. Wat er in de Emergency Room of vlak na binnnenkomst in de CCU gebeurde werd niet meegeteld.

Elke mogelijke parameter werd volgens een tamelijk willekeurig systeem in punten omgezet. Doodgaan telde voor 6 punten, een pacemaker krijgen was ook heel erg (4 punten). Toediening van antibiotica telde voor 1 punt, maar een plaspil voor 2 punten. Het geheel maakt een nogal willekeurige indruk, maar de auteurs beweren dat de keuze van de MAHI-CCU-lijst en de puntentelling van tevoren bedacht was. Ook beweren de auteurs dat de records van de patiënten door een geblindeerde arts werden beoordeeld, maar een zinnetje waaruit ondubbelzinnig blijkt dat het scoren van items op de MAHI-CCU-lijst ook blind werd gedaan ontbreekt.

Niet dat het wat uitmaakte. In de bidgroep was de score 11% lager dan in de controlegroep, als je de items op de MAHI-CCU-lijst ongelijk scoorde, en 10% lager als je ze gelijk scoorde. Dat is niet verwonderlijk, want wie gemiddeld 10 procent minder items bij de supermarkt inslaat, hoeft over het algemeen ook ongeveer 10 procent minder bij de kassa af te dragen, ongeacht hoe de prijzen voor de afzonderlijke items zijn.

Harris keek ook nog naar verblijfsduur in het ziekenhuis (en op de CCU) en naar een speciale schaal die in de eerdere studie van Byrd was gebruikt. Hoewel het bidden expliciet voor spoedig herstel was geweest, was er voor verblijfsduur geen verschil. Het minieme succesje van Byrd met diens scoresysteem bleek niet gereproduceerd te kunnen worden. Niet zo vreemd, want Byrd had zijn scoresysteem pas achteraf bedacht, dus hij was in de gelegenheid geweest het als het ware toe te snijden op zijn patiëntengroep.

Tien procent mag heel wat lijken, maar de zogeheten p-waarde was met 4% maar net onder de magische vijfprocentsgrens. Als de 466 patiënten waarvoor gebeden werd samen een dozijn MAHI-CCU-items meer hadden gehad (of 21 punten extra hadden opgelopen), dan hadden Harris et al. geen significant resultaat kunnen melden.

De lezer wordt nu wel erg nieuwsgierig naar de exacte toedracht bij het laten vallen van de even patiëntnummers. Weliswaar waren de behandelende artsen en de bidders geblindeerd, maar hoe zat het met de secretaresse die de namen aan de bidders moest doorgeven? Dat wordt niet uitgelegd. Het is zelfs niet duidelijk of die 24-uursmarge bij de onderzoeksopzet hoorde of pas achteraf bedacht is.

Het enige echt opvallende verschil tussen beide groepen was dat de oneven nummers behoorlijk wat vaker een Swan-Ganzcatheter kregen ingebracht (als je die ene ingreep niet meetelt, houdt de uitkomst op ‘significant’ te zijn). Zou bidden dus soms gezorgd hebben dat een volgens vele deskundigen nutteloze en gevaarlijke ingreep achterwege werd gelaten?

Het resultaat van de studie is dus een drietal uitkomsten, waarvan er twee luidkeels ‘NEE!’ roepen en eentje heel zachtjes ‘ja’ fluistert. De kans dat van drie uitkomsten er puur toevallig eentje ‘p=0,04′ oplevert is ruim 12 procent, en dat noemen we meestal niet-significant, dat wil zeggen: niet eens de moeite waard om op de een of andere manier uit te zoeken wat er nou aan de hand is. Harris ziet dit niet zo, want hij beweert (alweer in antwoord op diverse briefschrijvers) dat de MAHI-CCU-score de enige van tevoren geplande uitkomstmaat was.

Al met al een uiterst zwak resultaat, zeker gezien de onaannemelijkheid van de getoetste hypothese. Immers, de traditie om ‘significantie’ bij vijf procent te laten beginnen komt voort uit situaties waarin wat getoetst wordt niet al te verbazingwekkend
is. Harris et al. geven ook schoorvoetend toe dat de uitkomst een toevalligheid zou kunnen zijn.

De auteurs willen daar duidelijk niet aan, en proberen zelfs te verklaren waarom zij Byrds resultaat niet konden reproduceren. Bij Byrd waren de dertien procent patiënten die ‘bidden? – nee bedankt!’ hadden gezegd weggelaten, dus Byrd had te maken met patiënten die ontvankelijker waren voor gebedskracht. En de bidders van Byrd waren gemotiveerder, want die hadden meer gegevens gekregen over hun ‘klanten’. Deze redeneringen openen interessante kijkjes op de denkwereld van de onderzoekers. Ze organiseren een jaar lang vrijwel anoniem gebed, en gebruiken dan achteraf die anonimiteit als smoes om te ‘verklaren’ waarom het eigenlijk niet zo leuk uitkomt!

Van theologische zijde is dan ook bezwaar aangetekend. Dominee G. Messie schreef in Trouw (9) dat Harris van God een verhoorcomputer maakt, en dat het proberen af te dwingen van wonderen indruist tegen letter en geest van de bijbel. Volgens Messie worden trouwens ‘alle gebeden verhoord, alleen vrijwel nooit op de manier die we ons wensen…’

De bekende aartsskepticus en filosoof Professor Vermeersch was dezelfde mening toegedaan. ‘Zelfs als God bestaat (…) zou Hij toch zeer onnozel moeten zijn om mensen op commando beter te maken,’ fulmineerde de filosoof tegen de interviewer van Het Laatste Nieuws, en hij zette zijn woorden kracht bij met: ‘Je reinste waanzin, sorry dat ik me hier zo zit op te winden, maar dit is ronduit idioot.’ Vermeersch voegde eraan toe dat je met dit soort berichten valse hoop geeft. Bidden helpt wel volgens hem, namelijk voor de bidder zelf, omdat je er rustiger van wordt. Maar dit soort berichten is duidelijk ongezond voor ongelovigen — tenzij ze er hard om kunnen lachen natuurlijk.

Wie niet lacht is Paul Kurtz, de voorzitter van CSICOP, de Amerikaanse zuster van SKEPP en Skepsis. Volgens New Scientist vindt hij dat er nu maar eens een replicatie moet worden georganiseerd in samenwerking met zijn club, het Committee for the Scientific Investigation of Claims of the Paranormal (CSICOP). Zij zijn er klaar voor, maar dan moet er wel een zeer, zeer strak protocol komen, zei hij vroom. Inmiddels heeft de Skeptical Inquirer in het maart/aprilnummer van 2000 (10) al een analyse afgedrukt van de studies van Byrd en Harris waar onafhankelijk van ons het grootste bezwaar tegen de studie van Harris (niet-significant vanwege multiple outcome) wordt ingebracht.

Iedereen moet voor zichzelf maar bedenken of we te maken hebben met een toevalstreffer die misschien door naar het antwoord toe te rekenen wat is opgepoetst of met de afspiegeling van een echt verschijnsel dat lijnrecht indruist tegen de resultaten van twintig of meer eeuwen theologie, ten minste twee eeuwen wetenschap, en de enige eerdere studie over het effect van bidden op hartpatiënten van twaalf jaar geleden. Voor personen met lak aan wetenschap en primitieve geloofsopvattingen is de keus duidelijk, en voor vrijwel ieder ander ook, lijkt ons.

De studie van Harris et al. stimuleert ongewenste ontwikkelingen. Ze houdt het gevaar in dat artsen druk gaan uitoefenen op zieken om hun mening over religie te beïnvloeden. Of ze gaan schuldgevoelens aankweken (u bent ziek omdat u of de uwen niet genoeg bidden). Een van de onaangename kanten van New-Agespiritualiteit is dat die primitieve verbanden legt tussen gedrag en levensstijl van de patiënt en de ziekte, maar de studie van Harris et al. bevordert dezelfde denktrant in een klassiek-religieuze context.

Uit enquêtes in de VS blijkt dat veel (de helft tot twee derde) patiënten zouden willen dat hun arts met hen zou bidden. Spijtig genoeg doet maar 1% van de artsen dat. Blijkbaar is er in de VS nu een soort beweging op gang gekomen om artsen onder druk te zetten om met hun patiënten te bidden.

Brian Haynes protesteert hiertegen (11). Hij is hoogleraar Klinische Epidemiologie in McMaster University, en redacteur van APC Journal Club, het blad van het American College of Physicians en de American Society of Internal Medicine. Hij vindt dat men artsen niet mag gaan voorschrijven wat ze moeten doen, gewoon omdat een groep mensen dat wil. Het eind is dan zoek. Andere critici, Richard Sloan en Emilia Bagiella, merkten op dat getrouwd zijn en geld hebben ook statistisch samenhangen met een betere gezondheid. Moeten artsen dus huwelijksadviezen verstrekken of raadgeven bij sparen en beleggen?

Haynes pleit er voor dat artsen zich beperken tot interventies die ‘evidence based’ zijn. Wij zijn het met hem eens. De arts is verplicht betrouwbare geneeskunde af te leveren. Bidden hoort daar niet bij. Degenen die vrijwillig de taak op zich hebben genomen om voor anderen te bidden zijn doorgaans geen artsen. De samenleving is het best ermee gediend, als iedereen doet waartoe hij zich geroepen voelt en waarvoor hij is opgeleid.

Noten

1. William Harris et al., A randomised, controlled clinical trial of the effects of remote, intercessory prayer on outcomes in patients admitted to the coronary care unit. Archives of internal medicine, vol. 159, nr. 19 (October 25, 1999), p.2273-2278. Terug.

2. Nell Boyce, God on their side. New Scientist, 13 november 1999 (nr. 2212), p.24. Terug.

3. Wetenschappelijk bewijs: bidden voor zieken helpt. Trouw 20 november 1999. Terug.

4. Amerikanen vinden wetenschappelijk bewijs dat bidden helpt. De Morgen, 25 januari 2000. Terug.

5. Bidden om genezing? Waanzin! Het Laatste Nieuws, 27 januari 2000. Terug.

6. International Social Survey Programme, 1991, geciteerd in: Sociaal en Cultureel Planbureau, Secularisatie in Nederland, 1966-1991. Rijswijk, 1994. Terug.

7. R.C. Byrd, Positive therapeutic effects of intercessory prayer in a coronary care unit population. South. Med. J. (1988), vol. 81, p.826-829, herdrukt in Alternative Therapies in Health and Medicine, 3 (6), p.87-91. Terug.

8. Nicholas Humphrey, Prayer Power (brief), New Scientist, 25 December 1999, (nr. 2218), p.86. Terug.

9. G. Messie, Bidden helpt – maar hoe? Trouw, 27 november 1999. Terug.

10. Irwin en Jack Tessman, Efficacy of prayer. Skeptical Inquirer (2000) vol. 24 (2), p. 31-33. Zie ook Letters, Skeptical Inquirer 24 (4), p.63-64. Terug.

11. geciteerd door Linda Gunnersen, Faith and Healing. Annals of Internal Medicine, 8 januari 2000. Terug.

Een eerdere versie van dit artikel verscheen al op de website van SKEPP.

Noot voor de website

Harris heeft in een e-mail gedateerd 4 juni 2000 aan Irwin Tessman laten weten dat voor zover hij kan nagaan alle uitvallers in de eerste 24 uur de CCU levend hebben verlaten: ‘It appears that all departures from both groups were discharges not deaths.’ Harris heeft twee verklaringen: 1. toeval of 2. er werd in feite eerder begonnen met bidden, maar hij heeft geen gegevens waar dit uit uit kan blijken. Harris benadrukt dat de scheve verdeling ze helemaal niet was opgevallen (‘we really didn’t catch it’).

De brieven naar Skeptical Inquirer over het artikel van de gebroeders Tessman gingen ook over het punt dat familie en vrienden ook voor de controlegroep gebeden moeten hebben. Twee briefschrijvers gingen in op het feit dat de proef ook kan worden opgevat als een test van God. Van het standpunt van het ontwerp van proefopzetten betekent dit dat het te betwijfelen is of er van blindering en eerlijke verloting sprake kon zijn. Met andere woorden, het gewenste effect zou bereikt kunnen zijn doordat een ‘hoger wezen’ met de proefopzet gerommeld heeft of zich heeft laten leiden door de wens de proef te laten slagen in plaats van door de wensen van de bidteams. Ook suggereerde een briefschrijver dat niet zonder meer mag worden aangenomen dat de controlegroep geen enkel risico liep.

Uit: Skepter 13.1 (2000)

Vond u dit artikel interessant? Overweeg dan eens om Skepsis te steunen door donateur te worden of een abonnement op Skepter te nemen.

Steun Skepsis

Jan Willem Nienhuys is redacteur van Skepter en secretaris van Skepsis
Wim Betz was hoogleraar huisartsengeneeskunde aan de VUB en voorzitter van SKEPP