Opgeklopte koldergeesten

Opmerkelijk rekenwerk uit Druten

door Rob Nanninga

Lang verwacht en toch gekregen. In het jongste nummer van het Tijdschrift voor Parapsychologie publiceerden prof.dr. Dick Bierman, dr. Hans Gerding en drs. Rens Wezelman hun onderzoeksrapport over de Drutense poltergeist uit 1995. De onderzoekers zijn echter opnieuw vervallen in fouten die hun destijds al parten speelden.

In mei 1995 werd een Turkse familie in Druten geteisterd door destructieve krachten die op onverklaarde wijze schenen uit te gaan van de vijftienjarige zoon des huizes, Çetin Polat. Na vier hectische dagen riep men op maandag 15 mei de hulp in van het Parapsychologisch Instituut in Utrecht. Hans Gerding en Rens Wezelman reisden nog dezelfde dag naar Druten. Zij spraken met getuigen en installeerden een videocamera in de woning. De volgende avond zetten zij hun onderzoek voort in gezelschap van de fysicus dr. Dick Bierman, bijzonder hoogleraar in de parapsychologie. Hij installeerde een computer met een echte RNG (toevalsgetallengenerator). De volgende dagen probeerde Gerding de poltergeistverschijnselen met eigen ogen waar te nemen. Op 18 mei zat hij zelfs nog om tien voor drie ’s nachts met Çetin achter de computer. Na het weekend deden zich echter geen bijzondere verschijnselen meer voor.

In november 1995 publiceerden de drie onderzoekers een eerste verslag van de gebeurtenissen in de Nieuwsbrief van het Parapsychologisch Instituut. Hun conclusies bereikten NRC Handelsblad en andere nieuwsmedia, want ze waren nogal spectaculair. De parapsychologen achtten het op basis van hun onderzoek aannemelijk dat er in Druten echte poltergeistverschijnselen hadden plaatsgevonden. Ze beschreven een aantal psychokinetische voorvallen die ze hadden opgetekend uit de mond van ‘betrouwbare’ getuigen. Deze waarnemingen werden bovendien ondersteund door de resultaten van objectieve proeven met de toevalsgenerator. In het verslag staat hierover: ‘Çetin heeft 77 keer zo’n PK-test gedaan. Hij heeft daarbij enkele extreme resultaten behaald, waarbij de kans dat de uitkomst ‘toevallig’ is kleiner is dan 1 op 10.000.’

Verkeerde formule

Naar aanleiding van de berichten in de pers nam ik telefonisch contact op met Bierman. Hij vertelde dat Çetin inderdaad enkele opmerkelijke uitschieters had geproduceerd en dat het resultaat ook nog significant was wanneer je alle uitkomsten bij elkaar optelde. In januari ontving ik de testgegevens die Bierman mij had toegezegd. Bij elk van de 77 proeven werden 128 toevalsgetallen (nullen en enen) gegenereerd. Op het beeldscherm zag Çetin een cirkel die afhankelijk van deze getallen steeds een stukje groter of kleiner werd. Hij moest proberen de cirkel zo groot of klein mogelijk te maken. Dat lukte over het geheel genomen niet. Hij scoorde nauwelijks meer dan een half procent boven de kansverwachting. Desgevraagd liet Bierman per e-mail weten dat hij nooit iets anders had willen beweren en tijdens ons eerdere telefoongesprek blijkbaar een aantal halve herinneringen door elkaar had gehaald. Hij voelde zich niet verantwoordelijk voor het verslag in de Nieuwsbrief omdat hij daar feitelijk niet aan had meegewerkt. Zijn interesse ging in de eerste plaats uit naar een zogenaamd veld-RNG-experiment, dat verderop nog ter sprake komt.

Waar kwam dan die kans van 1 op 10.000 vandaan? Gerding vertelde dat hij zich had gebaseerd op statistische berekeningen die door Bierman waren uitgevoerd. Bierman ontdekte dat hij het getal 10.000 inderdaad ergens had opgeschreven. Hij probeerde de berekening opnieuw uit te voeren. Bij twee van de 77 proeven scoorde Çetin 79 treffers, 15 meer dan verwacht mocht worden. De kans op 79 treffers was volgens Bierman 0,3 procent, en door verschillende kansen met elkaar te combineren, kwam hij nu uit op een waarschijnlijkheid van 1 op 5.000.

Er klopte echter niks van omdat Bierman een verkeerde formule gebruikte. Daarmee berekende hij niet de kans op 79 treffers, maar de kans op meer dan 79 treffers; en niet de kans op twee keer 79 treffers, maar de kans op minimaal drie keer 80 of meer treffers, et cetera. Bierman liet me toen weten dat hij zich had vergist, maar dat ik daaraan niet te zwaar moest tillen omdat het slechts voorlopige berekeningen betrof die hij onder grote tijdsdruk had uitgevoerd. De berekeningen waren ook nog niet gecontroleerd door een onafhankelijke statisticus, die hij naar eigen zeggen altijd inschakelt voordat hij zijn rekenwerk publiceert. Gerding was helaas wat te hard van stapel gelopen. Bierman schreef dat ik in de officiële publicatie zeker zou worden bedankt voor mijn opmerkzaamheid.

Ik had ook nog wat vragen over de schijnbaar chaotische administratie die Gerding had bijgehouden. Hij gaf ieder blokje van vier proefjes een aparte filenaam die samen met de tijd en de datum in het geheugen van de computer werd vastgelegd. Uit de lijst die ik van Bierman kreeg, bleek dat Gerding in chronologische volgorde de volgende filenamen intoetste: chet1, chetii, chetiii, chetiv, chetv, chetvi, chetvii, cetinii, cetin4, cetim6, cetin6, cetin7b, cetin8b, cetin9, cetin10, cetin5. In deze lijst lijken enkele files te ontbreken. Bierman stuurde mij aanvullende gegevens waaruit bleek dat drie files leeg waren (cetin, cetin7 en cetin8). Dat kwam volgens Gerding omdat het programma een paar keer was gecrasht. Hoewel daarmee niet alles was verklaard, besloot ik deze kwestie maar te laten rusten omdat de experimenten sowieso niets hadden opgeleverd.

‘Waanzinnige schade’

In februari 1996 schreef ik een artikel over de poltergeist (1) waarin de beruchte rekenfout slechts kort ter sprake kwam. Voordat het stuk werd gepubliceerd stuurde ik het ter beoordeling naar Bierman, waarmee ik inmiddels al tientallen e-mailtjes had gewisseld. Hij erkende dat ik de feiten niet onjuist had weergegeven, al was hij wel bang dat de beoogde publicatie in Intermediair hem een slechte naam zou bezorgen. Ik schreef hem terug: ‘Ik beschouw mijn artikel als een reactie op de opgeklopte berichten die Hans Gerding de wereld in heeft gestuurd. Het spijt me oprecht dat jouw reputatie daar indirect ook schade door lijdt, maar toch kan ik me daar niet verantwoordelijk voor voelen.’

Na de publicatie werd Bierman benaderd door de wetenschapsjournalist Martijn van Calmthout, die voor de Volkskrant een stukje over de kwestie schreef. Daarin las ik dat Bierman verontwaardigd was omdat ik geen aandacht had besteed aan acht proefjes met Çetins halfzus. Zij had namelijk significant onder de kansverwachting gescoord (p < 0,05). Ik besloot een ingezonden brief te schrijven waarin ik uitlegde dat er in totaal zeven personen aan de PK-proefjes hadden deelgenomen. Het is dan niet opmerkelijk als één daarvan toevallig ‘succes’ boekt.

Ik stuurde mijn brief eerst naar Bierman voor een reactie. Volgens hem had Van Calmthout het niet helemaal goed begrepen. Hij verweet mij dat ik hem persoonlijk en de wetenschappelijke parapsychologie in het algemeen ‘waanzinnige schade’ had toegebracht met mijn artikel. Tientallen collega’s binnen de Universiteit van Amsterdam hadden hem er al op aangesproken. Het stuk sterkte hen in de overtuiging dat parapsychologie niet serieus te nemen valt. Ik kon niet ontkennen dat er ongetwijfeld mensen waren die door mijn stuk bevestigd werden in hun negatieve oordeel over de parapsychologie. Maar dat leek me geen reden om fouten te verzwijgen. Bierman stelde voor gezamenlijk een brief naar de Volkskrant te sturen. Dat vond ik wel een goede oplossing omdat ik er niet op uit was hem schade te berokkenen. We werden het uiteindelijk eens over een brief die als volgt begon:

‘De parapsycholoog Hans Gerding vertelde vorig jaar aan de pers dat er in het dorpje Druten waarschijnlijk een echte poltergeist actief was geweest. Informele proefjes die hij met een toevalsgenerator (RNG) uitvoerde, leken volgens een voorlopige evaluatie van de parapsycholoog Dick Bierman een bijzonder resultaat te hebben opgeleverd. Rob Nanninga, secretaris van de Stichting Skepsis, ontdekte echter dat er een rekenfout was gemaakt. Martijn van Calmthout wekt in de Volkskrant (9 maart) de indruk dat wij (Bierman en Nanninga) als kemphanen tegenover elkaar staan, maar dat valt reuze mee. We zijn het er beiden over eens dat er wetenschappelijk gezien onvoldoende reden is om enig geloof te hechten aan de poltergeist-verhalen uit Druten. Betrouwbare conclusies kunnen alleen worden getrokken op basis van goed gecontroleerde experimenten of waarnemingen, en die hebben in dit geval te weinig of niets opgeleverd. Vanuit theoretisch oogpunt waren Biermans formele ‘Field-RNG-experimenten’ het meest interessant, maar ook die leverden geen eenduidige conclusies op.’

Onze ingezonden brief werd niet geplaatst. We ontvingen echter wel een reactie van Martijn van Calmthout, die schreef: ‘Kennelijk is er veel veranderd, de afgelopen dagen. Temeer daar ik begrijp dat er op maandag nog sprake was van een ingezonden brief van Nanninga waarin ”vuige beschuldigingen” aan het adres van Bierman zouden worden geventileerd en waarvan Bierman al een afschrift had. Die brief heeft mij niet mogen bereiken, in tegenstelling tot uw huidige hartverwarmende blijk van verbroedering. Mijn felicitaties daarmee.’

Meer-random-dan-random

In hun onderzoeksverslag in het Tijdschrift voor Parapsychologie (2) maken Gerding, Wezelman en Bierman (1998) geen woord meer vuil aan de eerdere rekenfouten. Ze blijken wat nieuws te hebben ontdekt: ‘Zes van de 77 runs waren onafhankelijk positief (p < 0.03), terwijl er slechts twee van zulke runs verwacht mochten worden. De binomiale waarschijnlijkheid voor zes extreme runs in een totaal van 77 runs is 0.028.’ Blijkbaar hebben de onderzoekers nog steeds geen statisticus in de arm genomen en kunnen ze het ook zelf niet uitrekenen. Er waren geen zes maar slechts vier runs met p < 0,03 en de binomiale waarschijnlijkheid daarvan bedraagt twintig procent. Vermoedelijk gaat het om de zes runs waarin Çetin minimaal 11 treffers boven de kansverwachting had gescoord, want die leveren een waarschijnlijkheid van 3,47 procent op. We kunnen ons echter afvragen waarom de auteurs nou juist de grens bij 11 treffers (p = 0,0315) willen leggen. Als ze waren uitgegaan van minimaal 10 extra treffers (p <0,05) of van 12 of 13, dan zou de berekening geen significant resultaat hebben opgeleverd. (3)

Het is niet moeilijk om nog meer mogelijke statistische analyses te bedenken. Zo zouden we bijvoorbeeld kunnen kijken naar de runs waarin Çetin minimaal 12 treffers boven of onder de kansverwachting scoorde (p < 0,05). Dat lukte hem vijf keer en de bijbehorende toevalskans bedraagt 21,7 procent, wat dus zeker niet significant is. Zoals we al wisten is het resultaat evenmin significant als je alle runs bij elkaar optelt. De onderzoekers hebben kennelijk achteraf zitten knutselen tot ze een manier vonden om toch nog onder de magische grens van 5 procent te komen. Ze geven dit ook toe: ‘We moeten wel bedenken dat deze significantie marginaal is en dat er op vele manieren naar deze data gekeken kan worden.’ Deze techniek van in de data rondspeuren tot er iets – het geeft niet wat -gevonden is, heet exploratief onderzoek. In grote massa’s gegevens is meestal wel iets te vinden, zoals elke piramidoloog en bijbelcodespeurder kan bevestigen. Wat er uiteindelijk gevonden wordt, weerspiegelt slechts het geduld en het vernuft van de onderzoeker. Overigens is het gebruikelijk om het woord ‘significant’ te vermijden in exploratief onderzoek. Dat woord slaat op de situatie dat er voorafgaande aan een proef een eenduidige hypothese voorhanden is.

Hoe staat het met de Field-RNG-experimenten? Ook die worden in het onderzoeksverslag besproken. De apparatuur was zodanig ingesteld dat de RNG iedere 18 seconden 8192 bytes produceerde. De computer berekende 24 uur per dag de bijbehorende z-scores (afwijkingen van de kansverwachting) die automatisch op de harddisk werden opgeslagen. Wanneer er bij de familie Polat een steentje of iets anders door de lucht vloog, moest iemand zo snel mogelijk op de spatiebalk van de computer drukken zodat het tijdstip bij benadering werd vastgelegd. Op het beeldscherm verscheen dan een gebeurtenis-volgnummer dat in een logboek moest worden genoteerd, met daarachter een korte beschrijving van het voorval. Het was de bedoeling om na afloop na te gaan in hoeverre de RNG afwijkingen vertoonde op momenten dat er in de woning vreemde dingen gebeurden.

Ten eerste onderzocht Bierman of er tijdens de gebeurtenissen specifieke 8-bit-patronen optraden. Hij telde de frequentie van alle 256 mogelijke patronen, maar vond geen waarden die significant boven de verwachting lagen. Vervolgens keek hij of de z-scores tijdens de poltergeistactiviteiten extra hoog of laag uitvielen. Ook dat wat niet het geval, maar hij ontdekte wel iets anders. De z-scores lagen gemiddeld wat dichter bij nul dan verwacht mocht worden (p < 0,05). De RNG-output was volgens de onderzoekers ‘meer-random-dan-random’. Ze erkennen overigens dat het niet helemaal duidelijk was welke z-scores verzameld moesten worden: ‘Wij kozen voor de kleinst mogelijke eenheid tussen 18 en 36 seconden vóór het indrukken van de spatiebalk.’ Als ze iets anders hadden gekozen, zou het resultaat niet zo opwindend zijn geweest.

Volgens de auteurs ondersteunen de resultaten van de veld-RNG in zekere mate hun conclusie dat er in Druten vermoedelijk een echte poltergeist actief was (4). Ze hopen met hun onderzoeksmethode een nieuwe trend binnen het poltergeistonderzoek te hebben ingezet, al geven ze toe dat hun data vooralsnog een ‘exploratief karakter’ hebben: ‘Op basis van deze resultaten kunnen we niet veel anders doen dan in vergelijkbare gevallen van RSPK [recurrent spontaneous psychokinesis, een technische term voor poltergeistactiviteiten] een reductie van eerste orde RNG coherentie voorspellen.’ Voorspellen staat vrij, maar vooralsnog is er geen reden om aan te nemen dat de toevalsgenerator door een poltergeist werd beïnvloed.

Imitatieve fraude

Onze brief naar de Volkskrant sprak over onvoldoende reden voor enig geloof, maar de TvP-auteurs geven blijk van een onverminderd geloof in de geheime krachten van Çetin. Zij beschrijven diverse wonderbaarlijke gebeurtenissen die ook in het eerdere verslag te vinden waren. Een voorbeeld is een steen ter grootte van een half ei die vanuit de kamer met kracht tegen de keukenmuur sloeg en op de afzuigkap terecht kwam. In zijn vlucht passeerde de steen buurvrouw Connie die in de deuropening van de keuken stond met haar rug naar de kamer toe. Volgens de onderzoekers hebben drie getuigen verklaard ‘dat er niemand in de kamer achter haar stond die de steen gegooid kon hebben’.

In mijn artikel over de poltergeist schreef ik: ‘Men kan zich afvragen hoe de buurvrouw zo zeker wist dat Çetin de steen niet vanuit de aangrenzende woonkamer had geworpen. Gerding meende dat zij meteen achterom had gekeken, maar het lijkt aannemelijker dat haar aandacht in eerste instantie uitging naar het luidruchtige voorval in de keuken. Toen ik Gerding hierover doorvroeg, vertelde hij dat Çetin volgens de buurvrouw rustig op de bank in de kamer zat. De jongen was dus niet zo ver uit de buurt als hij in zijn verslag suggereerde.’

De andere twee getuigen stonden volgens mij in de keuken en konden Çetin ook niet in de gaten houden. Ik snap niet waarom zulke relevante feiten (er zijn meer voorbeelden) in het officiële onderzoeksverslag opnieuw verzwegen worden. In januari 1996 vroeg ik Gerding of ik inzage kon krijgen in de getuigenverklaringen die schriftelijk en op video waren vastgelegd. Dat bleek echter alleen mogelijk wanneer ik contractueel zou instemmen met een aantal voorwaarden, waaronder de volgende: ‘De door ons gegeven informatie mag uitsluitend en alleen verwerkt worden in een wetenschappelijke publicatie in een wetenschappelijk tijdschrift (met alle respect, Skepter is geen wetenschappelijk tijdschrift).’ Gerding stelde aan mij hogere eisen dan aan zichzelf. Ik ben niet op het voorstel ingegaan omdat ik dan het risico liep niets meer over de poltergeist te kunnen publiceren.

Nog voordat mijn artikel in Intermediair was verschenen, stuurde Gerding een lange ingezonden reactie naar de redactie. Daarin beweert hij dat mijn stuk feitelijke onjuistheden bevat. Zo zou hij mij nooit verteld hebben dat hij had gezien hoe Çetin heimelijk het deksel van een theepot sloeg. Ik stuurde Gerdings letterlijke citaat naar Bierman, en dat heeft wellicht geholpen want in het onderzoeksverslag staat nu: ‘Een onderzoeker zag Çetin een deksel van een theepot van een tafeltje op de grond gooien en vervolgens een verbaasde houding aannemen’. Çetin werd vaker betrapt, maar dat noemen de onderzoekers nog steeds ‘imitatieve fraude’. Volgens hen bootste Çetin de echte PK-verschijnselen na. Maar helaas hebben ze deze echte verschijnselen zelf nooit kunnen waarnemen of registreren omdat die zich alleen voordeden wanneer ze niet in de buurt waren.

Noten

(1) Mijn artikel verscheen op 1 maart 1996 in het weekblad Intermediair. Dezelfde maand werd een versie hiervan in Skepter gepubliceerd. Terug.

(2) Het artikel ‘De Drutense Poltergeist’ verscheen in mei 1998 in het Tijdschrift voor Parapsychologie, jaargang 64, nr. 3&4, p. 2-23. Dit nummer had eind 1996 al moeten verschijnen, maar het TvP kampt met een achterstand van meer dan een jaar. Terug.

(3) Jan Willem Nienhuys voerde een simulatie uit die duidelijk maakt dat je 6 tot 7 procent kans hebt om een ‘significant’ resultaat (met een p van gemiddeld 0,02) te vinden wanneer je pas achteraf bedenkt waar je de grens trekt. En dat is nog zonder gebruik te maken van mogelijkheden om ‘significant onder de kansverwachting’, ‘meer-random-dan-random’ of nog andere uitkomsten als bijzonder voor te stellen. Terug.

(4) De drie auteurs concluderen: ‘het lijkt ons, vooropgesteld dat we niet te maken hebben met een complot van familie, omwonenden, en politie tezamen, dat op basis van de getuigenverklaringen aannemelijk is gemaakt dat er minstens in enkele gevallen sprake is geweest van werkelijke RSPK-fenomenen. Deze conclusie wordt in zekere mate ondersteund door de resultaten van de veld-RNG, waarin de fraude hypothese hoe dan ook niet opgaat.’ Terug.

Naschrift

Gerding, Wezelman en Bierman schreven ook een Engelstalige versie van het verhaal over de Drutense poltergeist, die hier te vinden is. Het artikel verscheen in 2002 in het European Journal of Parapsychology, een internationaal vaktijdschrift (de EJP-versie staat helaas niet meer op internet). Hierin komen de onderzoekers opnieuw tot de slotsom dat er vermoedelijk sprake was van echte poltergeistverschijnselen. Mijn kritiek wordt niet vermeld en de auteurs doen alsof ze die nooit gelezen hebben. Ze schrijven bijvoorbeeld:

Officers Cramer and Van Deursen arrived on Sunday the 14th of May, and naturally, suspected the stone throwing merely to be due to mischief. For one and a half hour Van Deursen made a reconnaissance of the back side of the house, while Cramer checked this same side through a window on the top floor, using binoculars. They reported that in this way they would certainly have detected a perpetrator if there was one – unable to do so, they noticed that stones kept hitting the back of the house, only the house of the Turkish family and not the neighbours houses.

In mijn artikel in Intermediair deed ik verslag van een gesprekje met de politieman die op de bovenste verdieping van het huis door een raam naar buiten keek. Hij verklaarde dat hij geen steentjes had gezien, maar alleen tikken had gehoord tegen het benedenraam. Het was niet uitgesloten dat er ongezien aan de binnenkant iets tegenaan werd gegooid.

De onderzoekers beschrijven ook het incident waarbij er een steen de keuken binnenvloog terwijl de buurvrouw in de deuropening stond, met haar rug naar de woonkamer toe:

The stone brushed past the head of Wies who was standing in the doorway; she claims there was nobody in the room right behind her that could have thrown the stone.

Hans Gerding had mij verteld dat Çetin volgens de betreffende buurvrouw op de bank in de kamer zat toen dit gebeurde. In het bovenstaande citaat wordt echter opnieuw de indruk gewekt dat de jongen niet in de kamer aanwezig was. Ook de selectieve statistische berekeningen van de RNG-proeven zijn ongewijzigd overgenomen.

Ik vroeg Bierman waarom er niets met mijn kritiek is gedaan. Hij schreef me terug dat hij zich de kritiek niet meer goed kan herinneren en dat hij tegenwoordig met belangrijker onderzoek bezig is.

Uit: Skepter 11.3 (1998)

Rob Nanninga was hoofdredacteur van Skepter van 2002 tot 2014