Gissen in het Ganzfeld
Het noodlot van de parapsychologie
door Rob Nanninga – Skepter 13.4 (2000)
TIEN jaar geleden stond de parapsychologie op de drempel van een doorbraak. De ganzfeldmethode scheen het bestaan van telepathie met herhaalbare resultaten te kunnen aantonen. Helaas is deze hoop onlangs weer de bodem ingeslagen.
De ganzfeldmethode werd in 1973 voor het eerst toegepast door Charles Honorton, die al op jonge leeftijd was gegrepen door de parapsychologie. Als middelbare scholier bracht hij zijn zomervakanties bij voorkeur door in het laboratorium van J.B. Rhine, de grondlegger van de experimentele parapsychologie. Toen Honorton in 1964 zijn schooldiploma behaalde, was er al een onderzoeksartikel van hem verschenen in het Journal of Parapsychology. Hij studeerde nog een jaar aan een universiteit, maar stopte daarmee toen Rhine hem aannam als fulltime onderzoeker.
In Rhines laboratorium liet men proefpersonen kaarten raden waarop vijf geometrische figuren stonden: een cirkel, vierkant, ster, kruis en golflijn. Als de kaarten goed werden geschud, was de kans op een treffer bij elke poging 20 procent (1 op 5). In de jaren ’30 behaalden Rhines proefpersonen regelmatig trefferpercentages van wel 30 procent, maar later zakte het percentage naar 20,5 en nog lager. Veel parapsychologen raakten hierdoor uitgekeken op de raadproeven. Die waren volgens hen veel te eentonig en te kunstmatig. De proefpersonen zagen tijdens de experimenten geen cirkels of vierkanten voor hun geestesoog verschijnen, maar moesten toch steeds een geforceerde keuze maken. Dat leek niet erg op de spontane gevallen van vermeende telepathie of helderziendheid, die zich naar verluidt vaak tijdens nachtelijke dromen manifesteren.
In 1967 stapte Honorton over naar het Maimonides Medical Center in Brooklyn, waar telepathische droomexperimenten werden uitgevoerd. Bij deze experimenten sliep een proefpersoon ’s nachts in het laboratorium terwijl een zogenaamde zender zijn dromen probeerde te beïnvloeden door zich te concentreren op een toevallig gekozen afbeelding. Een nadeel was de experimenten nogal kostbaar en arbeidsintensief waren. Bovendien bleken andere onderzoekers de resultaten niet goed te kunnen herhalen.
Honorton zag veel heil in veranderde bewustzijnstoestanden, waaronder meditatie. Hij veronderstelde dat buitenzintuiglijke informatie moeilijk tot ons bewustzijn kan doordringen zolang we voortdurend worden afgeleid door zintuiglijke indrukken. Het subtiele paranormale signaal wordt als het ware overstemd door andere ervaringen die alle aandacht opeisen. De ganzfeldmethode bood een praktische oplossing voor dit probleem. Hierbij krijgt de proefpersoon via een hoofdtelefoon een monotoon geruis te horen terwijl over zijn ogen halve pingpongballen zijn geplaatst, beschenen door een gekleurd licht. Op deze wijze hoort en ziet hij steeds hetzelfde, een homogeen veld waarin geen patronen en details te onderscheiden zijn. Het gevolg is dat hij na verloop van tijd geen aandacht meer schenkt aan de onveranderlijke stimuli. Soms hoort hij het geruis niet eens meer. Als compensatie voor het gebrek aan variatie gaat hij spontaan imaginaire beelden zien die hij tijdens de sessie moet beschrijven. De bedoeling is dat deze voorstellingen enige overkomst vertonen met de afbeelding die gelijktijdig in een andere kamer door een zender wordt bekeken.
Na afloop van een sessie krijgt de proefpersoon gewoonlijk vier afbeeldingen te zien en moet hij aangeven welke daarvan het beste past bij zijn eerdere ganzfeldervaringen. Hij heeft 25 procent kans om toevallig het doelwit te kiezen dat door de zender werd bekeken. Honortons proefpersonen kozen echter in meer dan 40 procent van de gevallen het juiste plaatje. In drie jaar tijd voerde hij zes ganzfeldexperimenten uit die alle zes een statistisch significant resultaat opleverden.
Anderen parapsychologen volgden al spoedig zijn methode na, maar niet iedereen boekte er succes mee. Een van de pechvogels was de bekende parapsycholoog John Palmer, die vier keer een negatief resultaat verkreeg. Toch waren de uitkomsten over het geheel genomen verrassend goed. In 1981 verzamelde Honorton 42 gepubliceerde ganzfeldstudies en concludeerde dat de meerderheid (55%) een statistisch significant effect (p < 0,05) had opgeleverd.
Slordig onderzoek
Het ganzfeldonderzoek werd nader onder de loep genomen door de skeptische psycholoog Ray Hyman (1985). Hij merkte op dat de onderzoekers meestal meerdere manieren gebruikten om hun resultaten te berekenen. Daardoor hadden ze volgens hem minstens 10 procent kans dat een van hun statistische analyses een uitkomst opleverde die significant was op het gewenste 5%-niveau. Hij achtte het bovendien aannemelijk dat een deel van de mislukte experimenten nooit was gepubliceerd.
Honorton moest erkennen dat veel onderzoekers onjuiste p-waarden rapporteerden omdat ze geen rekening hielden met het aantal analyses dat ze uitvoerden. Om deze kritiek te ondervangen voerde hij een nieuwe meta-analyse uit waarbij hij alleen het aantal echte treffers telde: het aantal keren dat de proefpersonen het juiste plaatje de hoogste waardering gaven. Er waren 28 ganzfeldstudies die hierover informatie gaven. Daarvan leverden 12 (43%) een significant resultaat op. In totaal scoorden de proefpersonen 306 treffers uit 835 pogingen (36,6%) en dat kan geen toeval zijn (de kans is kleiner dan 1 op 100 miljoen).
Hoe zat het met de resterende 14 ganzfeldstudies die het aantal echte treffers niet rapporteerden (omdat ze een ander beoordelingssysteem gebruikten)? Laten we eens aannemen dat in deze experimenten precies volgens de kansverwachting werd gescoord. Wanneer we ze vervolgens bij de 28 optellen, vinden we nog steeds een uiterst significant effect. Er zijn veel meer mislukkingen nodig om dit effect te neutraliseren. Zelfs wanneer we 12.000 ganzfeldsessies toevoegen (minstens 300 experimenten) met een score van precies 25 procent, dan ligt het totale aantal treffers (3.306 uit 12.835 pogingen) nog altijd significant boven het kansniveau (p = 0,024). Het is uitgesloten dat er zoveel onderzoekswerk onbekend is gebleven vooral wanneer je bedenkt dat elke ganzfeldsessie een halve dag kost en dat er nauwelijks meer dan een tiental parapsychologische laboratoria zijn waar zulke proeven worden uitgevoerd.
Wanneer een experiment uit 16 sessies bestaat, zijn er 8 treffers nodig voor een significant resultaat, een scoringspercentage van 50 procent. Worden er 40 sessies uitgevoerd, dan heeft men minimaal 16 treffers nodig (40 procent), en bij 250 sessies hoeft het scoringspercentage nog maar 30 procent te bedragen. De proefpersonen moeten dus hoger scoren naarmate er minder sessies worden uitgevoerd. Stel nu dat ze een beetje paranormaal begaafd zijn en gemiddeld 35 procent treffers kunnen scoren (in plaats van 25). Hoe groot is dan de kans dat een experiment met 40 sessies een statistisch significant resultaat zal opleveren? Slechts 30 procent! Als men de kans op succes wil verhogen tot 90 procent, moeten er bijna 200 sessies worden uitgevoerd. Maar er is vrijwel geen enkele parapsycholoog die dat doet, want dan zou een experiment erg lang gaan duren. De ganzfeldexperimenten die Honorton verzamelde, telden gemiddeld slechts 30 sessies – te weinig om het veronderstelde effect regelmatig te kunnen aantonen.
Hyman gaf uiteindelijk toe dat de ganzfeldstudies als geheel een significant effect lieten zien, maar wilde dat niet toeschrijven aan buitenzintuiglijke waarneming omdat de kwaliteit van het onderzoek te wensen overliet. Zo bleek dat de proefpersoon na afloop van een sessie meestal vier foto’s kreeg waaronder de foto die eerder in handen van de zender was geweest. Om mogelijke sporen (zoals vingerafdrukken) te vermijden had men duplicaatafbeeldingen moeten gebruiken. Bovendien moesten de vier foto’s in een toevallige volgorde worden aangeboden, maar daarover was vaak geen informatie te vinden in het onderzoeksrapport. Hyman beschouwde zulke gebreken als symptomen van een onzorgvuldige onderzoekshouding. Samen met Honorton publiceerde hij een aantal methodologische richtlijnen voor toekomstig ganzfeldonderzoek en wachtte de ontwikkelingen verder af.
Hoogtepunt
Honorton gaf het niet op en richtte met steun van de McDonnell Foundation een geavanceerd ganzfeldlaboratorium in waar hij vanaf 1983 computergestuurde proeven uitvoerde, zodat menselijke fouten grotendeels werden uitgesloten. Via een toevalsgenerator werd een videoclip gekozen die automatisch enkele malen werd vertoond aan een zender, die in een geïsoleerde kamer zat. De proefpersoon kreeg na afloop van de ganzfeldsessie op een eigen beeldscherm vier clips te zien, waaruit hij de juiste moest kiezen. In 1990 rapporteerde Honorton hoe hij samen met zeven collega’s 355 ‘autoganzfeldsessies’ had uitgevoerd waaraan 240 proefpersonen deelnamen die in totaal 122 treffers (34%) hadden behaald (p = 0,00005). De gerenommeerde psycholoog Daryl Bem, die het laboratorium van Honorton persoonlijk had mogen inspecteren, achtte de tijd rijp om de resultaten in bredere kring bekend te maken. Samen met Honorton schreef hij er een artikel over dat in 1994 verscheen in het gezaghebbende tijdschrift Psychological Bulletin. Helaas maakte Honorton dit hoogtepunt niet meer mee omdat hij eind 1992 aan een hartaanval overleed.
Hoewel Hyman weinig kon aanmerken op de proefopzet, liet hij zich nog niet overtuigen. Hij vond het vreemd dat het succes louter te danken was aan de 190 sessies waarin bewegende videoclips als doelwit waren gebruikt. Deze leverden 40 procent treffers op. De resterende 165 sessies, waarin de zender een stilstaand beeld bekeek, resulteerden slechts in 27 procent treffers. Deze uitkomst stemde niet overeen met eerdere experimenten, waarin overwegend foto’s werden gebruikt. Waarom waren er nu opeens bewegende beelden nodig?
De experimentleider, die via een intercom in contact stond met de proefpersoon, was misschien een zwakke schakel in de proefopzet. Hij zag na afloop de vier mogelijke videoclips op zijn eigen beeldscherm en hielp de proefpersoon vaak mee om een keuze te maken. Het was essentieel dat hij geen informatie kon verkrijgen over het juiste doelwit, zodat men de videorecorder beter niet bij hem in de kamer had kunnen zetten. Er waren nog meer dingen voor verbetering vatbaar (zie Nanninga 1994), maar de gebreken waren niet zo groot dat ze de resultaten gemakkelijk konden verklaren. Hyman schreef dat het nu de taak van andere onderzoekers was de resultaten in hun eigen laboratorium te herhalen. In tegenstelling tot Bem was hij daar niet optimistisch over omdat in het verleden al vaak is gebleken dat parapsychologen niet goed kunnen voortbouwen op het werk van voorgangers. Om psi-effecten te vinden, moeten ze steeds iets nieuws verzinnen.
Bergafwaarts
Het lijkt erop dat Hyman inmiddels gelijk heeft gekregen. Vorig jaar publiceerden de Britse parapsychologen Julie Milton en Richard Wiseman een overzicht van dertig ganzfeldexperimenten die in de jaren ’90 in zeven verschillende laboratoria waren uitgevoerd en die meestal van betere kwaliteit waren dan het oudere werk. Hun conclusie was dat de resultaten bij elkaar opgeteld geen significante afwijking van de kansverwachting vertonen. Het gebrek aan significantie was overigens mede te wijten aan de van te voren vastgestelde manier waarop ze het eindresultaat berekenden. (Ze bepaalden de zogenoemde Stouffer z door alle afzonderlijke z-waarden van de experimenten bij elkaar te tellen en te delen door de wortel van het aantal). Als je alle treffers bij elkaar telt, vind je daarentegen wel een significant resultaat (p = 0,02). Niettemin lag het percentage treffers beduidend lager dan in de eerdere meta-analyses. Het bedroeg nu nog slechts 27,6 procent (331 treffers uit 1198 pogingen).
Julie Milton (1999) voegde negen latere experimenten aan de database toe, waardoor het geheel toch nog significant werd (p = 0,011). Dit was echter louter te danken aan een bijzonder succesvol experiment van Kathy Dalton. Zij schijnt een van de weinige parapsychologen te zijn die geen last heeft van de recessie. In een e-maildiscussie naar aanleiding van Miltons artikel, merkte John Palmer op dat de identiteit van de onderzoeksleider vermoedelijk de enige factor is die duidelijk van invloed is op de uitkomsten. Misschien is het met de ganzfeldexperimenten bergafwaarts gegaan doordat succesvolle onderzoekers zoals Honorton, Sargent en Braud geen bijdragen meer hebben geleverd. Het blijft onduidelijk waarom sommige onderzoekers veel meer succes hebben dan andere. De skepticus Nils Wiklund schreef: ‘Parapsychologen hebben hun vaardigheid als onderzoekers pas overtuigend aangetoond wanneer ze zuivere kansresultaten behalen.’ Maar dat is een vooroordeel, want we hebben geen zekerheid dat adequaat uitgevoerde experimenten nooit een psi-effect zullen opleveren. Voorlopig is het echter onduidelijk welke factoren en omstandigheden noodzakelijk zijn voor een positief resultaat. Er bestaat wat dat betreft ook weinig overeenstemming onder de ganzfeldonderzoekers. Volgens de parapsycholoog Adrian Parker (1999) is het onverstandig om psychologiestudenten als proefpersonen te gebruiken, omdat die meestal laag zouden scoren. Elke onderzoeker heeft echter zijn eigen voorkeuren en de experimenten wijken op zoveel punten van elkaar af, dat het moeilijk is om vast te stellen welke aanpak het meeste oplevert. Achteraf kun je voor elk negatief resultaat wel een mogelijke oorzaak bedenken.
De Nederlandse ganzfeldexperimenten tonen eveneens geen hoopvol beeld. Als ik alle uitkomsten bij elkaar optel (voor zover ze mij bekend zijn), is het totaal niet statistisch significant. Het effect is schijnbaar zo klein dat 477 sessies nog niet toereikend zijn om het te kunnen aantonen.
Nederlandse ganzfeldexperimenten |
||||
Sessies | Treffers | Percentage | p-waarde | |
1. Bierman (1983) | 32 | 11 | 34% | .154 |
2. Bierman (1987) | 16 | 6 | 37% | .189 |
3. Bierman et al. (1993) | 50 | 13 | 26% | .489 |
4. Bierman et al. (1993 | 50 | 12 | 24% | .618 |
5. Bosga et al. (1994) | 50 | 10 | 20% | .836 |
6. Bierman (1995) | 40 | 16 | 40% | .026 |
7. Bierman (1995) | 36 | 13 | 36% | .092 |
8. Wezelman/Bierman (1996) | 32 | 5 | 16% | .930 |
9. Wezelman/Bierman (1997) | 40 | 8 | 20% | .818 |
10. Wezelman/Bierman (1997) | 40 | 10 | 25% | .560 |
11. Wezelman / Bierman (1997) | 7 | 1 | 14% | .867 |
12. Wezelman / Bierman (1997) | 12 | 7 | 58% | .014 |
13. Wezelman et al. (1997) | 32 | 14 | 44% | .016 |
14. Wezelman (1998) | 40 | 9 | 22% | .700 |
Totaal
Jaren ’90 : experimenten 3- 14 |
477
429 |
135
118 |
28.3%
27,5% |
.055
.127 |
Om positieve resultaten te vinden werd er aan de Universiteit van Amsterdam en in het Parapsychologisch Instituut te Utrecht van alles uitgeprobeerd. Zo waren er experimenten (9 en 10) waarbij de onderzoeker en de proefpersoon in de helft van de gevallen van tevoren samen een joint rookten. Met een joint op ging het beter dan zonder, maar het verschil was niet significant. In experiment 12 werden Mexicaanse paddestoelen (met psilocybine) genuttigd. Dat scheen beter te werken. Maar toen Wezelman (1998) het opnieuw probeerde, viel het resultaat weer erg tegen. Er werd ook gezocht naar eigenschappen van hoogscorende proefpersonen. De proefpersonen die deelnamen aan experiment 3 en 4 vulden later een persoonlijkheidsvragenlijst in. Daaruit bleek dat degenen die een treffer hadden behaald meer open stonden voor ervaringen. Deze correlatie kon echter niet worden bevestigd in latere experimenten (6 – 8), waarbij men de vragenlijst van tevoren liet invullen.
De meest buitenissige ganzfeldstudie staat op naam van Rens Wezelman, Hans Gerding en Irma Verhoeven (1997). Om hun beperkte denkraam te overstijgen en hun geest open te stellen voor het wonderbaarlijke, voerden de onderzoekers allerlei magische rituelen uit voordat een ganzfeldsessie van start ging. Het laboratorium werd ’s avonds bij volle of wassende maan ceremonieel gezuiverd en ingewijd met kaarsen en wierook, er werden evocaties, invocaties en bezweringen uitgesproken, er werd op trommels geslagen, er werden ademhalingsoefeningen gedaan terwijl men elkaars chakra’s aanraakte, en er werd cannabis gebruikt. De achterliggende filosofie werd door de onderzoekers uitvoerig besproken, maar over de controlemaatregelen komen we helaas wat minder aan de weet. Volgens het protocol gebruikte de experimentleider, die tevens als zender fungeerde, een computerprogramma om aselect een afbeelding te kiezen. Maar op dat moment kon hij via een intercom al horen wat de proefpersoon tijdens zijn ganzfeldsessie beleefde. We moeten dus maar aannemen, dat hij niet een bijpassend plaatje heeft gezocht. Dit werd naar het schijnt door niemand gecontroleerd.
Naschrift
Daryl J. Bem, John Palmer & Richard S. Broughton publiceerden in 2001 een nieuwe meta-analyse van 40 ganzfeldexperimenten: Updating the Ganzfeld database: a victim of its own success? (pdf). Deze analyse valt gunstiger uit dan die van Wiseman & Smith doordat er enkele recente en succesvolle resultaten werden toegevoegd. Gemiddeld bleken de proefpersonen nu 30 procent treffers te scoren in plaats van 25.
Literatuurlijst
BEM, D.J. & C. HONORTON (1994)
Does psi exist? Replicable evidence for an anomalous process of information transfer.
Psychological Bulletin, 115(1), 4-18
BIERMAN, D.J. (1988)
A test on possible implications of the observational theories for ganzfeld research.
European Journal of Parapsychology, 7.
BIERMAN, D.J., D.J. BOSGA, H. GERDING & R. WEZELMAN (1993)
Anomalous information access in the ganzfeld: Utrecht – Novice series I and II.
Proceedings of the 36th PA Convention, 192-203.
BIERMAN, D.J. (1995)
The Amsterdam series III & IV: Target clip emotionality, effect sizes and openness.
Proceedings of the 38th PA Convention, 27-37.
BOSGA, D.J., J.L.F. GERDING & R. WEZELMAN (1994)
Target-affinity: an analysis of a psychological variable with possible implications for the ganzfeld procedure.
Proceedings of the 37th PA Convention, 83-86.
HONORTON, C. (1985)
Meta-analysis of the psi ganzfeld research: A response to Hyman.
Journal of Parapsychology, 49, 51-91.
HONORTON, C., et al. (1990)
Psi communication in the ganzfeld: Experiments with an automated testing system and a comparison with a meta-analysis of earlier studies.
Journal of Parapsychology, 54, 99-139.
HYMAN, R. (1985)
The ganzfeld psi experiment: A critical appraisal.
Journal of Parapsychology, 49, 3-49.
HYMAN, R. & C. HONORTON (1986)
A joint communiqué: The psi ganzfeld controversy.
Journal of Parapsychology, 50, 350-364.
HYMAN, R. (1994)
Anomaly or artifact? Comments on Bem and Honorton.
Psychological Bulletin, 115(1), 19-24.
MILTON, J. & R. WISEMAN (1999)
Does psi exist? Lack of replication of an anomalous process of information transfer. (pdf)
Psychological Bulletin, 125(4), 387-391.
MILTON, J. (1999)
Should ganzfeld research continue to be crucial in the search for a replicable psi effect? Part I. Discussion paper.
Journal of Parapsychology, 63, 309-333.
PARKER, A. (2000)
A review of the ganzfeld work at Gothenburg University.
Journal of the Society for Psychical Research, 64, 1-15.
SCHMEIDLER, G.R. & H. EDGE (1999)
Should ganzfeld research continue to be crucial in the search for a replicavle psi effect? Part II. Edited ganzfeld debate.
Journal of Parapsychology, 63, 335-388.
WEZELMAN, R. & D.J. BIERMAN (1997)
Process oriented ganzfeld research in Amsterdam Series IV B (1995): emotionality of target material, Series V (1996) and Series VI (1997): judging procedure and altered states of consciousness.
Proceedings of the 40th PA Convention, 441-453..
WEZELMAN, R., J.L.F. GERDING & I. VERHOEVEN (1997)
Eigensender ganzfeld psi: An experiment in practical philosophy.
European Journal of Parapsychology, 13, 40-53.
WEZELMAN, R. (1998)
Psi-experimenten met psilocybine.
Tijdschrift voor Parapsychology, 65(2), 18-23.
WISEMAN, R., M.D. Smith & D. Kornbrot (1996)
Exploring possible sender-to-experimenter acoustic leakage in the PRL autoganzfeld experiments.
Journal of Parapsychology, 60, 97-128.