Bronwater of brak water?
Een experiment met de spiertest
door Rob Nanninga
Skeptici onderzochten of het mogelijk is om bronwater van zout water te onderscheiden met behulp van een spiertest. De uitkomst van het experiment had een waarschijnlijkheid van 3%. Toch viel het wat tegen.
De test is inmiddels herhaald met een professionele spiertester. Zie het artikel Een geblindeerde O-ringtest: Vitalisator of methanol? (Skepter 22.1, 2009)
Het is niet zo eenvoudig om het veronderstelde effect van alternatieve therapieën onder gecontroleerde omstandigheden te meten. Daarvoor heb je ten eerste een groep bereidwillige patiënten nodig, waarvan een deel een geloofwaardige placebohandeling dient te krijgen. Ook moet later objectief kunnen worden vastgesteld in hoeverre de conditie van de patiënten is verbeterd. Zo’n experiment vereist een professioneel onderzoeksteam en een financieel budget waarover de stichting Skepsis niet beschikt. Er zijn echter wel andere nuttige experimenten mogelijk waaraan skeptici zich in hun vrije tijd kunnen wijden.
Steeds meer behandelaars maken gebruik van alternatieve diagnostische methoden, waaronder allerlei geheimzinnige meetapparatuur. Ze zijn daar heel enthousiast over en menen dat ze nauwkeurig kunnen vaststellen wat de patiënt mankeert of nodig heeft. De waarde van zulke diagnostische methoden kan meestal betrekkelijk simpel onder gecontroleerde omstandigheden blind worden getest. Het is opmerkelijk dat dit maar zelden gebeurt.
Wie een alternatieve diagnostische methode toepast en aanprijst, zou eigenlijk ook bereid of zelfs gemotiveerd moeten zijn om de betrouwbaarheid daarvan objectief aan te tonen – vooral wanneer een paar simpele proefjes voldoende zouden zijn om de medische wereld van de waarde te overtuigen. Herhaalbare successen onder gecontroleerde omstandigheden zouden vermoedelijk zelfs wereldnieuws zijn.
Patiënten die alternatieve diagnoses laten stellen, hebben er bovendien recht op om te weten hoe betrouwbaar zo’n diagnose is. Als de methode niet deugt, dan mogen we aannemen dat er regelmatig patiënten worden behandeld voor problemen die ze niet hebben. Nog verontrustender is de mogelijkheid dat een aandoening die medisch ingrijpen vereist, over het hoofd wordt gezien of zelfs wordt ontkend. Gelukkig weten veruit de meeste patiënten dat het onverstandig is om louter af te gaan op het oordeel van een alternatieve behandelaar. Zij gebruiken de alternatieven gewoonlijk slechts als aanvulling.
Energievelden in Utrecht
De promotors van de alternatieve methoden tonen erg weinig belangstelling voor wetenschappelijk onderzoek en ze voeren zelden of nooit geblindeerde proeven uit. Een typerend voorbeeld is het Van Praag Instituut in Utrecht, dat al drieduizend verpleegkundigen en verzorgenden leerde hoe ze met hun handen menselijke energievelden kunnen voelen. Er wordt beweerd dat ieder mens zo’n energieveld om zich heen heeft en dat een cursus Therapeutic Touch (TT) voldoende is om te leren voelen of een veld ‘verstoord’ is. Maar als dit klopt, dan moet het mogelijk zijn om louter op basis van deze paranormale tastzin vast te stellen of er al of niet een menselijk energieveld (en dus ook een mens) in de buurt is.
Op haar website schrijft het Van Praag Instituut: ‘Met de momenteel beschikbare technologie is het nog niet mogelijk gebleken deze energie te meten. Nu de belangstelling voor energetische behandelwijzen toeneemt, groeit ook de behoefte aan meetapparatuur. (…) Hoewel het menselijk energieveld (nog) niet wetenschappelijk is aangetoond, wordt het voor de toepassing van Therapeutic Touch als werkhypothese gebruikt.’
Meetapparatuur is echter overbodig wanneer je wilt vaststellen of TT-ers op onbekende wijze via hun handen informatie kunnen verkrijgen. In de VS bedacht de negenjarige Emily een eenvoudig proefje waaraan 21 TT-beoefenaren deelnamen. Ze moesten voelen boven welke handpalm Emily haar eigen hand hield, zonder haar te kunnen zien. Maar ze slaagden er niet in Emily’s energieveld betrouwbaar te detecteren en scoorden niet boven de kansverwachting. Volgens TT-deskundigen was er van alles op het experiment aan te merken, maar niemand nam de moeite een betere proef uit te voeren.
Het Van Praag Instituut is een offshoot van het Parapsychologisch Instituut, en het is in hetzelfde pand gevestigd. Het zou betrekkelijk eenvoudig zijn om de veronderstelde diagnostische vermogens van TT-ers in het eigen laboratorium te testen. Helaas liet Martine Busch, de directeur van het Instituut, mij weten dat ze daar geen interesse voor heeft. Betekent dit dat men de eigen ‘werkhypothese’ niet wil toetsen, en wordt het daarmee geen dogma? Ik kreeg geen antwoord meer op deze vraag, want Busch vond dat ze er genoeg over had gezegd en verklaarde onze briefwisseling voor gesloten.
De Nederlandse Vereniging van Klassiek Homeopaten leek meer belangstelling te hebben voor een gecontroleerd experiment. Een bestuurslid vertelde vorig jaar aan de krant dat er samen met Skepsis een geblindeerde proef zou worden uitgevoerd. Zijn collega’s bleken daar echter bezwaar tegen te hebben, zodat het plan werd afgeblazen. Waarom is het toch zo moeilijk om mensen te vinden die aan een proef willen meewerken?
Kinesiologie bij AC Milan
Zijn er werkelijk therapeuten die op alternatieve wijze de ene diagnose van de andere kunnen onderscheiden? Sinds februari 2005 staat er op de website van Skepsis een oproep. ‘Als u ervan overtuigd bent dat de methode die u gebruikt regelmatig succes oplevert, dan is het mogelijk om een experiment te bedenken waaruit dat kan blijken. We zullen proberen om dit experiment zo simpel mogelijk te houden. Dat kan betekenen dat u alleen meermaals een onderscheid hoeft te maken tussen diagnose A en diagnose B. Dit zullen diagnoses zijn die u al eerder heeft gesteld, zodat het experiment zo goed mogelijk aansluit bij de praktijk.’
De opzet van een experiment wordt in onderling overleg nauwkeurig afgesproken. De resultaten zullen in alle gevallen worden gepubliceerd in Skepter, desgewenst zonder de naam van de betrokkene te noemen. Wanneer de proef een resultaat oplevert met een toevalskans die kleiner is dan 1 op 1000, dan ontvangt de deelnemer een vergoeding van 500 euro. Het experiment wordt dan bovendien nog een keer herhaald onder leiding van een gerenommeerde wetenschapper en de beloning wordt verhoogd tot 10.000 euro.
Ondanks de uitgeloofde beloning stroomden de aanmeldingen niet binnen. Sommige diagnostici willen wellicht niet getest worden omdat ze bang zijn dat dit niets zal opleveren. Naarmate iemand meer heeft geïnvesteerd in een alternatieve methode, is er meer durf voor nodig om de eigen overtuiging op het spel te zetten. Bovendien vinden therapeuten hun praktijkervaringen vaak zo overtuigend, dat ze geen behoefte hebben aan betere bewijzen. Het is ook mogelijk dat ze terugschrikken voor een experiment omdat ze weinig vertrouwen hebben in de onderzoekers. Zo wordt er soms beweerd dat skeptici zich nooit zullen laten overtuigen, zodat het zinloos is om met hen samen te werken. Zulke vooroordelen kunnen het beste via persoonlijke contacten uit de weg worden geruimd.
Gerard kwam vorig jaar in contact met Skepsis vanwege zijn kritiek op het marketingsysteem van de firma Nikken. Hij publiceerde daar een artikel over in Skepter (herfst 2004). In reactie op een ander stuk over Nikken, dat in de vorige Skepter verscheen, stuurde Gerard mij een mailtje waaruit bleek dat hij vrij veel ervaring had met de zogenoemde spiertest. Deze methode wordt onder meer gebruikt om vast te stellen of een voedingsmiddel al of niet voor iemand geschikt is.
Meestal krijgt de cliënt de opdracht een van beide armen zijwaarts uit te strekken. Ze moet proberen haar arm horizontaal te houden terwijl de behandelaar op haar pols drukt. Vervolgens moet ze in de andere hand een flesje vasthouden. De diagnosticus vraagt of de inhoud van het flesje bij haar past. Het antwoord wordt verkregen door de uitgestrekte arm opnieuw naar beneden te drukken. Als dit gemakkelijk lukt en de spieren zwakker lijken dan aanvankelijk het geval was, dan kan men concluderen dat het flesje ongeschikt is voor de cliënt. Misschien zit er een stof in waarvoor ze overgevoelig is.
De spiertest werd onder de naam Toegepaste Kinesiologie veertig jaar geleden ontwikkeld door George Goodheart, een chiropractor uit Detroit. De test werd later gepopulariseerd door John Thie, de promotor van Touch for Health. De methode wordt in Nederland onder meer toegepast door leden van de Beroepsvereniging voor Kinesiologie. Zij sporen stoornissen, blokkades en plaatsen van onbalans op door meerdere spieren te testen.
Een zeer succesvolle kinesioloog is de Vlaamse chiropactor Jean-Pierre Meersseman. Hij is al verscheidene jaren medisch coördinator van de voetbalclub AC Milan. In zijn zogenoemde Milan Lab wordt de lichamelijke conditie van de spelers nauwkeurig in de gaten gehouden. Meersseman vertelde in een interview dat bepaalde voedingsmiddelen ogenblikkelijk hun weerslag hebben op de resultaten. Dat kan met een spiertest worden uitgezocht. De voetballer Clarence Seedorf liet op advies van Meersseman een verstandskies trekken omdat tests hadden uitgewezen dat dit zijn blessuregevoeligheid zou verminderen.
Psychotherapeuten hebben de spiertest eveneens ontdekt, want ook psychische problemen kunnen via de spieren worden geïdentificeerd. De bekende psychotherapeute (en juriste) dr. Carien Karsten, auteur van een aantal populaire psychologieboeken, deed mee aan een cursus en schreef daar ruim twee jaar geleden een lovende column over in het vrouwenblad Opzij. De arts Roy Martina was er al langer mee bezig (zie Skepter, juni 1998). Hij ontwikkelde zowel voor lichamelijke als geestelijke problemen een testmethode die hij aan velen onderwees.
De O-ringtest uit Japan
Martina geeft de voorkeur aan de O-ringtest. Daarbij moet de cliënt zijn duim tegen een vingertop houden, zodat er een ringetje ontstaat, dat de therapeut probeert los te trekken. De test is bedacht door de Japanse arts dr. Yoshiaki Omura (geb. 1934). Omura was in 1972 ook de eerste die in de VS acupunctuur gebruikte als verdoving bij een operatie. Sinds 1974 is hij hoofdredacteur van het tijdschrift Acupuncture and Electro-Therapeutics Research. Hierin publiceerde hij in 1981 zijn eerste artikel over de Bi-Digital O-Ring Test. Er volgden nog zo’n dertig andere studies waarvan samenvattingen te vinden zijn in PubMed, de openbare database van medische onderzoeksliteratuur (pubmed.nl). Omura richtte in 1991 een medische vereniging op die zich toelegt op het gebruik van de O-ringtest (www.bdort.net/en/).
De onderzoeksverslagen van Omura zijn bijzonder technisch. Het is fascinerend om te lezen wat hij allemaal met zijn O-ringtest aan de weet kan komen. De mogelijkheden lijken onbeperkt te zijn. Zo kan kanker eenvoudig worden opgespoord door een O-ringtest uit te voeren terwijl de patiënt een objectglaasje met kankercellen vasthoudt. De resultaten zijn volgens Omura te danken aan elektromagnetische velden die met elkaar resoneren. De test kan zo nodig worden uitgevoerd op een derde persoon die via een metalen draad of laserstraal met de patiënt in verbinding staat.
Omura en zijn aanhangers vinden het niet nodig om goed gecontroleerde experimenten uit te voeren: er wordt niets geblindeerd en gerandomiseerd, zodat er wetenschappelijk gezien weinig reden is om de resultaten serieus te nemen. Ook andere spiertesters menen ten onrechte dat praktijkervaringen, gevalsbeschrijvingen en ongeblindeerde proeven voldoende bewijs leveren. Hoewel de spiertest al 40 jaar bestaat, werd er maar een handjevol experimenten uitgevoerd dat de toets der kritiek kon doorstaan. Ze leverden geen van alle iets belangwekkends op.
Subtiel krachtenspel
Gerard leerde de O-ringtest van een integra-therapeut die bij Roy Martina een opleiding had gevolgd. Hoewel Gerard de methode niet professioneel toepast, heeft hij er wel veel ervaring mee. Hij gebruikte de testjes onder meer om het effect van magnetische producten te demonstreren. Gerard schreef mij dat de test werkt door een vraag te stellen aan iemands onderbewustzijn. De onderbewuste reactie kan vervolgens worden afgelezen aan de spierspanning in de vingers. ‘Bij een sterke test (“Ja”) blijven je duim en middelvinger gesloten en bij een zwakke test (“Nee”) gaan ze open. Daar kun je zelf niets aan doen; je hebt daar geen controle over.’
De O-ringtest kan onder meer worden gebruikt om het onderbewustzijn te vragen of een bepaald voedingssupplement geschikt is. De proefpersoon hoeft het alleen even in de hand te houden om de diagnose te kunnen stellen. Het uitgangspunt is dat ‘het onderbewustzijn alles weet en ook altijd de waarheid aangeeft’. Gerard schreef mij dat hij daar talloze voorbeelden van had gezien, zodat hij niet meer twijfelde aan de betrouwbaarheid van de test. Zo was hem gebleken dat mannen altijd zwak testen op een bepaald soort pillen die voor vrouwen zijn bedoeld, terwijl vrouwen zwak testen wanneer ze mannenpillen vasthouden.
Een ander frappant voorbeeld was de vrouw die haar eigen naam moest zeggen: ‘Ik ben Willemijn.’ Zulke uitspraken kunnen aan het begin van een sessie worden gebruikt om vast te stellen of iemand testbaar is. De eigen naam moet altijd een sterk resultaat opleveren. Maar in dit geval gingen de vingers van Willemijn gemakkelijk uiteen. Daar was echter een goede verklaring voor te vinden: Willemijn bekende dat ze zichzelf Trijntje noemde omdat ze een hekel had aan haar officiële naam. Trijntje testte inderdaad sterk, waarmee werd bevestigd dat het onderbewustzijn niet liegt.
Ik wilde wel geloven dat een spiertest consistente resultaten kan geven. Maar dat leek mij een gevolg van normale informatieoverdracht. Zowel de proefpersoon als de spiertester weten wat er getest wordt. Dat zal in veel gevallen leiden tot bepaalde verwachtingen, die de uitkomst van de test gemakkelijk kunnen beïnvloeden. De test wordt min of meer als een automatisme uitgevoerd, zonder er bewust bij na te denken. De spiertester neemt aan dat hij elke keer even hard en op dezelfde wijze aan de vingers van de cliënt trekt. Het is echter allerminst uitgesloten dat hij zichzelf onbewust heeft geconditioneerd om zijn eigen verwachtingen te bevestigen. Ook de verwachtingen van de proefpersoon kunnen een belangrijke rol spelen. Hij moet zijn duim iedere keer even hard tegen zijn middelvinger drukken. Maar hij weet van tevoren dat de vinger zwakker kan worden wanneer hij een bepaalde stof vasthoudt. Van die gedachte kan ongetwijfeld een suggestieve werking uitgaan. Het is goed mogelijk dat de proefpersoon hierdoor onbewust wat minder weerstand biedt.
De ene keer gaat de ring open en de andere keer blijft hij dicht. Dat is een duidelijk verschil. Maar het subtiele krachtenspel dat erachter steekt, laat zich moeilijk peilen. Het gaat erom of je met zo’n test iets aan de weet kunt komen dat zowel de tester als de geteste onbekend is. Kunnen mensen op de een of andere manier informatie verwerven die ze niet via de normale zintuigen hebben verkregen? Om dat te kunnen vastellen, moet het experiment goed geblindeerd worden. De spiertester en de proefpersoon mogen beslist niet kunnen weten welke stof er wordt onderzocht. Pas dan kunnen we er zeker van zijn dat de uitkomsten zuiver zijn, dat ze niet gestuurd worden door verwachtingen en dat we testen wat we willen testen.
Gerard schreef dat hij regelmatig dingen blind had getest, maar dat het geen verschil maakte. Dit opende perspectieven voor een gecontroleerd experiment, waaraan hij wel mee wou werken. Het leek mij het beste als hij zelf voor een geschikte proefpersoon zou zorgen, maar Gerard werkte liever met een aantal mensen die hij nog niet kende en die ik mocht uitkiezen. We moesten iets zien te vinden dat bij onze proefpersonen waarschijnlijk een sterke test zou opleveren en iets anders dat hun O-ring zou verzwakken. Bovendien moesten deze twee substanties uiterlijk niet van elkaar te onderscheiden zijn.
Bronwater was volgens Gerard een product dat bij iedereen past. Leidingwater met keukenzout (Jozo) zou daarentegen gegarandeerd door het lichaam worden afgewezen. De vloeistoffen mochten in bruine, glazen flesjes worden gestopt. De test kon in principe met twee flesjes worden uitgevoerd. Je kunt steeds een van beide flesjes kiezen door een muntstuk op te werpen. Het gekozen flesje wordt vervolgens naar de onderzoekskamer gebracht en gaat na afloop van de test weer terug. Een bezwaar hiervan is dat beide flesjes waarschijnlijk niet volstrekt identiek zijn. Een klein spikkeltje op het afsluitdopje kan al voldoende zijn om een flesje te herkennen en deze kennis zou ongemerkt van invloed kunnen zijn op het testresultaat. Een ander nadeel is dat de inhoud van de flesjes niet kan worden gecontroleerd voordat ze weer uit het zicht verdwijnen.
Ideale proefpersoon
Het leek verstandig om voor elke test een ander flesje te gebruiken. Ik bestelde daarom bij een homeopathische glashandel 100 amberkleurige flesjes van 50 ml. De chemicus en filosoof André Klukhuhn, bestuurslid van Skepsis, was bereid om ze van tevoren te vullen. Hij kreeg van Jan Willem Nienhuys een genummerde lijst met 100 toevalsgetallen, nullen en enen. Die waren bepaald door met een dobbelsteen even of oneven te gooien. Ik stuurde zelf eveneens een genummerde lijst met nullen en enen op. Het waren zuivere toevalsgetallen die ik op internet verkreeg bij random.org. Ik stuurde André ook een vel met plaknummers van 1 tot 100, die op de flesjes konden worden aangebracht. Als beide toevalsgetallen op onze lijsten gelijk waren, dan moest er bronwater in het desbetreffende flesje worden gestopt. Bij ongelijke getallen moest er zout kraanwater worden gebruikt. Het water was ongeveer anderhalf keer zo zout als zeewater – het bevatte 1 mol Jozo keukenzout per liter – en was dus beslist ongeschikt voor consumptie.
De test werd op zondagmiddag 19 juni uitgevoerd in Sterrenwacht ‘Sonnenborgh’ te Utrecht, waar Skepsis een vergaderruimte heeft. De flesjes stonden al klaar. Ze waren eerder gevuld door André Klukhuhn, die het pand weer had verlaten, zodat geen van de aanwezigen kon weten wat er in de flesjes zat. André vertelde later dat het nog een hele toer was geweest om de flesjes met behulp van twee kleine trechtertjes te vullen. Het zou handiger zijn geweest als we voor een pipet hadden gezorgd. Het zoute water was een dag eerder door Jan Willem gemaakt, zodat het evenals de flessen Spa-blauw op kamertemperatuur kon komen. Er deed zich nog een onverwacht probleem voor toen bleek dat het water een melkachtige kleur kreeg door een antiklontermiddel in het zout. Het was niet uitgesloten dat de witte kleur nog kon worden waargenomen wanneer het water in een bruin flesje zat. Gelukkig wist Jan Willem het probleem eenvoudig op te lossen met behulp van een paar koffiefilterzakjes, zonder dat dit van invloed was op het zoutgehalte.
Er waren vijf proefpersonen aanwezig: Gert Jan van ’t Land, Sineke Puister, Heleen van Lohuizen, Marie Prins en Erick Silkens. Om de testresultaten niet te verstoren, hadden ze die dag op verzoek van Gerard geen koffie gedronken en geen chocolade gegeten. We hadden afgesproken dat Gerard eerst een uur lang allerlei informele testjes zou doen om de proefpersonen vertrouwd te maken met de methode. Om de beurt werd we allemaal op de proef gesteld. Ook de experimentleiders, Jan Willem en ik, deden mee. Bij een van de proeven gaf Gerard ons een slokje leidingwater te drinken. Dat leverde bij iedereen een zwakke O-ringtest op. Het resultaat was daarentegen sterk nadat hij het glas met water even op een speciale magneet had gezet.
Toen ik zelf beweerde dat ik Pim heette, kon Gerard mijn O-ring gemakkelijk openen. Gert Jan testte vreemd genoeg ook zwak toen hij verklaarde dat hij Gert Jan heette. Navraag leerde echter dat hij eigenlijk Gerrit Jan heet. Die naam leverde wel een sterke test op! Er waren ook twee bruine flesjes beschikbaar – een met bronwater en een met zout water – die konden worden gebruikt om te bepalen wie het meest geschikt was voor het geplande experiment. Daarover bestond al spoedig geen twijfel meer: Erick slaagde met glans voor alle proeven. Hij had zich voorgenomen om deze onbevooroordeeld te ondergaan en kon zich goed op zijn taak concentreren. Met Erick als ideale proefpersoon begonnen we aan het experiment.
Statistisch significant
Er waren 93 genummerde flesjes beschikbaar. De twee flesjes die we in de oefenfase hadden gebruikt, vielen af en enkele andere waren gebroken aangeleverd. Ik reikte Erick steeds een flesje aan, te beginnen met nummer 1, zodat Gerard door middel van een spiertest kon nagaan hoe hij daarop reageerde. Gerard vroeg elke keer hardop om een ‘sterke test’ indien het flesje bij Erick paste. Jan Willem noteerde de uitkomsten van alle 93 proeven. De afgewerkte flesjes werden in ontvangst genomen door Tineke, de partner van Gerard. Afhankelijk van de uitkomst van een test werd het flesje aan de ene of aan de andere kant gezet. Na elke tien pogingen las Jan Willem voor wat hij had opgeschreven en gecontroleerden we of dit overeenstemde met de indeling van de flesjes. Ik maakte er ook nog een geluidsopname van met mijn voicerecorder, zodat het zeker is dat de uitkomsten correct werden genoteerd.
We hadden van tevoren schriftelijk afgesproken dat er een score moest worden behaald met een toevalskans die kleiner was dan 1 op de 1000. In dat geval zouden we 500 euro uitbetalen en het experiment nog een keer herhalen met een beloning van 10.000 euro. Het betekende dat er van de 93 flesjes minimaal 62 correct moesten worden ingedeeld. Een op de drie keuzes mocht dus fout zijn. Dit leek niet te veel gevraagd wanneer de test inderdaad zo betrouwbaar was als Gerard meende.
Het testen van de flesjes ging heel snel en leverde geen problemen op. Slechts een enkele keer was de uitslag niet helemaal duidelijk en werd de sterkte van de O-ring opnieuw bepaald. De proeven konden binnen een uur worden uitgevoerd, met inbegrip van de rustpauzes. Na afloop beschikten we over twee groepen flesjes: de ene groep zou bronwater moeten bevatten en de andere groep zout water.
Alle flesjes werden opengemaakt om door middel van een smaakproef vast te stellen wat erin zat. Dit vereiste enig doorzettingsvermogen van Erick en mijzelf, want het Jozowater was echt afschuwelijk zout. Jan Willem noteerde de uitslagen. Sineke en Erick ontvingen vervolgens de twee lijsten met toevalsgetallen, waarvan Jan Willem en ik duplicaten hadden meebracht in gesloten enveloppen. Aan de hand van deze lijsten werd vastgesteld wat er in elk flesje moest zitten. Dit stemde in alle gevallen overeen met de eerdere smaakproef. André had zijn werk dus goed gedaan. Hij kon onze lijst later nog vergelijken met zijn eigen versie, die hij na het vullen van de flesjes weer had meegenomen.
Er waren in totaal 52 flesjes waarin bronwater bleek te zitten en 41 flesjes met zout kraanwater. We stelden vast dat 56 van de 93 flesjes (60%) in de juiste categorie waren geplaatst: 30 met bronwater en 26 met zout kraanwater. Dat was helaas aanmerkelijk minder dan Gerard had verwacht en ook niet voldoende om van een succes te kunnen spreken. Het resultaat was niettemin wel statistisch significant op het vaak toegepaste 5% niveau (p=0,03 eenzijdig). Als je de flesjes willekeurig in twee groepen zou verdelen, dan heb je maar 3 procent kans om het resultaat van Gerard te evenaren of te overtreffen.
Testuitslag
|
Bronwater
|
Zout water
|
Sterk |
30
|
15
|
Zwak |
22
|
26
|
Wat moeten we van deze uitslag denken? Het is heel goed mogelijk dat het niets meer was dan toeval. Met één treffer minder zou het al niet meer significant zijn geweest. Skepsis voert wel eens vaker experimenten uit. Je mag er dan op rekenen dat daar toevallig een resultaat tussen zit met een waarschijnlijkheid die kleiner is dan 5 procent. Het zou pas opmerkelijk worden als zoiets nooit gebeurde.
Het resultaat zou ook kunnen worden beschouwd als een parapsychologisch psi-effect. Zulke effecten zijn doorgaans nogal klein en verdwijnen meestal als de proef wordt herhaald. Bovendien is het niet duidelijk aan wie of wat je ze mag toeschrijven. Volgens parapsychologen zijn psi-effecten niet noodzakelijk te danken aan de bijzondere vermogens van een proefpersoon. De proefleiders kunnen evengoed invloed hebben.
Een derde mogelijkheid is dat de spierproef inderdaad een beetje werkte, zij het veel minder goed dan Gerard had verwacht. Hij schreef dat de teleurstellende score naar zijn oordeel niet te wijten was aan de opzet van het experiment. Bronwater en brak water hadden een duidelijk onderscheid moeten opleveren. Erick was bovendien een prima proefpersoon en het experiment vond plaats in een ontspannen en positieve sfeer. Het feit dat de spiertest zo vaak herhaald werd, vormde volgens Gerard geen probleem omdat dit in de praktijk ook vaak gebeurt wanneer een therapeut een hele reeks mogelijkheden afwerkt. De onderzoeksgegevens boden ook geen reden om te veronderstellen dat vermoeidheid een rol had gespeeld, want de eerste helft van het experiment leverde evenveel treffers op als de tweede helft.
Gerard was van mening dat de successcore zo hoog had moeten zijn dat er niet meer kon worden getwijfeld aan de betrouwbaarheid van de methode. Om aan te tonen dat de spiertest in de praktijk bruikbaar is, moesten er betere resultaten worden geboekt. Aangezien de kansverwachting al 50% bedroeg, was een score van 60% niet echt veel meer. Een score van 80 uit 93 leek hem niet onredelijk voor een methode die onder meer wordt gebruikt om trauma’s in de vroege jeugd op te sporen. In zo’n geval wil je er toch vrij zeker van kunnen zijn dat de informatie klopt.
De skeptici die bij het experiment betrokken waren, toonden zich desondanks verrast over de uitslag. De meerderheid was het erover eens dat er reden was om het onderzoek nog een keer te herhalen. Zo schreef Gert Jan van ’t Land, die onlangs toetrad tot het bestuur van Skepsis: ‘de uitkomst zit bij mij in de range dat ik denk: nog maar een keer doen om het zeker te weten’. Het zou opmerkelijk zijn als een tweede experiment een vergelijkbaar resultaat opleverde.
Gerard had er geen bezwaar tegen om opnieuw aan een experiment mee te werken. Maar het leek hem een beter idee om daarvoor een gekwalificeerde integra-therapeut uit te nodigen die de O-ringtest professioneel gebruikt. Hij had het idee dat de magere resultaten aan hemzelf te wijten konden zijn. Misschien zou een meer ervaren O-ringtester veel hoger scoren. Hij wilde proberen om anderen te motiveren aan een test van Skepsis deel te nemen. Daarbij kon hij ze nu uit eigen ervaring vertellen dat het geen probleem is om met skeptici samen te werken. Als de spiertest echt werkt, dan willen skeptici dat graag zien. Het zou dogmatisch zijn om de waarde van de methode niet te erkennen wanneer goed geblindeerde experimenten daadwerkelijk slagen. Successen zouden ook veel interessanter zijn dan mislukkingen. Tot nog toe slaagde Gerard er echter niet in om therapeuten te vinden die aan een experiment wilden deelnemen.
Naschrift
Een herhaling van deze test met een professionele spiertester leverde geen succes op. Zie: Een geblindeerde O-ringtest: Vitalisator of methanol? (Skepter 22.1, 2009)