Helderziendheid of gezond verstand?

Een goede duizend Nederlanders hebben deelgenomen aan een landelijke toets ‘Voorspel het Nieuws van 1995’, een project van Skepsis, de Nederlandse Vereniging voor Parapsychologie en de wetenschapsredactie van De Telegraaf. Nu, in 1996, kan de balans worden opgemaakt.

De toets (1) was opgezet om na te gaan wat men denkt over de waarschijnlijkheid van een aantal gegeven voorspellingen en waarop men dat oordeel baseert. Ze werd eind vorig jaar gepubliceerd in De Telegraaf (zie Skepter, maart 1995). Kort samengevat was het resultaat dat de gemiddelde inzender van deze enquête bij het beoordelen van de gegeven voorspellingen niet beter scoort dan iemand die er eerlijk voor uitkomt dat het wat hem betreft kan vriezen of dooien. Maar als er onderscheid wordt gemaakt tussen degenen die zich beroepen op verstandelijke overwegingen of die meer vertrouwen op intuïtie en helderziendheid, dan komt het redelijk denkende deel der natie duidelijk voorop te liggen.

Ook wat er op het gebied van de vrije voorspellingen werd gedebiteerd, kon de werkgroep die het onderzoek verrichtte niet imponeren. De meeste gingen niet over onvoorzienbare gebeurtenissen of bevatten te weinig bijzonderheden om ze als een mogelijk teken van helderziendheid te kunnen beschouwen. En voor zover ze wel aan die criteria voldeden, kwamen ze niet uit. De grote nieuwsfeiten van 1995, zoals de aardbeving in Kobe, de moord op premier Rabin en het verloop van de oorlog in Bosnië, werden niet ondubbelzinnig voorspeld.

Om de betrouwbaarheid van de toekomstverwachting in een getal te kunnen uitdrukken, werd aan de deelnemers gevraagd 25 voorspellingen in te delen in 5 categorieën, genaamd A t/m E, waarin de waarschijnlijkheid per categorie opliep van 0 tot 20 procent in A, tot 80 à 100 procent in E. Als een voorspelling uitkwam, scoorde men resp. 0, 4, 7, 9 of 10 punten en omgekeerd, als de voorspelling niet uitkwam 10, 9, 7, 4 of 0 punten, al naar gelang men A, B, C, D of E had ingevuld.

Deze ‘eerlijke scoretabel’ ging uit van de 7 punten die men zeker zou krijgen door C in te vullen. Men kon er 3 verliezen of 2 winnen door B of D te kiezen, wat loonde als de kans dat men gelijk kreeg groter dan 60 tegen 40 procent was, en men kon er nog eens 1 winnen of 4 verliezen door A of E te kiezen, voor als men die kans groter dan 80 tegen 20 procent taxeerde. Wie op alle vragen C antwoordde, kreeg in totaal 175 punten, wie bij elke voorspelling een volkomen willekeurig vakje invulde, mocht statistisch 150 punten verwachten.

telegraaf1

De verdeling van de scores van alle deelnemers is weergegeven in de figuur 1, die een grote spreiding laat zien. Bijna eenvijfde blijft nog beneden de 150, zoals gezegd de score die men van een gedresseerde kip zou verwachten, en de helft blijft beneden de 175 waarvan een consequente weifelaar verzekerd zou zijn geweest. De laagste score was 51, de gemiddelde was 172 en de hoogste was 232 (van de maximaal te behalen 250). In hoeverre de uitslag beïnvloed is door het feit dat er slechts 4 van de 25 gegeven voorspellingen zijn uitgekomen, is niet duidelijk. Overigens, de deelnemers kenden de scoretabel niet; hen was slechts meegedeeld dat gokken niet beloond zou worden. Om precies te zijn: de methode zorgt ervoor dat de te verwachten score het hoogst is als men de waarschijnlijkheid correct heeft aangegeven. (2)

Wat de bronnen van hun kennis betreft, konden de deelnemers aangeven welke van de zes volgende mogelijkheden een kleine of grote rol speelden: toeval, verstandelijke overwegingen, intuïtie, helderziendheid, astrologie en kaartleggen en/of pendelen. Aan de hand daarvan heeft de werkgroep vastgesteld welk gewicht de inzenders gemiddeld aan die factoren hebben toegekend en wat de gewogen gemiddeldes van de scores waren. Een en ander is weergegeven in figuur 2. Door de kleine aantallen deelnemers die zich op de laatste drie bronnen beriepen, zijn de verschillen daartussen statistisch niet significant. Worden die samengevoegd tot één ‘paranormale’ groep, dan is de gemiddelde score daarvan (164) wel significant lager dan van de andere groepen. Verstandelijke overwegingen winnen met een flinke voorsprong.

telegraaf2

Het verband tussen de aangegeven kennisbron en de behaalde score wordt duidelijk zichtbaar als de inzendingen worden gesorteerd op volgorde van de score; dan neemt het gewicht van verstandelijke overwegingen toe en dat van intuïtie en paranormale bronnen af met toenemende score. Dit verband wordt geïllustreerd in figuur 3.

telegraaf3

Met elkaar zonden de deelnemers 2368 vrije voorspellingen in. Het onderzoek daaraan is nog niet afgesloten. (3) Een voorlopige conclusie is dat degene die zijn uitgekomen (30 à 40 procent) lijken te zijn ingegeven door rationele overwegingen of emotionele drijfveren, terwijl degene die zouden kunnen wijzen op langs paranormale weg verkregen kennis geen van alle zijn uitgekomen.

Statistisch gezien kan men concluderen dat van de lezers van De Telegraaf die aan deze landelijke toets hebben deelgenomen, zij die zich op verstandelijke overwegingen beriepen de waarschijnlijkheid van gegeven voorspellingen het best beoordeelden. Ook de analyse van de vrije voorspellingen gaf vooralsnog geen aanwijzing dat de inzenders over andere dan langs rationele weg verkregen kennis omtrent de toekomst beschikken.

Het verslag Landelijke Test ‘Het Nieuws van 1995’ door C.M. Braams, H.D. van Lohuizen, G.C. Molewijk (Skepsis), K. Roos ( De Telegraaf ), F. Snel, P.C. van der Sijde (NVP) verschijnt over enkele maanden. Meer hier over in de volgende Skepter.

Noten (toegevoegd voor de Skepsis-site)

1. De 25 potentiële nieuwsfeiten waren als volgt:
1. De verloving van prins Willem Alexander wordt officieel bekend gemaakt.
2. Een zeer zware storm veroorzaakt uitzonderlijke schade aan de mosseloogst.
3. Het heren-enkelspel op Wimbledon wordt gewonnen door Pete Sampras.
4. Het ‘paarse’ kabinet treedt af.
5. Op 31 december kost een liter loodvrije benzine minder dan ƒ 2,10.
6. Bij een ongeluk met een Nederlandse touringcar komen meer dan 5 mensen om het leven.
7. De Nederlandse politie legt beslag op een partij drugs met een straatwaarde van meer dan 200 miljoen gulden.
8. De gemiddelde jaartemperatuur in Nederland ligt onder de jaargemiddelden van de afgelopen 10 jaar.
9. De Nobelprijs literatuur wordt gewonnen door een Nederlandstalige schrijver.
10. Eurodisney moet zijn poorten sluiten.
11. Een gebied van minimaal 100 km2 wordt na een ongeluk in een kerncentrale geëvacueerd.
12. Een minister of staatssecretaris uit het ‘paarse’ kabinet treedt tussentijds af.
13. Een cycloon trekt een verwoestend spoor door een Nederlandse plaats.
14. De koers van de Amerikaanse dollar is op 31 december hoger dan ƒ 1,80.
15. Bij een treinongeluk in Nederland komen meer dan 5 mensen om het leven.
16. Nederland wordt getroffen door een aardbeving met een Richter-kracht van meer dan 5,5.
17. De KLM maakt officieel een samenwerkingsverband met een Europese luchtvaartmaatschappij bekend.
18. In de eerste helft van het jaar valt meer regen dan normaal en in de tweede helft minder.
19. Een Nederlandse sportvrouw vestigt een wereldrecord op een van de Olympische sporten.
20. Bij een olieramp spoelt op de Nederlandse kust meer dan 50.000 ton ruwe olie aan.
21. In oktober vindt ergens ter wereld een aardbeving plaats die zal blijken de krachtigste van het jaar te zijn.
22. Tijdens een Formule-1 race komt een deelnemende coureur om het leven.
23. Er wordt besloten de Betuwelijn niet aan te leggen.
24. Door uitzonderlijke droogte is in de Randstad het leidingwater minimaal een week op rantsoen.
25. Het WK Schaatsen All Round Mannen wordt gewonnen door Falco Zandstra.

Men kon kiezen uit: maximaal 20%, 20%-40%, 40%-60%, 60%-80% en minimaal 80% kans. De uitgekomen voorspellingen waren: 3,5,7,18 Terug.

2. De voor de hand liggende ‘beloning’ voor een voorspelling die zegt dat een bepaald feit met waarschijnlijkheid p gebeurt en met waarschijnlijkheid q niet gebeurt (met p+q=1) is: log p als het gebeurt, en log q als het niet gebeurt (hier ongeveer: 10 log10 10p). Bij die beloningsfunctie is het onmogelijk om meer te verdienen door een onjuiste waarschijnlijkheid te voorspellen. Terug.

3. Zie de beschouwing hieronder. Terug.


Raden naar het nieuws van 1995

Een verlaat commentaar

door Jan Willem Nienhuys

Het eindverslag over de Landelijke Test ‘Het Nieuws van 1995’ is nooit verschenen, maar het concept ervan bevat interessante details.

Het concept van het verslag over het ‘Nieuws van 1995’ sluimert in een aantal bureauladen, onder andere die van de redactie van Skepter. De medewerkers van de Nederlandse Vereniging voor Parapsychologie (NVP) zouden de bijna 2400 ‘vrije voorspellingen’, die allemaal op kosten van De Telegraaf waren uitgetikt, analyseren. Hun verslag is nooit afgemaakt.

Iets is er wel te vertellen van die vrije voorspellingen. De meeste (333) gingen over het Nederlandse koninklijke huis. Voorspellingen over politiek (binnen- en buitenlands, 276) waren een goede tweede, op de voet gevolgd door voetbal (265). Daarna kwamen oorlogen (249). Voetbal is natuurlijk niet als oorlog geteld, maar oorlogsdreiging wel. Een flinke portie voetbalvoorspellingen (105) ging trouwens over de Amsterdamse club Ajax. De andere categorieën zoals het weer (81), ongelukken (60) en overstromingen (33) waren duidelijk minder populair als onderwerp. De ideale voorspelling luidt dus: De koningin begint de troonrede met ‘Hand in hand, kameraden’.

Onder de vrije voorspellingen waren er die zeker niet zouden uitkomen (Nederland wint Eurovisie Songfestival – het was al bekend dat Nederland in 1995 niet zou deelnemen), die al uitgekomen waren (Scandinavië treedt toe tot de EU – met alleen Noorwegen duidelijk afzijdig) of die voor de hand liggende verwachtigingen waren (CDA blijft kwakkelen in de opiniepeilingen). Het NVP is er niet toe kunnen komen hier nadere mededelingen over te doen, en ook niet of er bij de paranormale voorspellingen iets interessants zit.

Als we naar de 25 voorspellingen van de test kijken, dan valt het op dat er veel gebeurtenissen genoemd worden die gemakkelijk als ‘uitzonderlijk’ betiteld kunnen worden, en veel inzenders dachten daar kennelijk ook zo over. Naar het oordeel van 80% van hen zou de Nobelprijs literatuur hoogstwaarschijnlijk niet in Nederland of Vlaanderen vallen, en ruim 60% meende dat de rampen van nummers 2, 11, 13, 16, 20, 24 de laagste waarschijnlijkheid hadden. Dat een Nederlander iets bijzonders zou presteren (nummers 1, 19 en 25) werd door de helft van de inzenders met ‘A’ (kans 0 tot 20 procent) betiteld.

Van een viertal vragen was de kansverwachting eenvoudig te schatten. Dat 1995 het koudste jaar zou zijn van de 11-jarige periode 1985-1995 (nummer 11) had natuurlijk een kans van 1/11. Evenzo kan de zwaarste aardbeving van het jaar in alle maanden vallen, en dat het oktober zou zijn (nummer 21) had een kans van 1/12. Opmerkelijk was dat bij vraag 21 wel 30% van de respondenten ‘E’ (kans 80 tot 100 procent) invulde. De uitgekomen voorspelling nummer 18 over de neerslag had objectief gezien een kans van precies 1 op 4 om uit te komen, en dus had een ‘rationele’ voorspeller ‘B’ horen in te vullen. Van alle vragen was dit de enige waar bij ‘A’ of ‘E’ niet de meeste antwoorden werden gegeven: het antwoord ‘C’ werd door eenderde van de inzenders gegeven. De onderzoekers voerden een aparte manier in om deze drie vragen te scoren, en constateerden dat de aldus verkregen score beter correleerde met de uitslag van de rest van de vragen dan de mededeling dat men geprobeerd had zijn verstand te gebruiken.

Wat hielden de inzenders voor uitgesproken waarschijnlijk? Bijna de helft dacht dat het aftreden van een paarse minister behoorlijk waarschijnlijk was. Het gebeurde niet. De voorspellingen over de dood van een Formule-I-coureur (nr. 22), de benzineprijs (nr. 5), de grootste drugsvangst (nr. 7), de koers van de dollar (nr. 14) en zoals vermeld de maand van de grootste aardbeving (nr. 21) ontvingen een ‘E’ van circa eenderde van de invullers. Daarvan zijn nummers 5 en 7 inderdaad uitgekomen, dus collectief ging het verstand (of de intuïtie) van de Telegraaf-lezers wel in de goede richting.

Uw rapporteur vind het raadselachtig dat de inzenders in zulke grote aantallen de voorspelling over de grootste aardbeving onjuist beoordeeld hebben. De auteurs van het conceptrapport zeggen er niets over. Misschien was de formulering (in oktober vindt ergens ter wereld een aardbeving plaats die zal blijken de krachtigste van het jaar te zijn) voor veel inzenders onduidelijk. Het klinkt gewoon als een strikvraag. Voor exacte wetenschappers, wiskundigen en logici is deze zin een makkelijk op te lossen mini-logipuzzel. Mogelijk hebben veel Telegraaf-voorspellers het zinsdeel ‘krachtigste van het jaar’ niet opgevat als ‘krachtigste ter wereld van het jaar’ (wat de opstellers voor ogen stond) maar als ‘krachtigste van het jaar op die plek’. Per slot van rekening stond tamelijk vooraan in de zin dat het om een bepaalde plaats ergens ter wereld ging. In aardbevingsgebieden voelt men regelmatig lichte schokken, honderdduizenden over de hele wereld samen, en dat ‘ergens ter wereld’ de zwaarste klap in oktober valt is vrijwel zeker (hoe de krant dan zo’n plek vindt en erover gaat schrijven is een tweede). De formulering is dus gemakkelijk totaal anders op te vatten, en dat geeft voor mij aan dat ze te dubbelzinnig is voor dit soort spelletjes.

De onderzoekers keken ook nog naar de stelligheid waarmee de inzenders hun voorspellingen deden. Wie veel vragen met ‘A’ of ‘E’ beantwoordt is zeer stellig, en wie overal ‘C’ (40% – 60% kans) aangeeft is weinig stellig. Het blijkt dat hoe verder men in de reeks toeval – verstand – intuïtie – paranormale methoden zit, des te stelliger men is en des te lager men scoort op de drie speciale vragen 8, 18 en 21.

Wat respondenten zeiden over het aandeel van diverse kennisbronnen in hun keuzes neem ik niet al te ernstig. Wie met een dobbelsteen zijn of haar keuze bepaald zou hebben, zou gemiddeld 150 gescoord hebben. De score 175 (25 maal 7) zou behaald zijn door iemand die overal ‘C’ had ingevuld. Wie per vraag precies zou hebben ingevuld wat de meeste mensen dachten, zou 177 of 181 hebben gehaald (bij vraag 17 over de KLM werden ‘D’ en ‘E’ beide 244 maal gekozen). Wie in plaats daarvan op de drie speciale vragen het ‘rationele’ antwoord had gegeven, zou nog 7 punten extra gescoord hebben. (De gemiddelde ‘verstand’-score, 176, zit daar ruim onder.) Het is dus erg onaannemelijk dat degenen die ‘toeval’ als voornaamste grondslag aangaven (gemiddelde score 169) inderdaad hun keuze met een dobbelsteen hebben bepaald.

Wie geeft zo’n antwoord ‘toeval’? Het lijkt me dat dat vaak weifelaars zijn die zich realiseren dat ze het eigenlijk niet weten en dat ze zich niet eens een indruk kunnen vormen van hoe de kansen liggen dat iets zal gebeuren of niet gebeuren. Habituele weifelaars zullen juist wat minder vaak voor de ‘extreme’ voorspellingen ‘A’ of ‘E’ kiezen. In elk geval moet men er volgens mij rekening mee houden dat wat de mensen zeggen niet is wat ze bedoelen, en dat wat de leek onder ‘toeval’ en ‘kans’ verstaat vrijwel niets te maken heeft met de betekenis die wetenschappers daar sinds een eeuw of drie aan geven.

Degenen die intuïtie (gemiddeld 169) of paranormale methoden (gemiddeld 164) claimden hebben waarschijnlijk toch zonder het te beseffen hun verstand in meerdere of mindere mate laten werken.

Volgens De Telegraaf van 9 maart 1996 waren de drie beste voorspellers R. Baars (232) uit Breda, J.K. Kroes (231) uit Den Haag en G.W.M. Mollen (230) uit Bergeyk. De beste deelnemer die zich op iets paranormaals had beroepen stond met 220 punten op de gedeelde 9de-10de-11de plaats. De drie organiserende partijen (De Telegraaf, de NVP en Skepsis) deden ook een poging. Ze vulden via een soort stemprocedure elk één formulier in. Daarbij behaalden ze respectievelijk 190, 191, en 222 punten. Helemaal eerlijk is de vergelijking met de modale Telegraaf-lezer niet, want de organisaties kenden het scoringssysteem, in tegenstelling tot de krantenlezers. Die moesten het doen met een mededeling in een begeleidend schrijven: ‘Een speciale op statistiek gebaseerde puntentelling waarbij gokken niet beloond wordt, zorgt ervoor dat na het afsluiten van de onderzoeksperiode op 31 december 1995 vastgesteld kan worden welke voorspellers het het best gedaan hebben’ (De Telegraaf, 26 november 1994). Een fotografie van twee streng kijkende onderzoekers (ze keken waarschijnlijk pal in een laagstaande zon) droeg er wellicht ook aan bij dat wagers van gokjes werden weerhouden.

Deze beschouwing werd speciaal voor de Skepsis-site vervaardigd.

Uit: Skepter 9.1 (1996)

C.M. Braams
Jan Willem Nienhuys is redacteur van Skepter en secretaris van Skepsis