Alledaagse vooroordelen

door Thomas Gilovich

Skeptici meenden allang dat alledaagse oordelen en redeneringen op een voorspelbare manier vertekend worden. Psychologisch onderzoek over dit onderwerp heeft in de afgelopen kwart eeuw deze vermoedens grotendeels bevestigd.

Er zijn twee soorten verklaringen voor de twijfelachtige ideeën die in de kolommen van de Skepter aan de orde komen. De ene soort gaat uit van motieven: sommige geloven schijnen zo geruststellend dat mensen ze daarom koesteren, ondanks hun twijfelachtige status. De andere soort is cognitief: foutieve redeneringen en oordelen maken dat mensen alledaagse ervaringen verkeerd interpreteren. De skeptische gemeenschap is ervan overtuigd dat dit schering en inslag is.

Waarom zijn skeptici zo weinig onder de indruk van het redeneervermogen van hun gemiddelde medemens? Tot voor kort berustte dit pessimisme op eenvoudige waarneming, vaak door hen die een scherp oog hadden voor de zwakheden van de menselijke natuur. Skeptici citeren graag wat Francis Bacon schreef in zijn Novum Organum (1620):

…al het bijgeloof is in wezen hetzelfde, of het nu gaat om astrologie, dromen, voortekenen, goddelijke straffen enzovoorts, … namelijk de misleide gelovers nemen de uitgekomen voorspellingen waar, maar verwaarlozen of negeren de mislukte, hoewel die veel vaker voorkomen

De spitse opmerkingen van John Stuart Mill en Bertrand Russell over de tekortkomingen van het menselijk oordeelsvermogen worden ook vaak geciteerd; de modernere auteurs Richard Feynman, Stephen Jay Gould en Carl Sagan worden om dezelfde reden vaak aangehaald.

In de afgelopen 25 jaar ging veel psychologisch onderzoek speciaal over de kwaliteit van alledaagse redeneringen. Daarom is het nu mogelijk om verder te gaan dan eenvoudige opmerkingen en grondig onderbouwde uitspraken te doen over de tekortkomingen van alledaagse oordelen. We kunnen ook bepalen of die beroemde geleerden het bij het goede eind hadden. Is het echt zo dat mensen gegevens verkeerd interpreteren op de manier die Bacon en Russell en anderen beweren? Wat zegt het onderzoek?

Vergeleken waarmee?

Sommige van de gebruikelijke beweringen over de zwakheden van menselijke redeneringen blijven stevig overeind bij proefondervindelijk onderzoek. Bijvoorbeeld, er wordt vaak beweerd dat mensen het ‘vergeleken waarmee’-probleem lastig vinden, met andere woorden, men is vaak onder de indruk van absolute aantallen, zonder dat men zich rekenschap geeft van het feit dat die niets zeggen zonder vergelijkingsmateriaal.

Bijvoorbeeld een artikel in het tijdschrift Discover drukt lezers op het hart dat als ze met een vliegtuig reizen, ze horen te weten waar de uitgangen zijn en ook goed voor ogen moeten hebben hoe je die kunt bereiken. Waarom? Het artikel vermeldt instemmend dat iemand 200 overlevenden had ondervraagd van ernstige vliegtuigongelukken, en dat gebleken was dat meer dan 90% zich van tevoren een beeld had gevormd van de ontsnappingsroutes. Dat is natuurlijk fijn voor de overlevenden, maar merk op dat degenen die het ongeluk niet overleefd hadden niet ondervraagd waren. Het is best mogelijk dat ook meer dan 90% van de doden hetzelfde hadden gedaan. Negentig percent klinkt alsof het dichtbij de 100% is, maar zonder vergelijkingsmateriaal betekent het niet zoveel.

Net zo zijn mensen vaak onder de indruk van het feit dat pakweg 30% van de onvruchtbare echtparen die een kind adopteren na de adoptie alsnog een kind krijgen. Alweer, dat is leuk voor die 30%, maar hoeveel percent wordt zwanger zonder voorafgaande adoptie? Verstrekkende conclusies worden getrokken uit de ervaring van een kankerpatiënt die geneest na met volharding geestelijke oefeningen te hebben gedaan – maar wat weten we over de afloop als hij of zij dat eens niet gedaan zou hebben?

Het probleem van het ontbrekende vergelijkingsmateriaal doet zich vooral voor als dat moeilijk te verkrijgen is. Neem bijvoorbeeld de claim ‘ik kan altijd zien of iemand een haarstukje heeft’. Hoe zou zo iemand kunnen bepalen hoeveel haarstukjesdragers hij niet in de gaten heeft gehad? Het idee van een toupet is toch dat het zo onopvallend mogelijk is?

Hoe dan ook, psychologisch onderzoek ondersteunt de bewering dat mensen het lastig vinden om behoorlijke vergelijkingen te maken. Studies van alledaagse redeneringen (Boring, 1954; Einhorn en Hogart, 1978; Nisbett en Ross, 1980) hebben aangetoond dat zelfs grote aantallen goed opgeleide mensen de zin en de noodzaak van controlegroepen totaal niet inzien.

Zoekt en gij zult vinden

Verder beoordelen mensen veronderstellingen niet op een neutrale manier. Dit wordt vaak beweerd, en ook deze bewering wordt door onderzoek gesteund. In feite neigen mensen ernaar bevestigingen te zoeken voor wat ze al vermoeden, en daarvoor geldt dan ‘zoekt en gij zult vinden’. Bevooroordeeld zoeken naar bevestigingen produceert meer steun voor een veronderstelling dan die verdient.

Dit verschijnsel is aangetoond in vele proeven die specifiek waren opgezet om na te gaan hoe goed de hypothesevormende strategieën van mensen zijn (Skov en Sherman, 1986; Snyder en Swann, 1978). Maar het is zo alomtegenwoordig dat het ook opduikt in studies die zijn opgezet met een totaal ander doel. Een van mijn favorieten is een proef waarin de deelnemers de volgende gegevens kregen (Shafir 1993):

Stel je voor dat je in de jury zit die moet beslissen over de voogdij van een enig kind, na een nogal gecompliceerde echtscheidingszaak. De zaak is zo ingewikkeld vanwege onduidelijke economische, sociale en emotionele aspecten, en je hebt besloten je beslissing uitsluitend op de volgende paar feiten te baseren. Welke ouder krijgt (als enige) het kind toegewezen? Ouder A heeft een modaal inkomen, een gemiddelde gezondheid, werkt op gebruikelijke tijden, heeft een redelijke relatie met het kind, en een tamelijk stabiel sociaal leven. Ouder B heeft een bovenmodaal inkomen, niet-ernstige gezondheidsproblemen, moet veel reizen voor het werk, een zeer nauwe band met het kind, en een buitengewoon actief sociaal leven.

De meerderheid van de respondenten wezen het kind toe aan ouder B, de ouder met de grote verschillen, die zowel voordelen (hoog inkomen, nauwe band) als nadelen (gezondheidsproblemen, vaak weg) heeft vergeleken met ouder A. Maar dit probleem werd in een andere versie voorgelegd aan een andere groep. In de andere versie ging het erom te kiezen wie het kind niet mocht krijgen. Ook hier kiest de meerderheid voor ouder B. Paradoxaal genoeg is dus ouder B zowel beter als minder geschikt om voor het kind te zorgen.

Het resultaat is paradoxaal, tenzij men in rekening brengt dat mensen de neiging hebben bevestigende informatie te zoeken. Op de vraag ‘wie moet het kind krijgen’, gaan mensen zoeken naar positieve kwaliteiten die kunnen leiden tot toewijzing. Op de negatieve kwaliteiten die de andere ouder zouden bevoordelen wordt dan minder scherp gelet. Maar bij de tegenovergestelde vraag ‘wie mag het kind niet krijgen’ wordt juist op de negatieve en diskwalificerende kenmerken gelet. Een beslissing om toe te wijzen of te ontzeggen zou eigenlijk gebaseerd moeten zijn op vergelijking van positieve en negatieve kenmerken van beide ouders, maar door de vraagstelling worden de respondenten als het ware de weg opgedrongen van zoeken naar bevestigingen voor het oordeel dat ze moeten uitspreken.

Dezelfde logica steekt de kop op als mensen bepaalde veronderstellingen gaan onderzoeken. Geruchten over duistere samenzweringen kunnen mensen ertoe brengen onevenredig veel bewijzen te zoeken voor het bestaan van het complot, en bewijzen van het tegendeel te verwaarlozen.

Selectief herinneren

Een derde vaak gehoorde klacht is dat mensen de neiging hebben om makkelijker informatie te onthouden die strookt met hun verwachtingen, dan informatie die daar juist niet mee klopt. Charles Darwin zei bijvoorbeeld dat hij altijd grote moeite deed om alles op te schrijven wat niet klopte met zijn theorieën, want ‘ik had ervaren dat zulke feiten en gedachten gemakkelijker aan het geheugen ontsnappen dan gunstige ervaringen’ (geciteerd door Clark 1984).

Deze kritiek op het alledaagse denken moet gecorrigeerd worden. Geheugenonderzoek heeft aangetoond dat mensen zich vaak dingen het makkelijkst herinneren die niet kloppen met hun verwachting of voorkeur. (Bargh en Thein 1985; Srull en Wyer 1989). Enig nadenken leert dat dit speciaal het geval is voor ‘bijna-treffers’ in het leven, die vaak onuitwisbaar in het geheugen gegrift worden. De romanschrijver Nicholson Baker (1991) geeft een perfecte illustratie:

Ik vertelde haar het verschrikkelijke verhaal hoe ik tweede werd in de spellingswedstrijd toen ik in de tweede klas zat. Ik had het woord ‘keep’ als c-e-e-p gespeld, vlak nadat ik ‘microfoon’ goed had gehad, en nog twee of drie jaar later deed het me gewoon pijn om de gele vuilniswagen te zien voorbijrijden waar met hoofdletters op stond HELP KEEP OUR CITY CLEAN, met die onmogelijke onlogische K die me zo vernederend had laten verliezen.

Bakers verhaal is natuurlijk een anekdote, en misschien wel verzonnen. Maar hij wordt gesteund door systematische onderzoeken. In een zo’n onderzoek (Gilovich 1983) vroeg men mensen die hadden gewed op de uitslag van voetbalwedstrijden, om zich zoveel mogelijk te herinneren van de weddenschappen die ze hadden afgesloten. Ze herinnerden zich duidelijk meer van hun verliezen – uitkomsten die ze waarschijnlijk niet hadden verwacht, en die ze zeker niet graag hadden zien gebeuren. Door de bank genomen herinnerden zij zich ruim de helft van de keren dat ze verloren hadden, en nog geen 30% van de gevallen dat ze de weddenschap gewonnen had.

Telefoon onder douche

Dat mensen zich dus het beste datgene herinneren wat ze verwachten of graag hebben is een eenvoudig idee, maar het moet aangepast worden. Toch is het een aantrekkelijk en schijnbaar juist idee, en we moeten er niet zomaar vanaf stappen. Het geloof in de betrouwbaarheid van verwachtingen van paragnosten schijnt toch wel degelijk gevoed te worden door selectief onthouden van voorspellingen.

Hoe kunnen we dit idee verzoenen met het feit dat informatie die niet klopt vaak beter wordt onthouden? Misschien ligt de oplossing erin dat we moeten letten op wat een gebeurtenis gedenkwaardig maakt. Sommige gebeurtenissen zijn ‘enkelzijdig’ en andere ‘tweezijdig’ als het erom gaat de aandacht te trekken. Tweezijdig wil zeggen dat ze opvallend zijn, ongeacht hun uitkomst. Als je op een uitslag van een wedstrijd of een verkiezing wedt, dan hebben beide uitslagen (winnen of verliezen) emotionele betekenis, en daardoor zal de uitslag hoe dan ook een bijzondere gebeurtenis zijn te midden van de dagelijkse stroom van ervaringen. Voor zulke gebeurtenissen is het twijfelachtig dat bevestigende informatie beter wordt onthouden dan tegensprekende informatie.

Veronderstel daarentegen dat je gelooft dat de telefoon altijd gaat als je onder de douche staat. De gebeurtenissen die er in dit verband toe doen zijn enkelzijdig. Als de telefoon gaat terwijl je onder de douche staat, zul je dit intens ervaren: eerst onder grote druk beslissen of je zult opnemen, dan eventueel druipend naar de telefoon hollen, en dan blijkt het ‘verkeerd verbonden’ te zijn of is het de een of andere telefonische enquête.

Als de telefoon niet gaat terwijl je onder de douche staat is dit zeker geen gebeurtenis die je lang zal heugen. Er gebeurde gewoon niets. Dit geloof is dus typisch iets waarvoor de relevante gebeurtenissen enkelzijdig zijn: alleen de bevestigingen zijn heuglijke gebeurtenissen.

Misschien zijn de opmerkingen van Bacon en Darwin het beste van toepassing op deze enkelzijdige voorvallen. Bij enkelzijdige voorvallen zijn het vaak de uitkomsten die kloppen met verwachtingen die opvallen en die beter worden herinnerd. Daarentegen zijn bij tweezijdige voorvallen beide uitkomsten even gedenkwaardig, en soms zijn zelfs uitkomsten die juist onverwacht of onverhoopt zijn het makkelijkst te onthouden.

Wat bepaalt echter of een gebeurtenis enkel- of tweezijdig is? Ongetwijfeld spelen meerdere factoren een rol. We beschouwen er twee voor het geval van voorspellingen van paragnosten. In de eerste plaats zijn de gebeurtenissen die paragnosten aankondigen typisch enkelzijdig, want zo’n voorspelling kan niet ontkracht worden door een specifieke gebeurtenis, maar alleen door een gebrek aan bevestiging over een lange tijd. De vergelijking waar het om draait is tussen bevestigen of niet-bevestigen, oftewel tussen gebeurtenissen en niet-gebeurtenissen. En het is zeker niet verwonderlijk dat de eerste heuglijker zijn dan de tweede.

Temporeel vaag

Om dit idee te testen kreeg een groep studenten een dagboek te lezen dat zogenaamd was geschreven door een andere student. Deze beschreef zichzelf als iemand met belangstelling voor voorspellende dromen (Madey 1993). Om na te gaan of voorspellende dromen ook iets waard waren, had ze besloten al haar dromen op te schrijven en eveneens alle belangrijke voorvallen in haar leven, om dan later te bepalen of er een verband was. De helft van de dromen (bijvoorbeeld: ‘ik zag veel blije mensen’) werd later gevolgd door gebeurtenissen die je zou kunnen opvatten als uitgekomen voorspellingen (‘de docent liet een proefwerk niet doorgaan, en de hele klas juichte’). De andere helft kwam niet uit.

De deelnemers aan de proef lazen het hele dagboek, deden vervolgens korte tijd iets anders om de tijd te vullen en de aandacht af te leiden, en moesten vervolgens proberen zich zoveel mogelijk dromen te herinneren. Ze herinnerden zich duidelijk meer (57%) van de uitgekomen dromen, dan van de niet-uitgekomen dromen (35%). Dit resultaat is nauwelijks verbazingwekkend, want het uitkomen van een droom versterkt de herinnering aan de droom zelf, terwijl ‘niet-uitkomen’ geen voorval is. De uitkomsten waar het om gaat zijn dus uit de aard der zaak enkelzijdig, bevestigingen worden gemakkelijker onthouden. Het eindresultaat is natuurlijk dat het geloof waar het hier om gaat, namelijk in voorspellende dromen, onterechte steun krijgt.

Paranormale voorspellingen zijn ook nog op een andere manier enkelzijdig. Ze zijn berucht om hun vaagheid, met name wat betreft het tijdstip waar ze betrekking op hebben. Een typische voorspelling luidt veeleer ‘een machtig leider komt in ernstige problemen’ dan ‘de president van de VS zal op 15 maart aanstaande vermoord worden.’ Zulke voorspellingen zijn temporeel vaag, in de zin dat er geen specifiek ogenblik is waarop geïnteresseerden zich kunnen concentreren. Voor zulk soort voorspellingen vallen bevestigingen weer beter op, omdat die de herinnering aan de oorspronkelijke voorspelling weer opfrissen. Dus temporeel vage verwachtingen hebben typisch met enkelzijdige gebeurtenissen te maken: de bevestigingen zijn heuglijker dan ontkrachtingen.

Temporeel scherpe verwachtingen zijn verwachtingen waarvoor men van tevoren weet wanneer de beslissing over al dan niet uitkomen valt. Als men denkt dat een bepaald land de Eurocup gaat winnen, weet men exact op welk ogenblik die voorspelling al dan niet zal zijn uitgekomen: als de scheidsrechter het einde fluit van de finale. Bijgevolg hebben temporeel scherpe verwachtingen juist met tweezijdige gebeurtenissen te maken, omdat de aandacht wordt gericht op het beslissende ogenblik, en beide uitkomsten dan even gemakkelijk worden opgemerkt en ook later herinnerd.

In een onderzoek analoog aan het bovengenoemde werd gekeken naar het verschil tussen temporeel vage en scherpe verwachtingen. De deelnemers moesten weer een dagboek lezen, ditmaal van een student die deelgenomen zou hebben aan proeven met buitenzintuiglijke ervaringen. De dagboekschrijver zou enige weken achter elkaar een niet voorspelbare uitspraak over de komende week hebben moeten doen (Madey en Gilovich 1993). In het dagboek stond zowel de wekelijkse voorspelling van de student als de belevenissen van die week. Er waren twee groepen dagboeklezers in het onderzoek De ene groep was blootgesteld aan de temporeel vage conditie. Die kregen ‘voorspellingen’ te lezen zonder tijdsaanduiding, bijvoorbeeld ‘ik heb het gevoel dat ik ruzie krijg met mijn psychologische onderzoeksteam’. In de temporeel scherpe conditie stond de dag waarop het zou gebeuren erbij, dus: ‘ik heb het gevoel dat ik op vrijdag ruzie krijg met mijn psychologische onderzoeksteam’. Bij beide condities kwam de helft van de voorspellingen uit (‘de docent deelde ons in onderzoeksteams in, en ons team kreeg meteen onenigheid over het onderwerp’) en de andere helft niet (‘de docent deelde ons in onderzoeksteams in, en ons team was het onmiddellijk en unaniem eens over het onderwerp’). In beide condities stond deze ‘gebeurtenis’ op dezelfde dag in het dagboek, namelijk op de dag die ‘voorspeld’ was in de temporeel scherpe conditie, vrijdag in het voorbeeld. Na het lezen van het dagboek en een korte tussentaak moesten de participanten zich zoveel mogelijk voorspellingen en bijbehorende gebeurtenissen proberen te herinneren.

De temporeel scherpe conditie hielp het geheugen wel, maar alleen bij de ontkrachtingen. In beide condities kon men zich iets meer dan 60% van de bevestigde voorspellingen herinneren. In de temporeel scherpe conditie werd 45% van de ontkrachte voorspellingen onthouden (wat meer dan bij de proef met de voorspellende dromen). In de temporeel vage conditie kwam maar een kwart (26%) van de ontkrachtingen boven water. Als men bedenkt dat de meeste voorspellingen van paragnosten temporeel vaag zijn, dan suggereert dit resultaat dat de ‘bewijzen’ voor de betrouwbaarheid van zulke voorspellingen indrukwekkender kunnen lijken dan ze werkelijk zijn.

Er is natuurlijk veel meer psychologisch onderzoek naar de kwaliteit van alledaagse oordelen gedaan dan hier is besproken (zie bijvoorbeeld Baron 1988; Dawes 1988; Gilovich 1991; Nisbett en Ross 1980; Kahneman, Slovic en Tversky 1982). Maar zelfs het korte bovenstaande overzicht kan voldoende duidelijk maken dat een aantal van de vooroordelen waarover vaak gesproken wordt echte controleerbare tekortkomingen zijn. Systematisch onderzoek ondersteunt in grote trekken de vermoedens van de skeptische gemeenschap, namelijk dat alledaagse oordelen niet vertrouwd kunnen worden. Dit is natuurlijk niet erg verrassend: juist omdat alledaagse oordelen niet vertrouwd kunnen worden zijn de beveiligingen tegen foute conclusies ontwikkeld die samen bekend staan als de wetenschappelijke methode. Het is te betreuren dat deze beveiligingen niet op grotere schaal worden onderwezen of op prijs gesteld.

Literatuur

Bacon, F. (1620). Novum organum.

Baker, N. (1991). Room temperature, New York Vintage.

Bargh, J.A., en R.D. Thein (1985). Individual construct accessibility, person memory, and the recall judgment link: the case of information overload. Journal of Personality and Social Psychology 49, 1129-1146.

Baron, J. (1988). Thinking and deciding. New York. Cambridge University Press.

Boring, E.G. (1954). The nature and history of experimental control. American Journal of Psychology, 67, 573-589.

Clark, R.W. (1984). The Survival of Charles Darwin: A biography of a man and an idea. New York: Random House.

Dawes, R. M. (1988). Rational choice in an uncertain world. Harcourt Brace Jovanovich.

Einhorn, H.J. en R.M. Hogarth. (1978). Confidence in judgment Persistence in the illusion of validity. Psychological Review, 85, 395-416.

Gilovich,T. (1983). Biased evaluation and persistence in gambling. Journal of Personality and Social Psychology, 44, 1110-1126.

Gilovich, T. (1991). How we know what isn’t so: The fallibility of human reason in everyday life. New York: The Free Press.

Kahneman, D., P. Slovic & A. Tversky (1982). Judgement under uncertainty: Heuristics and biases. Cambridge: Cambridge University Press.

Madey, S. (1993). Memory for expectancy-consistent and expectancy-inconsistent information: an investigation of one-sided and two-sided events. Ongepubliceerd proefschrift, Cornell University.

Madey, S.F., & T. Gilovich (1993). The effect of temporal focus on the recall of expectancy-consistent and expectancy-inconsistent information. Journal of Personality and Social Psychology, 65, 458-468.

Nisbett, R., & L. Ross (1980). Human inference: Strategies and shortcomings of social judgment. Prentice-Hall.

Shafir, E. (1993). Choosing versus rejecting: Why some options are both better and worse than others. Memory & Cognition, 21, 546-556.

Skov, R.B. & S.J. Sherman (1986). Information-gathering processes: Diagnosticity, hypothesis-confirmatory strategies, and perceived hypothesis confirmation. Journal of Experimental Social Psychology, 22, 93-121.

Snyder, M., & W.B. Swann (1978). Hypothesis-testing processes in social interaction. Journal of Personality and Social Psychology, 36, 1202-1212.

Srull, T.K., & R.S. Wyer (1989). Person memory and judgment. Psychological Review, 96, 58-83.

Dit artikel is een bewerking van een artikel in Skeptical Inquirer 21.2, dat in 1996 werd gepresenteerd op het skeptische wereldcongres in Amherst.

Uit: Skepter 10.2 (1997)

Thomas Gilovich is hoogleraar psychologie aan Cornell University in New York.