Leugendetectie

Sophie van der Zee onderzoekt aan de Erasmusuniversiteit leugenachtig gedrag en hoe je het kunt herkennen, zowel in het echte leven als online. Dat ze niet alleen een achtergrond in psychologie maar ook in informatica heeft, komt hierbij goed van pas.

door Pepijn van Erp – Skepter 33.4 (2020)

Sophie van der Zee (foto: Bas Uterwijk)

VOORDAT we in het onderzoek naar leugendetectie duiken, toch eerst de vraag wat liegen eigenlijk is. En valt bluffen er volgens u ook onder?

‘Leuk. Een stap die de meeste mensen overslaan. De wetenschappelijke definitie van liegen is: een beeld overbrengen aan een ander, zonder waarschuwing vooraf, waarvan de zender weet dat het onjuist is. Daar zitten meteen allerlei haken en ogen aan. Het creëren van dat verkeerde beeld kan door informatie te geven die niet klopt, of door informatie achter te houden. Bluffen is ook liegen: dan doe je alsof je meer weet dan je weet — je wil beter overkomen dan je bent. We hebben net een artikel klaar over de leugens van Trump, onderzocht aan de hand van zijn tweets. Factcheckers laten vaak zien dat wat hij zegt feitelijk onjuist is, en media roepen dan dat hij liegt.

Mijn bedenking hierbij is dat je eigenlijk niet weet of hij liegt, want dat kun je zo niet aantonen. Zonder de intentie om anderen te bedriegen, is het geen liegen. Het kan ook zijn dat je het gewoon niet weet, of dat je denkt dat het wél klopt. Of je bent slecht geïnformeerd en je zegt maar wat. Dat zit wel tegen bluffen aan. Volgens de definitie is het geen liegen, maar voor een president natuurlijk toch vrij fout.’

Het idee dat je liegen kunt meten — waar komt dat vandaan? Waarom zouden mensen die liegen zich anders gedragen dan mensen die de waarheid spreken?

‘De behoefte om leugenaars te ontmaskeren is natuurlijk zo oud als de leugen. Tweeduizend jaar geleden in India werkten ze met rijstkorrels. Het idee was dat je minder speeksel produceert als je liegt. Als de rijstkorrels dan droog uit je mond komen, vertelde je waarschijnlijk een leugen. Eigenlijk meten ze met een polygraaf nog steeds stress, net als ze met die rijstkorrels deden.’

Cognitieve belasting

‘Er zijn grofweg drie oorzaken waardoor leugenaars zich anders kunnen gedragen. Ten eerste: cognitieve belasting. Liegen is moeilijker dan de waarheid spreken. Voor de waarheid kun je putten uit je geheugen, bij het liegen moet je je verhaal construeren en tegelijk consistent houden. Ook zie je vaak dat mensen die liegen er niet van uitgaan dat ze geloofd worden. Ze gaan vaak proberen te overtuigen en zijn daarom ook meer bezig met het observeren van de ander om te kijken of het verhaal misschien bijgestuurd moet worden.

Er zijn daarnaast emotionele aspecten — liegen is behoorlijk belastend. Bij meer narcistische mensen zie je soms ook positieve emoties, omdat ze het gevoel hebben dat ze ermee wegkomen of dat ze slimmer zijn dan de rest van de wereld.

De derde reden verpest dan eigenlijk alles weer. Mensen die liegen, willen graag eerlijk overkomen en proberen hun ‘leugenachtige’ gedrag te verhullen. Dat gaat vaak mis, want mensen hebben een heel verkeerd beeld van wat leugenachtig gedrag is. Ze gaan dan gedrag dat niets te maken heeft met liegen aanpassen, zodat het, ironisch genoeg, een aanwijzing voor liegen wordt. Zo hoor je vaak dat wegkijken te maken heeft met liegen, terwijl dat uit onderzoek volstrekt niet blijkt. Maar leugenaars die dat denken, zullen je vaak heel nadrukkelijk gaan aankijken met als gevolg een onnatuurlijk oogcontact dat juist een aanwijzing voor liegen kan zijn. Het maakt het allemaal erg ingewikkeld — het is een vakgebied met veel controverses.’

Wat zijn nu de beste resultaten met leugendetectie? In een aantal artikelen kwam ik een score van ongeveer 75 procent tegen voor de verschillende technieken.

‘Je moet allerlei zaken meenemen als je het over getallen gaat hebben. Dat heeft te maken met hoe de onderzoeken zijn opgezet. In een deel van mijn experimenten zijn interviewer en verdachte allebei proefpersonen, waardoor je telkens andere combinaties krijgt. Dan vraag je de ondervrager of die een leugen of waarheid dacht te horen en op die manier kun je het menselijk oordeel inschatten. Dat zit overigens meestal rond kansniveau: ze hadden net zo goed een muntje kunnen opgooien. En dan mochten ze best lang interviewen, soms ook alles vragen wat ze wilden, overal op letten. In andere onderzoeken heb ik proefpersonen filmpjes laten zien waarop iemand een leugen of waarheid vertelt. Ook dan wordt er ongeveer vijftig procent gescoord bij een gelijk aantal leugens en waarheden.

Psychologen scoren relatief wat beter, maar politieagenten doen het net zo slecht als gemiddelde proefpersonen — studenten dus. Mensen die bij een inlichtingendienst werken doen het goed, en ook gevangenen. Die zitten rond de zestig procent.’

Taalgebruik

‘Mijn onderzoek tot nu toe laat steeds zien dat het met gebruik van technologie eigenlijk altijd beter gaat, of je nu lichaamsbewegingen analyseert, huidgeleiding of taalgebruik. Met onze motion capture zaten we zelfs op 82 procent — al zal dat in de praktijk wel wat lager uitvallen. Met die Trump-tweets kwamen we uit op 74 procent, dus nog steeds een stuk hoger dan met alleen menselijk oordeel. Daarvoor hebben we een taalanalyse gedaan waarbij we keken naar het verschil in woordgebruik tussen correcte en incorrecte tweets. We konden echt een flink verschil laten zien, wat erop duidt dat hij in een andere cognitieve staat verkeert bij het typen van ware tweets dan bij tweets die niet kloppen, een indicatie voor liegen.

Het voordeel van technologie is bovendien dat je kunt onderzoeken of je die kunt manipuleren en verbeteren, terwijl dat bij het menselijk oordeel veel lastiger is. Nadeel is dat buitenstaanders geneigd zijn technologie en apparaten meteen serieus te nemen — professionals als politieagenten, medewerkers van de immigratiedienst en de raad voor de rechtspraak staan er juist nogal afwijzend tegenover.’

Versterker voor een leugendetector. (foro: Wikimedia Commons)

Als je bij Trump kijkt naar waar die verschillen in zitten, dus welke woorden hij wanneer gebruikt, kun je dan ook nog beredeneren dat die met liegen te maken hebben?

‘Voor een groot deel past het netjes bij wat er in de literatuur staat beschreven. Mensen die liegen nemen meer afstand in hun verhaal, bijvoorbeeld door minder vaak ‘ik’ te gebruiken en meer de derde persoon. Dat doet Trump ook heel duidelijk.

Een van de verklaringen hiervoor komt uit reality monitoring, een techniek die ooit bedacht is om echte van nepherinneringen te kunnen onderscheiden. Dat komt uit onderzoek naar seksueel misbruik, maar is later ook bij leugendetectie toegepast. Het gaat ervan uit dat echte herinneringen (of ze nu kloppen of niet) rechtstreeks uit je geheugen komen en dat nepherinneringen meer beredeneerd zijn en dus meer cognitive processing words bevatten. Dat zag je bij Trumps tweets. Wat je daarin niet zag, is dat iemand bij echte herinneringen meestal meer perceptuele details noemt en dus woorden als ‘voelen’ en ‘zien’ vaker gebruikt. Nepherinneringen worden vaak abstracter beschreven. Het is een verschil dat je ook kunt aantreffen bij hotelbeoordelingen op internet bijvoorbeeld. De fake reviews zijn minder persoonlijk en bevatten minder details wat betreft ruimte en tijd.’

Is zo’n score redelijk algemeen, of zie je dat een bepaalde techniek beter is om bepaalde leugens of leugenaars te betrappen?

‘De een is een betere leugenaar dan de ander. Dat is duidelijk. We zijn net genomineerd voor de Klokhuis-wetenschapsprijs voor een onderzoek waarin we binnen gezinnen hebben gekeken wie de beste leugenaar was en wie het beste in staat was leugens te herkennen. Deelnemers moesten video’s opnemen waarin ze een leugen en een waarheid vertelden en die werden dan aan elkaar voorgelegd. Op die manier konden we voor iedereen een ‘leugen’- en ‘leugendetector’-score bepalen.

Ik had zelf verwacht dat kleine kinderen makkelijk te ontmaskeren zouden zijn, maar het blijkt dat die überhaupt nogal willekeurig zijn in het vertellen, zodat hun waarheid ook vaak nergens op slaat.’

Zouden de betere leugenaars uit dit onderzoek er ook nog uitspringen als je technologische methoden inzet?

‘Dat moeten we nog onderzoeken. Maar het kan wel, met de dataset die we nu hebben vergaard. Wat wij nu hebben uitgezocht is wat de belangrijkste factoren zijn die maken dat iemand een goede leugenaar is. Eén daarvan is de mate waarin iemand zelf vindt een vlotte babbel te hebben. Heel veel andere factoren die in de literatuur genoemd worden, zoals creativiteit en aantrekkelijkheid, sprongen er verder niet zo uit. Het gaat wel om zelfrapportage, dus het kan ook zijn dat mensen die aspecten niet zo goed van zichzelf kunnen beoordelen.’

In Nederland wordt leugendetectie niet gebruikt in de opsporing als ik het goed heb, maar in andere landen wel. Gaat dat op een goede manier?

‘In België gebruiken ze het, in Nederland is er veel weerstand zoals ik al zei. Maar hier hanteren ze bijvoorbeeld wel bepaalde interviewtechnieken die je onder leugendetectie kunt scharen, hoewel de gebruikers dat niet zo zien. In hun hoofd is leugendetectie de polygraaf, en al het andere mensenwerk. Het ontwikkelen van verhoortechnieken die kunnen helpen waarheid van leugen te onderscheiden, valt echter ook gewoon binnen ons vakgebied.’

Bewijs

‘Idealiter is leugendetectie overbodig. Als je beschikt over veel goed objectief bewijsmateriaal heb je een bekentenis niet nodig. Maar in de praktijk is dat vaak niet zo, en dan moet je toch iets. Dat wordt wel eens vergeten door mensen die negatief zijn over leugendetectie. Ze vergeten vaak ook dat we er zelf heel slecht in zijn en dat training weinig helpt. Training zorgt vaak wel voor meer zelfvertrouwen, maar tests laten geen echte verbetering in de prestaties zien.

Nogmaals, ik denk niet dat je resultaten van leugendetectie als bewijs moet willen gebruiken. Maar wat er uitkomt, kun je wel gebruiken als stuurinformatie of tactische informatie. Welke delen van de verklaring bijvoorbeeld interessant zijn om verder op door te vragen.

Ik snap de mensen die zeggen dat je hier heel erg mee moet uitkijken, maar als je toch de betrouwbaarheid van een verklaring moet bepalen, dan toont het onderzoek aan dat technologie vaak beter werkt dan alleen te vertrouwen op menselijke beoordeling. Er is veel nuance nodig om het verantwoord te kunnen gebruiken. En daar ligt wel een probleem, omdat de politie voor een groot deel een organisatie is van mensen met een mbo-opleiding van wie je eigenlijk niet kunt verwachten dat ze goed overweg kunnen uitspraken als ‘met zeventig procent zekerheid geldt dit of dat’. Ik bedoel dat niet onaardig, maar het is gewoon ingewikkeld.’

Van verzekeringsmaatschappijen hoor ik ook wel eens dat ze stemanalyse gebruiken bij telefoongesprekken met mensen die bijvoorbeeld een schadeclaim indienen. Klopt dat?

‘Soms krijg je inderdaad een boodschap dat er meegeluisterd wordt, maar vaak klopt dat al niet. Het heeft een hele mooie afschrikkende werking. Dat bleek ook uit Amerikaans onderzoek. Mensen gaan zich eerlijker gedragen als ze weten dat ze later met een polygraaf verhoord zullen worden — uiteraard alleen als die mensen denken dat leugendetectie werkt en ook echt toegepast gaat worden. Dat is dus deels gebaseerd op misleiding en daar kun je van alles van vinden, maar dat is weer een ander debat.’

In de huidige coronacrisis communiceren we nog meer via digitale middelen en minder face-to-face. Ziet u daarbij ook veranderingen in hoe goed we leugens kunnen herkennen?

‘Er zijn wel een paar dingen die nu relevant zijn. Videobellen en face-to-face zorgen, anders dan je zou verwachten, voor slechtere leugendetectie dan het lezen van teksten. Dat komt omdat mensen dan naar bepaald gedrag kijken terwijl dat vooral veel ruis geeft, ze letten op de verkeerde dingen.’

Corona

(foto: Bas Uterwijk)

‘Iets anders waar toevallig net een superleuk artikel over is verschenen: een collega uit de VS heeft gekeken naar het bron- en contactonderzoek bij coronabesmettingen. Het gebruikelijke onderzoek werd vergeleken met het toepassen van interviewtechnieken die bekend zijn uit verdachtenverhoor, en het videobellen via Zoom met het zelf laten invullen van een online vragenlijst. Wat er uitkwam is veelbelovend, want het gebruik van de verhoortechnieken levert vijftig procent meer contacten op en er was geen verschil tussen het gebruik van Zoom en die vragenlijst. Dat betekent dat je het bron- en contactonderzoek makkelijk flink kunt opschalen met een goed ontworpen digitale vragenlijst, zonder verlies van kwaliteit. Ik vind dat we dit nu ook in Nederland moeten gaan uitproberen.’

Voor het onderzoek naar leugendetectie moet je precies weten wat een leugen is en wat een waarheid, anders weet je niet of iemand liegt. Zijn de leugens in zo’n lab-setting dezelfde soort leugens waarmee we in het dagelijkse leven te maken hebben?

‘Een van de belangrijkste vragen is wat je nu hebt aan dit soort onderzoek. Is het generaliseerbaar? Mensen zijn er vaak sceptisch over, ik had er zelf ook niet echt een idee van. In het lab instrueren we proefpersonen vaak of ze moeten liegen of een waarheid moeten vertellen, terwijl zoiets in het dagelijkse leven toch meestal een vrije keus is. Ook staat er in het lab vaak niet veel op het spel als de leugen uitkomt. Dat proberen we trouwens wel hoor, door bijvoorbeeld goede leugenaars een stevige beloning in het vooruitzicht te stellen.

Ik denk dat de generaliseerbaarheid wel een probleem is. Het goede nieuws is dat uit een meta-analyse is gebleken dat leugenachtig gedrag niet zoveel verschilt tussen de studies in het laboratorium en de paar studies met data uit de normale wereld.

Het lastige is dat je uit de echte wereld bijna nooit data hebt waarvan je echt weet wat er gebeurd is, je mist de ground truth. Ons onderzoek naar detweets van Trump is daardoor best uniek. Normaal heb je geen factcheckers die al je berichten gaan checken en dan nog zijn er maar weinig mensen die zoveel leugens vertellen dat je er statistisch iets mee kan. Obama is ook wel gefactcheckt, maar die was een stuk eerlijker, dus niet zo interessant voor ons leugenonderzoek.’

Uit: Skepter 33.4 (2020)

Presentatie van Sophie van der Zee tijdens het Europese Skeptische congres 2019 in Gent.

Vond u dit artikel interessant? Overweeg dan eens om Skepsis te steunen door donateur te worden of een abonnement op Skepter te nemen.

Steun Skepsis

Pepijn van Erp is wiskundige, redacteur van Skepter en bestuurslid van Skepsis.