Van homo economicus naar homo bias – van kwaad tot erger?

Behavorial Economics, oftewel gedragseconomie, is nu echt een officieel onderdeel van de economische wetenschap geworden. Want na Kahneman heeft dit jaar een andere vertegenwoordiger van deze nieuwe subdiscipline, Richard Thaler, de Nobelprijs voor de Economie gekregen. Deze wetenschappers tonen aan dat mensen vrijwel altijd irrationele beslissingen nemen, terwijl neoklassieke economen juist uitgaan van rationeel handelende wezens. Is er inderdaad sprake van een fundamenteel verschil, of eerder van een schijntegenstelling. Om misverstanden te voorkomen: ik ga niet in op de Preadviezen die op 23 november worden uitgereikt. Mij gaat het om de meerwaarde van het academische onderzoek dat onder de vlag van gedragseconomie is uitgevoerd.

In 1974 verschijnt in het blad Science een artikel (pdf) van de Israëlische psychologen Amos Tversky en Daniel Kahneman (T&K), dat in de 40 jaar daarna meer dan 7000keer is geciteerd. T&K beschrijven daarin onder meer een experiment waarbij de proefpersonen in twee groepen zijn onderverdeeld. Iedere deelnemer draait eerst aan een soort rad van fortuin dat voor de ene groep stopt bij het getal10, voor de andere bij 65. De proefpersonen van T&K krijgen daarna de volgende vraag voorgelegd: “hoe groot is het aandeel Afrikaanse landen in de Ledenraad van de Verenigde Naties (VN)?” Ze moeten eerst aangeven of dat aandeel hoger of lager is dan het getal waar zojuist het rad van fortuin is blijven steken. Daarna moeten ze hun eigen inschatting maken.De eerste groep – waar het rad van fortuin stopt bij 10 – schat gemiddeld dat 25% van de VN-ledenraad uit Afrikaanse landen bestaat, de tweede groep komt gemiddeld uit op 45%. Appeltje eitje: bij een voldoende aantal proefpersonen kan statistisch worden bewezen dat het verstrekken van een vrij willekeurig getal – een anchor oftewel een referentiepunt – leidt tot een systematische afwijking – een anchoring bias oftewel een referentie-effect. Hoe vaak we het experiment ook uitvoeren, steeds blijkt dat bij een hoog anchor de anchoring bias naar boven afwijkt en bij een laag anchor naar beneden. Wetenschappers noemen dit een robuust resultaat.

Was ik proefpersoon in het T&K-onderzoek, ik zou hun vraag niet hebben kunnen beantwoorden. Want je moet weten hoeveel lidstaten de VN telt, hoeveel Afrikaanse landen er zijn, welke daarvan VN-lid zijn en tot slot even rekenen. Ook ik zou mij laten leiden door een willekeurig getal dat ik zojuist heb gezien, uit gemakzucht en omdat ik weet dat mijn keuze geen consequenties heeft. Was ik daarentegen een diplomaat die in VN-verband veel met Afrikaanse landen te maken heeft, dan zou ik hoogstwaarschijnlijk het goede antwoord wel weten. Of er in ieder geval voor zorgen dat ik het goede antwoord snel te pakken krijg. Tenminste als mij deze vraag door mijn chef zou worden gesteld en niet door een willekeurige onderzoeker. Zie hier het kernprobleem van ieder experiment: het is geheel vrijblijvend, en staat meestal ver af van de wereld waarin we keuzes moeten maken die ernstige consequenties kunnen hebben.

Op het verkeerde been

Een ander kenmerk van veel gedragseconomisch onderzoek is dat de proefpersonen vaak op het verkeerde been worden gezet. Neem het ‘Linda-probleem’ dat in de literatuur uitgebreid is besproken, zie hier. De proefpersonen kregen van T&K de volgende beschrijving: “Linda is een 31-jarige single, slim en met uitgesproken ideeën.Zij is afgestudeerd als filosofe. Als student was zij diep bezorgd over kwesties als discriminatie en sociale ongelijkheid, en nam zij deel aan demonstraties tegen kernenergie”.

Dan volgt de vraag: “ wat is het meest waarschijnlijk?, (a) dat Linda momenteel een bankemployee is, of (b) een bankemployee en actief in de feministische beweging”. Verreweg de meeste proefpersonen kiezen voor (b). Helemaal fout,zeggen T&K. Want de combinatie bankemployee & feministe komt per definitie minder vaak voor dan de totale populatie bankemployees. Is hier sprake van een conjunction fallacy, zoals T&K concluderen?Natuurlijk niet, de respondenten zijn gewoon op het verkeerde been gezet. Ingoed vertrouwen zijn ze er vanuit gegaan dat de verstrekte informatie relevant was, dat ze deze moesten gebruiken bij de beantwoording van de vraag. Wat zou u doen als deelnemer aan een dergelijk onderzoek?

Laten we er geen doekjes om winden: het is eigenlijk een vorm van bedrog. Want dergelijk onderzoek richt zich niet op de vraag of de proefpersonen irrationeel gedrag vertonen in bepaalde praktijksituaties maar in hoeverre zij over statistische basiskennis beschikken en deze ten aller tijde kunnen toepassen –ook als het niet relevant lijkt te zijn. Deze vorm van misleiding komt helaas nog vaak voor in gedragseconomisch onderzoek. Dit soort onderzoek getuigt ook van intellectuele luiheid, want je weet van tevoren dat de meeste respondenten ‘verkeerd’ antwoorden op dergelijke vragen.Bovendien kun je vrij gemakkelijk aantonen dat de uitkomsten significante verschillen opleveren, wat betekent dat jouw artikel zonder al teveel problemen wordt geaccepteerd voor een wetenschappelijke publicatie. Gedragseconmisch onderzoek lijkt op een grootscheepse jacht op nieuwe vormen van irrationaliteit; inmiddels zijn er al meer dan 150 biases ontdekt, zo kunnen we op Wikipedia lezen.

Verwisselingvan rollen

Dat mensen meestal irrationeel handelen, zou volgens Kahneman ook blijken uit het zogeheten endowment effect. In zijn beroemde boek Thinking, Fast andSlow (2011) schrijft hij (op p. 292-93) over professor R die op een veiling nogal bijzondere wijn heeft gekocht voor 35 dollar per fles. Hem wordt gevraagd of hij deze gaat verkopen wanneer per fles 100 dollar zou worden geboden.Wanneer R ontkennend antwoordt, is de interpretatie van Kahneman dat er sprake is van een endowment bias: R waardeert zijn wijn hoger louter vanwege het feit dat hij deze zelf in bezit heeft. Ook Richard Thaler omschrijft in zijn boek Misbehaving (2015) het gedrag van R als ‘non rational’ (p. 17).

Als R een wijnhandelaar zou zijn, hebben deze twee Nobelprijswinnaars natuurlijk volkomen gelijk. Maar dat is bij R niet het geval: hij verzamelt wijn als hobby, als ‘hebbedingetjes’. Zijn afweging zou je behoorlijk rationeel kunnen noemen: “de 65 dollar die ik bij verkoop verdien weegt niet op tegen het‘emotionele verlies’ (een disutility, zou een econoom zeggen) dat ik ervaar wanneer ik deze wijn niet meer in mijn kelder heb staan”. Wil je dus onderzoeken in hoeverre het endowment effect een belangrijke rol speelt bij economische besluitvorming, dan moet je om te beginnen twee groepen respondenten vergelijken: handelaren versus verzamelaars. Bovendien moet je naar verschillen in inkomen of vermogen kijken: de 65 dollar ‘winst’ die professor R kan incasseren zijn voor hem peanuts, terwijl iemand met een minimuminkomen of bijstandsuitkering veel eerder geneigd is om zijn wijn voorraad voor 100 dollar te verkopen – als we even buiten beschouwing laten dat minima zich zo’n dure hobby helemaal niet kunnen veroorloven.

Causale of hiërarchische relaties?

Het gebruik van experimenten wordt als een belangrijk voordeel van het gedragseconomisch onderzoek gezien. Met een experiment kan immers niet alleen een statistisch maar ook een causaal verband worden aangetoond. Het lijkt zo vanzelfsprekend: de onderzoekers manipuleren de onafhankelijke variabele – bijvoorbeeld een anchor – en kunnen daarna haarfijn registreren hoe de afhankelijke variabelen hierdoor worden beïnvloed.

In de natuurwetenschappen lijkt er niet veel mis met deze gedachtegang maar in het sociale domein ligt dit anders. Als een docent een vraag stelt en de leerling geeft daarop een antwoord, kun je dan beweren dat we een causale relatie op het spoor zijn? Natuurlijk niet, de leerling doet wat de docent hem gevraagd heeft. Het alternatief ‘niet antwoorden’ – of zeggen dat het een onzinnige vraag is –heeft immers allerlei vervelende consequenties en druist in tegen wat we in zo’n situatie normaal vinden. Zo ook de situatie in een sociaalwetenschappelijk laboratoriumonderzoek: de proefpersoon reageert op bepaalde opdrachten of prikkels omdat hij daarvoor is ‘ingehuurd’. Hij komt op allerlei manieren in de problemen als hij ‘de regels van het spel’ niet respecteert.Vind u dat ik overdrijf? Lees dan de essays van Rutger Bregman over twee beroemde experimenten, het Stanford Prison Experiment en het Milgram Experiment.

Is het vignet een oplossing?

Kunnen de nadelen van het laboratoriumexperiment, waar andere wetten gelden dan in het echte leven,worden ondervangen door een vignet-experiment? Dat is een enquête –tegenwoordig vrijwel altijd via internet – waarbij de respondenten ad random in bepaalde groepen worden onderverdeeld. Bijvoorbeeld de ene helft krijgt eenhoog, de andere een laag anchor. Op dezelfde manier kun je diverse groepen respondenten uiteenlopende hypothetische situaties voorleggen om te kijken of dezelfde enquêtevragen systematisch anders worden beantwoord. Met de moderne techniek kun je zelfs meten hoe lang de respondenten nadenken over bepaalde vragen, al is natuurlijk niet uit te sluiten dat ze ondertussen iets heel anders doen. Maar ook nu geldt dat alles vrijblijvend is. In een hypothetische situatie kunnen je hypothetische antwoorden verwachten. Dat geldt zowel voor het laboratoriumexperiment als bij verschillende vormen van enquetering (waarover ik eerder schreef).

Rationeel of irrationeel, is dat de vraag?

Er lijkt een diepe kloof te bestaan tussen neoklassieke economen en de volgelingen van T&K die zich afficheren als behavorial economists oftewel gedragseconomen. De eerste groep gaat uit van de rationele beslisser die over alle benodigde informatie beschikt en dan een optimale beslissing kan nemen. Overigens is dat laatste nogal betrekkelijk want economen bedenken steeds nieuwere modellen waaruit blijkt dat het nóg optimaler kan, althans wanneer je hún model toepast. De tweede groep ziet de mens juist als een irrationeel wezen die zich voortdurend laat verleiden tot een of andere cognitieve bias. Gezien de ruim 150 biases die inmiddels zijn ‘ontdekt’, is het eigenlijk verbazingwekkend dat mensen op een of andere geheimzinnige manier meestal toch verstandige keuzes maken. Zoals het eveneens wonderbaarlijk is dat we nog steeds geen perfecte wereld hebben, want economen hebben voor bijna alles een optimale oplossing bedacht. Beide‘raadsels’ kunnen volgens gedragseconomen en neoklassieke modellenbouwers worden opgelost met de accuracy-effort trade-off. Kort samengevat: als je weinig tijd hebt of neemt, gebruik dan een simpele vuistregel, ook welbekend als fast thinking, ‘gezond verstand’ of heuristiek; maar als je een betere beslissing wilt, neem dan een ingewikkeld en slow beslissingsmodel waarin rekening wordt gehouden met de complexiteit van de problematiek.

Fast or slow?

Dit advies wordt echter niet ondersteund door psychologisch onderzoek dat bijvoorbeeld wordt uitgevoerd bij het Berlijnse Max Planck Institute for Human Development, onder leiding van Gerd Gigerenzer. Daaruit blijkt dat mensen in de meeste situaties – en meestal onbewust – allerlei simpele vuistregels gebruiken, en dat deze heuristieken vaak betere resultaten opleveren dan de ingewikkelde modellen en beslisregels die op basis van wetenschappelijk onderzoek tot stand zijn gekomen. Ap Dijksterhuis, hoogleraar aan de Radboud Universiteit, zegt in zijn zeer leesbare boek “Het slimme onbewuste”(2007) iets vergelijkbaars. Als we bewust gaan nadenken komen we vaak tot slechtere beslissingen dan wanneer we ons laten leiden door wat hij het onbewuste noemt. Wat dat onbewuste precies is en hoe het functioneert, daarover is nog weinig bekend. Ook is nog niet helemaal duidelijk in welke situaties het toch beter is om bewust na te denken. Voorlopig bevestigt het onderzoek de stelling van Sigmund Freud dat bewust afwegen van voor- en nadelen de voorkeur geniet bij eenvoudige beslissingen,maar niet bij complexe beslissingen (Dijksterhuis 2007,p. 104).

Waarom wordt dan toch vaak de voorkeur gegeven aan ingewikkelde modellen, oftewel aan slow thinking? In een wereld waarin iedere ‘fout’ (lees: afwijking van de norm)wordt opgeblazen en genadeloos afgestraft, kun je vaak maar beter je gezonde verstand opzij zetten en een beroep op externe adviseurs of interne staffunctionarissen die met een ‘gepast model’ komen. Natuurlijk, dat mag wat kosten, maar het benodigde bedrag hoef je als leidinggevende toch niet zelf te betalen. En als het misgaat, is er altijd nog het beste excuus aller tijden: “de anderen deden het toch ook!”. Naarmate internet en andere (sociale) media het dagelijkse leven binnendringen wordt deze vorm van lafheid alleen maar erger.Want het is makkelijker geworden om snel te weten wat de anderen doen of zeggen, en moeilijker om een onafhankelijke koers te varen.

Van fallacy naar (ecological) validity

Begrijp mij niet verkeerd: ik zie wel degelijk de meerwaarde van de gedragseconomie. Ik heb eerder bepleit om de drie planbureaus om te zetten in een brede variëteit van nieuwe onderzoeksinstituten, en om een daarvan – in navolging van het Britse Behavioural Insights Team – gedragseconomisch onderzoek te laten doen ten behoeve van beleidsvorming op diverse niveaus.Ook heb ik bewondering voor T&K wat betreft hun pogingen om experimentele bevindingen toe te passen voor het verbeteren van de gezondheidszorg, zoals beschreven in hoofdstuk 8 van het boek dat Michael Lewis over deze twee gedreven onderzoekers schreef. Daarin lezen we overigens ook dat T&K zelf nogal twijfels hadden over de betekenis van het anchoring onderzoek (p.192-195).

Mijn kritiek richt zich vooral aan de vooronderstellingen die aan het meeste gedragseconomische onderzoek ten grondslag liggen. De belangrijkste is dat de absolute rationaliteit als norm wordt gekozen; wijk je daarvan af dan vertoon je irrationeel gedrag, zeggen de meeste gedragseconomen in hun academische geschriften. Volgens Nobelprijswinnaar Herbert Simon is dat een verkeerd uitgangspunt. Niet de absolute rationaliteit van de neoklassieke economen moet het vertrekpunt zijn,maar de beperkte rationaliteit waar wij menselijke wezens mee behept zijn.Volgens gedragseconomen nemen wij domme beslissingen omdat wij beperkt rationeel zijn – en kunnen wij daarom beter belangrijke beslissingen over laten aan deskundigen die met ingewikkelde en wetenschappelijk verantwoorde modellenwerken. Onderzoekers als Simon en Gigerenzer daarentegen komen tot een heel andere conclusie en aanbeveling: juist vanwege onze beperkte rationaliteit ontwikkelen wij allerlei slimme heuristieken en die pakken in de praktijk meestal beter uit dan de oplossingen van de zogeheten deskundigen.

Wat we hard nodig hebben is onderzoek naar wat Gigerenzer aanduidt als ecological validity. Daarbij gaat het om de vraag onder welke externe omstandigheden – oftewel: in welk institutioneel ecosysteem – slow thinking beter of juist slechter is dan fast thinking, en welke heuristieken dan de meeste meerwaarde opleveren (en voor welke categorie mensen)? In dit opzicht hebben gedragseconomen nog een lange weg te gaan, en zullen ze veel meer met andere sociale wetenschappers (en met ervaringsdeskundigen) moeten samenwerken dan tot dusver het geval is geweest.

Auteur

Categorieën

Niet gecategoriseerd