De economie van de zwakste schakel
Aute ur(s ):
Haan, M.A. (auteur)
Los, B. (auteur)
Riyanto, Y.E. (auteur)
Haan en Los zijn werkzaam aan de Rijksuniversiteit Groningen. Riyanto is werkzaam aan de National University of Singapore.
m.a.haan@eco.rug.nl
Ve rs che ne n in:
ESB, 89e jaargang, nr. 4432, pagina 207, 30 april 2004 (datum)
Rubrie k :
Consumentengedrag
Tre fw oord(e n):
De prijzenpot van het spelprogramma De Zwakste Schakel zou veel groter kunnen zijn als deelnemers andere beslissingen nemen. Ze
zetten nu vaak te veel op het spel om tegenspelers te overtuigen van hun capaciteiten.
Economie is overal. Voortdurend nemen individuen beslissingen waarbij ze een afweging maken tussen verwachte kosten en baten van
hun mogelijke acties. Economen veronderstellen meestal dat in dergelijke situaties die beslissing wordt genomen waarvan de verwachte
opbrengst zo hoog mogelijk is. In dit artikel toetsen we in hoeverre economische actoren zich inderdaad zo gedragen. Dat doen we aan
de hand van gegevens uit 77 afleveringen van de Britse oerversie van de populaire spelshow De Zwakste Schakel. In deze show nemen
deelnemers met grote regelmaat een ‘bank’-beslissing. Daarbij wordt besloten om een bepaald bedrag veilig te stellen of op het spel te
zetten met de mogelijkheid dat er veel meer wordt verdiend. We tonen aan dat de genomen bankbeslissingen de verwachte opbrengst
van de winnaars (de ‘pot’) niet maximaliseren. Vervolgens bestuderen we of dit toe te schrijven is aan strategisch gedrag.
Het is maar een spelletje
The Weakest Link wordt elke werkdag op BBC 2 uitgezonden. De show startte in het najaar van 2000 en werd al snel enorm
populair, met name door het onconventionele gedrag van quizmaster Anne Robinson. Tientallen landen hebben inmiddels hun
eigen versie van de show. In Engeland geldt het cynische “You are the weakest link. Goodbye!” waarmee elke verliezend
deelnemer wordt weggestuurd, inmiddels als een gevleugelde uitspraak.
Elke show telt negen deelnemers1. Deelnemers krijgen bij toerbeurt een kennisvraag voorgeschoteld. Centraal in de show
staat een ‘keten’ die aan het begin van elke ronde op £0 staat. De keten bestaat uit de bedragen £0, £20, £50, £100, £200,
£300, £450, £600, £800 en £1000. Bij een correct antwoord gaat het bedrag in de keten één stapje omhoog. Bij een fout
antwoord gaat de keten terug naar £0. Voordat een speler een vraag krijgt, heeft deze de mogelijkheid om te ‘banken’: in dat
geval wordt het bedrag op de keten veilig gesteld door het bij de pot op te tellen. Vervolgens gaat ook dan de keten terug naar
£0 en krijgt de deelnemer alsnog een vraag. De moeilijkheidsgraad van een vraag is onafhankelijk van het bedrag dat op de
keten staat, maar vragen worden wel van ronde tot ronde steeds moeilijker. Een ronde eindigt als de tijd om is, of als er in die
ronde een totaal van £1000 gebankt is.
Na elk van de eerste zeven ronden wordt één van de deelnemers door de anderen weggestemd. In ronde 8 zijn er dan nog
twee spelers over. Zij spelen samen nog een korte ronde waarvan de opbrengst wordt verdrievoudigd. Daarna spelen deze twee
spelers een finale. Wie wint, krijgt de pot. De anderen krijgen niets.
Natuurlijk zijn wij niet de eersten die economisch gedrag in spelsituaties onderzoeken2. Met name onder experimenteel economen is dat
een populaire bezigheid. Het voordeel van experimentele economie is dat het gedrag van individuen in een gecontroleerde omgeving kan
worden bestudeerd, zonder verstorende invloeden van buitenaf3. Een nadeel van experimenten kan zijn dat er relatief kleine bedragen op
het spel staan, zodat deelnemers een geringe prikkel hebben om zich daadwerkelijk in te spannen, zodat ze de best mogelijke beslissing
nemen4. Omdat de bedragen die bij spelshows worden uitgekeerd aanmerkelijk hoger zijn dan de bedragen die in laboratoriumstudies op
het spel staan, is een analyse van dergelijke shows helemaal niet zo’n gek idee.
Het ‘banken’ zoals beschreven in het tekstkader is een economische beslissing. Iedere deelnemer is er bij gebaat om de verwachte pot zo
groot mogelijk te maken door op het juiste moment te banken. Bij stelselmatig te vroeg banken zal er per vraag weinig worden verdiend,
bij stelselmatig te laat banken wordt er vaak helemaal geen geld binnengehaald. Deelnemers hebben echter ook een prikkel om anderen
ervan te overtuigen dat ze goede spelers zijn. Goede spelers worden minder snel weggestemd, omdat ze meer aan de pot bijdragen. In
eerste instantie gaan we ervan uit dat bankgedrag van een speler geen invloed heeft op de inschatting door andere deelnemers van de
kwaliteit van deze speler. Als bankgedrag wél invloed heeft op deze inschatting en dus op het stemgedrag, dan zal dat ook invloed
hebben op het optimale bankgedrag van een individuele deelnemer. We komen hier later op terug5.
Het onderzoek
We keken naar 77 afleveringen van The Weakest Link, uitgezonden in de periode van december 2000 tot en met mei 2001. In die
uitzendingen werden in totaal 12.685 vragen gesteld, waarvan 58,6 procent correct werd beantwoord. Er werden 7.427 bankbeslissingen
genomen door 693 deelnemers. De bbc keerde een prijzengeld uit van £180.100.
We onderzoeken eerst of deelnemers de strategie hanteren die de verwachte pot maximaliseert. Voor het gemak zullen we dat de ‘optimale
strategie’ noemen. De optimale strategie hangt af van veel factoren: het bedrag dat momenteel op de keten staat, het bedrag dat in een
bepaalde ronde al is veilig gesteld en de kansen van de verschillende deelnemers om een vraag goed te beantwoorden. Als deelnemers
een optimale strategie hanteren, dan is het onmogelijk met een alternatieve strategie de pot systematisch te vergroten. Mochten we toch
zo’n alternatieve strategie kunnen vinden, dan tonen we daarmee op een eenvoudige manier aan dat deelnemers niet de optimale strategie
hanteren.
Rationele deelnemers?
Met behulp van onze data zijn we nagegaan welke ‘naïeve strategie’ in de door ons geanalyseerde shows de grootste pot zou hebben
opgeleverd. Een ‘naïeve strategie’ heeft de vorm: bank in ronde x alleen wanneer de keten op bedrag y staat en bank bovendien altijd in
de laatste vijftien seconden van een ronde6. Zo’n strategie is naïef omdat een slimme speler het veel beter kan doen door rekening te
houden met alle factoren die we al eerder schetsten. Alle mogelijke naïeve strategieën hebben we geanalyseerd. Er blijken naïeve
strategieën te bestaan die meer opleveren dan wat de deelnemers feitelijk binnenhalen. De beste naïeve strategie is om in de eerste vier
ronden altijd te banken op £200 en in de laatste vier ronden altijd op £20. Deze strategie zou hebben geleid tot een pot van gemiddeld
£2565, tien procent meer dan de deelnemers daadwerkelijk verdienden. In 75 procent van de shows die we bestudeerden, zou deze
strategie tot een grotere pot hebben geleid. Deelnemers aan The Weakest Link hanteren dus niet de bankstrategie die de verwachte pot
maximaliseert. Integendeel, een volstrekt mechanische beslisregel had aanzienlijk meer opgeleverd.
Op basis van bovenstaand resultaat lijken deelnemers niet erg rationeel in hun bankgedrag. Uit onze data blijkt echter dat deelnemers wel
degelijk rekening houden met de stand van zaken op het moment van het nemen van een bankbeslissing.
tabel 1 geeft de bankfrequenties in onze data. Uit de tabel kan bijvoorbeeld worden afgelezen dat er gebankt is in 29,5 procent van alle
gevallen dat er in een tweede ronde £50 op de keten stond. Uit de tabel blijkt dat deelnemers eerder geneigd zijn te banken naarmate er
een hoger bedrag op het spel staat en naarmate de show vordert. Zoals eerder opgemerkt worden in latere rondes vragen steeds
moeilijker. Deelnemers banken dus eerder als de vragen gemiddeld moeilijker zijn.
Tabel 1.Waargenomen bankfrequenties voor gegeven bedragen en rondes, in proporties
£20
ronde
ronde
ronde
ronde
ronde
ronde
ronde
ronde
1
2
3
4
5
6
7
8
0,051
0,073
0,108
0,143
0,161
0,251
0,314
0,650
£50
£100
£200
£300
0,186
0,426
0,545
0,295
0,510
0,736
0,321
0,611
0,732
0,435
0,670
0,507
0,800
0,537
0,756
0,605
0,732
0,587
Ook blijkt dat deelnemers minder snel banken naarmate ze meer weten. Er blijken gemiddeld namelijk meer goede antwoorden gegeven te
worden na een beslissing om niet te banken, dan na een beslissing om dat wel te doen (zie tabel 2)7.
Tabel 2.Waargenomen kans op een goed antwoord, in proportiesa
ronde
na ‘bank’
na ‘niet-bank’
1
0,77
0,80
2
0,66
0,72
3
0,59
0,65
4
0,60
0,63
5
0,54
0,55
6
0,46
0,54
7
0,43
0,51
8
0,47
0,48
a De verschillen zijn niet in elke ronde significant. Gezamenlijk zijn ze dat echter wel.
De verschillen zijn niet in elke ronde significant. Gezamenlijk zijn ze dat echter wel. Deelnemers lijken dus wel degelijk bewuste
afwegingen te maken bij hun bankbeslissing. Ze banken eerder naarmate er meer geld op het spel staat, vragen moeilijker zijn en ze
minder weten. Stuk voor stuk verstandige beslissingen. Toch slagen ze er bij lange na niet in de pot te maximaliseren. Hoe kan dat?
Strategisch bankgedrag
Om meer inzicht te krijgen in hoe het bankgedrag zich verhoudt tot het optimale bankgedrag maken we gebruik van een
computersimulatie. We veronderstellen dat alle deelnemers in een bepaalde show en in een bepaalde ronde dezelfde kans hebben op het
geven van een goed antwoord. We nemen aan dat die kans gelijk is aan wat we in de betreffende show en ronde in de data waarnemen.
Door middel van dynamisch optimaliseren is het mogelijk te berekenen wanneer er gebankt had moeten worden. Als input voor ons
algoritme nemen we de geobserveerde goede en foute antwoorden in onze shows. We laten ons algoritme dus de rondes in de shows
naspelen, maar veranderen de bankbeslissingen, die nu optimaal worden genomen.
Bij elke bankbeslissing die een speler moet nemen, weet deze hoeveel geld er is veilig gesteld en hoeveel geld er op de keten staat. Met
behulp van ons algoritme kunnen we voor die specifieke situatie uitrekenen of de deelnemer wel of niet zou moeten banken. Een
deelnemer kan op twee manieren in de fout gaan: hij of zij kan banken terwijl dat niet optimaal is (te vroeg banken), maar kan ook nalaten
om te banken terwijl banken wel optimaal is (te laat banken).
tabel 3 geeft aan hoe vaak er te vroeg of te laat werd gebankt. Van alle gevallen dat er in ronde 1 volgens ons algoritme niet gebankt had
moeten worden, werd dat in 19,7 procent van de gevallen toch gedaan. In deze gevallen wordt er dus te vroeg gebankt. Van alle gevallen
dat er in ronde 1 wel gebankt had moeten worden, werd dat in 64,0 procent van de gevallen niet gedaan. In deze gevallen wordt er dus te
laat gebankt. Uit de laatste kolom van de tabel blijkt dat er in ronde 1 tot en met 7 relatief veel vaker te laat dan te vroeg wordt gebankt.
De verhouding tussen beide getallen wordt steeds lager. In ronde 8 slaat het beeld volledig om: in die ronde wordt er juist veel vaker te
vroeg dan te laat gebankt.
Tabel 3.Classificatie van bankbeslissingen, in proporties
te vroeg
ronde
ronde
ronde
ronde
ronde
ronde
ronde
ronde
1
2
3
4
5
6
7
8
0,197
0,242
0,269
0,316
0,345
0,399
0,398
0,680
te laat
0,640
0,694
0,736
0,710
0,716
0,655
0,595
0,339
te laat / te vroeg
3,24
2,87
2,73
2,25
2,07
1,64
1,50
0,50
Wat kan het patroon in tabel 3 verklaren? Mogelijke risicoaversie van de deelnemers biedt geen verklaring. De gegevens in de eerste
zeven ronden suggereren dat er juist sprake is van risicozoekend gedrag. Maar als deelnemers zulk gedrag vertonen, dan is er geen reden
om in ronde 8 plotseling om te slaan naar risicomijdend gedrag. Een andere verklaring is zelfoverschatting: mensen zijn vaak geneigd om
hun eigen vaardigheden systematisch te hoog in te schatten6. Dat kan verklaren waarom er in vroege ronden systematisch te laat
gebankt wordt. Maar ook in dat geval is de plotselinge omslag in ronde 8 niet te verklaren.
Seingedrag
Het geobserveerde patroon kan echter wel verklaard worden door strategisch gedrag dat te maken heeft met het wegstemmen van de
kandidaten na iedere ronde. Tot en met de zevende ronde wordt één van de deelnemers door de anderen weggestemd. Meestal is dat de
speler waarvan de indruk bestaat dat deze over de minste kennis beschikt, omdat deze deelnemer weinig zal bijdragen aan de pot. Een
logische verklaring voor het patroon in tabel 3 is dan de volgende. In elke ronde proberen deelnemers zich beter voor te doen dan ze
werkelijk zijn. Ondanks dat ze soms foute antwoorden geven, kunnen ze door hun bankgedrag toch de indruk proberen te wekken dat
zo’n fout antwoord slechts een ongelukkig toeval is en dat ze zelf wel weten dat ze eigenlijk veel beter zijn. Door te laat te banken,
probeert een deelnemer dus een sein (of signaal) te geven dat zijn werkelijke capaciteiten veel groter zijn7. Als alle deelnemers dit gedrag
vertonen, dan zullen we inderdaad zien dat er in ronde 1 veel te laat wordt gebankt. In ronde 2 is de prikkel om laat te banken al in mindere
mate aanwezig. De deelnemers hebben nu immers meer informatie over elkaars kwaliteiten, omdat er al meer vragen zijn beantwoord.
Daarom is er minder gelegenheid de concurrenten voor de gek te houden door laat te banken. Dit patroon gaat door tot en met ronde8.
Deelnemers moeten een afweging maken tussen een zo groot mogelijke pot en het zich voordoen als een uitstekende, alwetende
deelnemer. Naarmate de show vordert, wordt de laatste prikkel steeds minder sterk. We zien dan ook dat er steeds minder vaak te laat
wordt gebankt. Na ronde 8, tenslotte, wordt er niet meer gestemd. In ronde 8 is er dus geen strategische reden meer om laat te banken.
Conclusie
Deelnemers aan het spelprogramma The Weakest Link banken niet op een manier die de verwachte pot maximaliseert. Toch hoeft dit niet
te betekenen dat deelnemers niet rationeel zijn. Ze lijken bewust te laat te banken in een poging andere deelnemers te doen geloven dat
ze beter zijn dan in werkelijkheid het geval is. In feite nemen deelnemers hierdoor te veel risico, waardoor voor de deelnemers gezamenlijk
een ongewenste situatie ontstaat. In die zin is hier sprake van een gevangenendilemma.
Op het eerste gezicht lijkt het alsof deelnemers aan The Weakest Link banken op een manier die verre van optimaal is. Maar als we
strategische overwegingen ook in beschouwing nemen, dan zien die bankbeslissingen er een stuk intelligenter uit.
Marco Haan, Bart Los en Yohanes Riyanto
Dit artikel is gebaseerd op Haan, M.A., B. Los en Y.E. Riyanto, 2004.
Literatuur
Beetsma, R.W.J. en P.C. Schotman (1999) Risico-aversie in Lingo!, ESB, 30 juli 1999, blz. 560-563.
Bénabou, R. en J. Tirole (2002) Self-Confidence and Personal Motivation.
Quarterly Journal of Economics, jrg. 117, nr. 3, blz. 871-916.
Haan, M.A. en P. Kooreman, Meeliftgedrag en collectieve goederen, ESB,
28 juni 2002, blz. 512-514.
Haan, M.A., B. Los en Y.E. Riyanto (2004) “Signaling Strength? An Analysis of Economic Decision Making in The Weakest Link”,
ongepubliceerd. Zie www.eco.rug.nl/~haanma. Alle technische details zijn daar te vinden. Eerdere versies van deze paper
circuleerden onder de titel “The Weakest Link A Field Experiment in Rational Decision Making”.
Levitt, S.D. (2003) Testing Theories of Discrimination: Evidence from “Weakest Link”, NBER working paper 9449.
Offerman, Th. en J.J.M. Potters, Homo Economicus als proefdier, ESB, 5 april 2002, blz. 264-267.
Spence, A.M. (1973) Job Market Signaling. Quarterly Journal of Economics,
jrg. 87, nr. 3, blz. 355-74
1 In de Nederlandse versie zijn dat er maar acht. Onze beschrijving van de regels heeft betrekking op de show zoals die wordt gespeeld
op de BBC. Op hoofdlijnen komt de Engelse show overeen met de Nederlandse versie.
2 We zijn zelfs niet de eersten die gebruik maken van spelshows op tv. Zie bijvoorbeeld R.W.J. Beetsma en P.C. Schotman (1999). Ook
The Weakest Link wordt vaker gebruikt. Zie S.D. Levitt (2003), die toetst of het stemgedrag duidt op discriminatie.
3 Zie bijvoorbeeld Th. Offerman en J.J.M. Potters (2002).
4 Een ander nadeel is dat subjecten in een kunstmatige omgeving worden geplaatst. Die beperking geldt uiteraard ook voor spelshows.
Een natuurlijk experiment waarin subjecten in hun natuurlijke omgeving beslissingen nemen, wordt besproken in M.A. Haan en P.
Kooreman (2002).
5 Merk op dat we in dit artikel alleen kijken naar bankgedrag, niet naar andere vormen van strategisch gedrag.
6 De laatste toevoeging is uiteraard omdat elke vraag gedurende die vijftien seconden de laatste kan zijn.
7 Zie bijvoorbeeld Bénabou, R. en J. Tirole (2002).
8 Dit signaal is kostbaar, omdat het de verwachte opbrengst verlaagt. In die zin is een dergelijk signaal vergelijkbaar met die welke
geanalyseerd worden in bijvoorbeeld A.M. Spence (1973).
Copyright © 2004 Economisch Statistische Berichten (www.economie.nl)