——-Speltheorie in beweging
E.E.C. van Damme en A. Heertje*
D
e speltheorie speelt een niet meer weg te denken rol in de moderne economie. De
toekenning van de Nobelprijs voor economie 1994 aanjohn Nash, john Harsanyi
en Reinhard Selten vormt hiervoor een erkenning.
Het karakter van de economische wetenschap is
door de speltheorie ingrijpend gewijzigd. De theorie
over het micro-economische
keuzegedrag van producenten, consumenten, eigenaren van produktiefactoren, ambtenaren en politici wordt herschreven 1. Geschriften over de industriële organisatie, waarin het
gedrag van marktpartijen wordt geanalyseerd op monopoloïde markten verschillen hemelsbreed van de
publikaties van nog maar tien jaar geleden2. Voor
zover in de macro-economie de monetaire theorie en
de theorie van de internationale betrekkinge.n verschijnselen worden herleid tot individuele beslissingen, worden ook deze beschouwingen vernieuwd3.
In het economische leven onderhouden de subjecten jegens elkaar wederkerige betrekkingen, die
men als conflictsituaties kan typeren omdat meestal
tegenstrijdige belangen worden behartigd. De speltheorie behandelt in het algemeen deze conflictsituaties. Daarbij is het onverschillig of het gaat om een
vriendelijk schaakspel dan wel een onvriendelijke bewapeningswedloop4.
In dit artikel beperken wij ons
tot speltheorie en de economie.
Von Neumann en Morgenstern
Het wiskundige genie John von Neumann5 en de econoom Oskar Morgenstern hebben samengewerkt bij
het maken van het boek Theory of games and economie behavior6. Morgenstern had kennis genomen van
Von Neumanns formele uitwerking van de speltheorie uit 19287 en zag de betekenis voor de economie
direct in8. Het eerste hoofdstuk van hun boek handelt dan ook over consumenten en producenten, volkomen concurrentie, algemeen evenwicht, de meetbaarheid van het nut en de nutsfunctie. De beschouwingen monden uit in het oogmerk een wiskundige
beschrijving te geven van ‘rational behavior for the
participants in a social economy’ en het inzicht dat
de speltheorie daartoe een geschikt instrument is9.
Het geniale van Von Neumann schuilt in het scheppen van een abstracte wereld, waarin spelers strategieën spelen op basis van verwachte uitkomsten, op
elkaar reageren, rekening houden met elkaars verwachtingen en waarin de resulterende onbestemdheid van het gedrag wordt opgeheven door het bestaan van een evenwicht te postuleren. Dit evenwicht
heeft de eigenschap dat de voorspelde acties van de
spelers overeenstemmen
met de werkelijke acties.
Daartoe wordt aan rationeel gedrag de inhoud gegeven, dat elke speler het spel zo speelt dat de individueel verwachte opbrengsten worden gemaximeerd.
Dit uitgangspunt omtrent rationeel gedrag heeft
geleid tot diepgaande studies over beslissingen door
subjecten in bedreigende en onzekere situaties, waarbij met het verfijnen van de theorie vraagstellingen
complexer zijn geworden en het zicht op empirische
toetsing moeilijkerlO. De Nobelprijswinnaars van dit
jaar zetten deze lijn van wat wel wordt genoemd ‘individualism in game theory’ voortll.
• De auteurs zijn hoogleraar economie aan resp. het CentER
van de Katholieke Universiteit Brabant en de Juridische Faculteit van de Universiteit van Amsterdam. Dit artikel is geschreven naar aanleiding van het toekennen van de Nobelprijs voor economie aan John Nash, John Harsanyi en Reinhard Selten voor hun baanbrekende bijdrage tot de speltheorie, in het bijzonder de niet-coöperatieve spelen.
1. Zie bij voorbeeld D.M. Kreps, A course in micro-economie theory, Princeton, 1990.
2. Zie bij voorbeeld]. Tirole, The theory of industrial organization, Cambridge, Mass., 1988; e.G. Krouse, Theory of
industrial economics, Oxford, 1990. Al eerder beperkte
zich ].W. Friechan tot oligopolie, in Oligopoly and the theory of games, Amsterdam, 1977.
3. Zie bij voorbeeld B. Eden, The adjustment of prices to
monetary shocks when trade is uncertain and sequential,
jour;nal of Political Economy, 1994, blz. 493-509. Verder
voorbeelden in R. Gibbons, A primer in game theory,
Hempstead, 1992, blz. 112-115 en 208-210.
4. Zie bij voorbeeld P.e. Ordeshook, Game theory and political theory, Cambridge, 1986; een toepassing op de wereldliteratuur biedt S.j. Brams, Game theory and literature, Games and Economie Behaviour, 1994, blz. 32-54 en M. Shubik, Game theory in the social sciences, Cambridge, 1982.
5. Zie N. Macrae, john von Neumann, New York, 1992.
6.]. von Neumann en O. Morgenstern, Theory of games
and economie behaviour, Princeton, 1944.
7.]. von Neumann, Zur Theorie der Gesellschaftsspiele, Mathematische Annalen, jg. 100, blz. 295-320.
8. Over zijn bijdrage: A. Schotten, Oskar Morgenstern’s contribution to the development of the theory of games, in E.R.
Weintraub (red.), Towards a history ofgame theory, Durham, 1992, blz. 95-112.
9.]. von Neumann en O. Morgenstern, op. cit, blz. 31.
10. Zie bij voorbeeld]. Harsanyi, Advances in understanding rational behavior, in Essays on ethics, social behavior, and scientific explanation, Dordrecht, 1976, blz. 89118; K. Binmore, Essays on the foundations of game theory,
Oxford, 1990; D.M. Kreps, Game theory and economie model/ing, Oxford, 1990.
11. M. Bacharach en S. Hurley (red.), Foundations of decision theory, Oxford, 1991, blz. 4.
l
Speltheorie
De speltheorie kan nu iets nader worden aangeduid
als de formele studie van rationeel gedrag in interactieve conflictsituaties. De conflictsituaties zijn interactief, omdat de individuen zich bij het overwegen van
hun acties realiseren dat zij elkaar over en weer beïnvloeden. Von Neumann en Morgenstern hebben zich
beperkt tot zogenaamde nulspelen, waarbij de winst
van de één precies wordt gecompenseerd door het
verlies van de ander. Daarnaast hebben zij enige aandacht geschonken aan coalitievorming bij grotere
aantallen spelers, zonder daarbij een theorie van het
onderhandelen te ontwikkelen.
Hoewel de speltheorie in de kiem kan worden
opgevat als het instrumentarium voor het analyseren
van het economische proces indien door machtsposities op de markten, de Pareto-optimale wereld van
Adam Smith met volkomen concurrentie op alle
markten, wordt verlaten, ebde het aanvankelijke enthousiasme in de jaren zestig weg. Er waren wel enkele toepassingen op de theorie van het oligopolie,
maar deze bleven toch betrekkelijk onopgemerkt12.
De grote opleving kwam toen het baanbrekende
werk van Nash, die kans zag een evenwichtsbegrip
te formuleren voor alle gevallen waarin de spelers andere dan volledig tegengestelde belangen hebben,
wortel schoot. Sinds zijn bijdragen wordt in de speltheorie onderscheid gemaakt tussen coöperatieve en
niet-coöperatieve spelen. Bij een coöperatief spel
kunnen de spelers bindende overeenkomsten aangaan, bij een niet-coöperatief spel kunnen zij dat
niet. Nash13 heeft met enkele artikelen in de jaren
vijftig de grondslag gelegd voor de verdieping van de
niet -coöperatieve speltheorie en voor de analyse van
coöperatie tussen spelers langs de weg van nietcoöperatieve onderhandelingenl4
Harsanyi en Se!ten
hebben binnen dit raamwerk innovatieve bijdragen
geleverd die de betekenis van de speltheorie voor de
economie aanzienlijk hebben vergroot. In het algemeen is Selten daarbij non-conformistischer gebleken
dan Harsanyi. De drie Nobelprijswinnaars ontvangen
de prijs in het bijzonder voor hun bijdragen aan de
niet-coöperatieve speltheorie, die in de economie de
meeste opgang heeft gemaakt.
Het Nash-evenwicht
In de niet-coöperatieve speltheorie wordt het Nashevenwicht gehanteerd als oplossing. De strategiecombinatie wordt een Nash-evenwicht genoemd, als
geen van de sp”elers een prikkel heeft om van zijn
strategie af te wijken, gegeven dat de andere spelers
niet afwijken. Nash bewees dat elk non-coöperatief
spel ten minste één evenwicht kent, hetzij met zuivere hetzij met gemengde strategieën. In het laatste geval worden niet de acties van de andere spelers voorspeld, maar wel de kansen op uiteenlopende acties.
Het Nash-evenwicht kan worden opgevat als een formele uitwerking van het methodologisch individualisme, daar het voortvloeit uit de aanname dat individuen hun belangen behartigen door het maximeren van
opbrengsten. De duopolietheorie van Cournot is een
speciaal geval van het algemene Nash-evenwicht15
ESB 19-10-1994
Fris op
Economische kennis veroudert snel. De
serie ‘Fris op’ brengt u op de hoogte van
nieuwe ontwikkelingen in de economische
theorie en hun praktische betekenis.
Een simpel voorbeeld kan dienen om dit evenwichtsbegrip te verduidelijken. Stel in een stad zijn
twee winkels die vredig naast elkaar bestaan. De minister van EZ kondigt een verruiming van de openingstijden aan, en de winkeliers moeten besluiten
hun winkels al dan niet langer open te houden. Veronderstel dat in de huidige situatie elke winkelier
een marktaandeel van 50% heeft, dat als slechts één
winkel langer open is deze winkel een marktaandeel
van 65% verwerft en dat de kosten voor het langer
open zijn precies gedekt worden door een stijging
van het marktaandeel met 10%. In dit geval is de situatie waarin geen van beide winkels langer open is
geen evenwicht. De netto winst van een winkel stijgt
als deze als enige langer open is. Beide winkeliers
ondervinden een prikkel om langer open te zijn en
in het evenwicht zullen ze inderdaad beiden de ruime re openingstijden hanteren. Als de concurrent langer open is, is het voor mij optimaal om ook langer
open te zijn. Het gevolg is dat de langere openingstijden voor elke winkel tot een lagere netto winst leiden: het marktaandeel blijft 50%, maar de kosten stijgen. Er is in dit geval sprake van een zogenaamd
prisoner’s dilemma. Het individuele optimum à la
Nash is niet het best bereikbare voor de individuen.
Het prisoner’s dilemma illustreert dat niet kan
worden vertrouwd op de ‘invisible hand’-gedachte
van A. Smith. Door het behartigen van hun individuele belangen komen de spelers niet in de voor hen
beste situatie terecht. Het dagelijks leven biedt een
rijke variatie aan voorbeelden van het dilemma van
de gevangene.
Onvolledige
informatie
Tot 1968 zag de speltheorie geen kans om te gaan
met de praktisch erg relevante situatie, dat de spelers
over onvolledige informatie beschikken.
12. Een goed voorbeeld
is M. Shubik, Strategy and market
stru ctu re, New York, 1959.
13. J. Nash, Equilibrium
points in N-person games, Proceedings NationaI Academie Sciences, jg. 39, 1950, blz. 48-49;
idem, Non-cooperative games, Annals of Mathematics, jg.
54, 1951, blz. 286-295; idem, The bargaining problem, Econometrica, 1950, blz. 150-162 en Two persons cooperative
games, Econometrica, 1953, blz. 128-140.
14. K. Binmore (red.), The economics ofbargaining, Oxford, 1987 en M.J. Osborne en A. Rubinstein, Bargaining
and markets, New York, 1990.
15. A.A. Cournot, Recherches sur les principes mathématiques de la théorie des richesses, Parijs, 1838, blz. 88-100 en
A.F. Daughety (red.), Cournot oliROPO~Y,
Cambridge, 1988.
-In drie artikelen in het tijdschrift
Management Scienee liet John Harsanyi zien hoe spelen met onvolledige informatie omgezet kunnen
worden in spelen met volledige informatie, en hoe deze geanalyseerd
kunnen worden16. Daarvoor werden deze spelen als onoplosbaar
beschouwd omdat ze aanleiding geven tot ‘infinite regress’ van reciproke verwachtingen. Beschouw als
simpel voorbeeld de onderhandelingen tussen een koper en verkoper
van een huis. De verkoper is onzeker over de prijs die de koper bereid is te betalen, de koper is onzeker over de prijs die de verkoper
wil hebben. Deze onzekerheid kan de eerste-orde
verwachting genoemd worden. De koper is echter
ook onzeker over de onzekerheid van de verkoper,
en omgekeerd heeft ook de verkoper tweede-orde
onzekerheid. Zo is er derde-orde onzekerheid, enz.
Harsanyi hakt deze gordiaanse knoop door door een
fictieve loterij bij het begin van het spel in te voeren
die iedere speler zijn informatie geeft. Ter illustratie
volgt hier het voorbeeld van Akerlof17.
Beschouw onderhandelingen over de verkoop
van een gebruikte auto. De verkoper weet of deze
auto nog in goede staat is of niet, de potentiële koper moet afgaan op allerlei gebrekkige signalen over
de kwaliteit, zoals het motorgeluid, de kilometerstand en de staat van de carrosserie. Er is sprake van
asymmetrische informatie: de verkoper weet meer
dan de koper, Veronderstel, eenvoudigheidshalve,
dat de auto ofwel het snel zal begeven, ofwel dat
deze in perfecte staat is. In het eerste geval is de auto
voor zowel de koper als verkoper niets waard. In het
tweede geval is de auto bij voorbeeld f 6.000 waard
voor de verkoper terwijl deze f 8.000 waard is voor
de koper. De verkoper kent de waarde, de koper
kent deze niet. Welke prijs moet de koper nu bieden?
De belangrijkste observatie van Harsanyi is dat de koper zijn probleem alleen dan kan oplossen als hij in
staat is aan te geven met welke kans de auto van goede, dan wel van slechte kwaliteit is. Omgekeerd
geldt dat zodra deze kans bekend is, het probleem
eenvoudig is. Als we de kans dat de auto goed is met
p aangeven dan is de verwachte waarde van de auto
8.000p. De koper moet zeker niet meer dan de verwachte waarde bieden. Anderzijds weet de koper dat
als hij minder dan f 6.000 biedt, de verkoper van de
auto met goede kwaliteit altijd zal weigeren te verkopen. Om te voorkomen dat hij een kat in de zak
koopt, moet de koper dus minstens f 6.000 bieden.
De conclusie is dat een (risico-neutrale)18 koper f
6.000 moet bieden als 8.000p 2: 6000 (dus p 2: 0,75)
en dat de koper geen bod moet uitbrengen als hij de
kans dat de wagen slecht is op minstens 25% inschat.
Harsanyi betoogt in dit geval dat het probleem onvolledig gespecificeerd is als de kansinschatting van de
koper ontbreekt. Hij betoogt meer in het algemeen
dat rationele (Bayesiaanse) spelers altijd in staat zullen zijn zulke kansinschattingen te maken, en dat ver-
schillende rationele spelers tot dezelfde kansinschatting zullen komen. Het spel waarin deze kansinschattingen volledig gespecificeerd zijn, is met de gebruikelijke technieken in de vorm van Nash-evenwichten
op te lossen en dus is het volgens Harsanyi geen enkel probleem om situaties met onvolledige informatie
te modelleren en te analyseren. Merk overigens op
dat er een belangrijk verschil is tussen situaties met
volledige en onvolledige informatie. Indien informatie volledig is, is er geen enkele reden om aan te nemen dat onderhandelingen niet tot een efficiënte uitkomst leiden. Dit is ook de inhoud van het zogenaamde Coase-theorema, een van de bijdragen waarvoor RonaId Coase in 1991 de Nobelprijs kreeg19
Zodra informatie onvolledig is, kunnen we geen efficiëntie meer verwachten: als p < 0,75 dan zal een verkoper van een auto van goede kwaliteit de koper er
niet van kunnen overtuigen dat de auto inderdaad
goed is (een verkoper van een ‘lemon’ zal immers
even overtuigende argumenten brengen) en bijgevolg zal een transactie niet tot stand komen. Informatieproblemen zijn dus een bron van transactie kosten
en met behulp van de speltheorie is de onderzoeker
in staat deze transactiekosten te kwantificeren, dat
wil zeggen er kan berekend worden hoeveel procent
efficiëntieverlies veroorzaakt wordt door asymmetrische informatie.
Informatieproblemen staan centraal in een groot
deel van de moderne economische literatuur. Hoewel de eerste artikelen op dit gebied van Akerlof,
Hayek, Rothschild en Stiglitz en Spence geen gebruik
maakten van het speltheoretisch instrumentarium en klaarblijkelijk Harsanyi’s bijdrage dus niet onmisbaar was – kan toch gesteld worden dat Harsanyi’s
bijdrage in belangrijke mate aan het momentum
heeft bijgedragen. Harsanyi’s algemene formulering
heeft economen in staat gesteld te zien hoe wijd verbreid problemen van adverse selectie (verborgen informatie) en moreel risico (verborgen acties) zijn, en
welke drastische consequenties deze kunnen hebben. Een belangrijk toepassingsgebied zijn veilingsituaties gebleken. Bij een veiling is de verkoper
onvolledig geïnformeerd over hoeveel een koper
bereid is te betalen, terwijl iedere koper onvolledig
geïnformeerd is over hoeveel elk van zijn concurrenten bereid is te betalen. Het probleem van een koper
(hoeveel te bieden?) alsmede het probleem van de
verkoper (welke veilingmethode levert de hoogste
prijs op) kan met de technieken van Harsanyi worden gemodelleerd en opgelost. Een zeer recente toepassing is de veiling van etherfrequenties in de VS
waarbij zowel de regering (in concreto, de Federal
16. J. Harsanyi, Games with incomplete information played
by Bayesian players, Management Science, jg. 14, 1968, blz.
159-182,320-332 en 468-502. Harsanyi bedankt Selten voor
zijn essentiële bijdragen. Zie ook zijn boek. Rational hehavior and hargaining equilibrium in games and social situations, Cambridge, 1977.
17. G. Akerlof, The market for lemons, Quater(v journalof
Economics, jg. 84, 1970, blz. 488-500. 18. Hoe meer risicoavers de koper is, hoe lager de kans dat de transactie tot
stand komt.
19. R.H. Coase, Thefirm, the market and the laU’, Chicago,
1988.
Communications, FCC) als de zenders zich uitgebreid
door teams van toonaangevende speltheoretici lieten
adviseren, dit om te voorkomen wat in Nieuw-Zeeland gebeurde, waar een frequentie werd toegewezen voor $6 terwijl $60.000 geboden was. Zoals The
Economist hierover opmerkte: “As game theorists will
teil you, the more complex the problem, the higher
the costs of using a simple approach,,2o
Dynamische spelen
Als we Harsanyi’s bijdrage karakteriseren als ‘het uitbreiden van het Nash-evenwichtsconcept tot spelen
met onvolledige informatie’ dan kunnen we die van
Selten samenvatten als ‘het uitbreiden van het Nashevenwicht tot dynamische spelen’, dat wil zeggen tot
spelen waarin de spelers meerdere zetten doen. Nash
had aan deze uitbreiding geen aandacht gegeven, vermoedelijk omdat hij uitging van de geldigheid van
het normalisatie-principe van Von Neumann en Morgenstern, een principe dat zegt dat bij elk dynamisch
spel een ‘equivalent’ statisch spel geconstmeerd kan
worden. Selten liet echter zien dat dit principe problematisch is. Hoewel de Nash-evenwichten van een dynamisch spelovereenstenen
met de Nash-evenwichten van het bijbehorende genormaliseerde (statische)
spel, zijn niet alle statische evenwichten ‘redelijk’ in
het dynamische spel. Sommige evenwichten verkrijgen hun stabiliteit namelijk slechts doordat ze op ongeloofwaardige dreigingen bemsten. Selten is erin geslaagd een nauwkeurige formele karakterisering te
geven van welke dreigingen ongeloofwaardig zijn en
welke evenwichten bijgevolg onredelijk zijn. In 1965
introduceerde hij het begrip ‘deelspel perfecte evenwichten’, dat hij in 1976 nog verder verfijnde tot perfecte evenwichten21. Hoewel later onderzoek heeft laten zien dat deze evenwichten toch niet zo perfect
zijn als de naam suggereert, en sindsdien nog andere
evenwichtsbegrippen zijn ingevoerd, kan toch gesteld worden dat Seltens oorsponkelijke concept een
doorbraak betekende. Het is dan ook dit concept dat
in de micro-economie en in de theorie van de industriële organisatie de meeste toepassingen heeft gevonden. Een eenvoudig voorbeeld volstaat om de essentiële ideeën te illustreren.
Veronderstel dat twee vliegtuigbouwers (noem ze
Fen 0) overwegen een vliegtuig voor de middellange afstand te ontwikkelen. F kan zijn ontwerp baseren op een bestaand model, met als gevolg dat de
ontwikkelingskosten relatief laag zijn en dat het nieuwe model binnen 3 jaar op de markt kan zijn. 0
moet van de grond af beginnen en kan zijn vliegtuig
pas op z’n vroegst over 5 jaar in de lucht hebben. De
ontwikkelingskosten voor 0 zijn bovendien hoger. 0
heeft echter het voordeel dat deze ontwikkelingskosten intern gefinancierd kunnen worden. F heeft liquiditeitsproblemen en moet een bank, B, benaderen
om de ontwikkelingskosten te financieren. De marktopinie is dat beide vliegtuigen even goed zullen zijn
en dat het marktsegment een natuurlijk monopolie is,
met andere woorden als slechts één producent op de
markt actief is dan maakt deze winst; als beide producenten actief zijn, zijn beide projecten verliesgevend.
Op het moment dat F de bank B benadert, dreigt 0,
ESB 19-10-1994
onafhankelijk van wat F zal doen,
een concurrerend toestel op de
markt te brengen. In vriendelijke bewoordingen maakt 0 duidelijk dat
B het project van F maar beter niet
kan financieren omdat dit project
toch verliesgevend zal zijn. Wat
moet B doen? Als de dreiging inderdaad uitgevoerd zal worden is het
beter geen geld te investeren, maar
als 0 niet op de markt komt, is het
project van F winstgevend. Is de
dreiging van 0 geloofwaardig? Het
antwoord is nee. Als B financiert zal
F als eerste op de markt zijn. 0
wordt dan geconfronteerd met een
fait accompli en heeft de keuze tusJohn Harsanyi
sen niet op de markt komen (geen winst, maar
ook geen verlies) of ook tot de markt toetreden. Omdat het laatste verliesgevend is zal 0 eieren voor zijn
geld kiezen en niet toetreden. De dreiging is niet geloofwaardig; als B rationeel is negeert hij deze, hij
kan met een gem st hart investeren. Het enige deelspel perfecte evenwicht is ‘B financiert, alleen F is op
de markt actief’. Deze situatie is ook een Nash-evenwicht. Echter de situatie ‘B financiert niet en alleen 0
treedt toe’ is ook een evenwicht. Het evenwichtsconcept van Nash is nu onbevredigend omdat het geen
onderscheid maakt tussen geloofwaardige en ongeloofwaardige dreigingen. Seltens perfectheidsbegrip
elimineert het evenwicht waarin 0 toetreedt, het adviseert B de dreiging van 0 niet serieus te nemen22
Selectie van evenwichten
De meeste non-coöperatieve spelen hebben meer
dan één Nash-evenwicht. Er zijn derhalve voor de
spelers verscheidene rationale acties. Het doen van
een keuze uit deze verzameling is een hachelijke
zaak. Het probleem illustreren we weer met een voorbeeld.
Beschouw Cmsoë die net Vrijdag op zijn eiland
ontdekt heeft. Stel dat Cmsoë een uitstekend jager is
en Vrijdag een prima visser. Omgekeerd geldt dat vissen Crusoë slecht afgaat en dat Vrijdag geen geweer,
noch pijl en boog kan hanteren. Als Cmsoë (Vrijdag)
20. Revenge of the nerves, The Economist, 23 juli 1994.
21. R. Selten, Spieltheoretische
Behandlung eines Oligopolmodels mit Nachfragetragheit,
Zeitschrift für die gesammte
Staatswissenschaft, jg. 121, 1965, blz. 301-324,667-689;
idem, Reexamination of the perfectness concept for equilibrium points in extensive games, Internationaljournal of
Game lbeory, jg. 4, blz. 25-55.
22. Selten heeft een goede toelichting op zijn werk gegeven
in R. Selten, In search of a better understanding of economie behaviour, in A. Heertje (red.), lbe makers of modern
economics, New York, 1993, blz. 115-139. Over verfijningen
van het Nash-evenwieht ook E. van Damme, Stability and
perfection of Nash equilibria, tweede druk, Berlijn, 1991 en
E. Kohlberg, Refinement of Nash equilibrium: the main ideas, in T. Ichiishi, A. Neyman en Y. Tauman (red.), Game
theory and applications, New York, 1990, blz. 3-45.
23. Dit volgt uit Cobb-Douglas preferenties, die hier worden aangenomen.
5
N
-+–f—seert.
5
3,3
0,2
_-+ __ +-__
N
2,0
2,2
zich specialiseert vangt hij 6 dieren (vissen), als hij
zijn tijd verdeelt, vangt hij 2 van elk23 Crusoë en Vrijdag moeten besluiten of ze zich zullen specialiseren
en dan via handel in hun behoeften zullen voldoen,
of dat ze ‘self-supporting’ zullen blijven. Er zijn twee
evenwichten: ze kiezen elk zich te specialiseren, of
ze kiezen elk ervoor om dat niet te doen. Als Crusoë
zich specialiseert, zal Crusoë willen handelen en is
het optimaal voor Vrijdag omdat ook te doen: als Vrijdag zich ook specialiseert zal hij 3 vissen en 3 dieren
kunnen consumeren in plaats van 2. Als Crusoë zich
echter niet specialiseert dan heeft Crusoë geen interesse in meer vissen, hij zal niet willen handelen en
bijgevolg is het voor Vrijdag optimaal om ook selfsupporting te zijn. Het is duidelijk dat het specialisatie-evenwicht het autarkie-evenwicht Pareto domineert.
Echter specialisatie is riskant; het nut van individu i is gelijk aan nul als uitsluitend i zich specialiDit wordt ook weergegeven in de nevenstaande spelmatrix. De rijen zijn de acties van Crusoë
(specialisatie, of niet), de kolommen die van Vrijdag.
De getallen in de matrix geven eerst het nut van Crusoë, dan dat van Vrijdag.
In de terminologie van Harsanyi/Selten is het autarkie-evenwicht (N,N) risico-dominant. Er is in dit
spel dus sprake van een conflict tussen selectie op
basis van risico-dominantie en selectie op basis van
Pareto-dominantie. In hun boek over evenwichtsselectie geven Harsanyi en Selten een algemene definitie van het begrip risico-dominantie24 De definitie is
gebaseerd op de zogenaamde ‘tracing procedure’,
een wiskundig model voor een gedachten proces
waarmee de spelers een initiële situatie die niet noodzakelijk een evenwicht is transformeren in een evenwichtssituatie. In essentie bestaat de selectietheorie
van Harsanyi en Selten uit twee delen: CD een theorie
over hoe de spelers hun initiële verwachtingen vormen (de kern van deze theorie is een versie van het
‘principle of insufficient reason’ dat op Laplace teruggaat) en (ij) de ‘tracing procedure’ die deze à priori
verdeling omvormt tot een evenwicht. De theorie beschrijft dan hoe met behulp van risico- en Pareto-dominantie een uniek evenwicht, de oplossing van het
spel, bepaald kan worden. Een belangrijke eigenschap van de theorie is dat voor simpele onderhandelingsproblemen de oplossing overeenstemt met de
oplossing zoals deze reeds door Nash voor deze klasse van spelen bepaald was. Ook op dit punt geldt
dus weer dat de theorie van Harsanyi en Selten een
uitbreiding van die van Nash is.
Het is interessant op te merken dat in het conflict
tussen risico-dominantie en Pareto-dominantie, Harsanyi en Selten dit laatste criterium een hogere prioriteit toekennen. In zekere zin is deze keuze ad hoc,
en eigenlijk had Selten een voorkeur voor een theorie die uitsluitend op risico-dominantie gebaseerd is.
Omdat Harsanyi niet wilde toegeven en omdat het
toch al 20 jaar geduurd had voordat het boek uitkwam, heeft Selten uiteindelijk toegegeven. Echter in
de appendix van het boek geven de auteurs reeds
aan dat hun theorie niet de enige mogelijke theorie
van rationeel gedrag is. Het boek bewijst dat het mogelijk is perfect rationeel gedrag op consistente wijze
te definiëren, het begrip is dus niet inhoudsloos. Het
kan echter op alternatieve manieren worden ingevuld, en op het Nobel-symposium van juni vorig jaar
hebben Harsanyi en Selten elk een alternatieve theorie voorgesteld. Deze theorieën worden binnenkort
in het tijdschrift Games and Economie Behavior gepubliceerd25
Quo vadis?
Het begrip ‘perfecte rationaliteit. is intern consistent,
maar wat is de relevantie van dit begrip voor de praktijk van alledag? Wat is de relevantie van de speltheorie – die immers op dit begrip is gebaseerd – voor
deze praktijk? De veronderstelling van perfecte rationaliteit zal in sommige gevallen een betere benadering van de werkelijkheid zijn dan in andere, en bijgevolg zullen voorspellingen of aanbevelingen die op
deze veronderstelling zijn gebaseerd in sommige gevallen beter zijn dan in andere.
Het is niet moeilijk voorbeelden te verzinnen
waarin deze veronderstelling tot onzinnige uitkomsten leidt. De Nobelprijswinnaars zelf hebben vermoedelijk de beste voorbeelden gegeven. In een van
zijn artikelen behandelt Selten bij voorbeeld de zogenaamde ‘paradox van de winkelketen,26. De paradox
kan duidelijk maken dat er geen enkele speltheoreticus te vinden is die zonder meer in de voorspellingen van de speltheorie gelooft. Bij het spel zijn drie
spelers betrokken. Een speltheoreticus (S), een speler (0) die in de oneven ronden aan de beurt is, en
een speler (E) die in de even ronden aan zet is. Het
spel duurt maximaal 25 ronden. In de eerste ronde
zet Sf 1,- in en heeft 0 de mogelijkheid het spel al
dan niet te beëindigen. Als 0 het spel stopt krijgt hij
3/5 van de pot (nuf 1,-) en E krijgt de rest (S verliest
dusf 1,-). Als het spel in de tweede ronde komt, verdubbelt S de pot. Nu heeft E de keuze tussen het
spel te stoppen (hij krijgt dan 3/4 van f 2) of door te
gaan. Als hij het laatste kiest, verdubbelt S de pot
weer en is 0 weer aan de beurt. Zo gaat het spel
door tot een van de spelers stopt, of tot 25 rondes gespeeld zijn. Als in deze laatste ronde 0 het spel stopt
krijgt hij 3/4 x 225 = f 25 miljoen, terwijl E danf 8,3
miljoen krijgt. Als 0 het spel dan nog niet stopt, krijgen beide spelers niets. De rationele oplossing van
dit spel is eenvoudig te bepalen. In de vijfentwintigste ronde zal 0 het spel zeker stoppen. Als de vierentwintigste ronde bereikt wordt, heeft E de keuze tus24
sen stoppen, dat levert hem 3/4 x 2 op, doorgaan
25 op. Het eerste is meer, bijgevolg zal E
levert 1/4 x 2
het spel stoppen als de 24e ronde bereikt wordt.
Maar dan zal 0 het spel reeds in de 23e ronde stoppen; en door deze redenering voort te zetten zien we
dat 0 het spel meteen in de eerste ronde zal stop-
24. J. Harsanyi en R. Seten, A genera I theory of equilibrium
selection in games, Cambridge, 1988.
25. J. Harsanyi, A new theory of equilibrium select ion for
games with complete information en R. Selten, An axiomatic theory of a risk dominanee measure for bipolar games
with linear incentives.
26. R. Selten, The chain store paradox, 7beory and Decision, jg. 9, 1978, blz. 127-159.
pen. Als E en 0 rationeel zijn (liever gezegd als ze ‘rational fools’ zijn) dan kan de speltheoreticus dus
nooit meer dan! 1,- kwijt zijn. Als de speltheoreticus
rationeel is en de keuze heeft tussen (a)! 100 krijgen
en gedwongen zijn als geldschieter S te fungeren in
het bovenstaande spel en (b) niets te krijgen, maar
ook geen verplichtingen aan te gaan, dan zou hij dus
(a) moeten kiezen. We moeten de eerste speltheoreticus nog zien die deze keuzes maakt.
Het voorbeeld maakt duidelijk dat we niet op de
rationaliteit van individuen kunnen vertrouwen en
dat het soms verstandig kan zijn om (te pretenderen)
niet rationeel te zijn27. Maar in welke situatie is de
veronderstelling van rationaliteit dan wel toepasbaar,
en wat moeten we doen in situaties waarin deze niet
toepasbaar is? Harsanyi en Selten verschillen over het
antwoord op deze vragen van mening. Selten heeft
duidelijk minder vertrouwen in de theorie dan Harsanyi. Terwijl Harsanyi de theorie van perfect rationaal
gedrag verder verfijnde, probeerde Selten een theorie
van begrensde rationaliteit te ontwikkelen.
Volgens Seltens theorie kan een beslissing op drie
niveaus tot stand komen: door routine, verbeelding
of analyse. Hogere niveaus vereisen meer inspanning
en leiden bovendien niet altijd tot betere resultaten
omdat denkprocessen niet onfeilbaar zijn. Bijgevolg
kan het rationeel zijn hogere beslissingsniveaus niet
te activeren, en zelfs als ze geactiveerd zijn, kan het
optimaal zijn een beslissing die gesuggereerd wordt
door een lager niveau te implementeren. Toen Selten
zijn ‘chain store paper’ aan een leidinggevend tijdschrift aanbod, vroeg de referee het tweede gedeelte
van het artikel te elimineren omdat hij het als irrelevant beschouwde. Selten weigerde omdat hij juist dit
gedeelte belangrijk vond. Hierdoor verscheen het artikel pas veel later in een minder prestigieus tijdschrift.
Opnieuw een voorbeeld van ‘how the mighty have
fallen,28 Zelfs nu is het nog zo dat praktisch alle verwijzingen naar Seltens artikel uitsluitend op de eerste
helft betrekking hebben.
Een klassiek economisch argument ter rechtvaardiging van de veronderstelling van rationaliteit is gebaseerd op natuurlijke selectie: rationele individuen
zullen succesvoller zijn dan individuen die niet perfect rationeel zijn en bijgevolg zal de eerste groep de
laatste verdringen. Het bovenstaande voorbeeld heeft
laten zien dat dit in een speltheoretische context niet
juist hoeft te zijn. Onderzoek naar de vraag in welke
situatie het argument dan wel geldt heeft aan het
licht gebracht dat speltheoretische technieken en concepten ook op het gebied van de biologie goed toetasbaar zijn. Het door de bioloog voorgestelde begrip
van ‘evolutionair stabiele strategieën’ blijkt niets anders te zijn dan een Nash-evenwicht met een bepaalde extra stabiliteitseigenschap29 In een biologische
context heeft men echter het voordeel dat men de beschikking heeft over een expliciet dynamisch proces natuurlijke selectie – waarmee het evenwicht (eventueel) bereikt wordt. Momenteel wordt onderzocht of
deze processen ook in de economie toepasbaar zijn.
Reinhard Selten is de drijvende kracht achter deze onderzoekslijn. Het ligt in de lijn der verwachting dat
dit onderzoek tot een verdere stimulans van de evolutionaire economie zal leiden.
ESB 19-10-1994
Een tweede rechtvaardiging is
dat, als individuen voldoende ervaring met een bepaalde situatie kunnen opbouwen, zij op den duur zuIlen leren hoe perfect rationeel te
handelen. Dit argument is ook
reeds in het (ongepubliceerde)
proefschrift van Nash terug te vinden. Nash geeft twee rechtvaardigingen voor zijn evenwichtsbegrip. De
eerste is dat alleen een theorie die
een Nash-evenwicht voorschrijft
niet zelfvernietigend is. In de tweede interpretatie is het volgens Nash
onnodig om aan te nemen dat spelers volledig geïnformeerd zijn of de
mogelijkheid of neiging hebben om
Reinbard Selten
complexe redeneringen te volgen. Als de participanten empirische informatie kunnen opbouwen
over de relatieve aantrekkelijkheid van de acties die
zij ter beschikking hebben, dan moet, als het proces
een stabiele toestand bereikt, de eindtoestand een
Nash-evenwicht zijn. Omdat in het gepubliceerde
werk van Nash deze tweede rechtvaardiging niet genoemd werd, heeft deze tot voor kort weinig aandacht gekregen. In de laatste paar jaar echter staat
juist deze tweede manier van aanpak centraal. Het
actiefste onderzoeksgebied binnen de speltheorie
concentreert zich op de vragen: welke leerprocessen
leiden tot stabiele uitkomsten, en: welke Nash-evenwichten zijn stabiele uitkomsten van leerprocessen?
Slot
Uit de moderne economie is de speltheorie niet meer
weg te denken30 Voortreffelijke leerboeken zagen
reeds het licht31. Al deze werken weerspiegelen de
enorme invloed die van de Nobelprijswinnaars is uitgegaan. Het overheersende beeld is dat de voorlopige antwoorden op oude vragen, tal van nieuwe vragen oproepen, speciaal over de rationaliteit van ons
handelen. Blijkens een telefoongesprek met een van
ons (AH) vertrouwt Selten daarbij niet langer alleen
op de speltheorie, maar zoekt hij alweer naar nieuwe
wegen. Voor ons allen een lichtend voorbeeld.
Eric van Damme en Arnold Heertje
27. A. Sen, Rational fools: a critique of the behavioral assumption of economie theory, Philosophy and Public A.f
fairs, jg. 6, 1977 en R.J. Aumann, Irrationality in game theory, in Economie anaZvsis of markets and games, 1993.
28.]. Gans en G. Shephard, How are the mighty fallen: rejected articles by leading economists, Journalof Economie
Perspectives, jg. 8, 1″994,blz, 165-179.
29. ].M. Smith, Evolution and the theory of games, Cambridge, 1982.
30. Een aardig voorbeeld is W. Kanning, Economische
macht, Amsterdam, 1991, waarin economische macht speltheoretisch wordt geanalyseerd.
31. ].W. Friedman, Game theory with applications to economics, Oxford, 1989; R.B. Myerson, Game theory, Cambridge, Mass., 1991; o. Fudenberg en]. Tirole, Game theory, Cambridge, 1991; K. Binmore, Fun and games, Lexington, Mass., 1992; M.J. Osborne en A. Rubinstein, A course
in game theory, Cambridge, Mass., 1994; E. Rasmusen, Games and information, tweede druk, Oxford, 1994.