Mouter en De Vries (2026) stellen voor om welvaartseffecten in de MKBA op andere wijze te incorporeren. Hiertoe willen ze preferenties van beleidsaanpassingen, in hun woorden, ‘collectief’ meten, in plaats van individueel. Aan de voorgestelde methode kleven echter fundamentele problemen.
Op deze blog is een reactie van Niek Mouter en Martijn de Vries verschenen
Om de impact van beleidsplannen goed in te schatten, wordt vaak een maatschappelijke kosten-batenanalyse (MKBA) gemaakt. Om hierin transparante en consistente afwegingen te kunnen maken, worden effecten op de welvaart zo goed mogelijk in kaart gebracht, en onderling vergelijkbaar gemaakt door ze in dezelfde eenheid (geld) om te rekenen.
Een uitdaging is om de MKBA-systematieken en -rapportages te vernieuwen zodat ze beter aansluiten bij brede welvaartsafwegingen. De Raad voor de Leefomgeving en Infrastructuur (Rli, 2024) noemt met name het (beter) inzichtelijk maken van verdelingseffecten, en het beter rechtdoen aan effecten die moeilijk te kwantificeren en/of monetariseren zijn.
In een recent ESB-artikel pleiten Mouter en De Vries (2025) ervoor om voor moeilijk kwantificeerbare effecten gebruik te maken van wat zij ‘collectieve betalingsbereidheid’ noemen. Daarbij stellen zij voor om referendum-achtige vragen te stellen, waarbij respondenten aangeven welke keuze zij vinden dat een overheid zou moeten maken tussen alternatieve beleidsvormen die verschillen in uitkomsten. Een van de verschillen tussen de alternatieven is een belasting, zodat andere effecten in geld kunnen worden uitgedrukt. Een dergelijk electoraal perspectief op economische waardering is om verschillende redenen een slecht idee. In deze blog bespreek ik er vier die te maken hebben met de manier van waarderen op zichzelf.
Individuele versus collectieve betalingsbereidheid
Wat Mouter en De Vries bedoelen met ‘collectieve betalingsbereidheid’ wijkt af van wat het betekent in de basistheorie van publieke goederen. Varian (2010) legt uit dat de gezamenlijke betalingsbereidheid voor een publiek goed de som is, over individuen, van hun individuele betalingsbereidheid. De individuele betalingsbereidheid drukt daarbij de voorkeuren van een individu uit in de hoeveelheid geld die voor die persoon exact zou compenseren voor een verandering in de hoeveelheid van het betreffende goed. Er is dus sprake van een ‘afruilbereidheid’ voor het individu, waarmee welvaartseffecten die van nature verschillende eenheden kennen (bijvoorbeeld decibellen geluidsdruk of uren tijdswinst) in een MKBA vergelijkbaar worden gemaakt door ze in dezelfde eenheid (euro) uit te drukken. Voor een puur publiek goed – neem vrijwaring van geluidsoverlast in een bepaald gebied – is de collectieve betalingsbereidheid volgens de basistheorie de sommatie, over de relevante individuen, van die individuele betalingsbereidheid.
Mouter en De Vries definiëren de ‘collectieve betalingsbereidheid’ anders, namelijk als de afruilbereidheid die respondenten in (enquête-)onderzoek naar stated preference hebben aangegeven tussen een verandering in een bepaalde beleidsuitkomst – bijvoorbeeld geluidsoverlast – en een belasting per huishouden. Die afruilbereidheid wordt afgeleid door mensen meermaals tussen beleidsopties te laten kiezen, alsof het een serie referenda betreft. De ratio’s van de schattingscoëfficiënten geven daarmee inzicht in hoe de stemverhoudingen in een referendum zouden verschuiven bij aanpassingen van de beleidsvoorstellen – óók een interessante vraag, maar niet leidend tot waarderingskengetallen die in een MKBA systematiek bruikbaar zijn.
Het electorale perspectief van Mouter en De Vries leidt namelijk om verschillende redenen tot problemen als de gemeten preferenties worden gebruikt in een MKBA.
Egoïsten tellen zwaarder mee in de waardering
Een eerste fundamenteel probleem is dat de belangen van egoïsten zwaarder zullen wegen dan van meer sociaal ingestelde mensen. Stel dat er slechts twee personen (A en B) zijn en we verder vereenvoudigende aannames maken die, zoals hieronder zal blijken, eigenlijk gunstig zijn voor de voorgestelde methode. A en B kennen elkaars preferenties perfect. Er zijn geen merit good-overwegingen, geen externe (spill-over-)effecten, er is geen free-riding in de gehanteerde belasting, en A en B antwoorden eerlijk en niet-strategisch, gegeven hun visies.
Personen A en B kennen twee verschillen. Ten eerste verschilt hun waardering voor het goed, bijvoorbeeld de waardering van geluidsoverlast van een snelweg. Persoon A ervaart het geluid als zeer negatief, terwijl B er minder problemen mee heeft. Ten tweede gedraagt A zich als een zuivere egoïst die alleen zijn eigen voorkeuren weegt en dus puur vanuit eigen belang kiest (“Wat zou voor mij het fijnst zijn?”), terwijl B juist vindt dat de overheid bij elke beslissing iedereen even zwaar zou moeten laten meewegen, en ook volgens dat principe ‘sociaal’ kiest (“Wat denk ik dat voor ons gezamenlijk de beste uitkomst is?”). Op de enquêtevraag “Wat vindt u dat de overheid zou moeten doen?” weegt A alleen zijn eigen voorkeuren, en B het gemiddelde van de voorkeuren van A en zichzelf.
In de door Mouter en De Vries gebruikte ‘collectieve betalingsbereidheid’ wegen de individuele voorkeuren van persoon A dan drie keer zo zwaar mee als die van persoon B (namelijk volledig bij de keuzes van A en voor de helft bij de keuzes van B, terwijl de eigen voorkeuren van B alleen voor de helft in B’s eigen keuzes meetellen).
Uiteraard is er veel te zeggen voor het wegen van voorkeuren; zo zal het bij een MKBA inzichtelijk zijn om te zien hoe de ranking van beleidsalternatieven verandert als er gecorrigeerd wordt voor het effect van inkomen op waarderingskengetallen. Maar, zodanig wegen dat automatisch een zwaarder gewicht geldt voor wie zich egoïstischer opstelt, lijkt onwenselijk.
Kennis over de preferenties van anderen is minder dan over eigen preferenties
Het tweede probleem is dat dat A en B elkaars preferenties moeten kennen om een weloverwogen collectieve keuze te kunnen maken; althans, zodra ze niet zoals individu A hierboven volledig egoïstisch zijn en in plaats daarvan van mening zijn dat de overheid bij het nemen van beslissingen méér belangen en preferenties moet meewegen dan alleen maar hun eigen individuele preferentie. Dan moeten ze dus een inschatting maken van wat andere mensen vinden. Dit is een essentieel verschil met waarderingsstudies waarin vragen worden gesteld om de eigen individuele voorkeur in beeld te brengen – om die pas daarna te aggregeren om het beleidsproces te informeren.
Stel dat personen verschillen in preferenties, maar gelijkmatig altruïstisch zijn – niet volledig egoïstisch. Dan zou onzekerheid over de preferenties van de ander leiden tot een minder zuivere meting. Met twee sociale respondenten, van het type B, zou al de helft van de inschatting van de preferenties met extra onzekerheid omgeven zijn. Bij realistischer voorbeelden, met duizenden of miljoenen van een gemeente, regio of land, verergert dit probleem navenant.
Preferentiesoevereiniteit
Een derde probleem ontstaat wanneer het goed volgens ten minste sommige respondenten het karakter van een merit of demerit good heeft. Dat treedt op wanneer een respondent meent dat anderen minder (bij merit goods) of meer (bij demerit goods) waarde toekennen aan hun eigen consumptie dan dat maatschappelijk wenselijk is. Een voorbeeld voor reistijdwaardering is als sommige respondenten menen dat automobilisten reistijdwinsten overwaarderen. Bijvoorbeeld als ze van mening zijn dat “al dat gejakker nergens goed voor is; mensen moeten eens flink onthaasten”.
Zo’n mening over de waarden van anderen conflicteert met het intrinsieke belang van preferentie-soevereiniteit: de natuurlijke en vanzelfsprekende wens om zelf over de eigen voorkeuren en keuzes te gaan (“onthaasten doe ik thuis”). Ook hier ontstaan onzuiverheden wanneer respondenten verschillend oordelen over het merit- of demerit-karakter van een goed. Mensen die dat wél doen, herwegen de preferenties van mensen die dat niet doen, maar andersom gebeurt het niet.
Er is niets mis met overwegingen van merit of demerit good bij beleidskeuzes, maar het is daarbij wél wenselijk dat de overheid expliciet is over deze argumentatie. Voor beleidsevaluaties wil je deze argumenten niet uit beeld laten verdwijnen door mensen uit beleidspakketten te laten kiezen, waarna deze overwegingen niet meer te onderscheiden zijn van andere overwegingen achter de keuzes.
Strategisch kiezen wordt aangemoedigd
Het vierde probleem komt door strategisch gedrag. Bij reguliere stated preference-waarderingsstudies wordt getracht te voorkomen dat respondenten hun antwoorden strategisch laten afwijken van hun werkelijke voorkeuren, teneinde zo de studie-uitkomst in de door hen gewenste richting te manipuleren (Johnston et al. ,2017). Dat kan bijvoorbeeld door de suggestie te voorkomen dat enquêteantwoorden beleidskeuzes zullen beïnvloeden. De methode van Mouter en De Vries doet het tegenovergestelde en vraagt de respondent juist zich voor te stellen dat de antwoorden een effect hebben op beleid. Dat is een open invitatie om strategisch te antwoorden: de antwoorden zodanig laten afwijken van de werkelijke eigen voorkeur dat de studie-uitkomst uiteindelijk juist wél zo dicht mogelijk bij die eigen voorkeur uitkomt. Dit leidt tot een groter gewicht voor wie strategischer antwoordt. Ook dit lijkt onwenselijk.
Meetfouten leiden tot grote problemen in schattingen
Zo zien we een cocktail aan mogelijke meetfouten, waarvan a priori onduidelijk is of ze elkaar versterken of compenseren. In de uitkomsten van Mouter en De Vries lijken beide situaties zich op het eerste gezicht voor te doen. Zo merken ze op dat de waardering voor een statistisch mensenleven met 6,3 miljoen euro lijkt op gangbare schattingen. Echter, die berekening klopt niet: de coëfficiënt voor één verkeersdode per jaar wordt gedeeld door de coëfficiënt van een eenmalige, dus niet jaarlijkse, belastingverhoging. Zouden de respondenten de eenmalige euro belasting mentaal hebben omgezet naar een jaarlijks renteverlies van bijvoorbeeld 2,5 cent, dan implodeert de geschatte waarde tot een kleine 160.000 euro. Gezien de gangbare schattingen, lijken de meetfouten hier dus alsnog te leiden tot een te lage schatting.
Een ander voorbeeld is de zeer lage waardering van tijdsbesparing die Mouter en De Vries berekenen. Uit tabel 1 leid ik af dat respondenten 589.936 euro aan belastinggelden over hebben voor anderhalf miljoen keer (het dagelijks aantal ritten volgens hun tabel 1) een besparing in de reistijd van minimaal een kwartier. Dat komt neer op 1,57 euro per uur. Deze tijdswaardering daalt naar een extreem lage waarde van 4 cent per uur als we weer corrigeren voor het eenmalige karakter van de belasting. Beide schattingen zijn beduidend lager dan de reistijdwaardering van ruim 10 euro per uur die Significance (2023) vond, en welke weer goed in lijn is met het gemiddelde van 50 procent van het brutoloon dat internationaal als representatief wordt aangemerkt (Small et al., 2024). Dat gemiddelde is gebaseerd op talloze revealed én stated preference-studies naar hoe mensen zélf tijdwinsten en -verliezen in mobiliteitsgedrag waarderen.
Besluit
De fundamentele bezwaren roepen flinke twijfel op over de door Mouter en De Vries gebruikte methode. Er bestaan betere remedies voor de door hen gesignaleerde uitdagingen bij met meten van preferenties in stated preference-onderzoek. Bijvoorbeeld, door de context zorgvuldig te beschrijven wanneer deze ertoe doet. Wanneer beslissingen beïnvloed dreigen te raken door het meeliften op de inspanning van anderen, kan een slimme specificatie van de keuzesituatie of van het geldelijke attribuut dit ondervangen.
De rol van MKBA in het beleidsproces is niet om keuzes te dicteren, maar om kosten en baten in beeld te brengen en zo besluitvorming te ondersteunen. De gebruikte methode gaat echter richting een serie van referenda, beperkt tot een kleine groep respondenten. Zeker waar er zelf-selectie optreedt in het lidmaatschap van internetpanels of het beantwoorden van vragenlijsten, dreigt door die beperking tot een kleine groep verdere vertekening door niet-representativiteit – zo zou de genoemde lage tijdswaardering versterkt kunnen zijn doordat mensen met een lage tijdwaardering vaker geneigd zijn vragenlijsten in te vullen (Kouwenhoven et al., 2014).
Daarnaast ontstaat de onwenselijke figuur dat met de voorgestelde ‘collectieve betalingsbereidheid’ de MKBA niet langer het beleidsproces informeert over de zo objectief mogelijk vergelijkbaar gemaakte positieve en negatieve effecten. In plaats daarvan kaatst deze methode de vraag terug aan (sociaal antwoordende) respondenten: wat schat u eigenlijk in dat de maatschappelijke kosten en baten zijn? Dat zou óók een interessante vraag zijn, maar eentje waarvan de antwoorden niet geschikt zijn voor het bereiken van het doel van de MKBA.
Omdat MKBA’s ingezet worden voor grote projecten en beleidsvoornemens, staat er veel op het spel, waardoor het gebruik van onzuivere schaduwprijzen naar verwachting zal leiden tot aanzienlijke maatschappelijke verliezen wanneer publieke middelen daardoor inefficiënt worden ingezet.
Literatuur
Johnston, R. J., Boyle, K.J., Adamowicz et al. (2017) Contemporary guidance for stated preference studies. Journal of the Association of Environmental and Resource Economists, 4(2), 319-405. https://doi.org/10.1086/691697
Kouwenhoven, M., G.C. de Jong, P. Koster et al. (2014) New values of time and reliability in passenger transport in The Netherlands. Research in Transportation Economics, 47, 37–49.
Mouter, N. en M. de Vries (2026) Breid kosten-batenanalyse uit met analyse collectieve betalingsbereidheid. ESB, te verschijnen.
Rli (2024) Waardevol regeren: Sturen op brede welvaart. Raad voor de Leefomgeving en Infrastructuur, Rapport, 2024/04.
Significance (2023) Values of time, reliability and comfort in the Netherlands 2022. Significance, Technical Report, 21 november. Te vinden op www.kimnet.nl.
Small, K.A., E.T. Verhoef en R. Lindsey (2024) The economics of urban transportation, 3e editie. Londen: Routledge.
Varian, H.R. (2010) Intermediate microeconomics – A modern approach, 8e editie. New York: Norton.
Auteur
Categorieën