Volgens Van Hulst en Blank in ESB 4749 is de optimale schaal voor ziekenhuizen 320 bedden. Aangezien een gemiddeld Nederlands ziekenhuis 450 bedden heeft, leveren ziekenhuisfusies volgens de auteurs geen schaalvoordelen op. Om verschillende redenen valt deze conclusie echter niet uit hun analyse te trekken.
Reactie
Dit artikel is een reactie op Nederlandse ziekenhuizen te groot voor verdere schaalvoordelen
De reactie van Jos Blank en Bart van Hulst op dit artikel staat hier
In het kort
– De meta-analyse van Van Hulst en Blank levert mogelijk een onderschatting van de optimale schaal van ziekenhuizen.
– Hun analyse houdt niet afdoende rekening met patiëntenkenmerken, zorgkwaliteit en niet-parametrische studies.
Van Hulst en Blank (2017; hierna: HB) baseren zich in hun ESB-artikel op een meta-analyse uit het proefschrift van Van Hulst (2016). De meta-analyse betreft 41 studies uit de literatuur met elk een of meer schattingen van de schaalelasticiteit, in totaal 95 schattingen. De gerapporteerde schaalelasticiteit is gemiddeld 1,1. Gemiddeld is er dus sprake van schaalvoordelen: als de kosten met 1 procent toenemen, neemt de productie met 1,1 procent toe. De 41 studies rapporteren ook het gemiddelde aantal bedden in de ziekenhuizen waar de studies op zijn gebaseerd. Uit een regressieanalyse blijkt dat de schaalelasticiteit lager is in studies gebaseerd op gemiddeld grotere ziekenhuizen. Uit deze regressieanalyse berekenen HB de optimale schaal van 320 bedden. De analyse kent echter een aantal beperkingen.
Gaat de daling door boven de 450 bedden?
Het door HB gevonden verband tussen aantal bedden en schaalelasticiteit is afkomstig uit landen met een kleinere gemiddelde ziekenhuisomvang dan in Nederland. Hun data bevatten geen waarnemingen voor een gemiddelde ziekenhuisomvang boven de 450 bedden. We weten daarom niet of voorbij de 450 bedden de door HB gerapporteerde schaalelasticiteit blijft dalen of wellicht weer stijgt.
Geen goede correctie patiëntkenmerken
Grotere ziekenhuizen behandelen gemiddeld complexere patiënten, waardoor de kosten per patiënt hoger zijn. Zonder goede correctie voor dit verschil in casemix lijken de kosten dan hoger in grotere ziekenhuizen. Het is daarom cruciaal om goed rekening te gehouden met verschillen in casemix.
In de meta-analyse van HB zijn studies meegenomen die voor casemix corrigeren en studies die dat niet doen. Uit Van Hulst (2016) blijkt dat slechts zes procent van de studies en vijftien procent van de observaties niet corrigeert voor casemix. Als er voor casemix is gecorrigeerd, is dit meestal gedaan via één samengestelde casemixindex. Minder dan dertig procent van de studies corrigeert voor casemix via de gewogen-outputmethode.
HB hebben gekeken of het al dan niet corrigeren voor casemix de gerapporteerde schaalelasticiteit beïnvloedt. Dit blijkt het geval, maar alleen als de casemixcorrectie plaatsvindt via de gewogen-outputmethode. Vindt de casemixcorrectie plaats via één samengestelde casemixindex, dan blijkt de casemixvariabele niet statistisch significant te zijn. Dit verschil is opmerkelijk, en kan erop wijzen dat het niet mogelijk is om via een samengestelde variabele goed te corrigeren voor casemixverschillen. De gewogen-outputmethode corrigeert waarschijnlijk beter, maar ook niet volledig, voor casemixverschillen.
In de meeste (zo niet alle) studies is er dus niet afdoende rekening gehouden met verschillen in casemix. Dit maakt de interpretatie van de coëfficiënt op het aantal bedden problematisch. Het is goed mogelijk dat de coëfficiënt op de beddenvariabele casemixverschillen oppikt, in plaats van schaaleffecten. Wat de onderzoekers hadden kunnen doen, is het aantal bedden ook als interactieterm opnemen met de wijze waarop voor casemixverschillen is gecorrigeerd. Die interactievariabele pikt de studies eruit die op een relatief goede manier hebben gecorrigeerd voor casemix. Als de interactie tussen bedden en casemix-correctiemethode negatief is, dan wijst dit erop dat de beddenvariabele (ook) casemixeffecten oppikt.
Kwaliteitsverschillen niet meegenomen
Het woord kwaliteit komt één keer voor in het artikel: “In een eerdere ESB is al aangetoond dat ziekenhuisfusies niet aantoonbaar leiden tot betere kwaliteit (Batterink et al., 2017).” Het artikel waar HB naar verwijzen heeft als titel ‘Ziekenhuisfusies leiden niet aantoonbaar tot betere kwaliteit’. ‘Aantoonbaar’ is hier een sleutelwoord, want de gebruikte kwaliteitsgegevens waren imperfect en onvolledig. Er kon bijvoorbeeld niet gekeken worden of fusies het mogelijk maken om de nacht- en weekenddiensten beter te organiseren, of om beter te voldoen aan volumenormen. Zelfs als een grotere schaal gepaard gaat met een meer dan evenredige kostenstijging, betekent dit dus niet dat die grotere schaal inefficiënt is.
Niet-parametrische studies leiden tot andere conclusie
HB baseren zich uitsluitend op parametrische studies. Hierbij wordt een bepaalde wiskundige vorm voor de onderzochte relatie verondersteld. Dit is een probleem omdat de juiste wiskundige vorm onbekend is (Wilson en Carey, 2004). Vanwege dit probleem met parametrische studies kiezen sommige onderzoekers voor een niet-parametrische aanpak. Wilson en Carey concluderen op grond van een dergelijke aanpak dat ook bij de grootste ziekenhuizen in hun data (meer dan 400 bedden) verdere groei schaalvoordelen kan opleveren.
HB noemen de niet-parametrische studies niet in het ESB-artikel, maar Van Hulst (2016) vat deze studies wel samen in zijn proefschrift. Ook op deze niet-parametrische studies past hij een regressieanalyse toe. Hierin wordt niet geprobeerd verschillen in de schaalelasticiteit te verklaren, zoals in HB, want de meeste niet-parametrische studies rapporteren geen schaalelasticiteit. Wat deze studies vaak wel rapporteren, is de optimale schaal. Van Hulst (2016) probeert de verschillen in optimale schaal te verklaren uit onder meer het gemiddelde aantal bedden van de ziekenhuizen in de studie. Hij concludeert dat de geschatte optimale schaal toeneemt met het gemiddelde aantal bedden in de studie. Maar deze uitkomst wordt door hem terzijde geschoven omdat verschillen in het gemiddelde aantal bedden ook verschillen in context zouden oppikken, waarmee hij mogelijk doelt op verschillen in type ziekenhuis en verschillen in casemix. Maar dat geldt net zo goed voor de beddenvariabele in de parametrische studies die de basis vormen voor het ESB-artikel.
Gebruikte schaalelasticiteiten gelden niet bij het gemiddelde aantal bedden
HB nemen aan dat de schaalelasticiteit die in een bepaalde studie is gevonden, geldt bij het gemiddelde aantal bedden in die studie. Dat hoeft niet het geval te zijn. Figuur 1 geeft de situatie weer waarin de schaalelasticiteit groter is dan 1 voor kleine ziekenhuizen, dan lange tijd praktisch gelijk is aan 1, en dan bij de grootste ziekenhuizen daalt onder de 1. Dit is precies het patroon dat volgens figuur 1 in HB uit de studies naar voren komt.
In een steekproef met alleen ziekenhuizen met 1 tot 200 bedden is de geschatte elasticiteit dan groter dan 1, en in een steekproef met ziekenhuizen met 200 tot 400 bedden juist kleiner dan 1. In beide gevallen is voor het ziekenhuis met het gemiddelde aantal bedden in de steekproef (100 respectievelijk 300 bedden) de werkelijke schaalelasticiteit echter gelijk aan 1.
Als we, zoals HB doen in hun figuur 1, de in de beide steekproeven geschatte schaalelasticiteit relateren aan het gemiddelde aantal bedden, dan overschatten we de elasticiteit van het ziekenhuis met het gemiddelde aantal bedden in steekproef 1, en onderschatten we de elasticiteit van het ziekenhuis met het gemiddelde aantal bedden in steekproef 2. Als we deze over- en onderschattingen vervolgens in een regressieanalyse relateren aan het gemiddelde aantal bedden, dan overschatten we de mate waarin de schaalelasticiteit daalt met het aantal bedden. Dit resulteert in een onderschatting van het optimale aantal bedden.
Conclusies
De meta-analyse van HB is niet toepasbaar op Nederland omdat de gemiddelde omvang van de ziekenhuizen in alle achterliggende studies kleiner is dan het gemiddelde Nederlandse ziekenhuis. Bovendien is er niet afdoende gecorrigeerd voor patiëntkenmerken, en er is geen rekening gehouden met kwaliteit van zorg. Niet-parametrische studies wijzen bovendien op onbenutte schaalvoordelen bij grote ziekenhuizen. En tot slot kan het gebruik in een meta-analyse van de gemiddelde ziekenhuisomvang resulteren in een onderschatting van de optimale schaal.
Literatuur
Batterink, M., M. Pomp, R. Kemp et al. (2017) Ziekenhuisfusies leiden niet aantoonbaar tot betere kwaliteit. ESB, 102(4745), 20–22.
Hulst, B.L. van (2016) Enhancing hospital productivity. Proefschrift. Technische Universiteit Delft.
Hulst, B. van, en J. Blank (2017) Nederlandse ziekenhuizen te groot voor verdere schaalvoordelen. ESB, 102(4749), 226–228.
Wilson, P.W., en K. Carey (2004) Nonparametric analysis of returns to scale in the US hospital industry. Journal of Applied Econometrics, 19(4), 505–524.