Ga direct naar de content

Waarom klassenverkleining niet helpt

Geplaatst als type:
Geschreven door:
Gepubliceerd om: maart 17 1999

Waarom klassenverkleining niet helpt
Aute ur(s ):
Dobbelsteen, S. (auteur)
Levin, J. (auteur)
Oosterbeek, H. (auteur)
De auteurs zijn alle drie betrokken b ij het NWO-prioriteiten-programma SCHOLing, ARb eidsmarkt en economische ontwikkeling.
Ve rs che ne n in:
ESB, 84e jaargang, nr. 4197, pagina 250, 2 april 1999 (datum)
Rubrie k :
Tre fw oord(e n):
onderw ijs, scholing

Klassenverkleining heeft geen duidelijke gunstige invloed op de leerprestaties van kinderen. Dit komt doordat bij klassenverkleining
ook het aantal medeleerlingen waar een kind iets van leert, afneemt.
Een van de speerpunten in het onderwijsbeleid van het kabinet is de verkleining van klassen in het basisonderwijs. Het vorige kabinet
had hier reeds toe besloten, en het huidige kabinet heeft de uitvoering ter hand genomen.
Het besluit tot klassenverkleining is niet gebaseerd op een uitgebreide hoeveelheid onderzoek die de voordelen van deze maatregel
overtuigend aantonen. Integendeel, voor de Nederlandse situatie is er feitelijk slechts één recente studie over dit onderwerp beschikbaar:
de rapportage van de onderwijskundigen Bosker en Hox, speciaal ten behoeve van een in 1996 ingestelde adviescommissie 1. In die
rapportage wordt verslag gedaan van een analyse waarin prestaties op de terreinen van taal en rekenen gerelateerd worden aan
klassengrootte. Hierbij is gebruik gemaakt van de eerste golf van het zogenoemde PRIMA-cohort dat gegevens bevat van ruim 12.000
leerlingen uit de groepen 2, 4, 6 en 8 van de basisschool.
Nauwkeurige lezing van het onderzoek van Bosker en Hox leert dat de resultaten ten voordele van klassenverkleining veel minder
overtuigend en omvangrijk zijn, dan in het rapport van de commissie en in de latere publike discussie wordt gesuggereerd.
Selectiviteit
Nog belangrijker is de tekortkoming van het onderzoek van Bosker en Hox is dat voorbij wordt gegaan aan het probleem van selectiviteit.
Door leerprestaties van leerlingen in kleine en grote klassen met elkaar te vergelijken wordt impliciet verondersteld dat de toedeling van
leerlingen over klassen van verschillende grootte door het toeval is bepaald. Dat hoeft niet het geval te zijn. Ouders die meer dan
gemiddeld om de leerprestaties van hun kinderen geven, zouden hun kinderen naar scholen kunnen sturen met klassen die kleiner zijn
dan gemiddeld. Ook zonder kleinere klassen zouden de kinderen van deze ouders – vanwege de grotere betrokkenheid van hun ouders waarschijnlijk betere leerprestaties hebben. Een andere bron van selectiviteit is ook denkbaar. Als een school voor een jaargroep meer
dan één klas heeft, kan worden besloten klassen van ongelijke grootte te vormen en leerlingen op basis van (verwachte) leerprestaties
over de klassen te verdelen. Voor beide voorbeelden geldt: zonder voor deze vorm van selectie te corrigeren, wordt een relatie tussen
klassengrootte en leerprestaties waargenomen die niet causaal is.
De ideale manier om selectiviteit uit te sluiten is door het opzetten van een veld-experiment. Een recent voorbeeld hiervan is het
zogenoemde Student/Teacher Achievement Ratio -experiment dat is opgezet in de Amerikaanse staat Tennessee. In dit grootschalige
experiment zijn kinderen in de basisschoolleeftijd (en leerkrachten) door het lot verdeeld over drie soorten klassen: kleine klassen met 1317 leerlingen, gewone klassen met 22-25 leerlingen, en gewone klassen met een onderwijsassistent. Een zorgvuldige analyse van de
uitkomsten van het experiment door Krueger laat zien dat leerlingen in de kleine klassen hoger scoren dan leerlingen in gewone klassen 2.
Grootschalige onderwijsexperimenten als in Tennessee zijn helaas zeer uitzonderlijk. En hoewel het resultaat voor de situatie in
Tennessee zeer overtuigend is, garandeert niets dat dezelfde resultaten zich onder de Nederlandse omstandigheden ook voordoen.
Bovendien is een reductie met acht tot negen leerlingen per klas (zoals in Tennessee) aanmerkelijk groter dan die waaraan in de
Nederlandse beleidsvoornemens gedacht wordt.
Om zonder echt experiment toch verantwoorde uitspraken te kunnen doen, hebben we gebruik gemaakt van de naast-beste methode van
het ‘natuurlijk experiment’. Uitgangspunt hierbij is een situatie of verschijnsel in de werkelijkheid waarvan aannemelijk gemaakt kan
worden dat het een echt experiment nabootst.
Zaagtand als instrument
Het ‘natuurlijk experiment’ waarvan we in ons onderzoek gebruik maken is de wijze waarop in Nederland personeelsformatie aan scholen
wordt toegewezen 3. Dit geschiedt op basis van een niet-lineaire, niet-monotone functie van het totaal aantal leerlingen dat bij de school
staat ingeschreven 4. De zaagtand-afbeelding in figuur 1 illustreert de relatie tussen de totale omvang van een school en de volgens de

formatieregels voorspelde gemiddelde klassengrootte. Het zaagtand-verloop ontstaat doordat steeds pas voorbij een bepaalde marginale
toename van het aantal leerlingen extra personeelsformatie wordt toegewezen. Vóór dat punt neemt, door het stijgend aantal leerlingen,
de klassengrootte toe, ná toewijzing van een extra leerkracht daalt de gemiddelde klassengrootte. Het idee is nu dat ouders misschien wel
voor een school kiezen die bereid is meer geld aan extra leerkrachten te besteden, maar dat zij onmogelijk zo kunnen kiezen dat ze precies
de kleine gemiddelde klassengrootte treffen, waarvan sprake is in het dal van een zaagtand. Op deze wijze creëren de formatieregels enige
mate van exogene variatie in de gemiddelde klassengrootte van een school, die niet beïnvloed wordt door het gedrag van ouders en
schooldirecties. Door nu de formele gemiddelde klassengrootte als instrumentele variabele te gebruiken, kunnen we het effect van deze
‘toevals’-component van klassengrootte bepalen 5. Deze methode is eerder toegepast in een recente studie van Angrist en Lavy, waarin
ze de relatie tussen leerprestaties en klassengrootte in Israel analyseren 6.

Figuur 1. Verband tussen aantal aanmeldingen en klassengrootte
tabel 1 vat de belangrijkste schattingsresultaten samen, afzonderlijk voor taal- en rekenvaardigheid en afzonderlijk voor de groepen 4, 6
en 8 7 van het PRIMA-cohort. Zowel uitkomsten op basis van gewone kleinste kwadraten (OLS) als op basis van de instrumentele
variabele (IV) zijn weergegeven. Hierbij hebben de OLS-resultaten betrekking op de werkelijke klassengrootte en IV-resultaten betrekking
op de formele klassengrootte. De uitkomsten zijn vrij eenduidig: de OLS-resultaten laten in geen enkel geval een significante samenhang
tussen klassengrootte en leerprestaties zien. De IV-uitkomsten geven in een aantal gevallen wel een significante samenhang te zien, maar
deze samenhang is positief: kleinere klassen gaan in die gevallen gepaard met slechtere leerprestaties. Bovendien is in bijna alle gevallen
de coëfficiënt van het effect groter voor de IV-schatting als voor de OLS-schatting. Dit patroon ondersteunt de gedachte dat OLSresultaten vertekend zijn doordat een bepaald type ouders hun kinderen aanmeldt bij scholen met kleinere klassen. Immers, als we met
behulp van IV deze endogene component eruit filteren, dan vinden we een minder gunstig effect van kleinere klassen. Overduidelijk blijkt
in elk geval dat ook na correctie voor mogelijke endogeniteit van klassengrootte er geen enkele aanwijzing is voor een positief effect van
klassenverkleining op leerprestaties.

Tabel 1. Effect van klassengrootte op schoolprestaties volgens twee verschillende schattingsmethoden effect van een extra
leerling op percentiel-scores
4e groep
rekenen
taal
OLS-schattingsmethode
IV-schattingsmethode

0,142
0,351

-0,092
0,171

6e groep
rekenen
taal
-0,088
0,197

-0,201*
-0,260

8e groep
rekenen
taal
0,059
0,779**

0,063
0,466*

***/**/* geven significantie op 1%/5%/10%-niveau aan,
Afhankelijke variabelen zijn de percentiel scores voor taal en rekenen. Alle vergelijkingen bevatten als controle-variabelen : vier SES
dummies voor sociale achtergrond van de leerling, een dummy voor geslacht van de leerling, percentage meisjes in de klas, geslacht
en ervaring van de leerkracht en ervaring van de leerkracht, dummies voor duo-baan en samengestelde klassen, schoolgrootte,
gemiddelde SES-score van de school en denominatie van de school. Verder is er rekening mee gehouden dat de storingstermen van
leerlingen van dezelfde school gecorreleerd kunnen zijn. Het aantal waarnemingen bedraagt 4453 voor groep 4, 4090 voor groep 6 en
4244 voor groep 8, De gecorrigeerde R-squared varieren van 0,09 voor rekenen in groepen 4 en 6 tot 0,16 voor taal in groep 8, Een
Hausman test geeft voor groep 8 een significant verschil aan tussen de OLS- en IV-puntschattingen van het klassengrootte-effect
op zowel taal- als rekenprestaties,

Twee effecten
Onze bevinding dat verkleining van klassen niet gepaard gaat met betere leerprestaties is niet uniek. Ook Hoxby vindt in een recente
studie waarin ze van de instrumentele variabele- methode gebruik maakt, geen effect 8. Eerdere studies die geen correctie plegen voor
endogeniteit vinden, met enige regelmaat, evenmin effect. De vraag is dan natuurlijk: hoe kan dit?
De verklaring die we hebben gevonden, wordt gesuggereerd in literatuur op het gebied van de sociaal cognitieve leerpsychologie 9.
Kinderen leren niet alleen iets van hun leerkracht, maar ook van hun medeleerlingen. De betreffende literatuur geeft sterke aanwijzingen
dat het leren van kinderen vooral wordt bevorderd door de aanwezigheid van mede-leerlingen die in cognitieve zin ongeveer even
vaardig zijn als zijzelf. Hoe meer even knappe mede-leerlingen er in de klas zitten des te groter de kans dat daar een leerling bij is waarin
de leerling wiens leerprestaties worden beschouwd zich herkent en waaraan die zich kan en wil spiegelen.
Wanneer een klas nu wordt verkleind, gebeuren er twee dingen tegelijkertijd. Enerzijds krijgt de leerkracht per leerling meer tijd
beschikbaar, anderzijds neemt het aantal mede-leerlingen af, en daarmee ook bij verwachting het aantal even knappe mede-leerlingen.
Beide effecten werken naar verwachting in tegengestelde richting.

Beide effecten werken naar verwachting in tegengestelde richting.
Of er inderdaad twee tegengestelde effecten werkzaam zijn, hebben we getoetst door voor elke leerling in de steekproef een extra
variabele te creëeren die het aantal mede-leerlingen meet die een IQ hebben dat minder dan drie IQ-punten verschilt van het IQ van de
leerling in kwestie. Deze nieuw gecreëerde variabele is als extra controle-variabele in de regressie-vergelijkingen opgenomen. tabel 2 vat
de uitkomsten samen 10.

Tabel 2. Effect van klassengrootte en medeleerlingen met een hoger IQ op de schoolprestaties effect van een extra leerling op
percentiel-scores
4e groep
rekenen taal
Klassengrootte
Aantal mede-leerlingen
met vergelijkbaar IQ

0,074

0,051

0,975*** 0,421

6e groep
rekenen taal
-0,053

-0,507*

0,962*** 0,863***

8e groep
rekenen taal
0,603

0,319

0,641*** 0,536***

***/**/* geven significantie op 1%/5%/10%-niveau aan.
Afhankelijke variabelen zijn de percentiel scores voor taal en rekenen. Alle vergelijkingen bevatten als controle-variabelen: vier SES
dummies voor sociale achtergrond van de leerling, een dummy voor geslacht van de leerling, percentage meisjes in de klas, geslacht
en ervaring van de leerkracht en ervaring van de leerkracht, dummies voor duo-baan en samengestelde klassen, schoolgrootte,
gemiddelde SES-score van de school en denominatie van de school. Verder is er rekening mee gehouden dat de storingstermen van
leerlingen van dezelfde school gecorreleerd kunnen zijn. Het aantal gebruikte waarnemingen bedraagt 4453 voor groep 4, 4090 voor
groep 6 en 4244 voor groep 8. De gecorrigeerde R-squared varieren van 0.10 voor rekenen in groep 6 tot 0.17 voor taal in groep 8.
Een Hausman test geeft voor groep 8 een significant verschil aan tussen de OLS- en IV-puntschattingen van het klassengrootteeffect op rekenprestaties.

De resultaten geven duidelijk steun voor de aanwezigheid van twee afzonderlijke en tegengestelde effecten. In vrijwel alle gevallen
vinden we dat het aantal mede-leerlingen met vergelijkbaar IQ een significant positieve invloed heeft op de leerprestaties van een kind.
Tevens vinden we in alle gevallen dat vergeleken met de resultaten uit tabel 1 het (pure) klassengrootte-effect kleiner of negatiever is
geworden. Meer in het bijzonder: voor zesde-groepers is het (pure) klassengrootte effect in drie van de vier gevallen significant negatief,
en voor achtste-groepers zijn de significant positieve coëfficiënten die eerst voor klassengrootte werden gevonden, nu niet langer
significant.
Besluit
De resultaten die in deze bijdrage zijn gerapporteerd, laten zien dat er ernstig getwijfeld dient te worden aan de positieve effecten die
verkleining van klassen in het basisonderwijs zou hebben op de leerprestaties van kinderen. Wij vinden geen enkele steun voor een
dergelijk gunstig effect. Dit contra-intuïtieve resultaat kan worden verklaard door het feit dat verkleining van klassen er niet alleen toe
leidt dat de leerkracht per leerling meer tijd krijgt, maar dat tevens het (verwachte) aantal mede-leerlingen waar een kind iets van leert,
afneemt.
Twee kanttekeningen zijn op z’n plaats. Ten eerste: onze resultaten zeggen niet dat er geen extra overheidsgeld aan het basisonderwijs
zou moeten worden besteed. Wat onze resultaten wel zeggen is dat extra middelen voor het basisonderwijs beter niet aan verkleining van
klassen kunnen worden besteed 11. Ten tweede, de bevinding dat een groter aantal mede-leerlingen met een vergelijkbaar IQ bevorderlijk
is voor de leerprestaties zou makkelijk kunnen worden gebruikt ter ondersteuning van het samenstellen van homogene klassen. Dit gaat
er echter aan voorbij dat we alleen hebben gekeken naar de effecten op leerprestaties voor taal en rekenen. Kinderen leren op school
meer dan dat, en juist voor de andere dingen zou het gunstig kunnen zijn om in een heterogeen samengestelde klas te zitten

1 R. Bosker, en J. Hox, Klassengrootte en het functioneren van leerlingen en leerkrachten; een onderzoek op basis van de PRIMA-cohort
gegevens, Bijlage IV in: commissie Kwalitatieve aspecten van de groepsgrootte in het basisonderwijs, Advies over de betekenis van
klassenverkleining voor beter basisonderwijs, 1996.
2 A.B.Krueger, Experimental estimates of education production functions, NBER Working Paper Series, nr. 6051, Juni 1997.
3 Een uitgebreide rapportage van de analyses is te vinden in: S. Dobbelsteen, J. Levin en H. Oosterbeek, The causal effect of class size
on scholastic achievement: Distinguishing the pure class size effect from the effect of changes in class composition, februari 1999,
mimeo.
4 Hierbij worden leerlingen gewogen naar gelang hun sociaal-economische achtergrond. De weegfactor bedraagt maximaal 1.90, voor
allochtone leerlingen waarvan de ouders maximaal een VBO-opleiding hebben.
5 Hierbij is de aanname dat de formele klassengrootte op zichzelf geen effect heeft op de leerprestaties, anders dan via de relatie met
werkelijke klassengrootte.
6 J. D.Angrist. en V. Lavy, Using Maimonides’ rule to estimate the effect of class size on scholastic achievement, Quarterly Journal of
Economics, te verschijnen.
7 Bosker en Hox rapporteren ook resultaten voor groep 2. Uit de antwoorden van de leerkrachten blijkt dat een aanzienlijk aantal

leerkrachten van groep 2 de vraag verkeerd heeft begrepen.
8 C.M. Hoxby, The effects of class size and composition on student achievement: new evidence from natural population variation, NBER
Working Paper Series, Nr. 6869, 1999.
9 Zie bijvoorbeeld: A. Bandura, Social foundations of thought and action: a social cognitive theory, Englewood Cliffs, NJ: Prentice
Hall, 1986.
10 In alle vergelijkingen zijn weer dezelfde controle-variabelen opgenomen als in de eerdere regressies.
11 Zelfs in gevallen waar klassenverkleining wel leidt tot betere leerprestaties kan dat het geval zijn. Belangwekkend is in dit opzicht nog
het volgende. Angrist en Lavy vinden in hun artikel dat in Israel klassenverkleining wel leidt tot verbetering van de leerprestaties. In een
later artikel hebben ze ook gekeken naar de effecten op leerprestaties van extra training voor leerkrachten. Ook zulke extra training
bevordert de leerprestaties. Extra training van leerkrachten blijkt echter veel kosteneffectiever dan klassenverkleining. Zie: J.D.Angrist en
V. Lavy, Does teacher training affect pupil learning? Evidence from matched comparisons in Jerusalem Public Schools, NBER Working
Paper Series, nr. 6781, november 1998.

Copyright © 1999 – 2003 Economisch Statistische Berichten (www.economie.nl)

Auteur