Hoe vergroot je de betrouwbaarheid van een toets?

Geschreven door Jolanda Soeting, Teelen Kennismanagement

Elke dag worden in Nederland heel veel toetsen afgenomen. Van kleuters tot inburgeraars: niemand ontkomt er meer aan. Hoeveel toetsen maakt een mens eigenlijk in zijn leven? Ik heb geen idee waarop de toets-teller voor mijzelf staat. Maar zijn al die toetsen wel even zinvol geweest?

Beslissing

Aan bijna elke toets is een beslissing gekoppeld. Soms een vrij onschuldige beslissing, bijvoorbeeld of je mee moet doen aan een bijscholing en of je een 7 of toch een 8 op je rapport krijg. Maar soms ook een (heel) belangrijke beslissing: welke vervolgopleiding je mag gaan doen en zelfs of je een verblijfsvergunning krijgt.

Betrouwbaarheid

Elke toets heeft een bepaalde betrouwbaarheid, die achteraf kan worden bepaald. We bepalen de betrouwbaarheid met behulp van een schatting. Een hoge betrouwbaarheid houdt in dat de toets bij een bepaalde kandidaat elke keer (vrijwel) hetzelfde resultaat oplevert.

Hoe betrouwbaarder de toets, hoe groter de kans dat de juiste beslissing wordt genomen. Hoe lager de betrouwbaarheid, hoe groter de kans op een verkeerde beslissing. Vooral rond de zak/slaaggrens (cesuur) zullen dan kandidaten slagen die eigenlijk hadden moeten zakken. En andersom.

Daarom zijn er normen voor de geschatte betrouwbaarheid van een toets.

Betrouwbaarheid (Cronbach’s alpha of KR-20)

Beoordeling toets

0,80 en hoger0,60 tot 0,80

0,60 en lager

goed tot zeer goedmatig tot voldoende voor een summatieve toets

voldoende tot goed voor een formatieve toets

onvoldoende

Bij een toets met een betrouwbaarheid die lager is dan 0,60, had je in feite net zo goed de beslissing kunnen nemen door voor elke kandidaat met een dobbelsteen te gooien. 1, 2 of 3? Gezakt! 4, 5 of 6? Geslaagd! Dat kost veel minder tijd en het is net zo (on)betrouwbaar (maar natuurlijk wel nog minder valide).