Europese systemen
Nederland (1-10)
Schaal: 1 (zeer slecht) tot 10 (uitmuntend) Voldoende: 5,5 of hoger (afgerond naar 6)
| Cijfer | Betekenis | Frequentie |
|---|---|---|
| 10 | Uitmuntend | ~0,1% |
| 9 | Zeer goed | ~2,7% |
| 8 | Goed | 15-25% |
| 7 | Ruim voldoende | ~34% |
| 6 | Voldoende | ~39% |
| 5 | Onvoldoende | Variabel |
| 1-4 | Zeer onvoldoende | Zeldzaam |
Historische oorsprong. De 1-10 schaal werd officieel ingevoerd aan het einde van de 19e eeuw. Bij de invoering werd besloten dat een 10 uitsluitend toegekend mocht worden bij absolute perfectie. Omdat het als bijna blasfemisch werd beschouwd dat stervelingen konden beoordelen wat absolute perfectie was, werd een 10 vrijwel nooit gegeven (Nuffic/Fulbright, 2022).
Filosofie. Het systeem is geworteld in calvinistische terughoudendheid: perfectie is voorbehouden aan God, niet aan menselijk werk. Dit verklaart waarom de bovenste schaalhelft (8-10) zo spaarzaam wordt gebruikt, in tegenstelling tot het Amerikaanse systeem waar de bovenste helft de norm is. Het systeem is absoluut (criteriumgericht): het cijfer is gebaseerd op de individuele prestatie, niet op vergelijking met anderen.
Typisch gemiddelde: ~7. Een gemiddelde van 8 wordt als "uitstekend" beschouwd.
Bronnen: Nuffic/Fulbright (2022)1; Wikipedia: Academic grading in the Netherlands2; Study in NL3; VU Amsterdam4
Duitsland (1-6, omgekeerd)
Schaal: 1 (beste) tot 6 (slechtste) Voldoende: 4 (Ausreichend) of beter
| Cijfer | Benaming | Betekenis |
|---|---|---|
| 1 | Sehr gut | Uitstekend |
| 2 | Gut | Goed |
| 3 | Befriedigend | Bevredigend |
| 4 | Ausreichend | Voldoende |
| 5 | Mangelhaft | Onvoldoende |
| 6 | Ungenugend | Zeer onvoldoende |
Varianten: Universiteiten gebruiken 1-5 (geen 6), met tussencijfers (+/-). De bovenbouw gymnasium (Oberstufe) gebruikt een 0-15 puntenschaal.
Historische oorsprong. Het zescijfersysteem vindt zijn oorsprong in het Pruisische onderwijssysteem van de 18e en 19e eeuw. Het werd formeel gestandaardiseerd in de loop van de 19e eeuw. Schneider & Hutt (2023) tonen aan dat Horace Mann het Pruisische systeem meebracht naar de VS na een bezoek aan Pruisen, gefascineerd door de "pedagogische en organisatorische kracht" ervan.
Filosofie. Het omgekeerde systeem (1 = best) weerspiegelt een ordening van excellentie: je begint bij het ideaal en daalt af. De nadruk ligt op strenge differentiatie.
Typisch gemiddelde: ~3,0 ("Befriedigend"). 20-40% van universiteitsstudenten zakt voor tentamens.
Bronnen: Wikipedia: Academic grading in Germany5; Studying-in-Germany.org6; Schneider & Hutt (2023)7; Schneider & Hutt (2014)8
Frankrijk (0-20)
Schaal: 0 tot 20 Voldoende: 10/20
| Cijfer | Benaming | Betekenis |
|---|---|---|
| 16-20 | Tres Bien | Uitstekend |
| 14-15,9 | Bien | Goed |
| 12-13,9 | Assez Bien | Redelijk goed |
| 10-11,9 | Passable | Voldoende |
| 0-9,9 | Insuffisant | Onvoldoende |
Historische oorsprong. Het systeem evoleerde in fasen:
- Eind 18e eeuw: bulletins met studentenevaluaties en klasseranglijsten
- Tweede Keizerrijk (1852-1870): numeriek systeem van 0-5
- 1890: het huidige systeem van 0-20, gelijktijdig met het moderne baccalaureat
De keuze voor 20 is verbonden met de Franse vigesimale (twintigtallige) traditie, die teruggaat op Keltische en Vikingse invloeden in de Franse taal (quatre-vingts = 4x20 = 80).
Filosofie. Bewust conservatief en streng. De bovenste helft (15-20) wordt beschouwd als exceptioneel. Een 20/20 wordt vrijwel nooit gegeven: "personne n'est parfaite."
Typisch gemiddelde: 10-12/20. Score boven 12 plaatst een student in de top 10-20%.
Bronnen: Wikipedia: Academic grading in France9; Wikipedia: Vigesimal10; ICES grading system (PDF)11
Italie (0-10 / 0-30)
School (0-10): Voldoende vanaf 6/10 Universiteit tentamens (0-30): Voldoende vanaf 18/30 Afstudeerscijfer (0-110): Minimum 66/110
| Cijfer (uni) | Betekenis |
|---|---|
| 30 e lode (30L) | Uitmuntend met lof |
| 28-30 | Uitstekend |
| 25-27 | Goed |
| 22-24 | Bevredigend |
| 18-21 | Voldoende |
| 0-17 | Onvoldoende |
Historische oorsprong. Het systeem werd fundamenteel hervormd door de Gentile Reform van 1923 -- koninklijke decreten uitgevaardigd door neo-idealistisch filosoof Giovanni Gentile, minister van Onderwijs in het eerste kabinet-Mussolini. De universitaire 30-puntsschaal werd verder gestandaardiseerd via het Bologna-proces en Ministerieel Decreet 509/1999.
Filosofie. Strengheid bij individuele tentamens (18/30 als minimum) gecombineerd met een ceremonieel eindcijfer (110-schaal). De toevoeging cum laude benadrukt dat excellentie boven het meetbare uitgaat.
Bronnen: Wikipedia: Academic grading in Italy12; Wikipedia: Gentile Reform13; Florence Bilingual School14
Spanje (0-10)
Schaal: 0 tot 10 Voldoende: 5/10
| Cijfer | Benaming | Vertaling |
|---|---|---|
| 9-10 | Sobresaliente (SB) | Uitmuntend |
| 7-8 | Notable (NT) | Opmerkelijk goed |
| 5-6 | Aprobado (AP) | Voldoende |
| 0-4,9 | Suspenso (IN) | Onvoldoende |
Bijzonder: Matricula de Honor -- toegekend aan maximaal 5% van de studenten per groep.
Historische oorsprong. De Ley Moyano (1857) was de eerste alomvattende onderwijswet in Spanje. Deze bleef in essentie ongewijzigd tot 1970 (Ley General de Educacion). Het systeem combineert van oudsher beschrijvende kwalificaties (Sobresaliente, Notable) die later aan numerieke waarden werden gekoppeld.
Bronnen: Wikipedia: Academic grading in Spain15; Britannica: Moyano Law16
Zweden (A-F)
Huidige systeem (sinds 2011): A-F (criteriumgericht)
| Cijfer | Betekenis |
|---|---|
| A | Uitmuntend |
| B | Zeer goed |
| C | Goed |
| D | Bevredigend |
| E | Voldoende |
| F | Onvoldoende |
Historische evolutie:
- Voor 1994: numerieke schaal 1-5 (normreferentie)
- 1994-2010: IG/G/VG/MVG (criteriumreferentie)
- 2011-heden: A-F, ingevoerd omdat ~10% van leerlingen zakte voor kernvakken
Filosofie. Bewuste verschuiving van normreferentie naar criteriumreferentie -- Scandinavische nadruk op individuele ontwikkeling boven competitie.
Bronnen: Wikipedia: Academic grading in Sweden17; Skolverket (2017)18; Nordic Cooperation19
Denemarken (7-trins-skala)
Huidige systeem (sinds 2007):
| Cijfer | ECTS | Betekenis |
|---|---|---|
| 12 | A | Uitstekend |
| 10 | B | Zeer goed |
| 7 | C | Goed |
| 4 | D | Bevredigend |
| 02 | E | Voldoende |
| 00 | Fx | Onvoldoende |
| -3 | F | Zeer onvoldoende |
De voorloopnul in "00" en "02" is bewust gekozen om fraude met cijfers te voorkomen.
Historische oorsprong. Voorganger was de 13-schaal (1963-2007) met een uniek cijfer 13 voor studenten die "boven het curriculum uitstegen." Omdat geen enkel ander EU-land cijfers boven perfecte beheersing kende, was 13 onvertaalbaar. Dit leidde tot hervorming naar de ECTS-compatibele 7-trins-skala.
Bronnen: Wikipedia: Academic grading in Denmark20; University of Copenhagen21; Deens Ministerie van Onderwijs22
Finland (4-10)
Schaal: 4 (onvoldoende) tot 10 (uitstekend) Voldoende: 5
| Cijfer | Betekenis |
|---|---|
| 10 | Uitstekend |
| 9 | Zeer goed |
| 8 | Goed |
| 7 | Bevredigend |
| 6 | Matig |
| 5 | Toereikend |
| 4 | Onvoldoende |
Eindexamen (Ylioppilastutkinto) -- uniek Latijns systeem:
| Cijfer | Latijn | Vertaling |
|---|---|---|
| L | Laudatur | Geprezen |
| E | Eximia cum laude approbatur | Met uitzonderlijke lof goedgekeurd |
| M | Magna cum laude approbatur | Met grote lof goedgekeurd |
| C | Cum laude approbatur | Met lof goedgekeurd |
| B | Lubenter approbatur | Met genoegen goedgekeurd |
| A | Approbatur | Goedgekeurd |
| I | Improbatur | Niet goedgekeurd |
Historische oorsprong. De Latijnse gradaties weerspiegelen de universitaire traditie uit het Heilige Roomse Rijk. Lubenter approbatur en Magna cum laude approbatur werden in 1970 toegevoegd, Eximia cum laude approbatur pas in 1996.
Bronnen: Wikipedia: Academic grading in Finland23; Nordic Cooperation24
Belgie (0-20)
Hoger onderwijs:
| Cijfer (op 20) | Betekenis |
|---|---|
| 18-20 | Uitstekend |
| 16-17 | Zeer goed |
| 14-15 | Goed |
| 12-13 | Meer dan voldoende |
| 10-11 | Voldoende |
| 0-9 | Onvoldoende |
Voldoende: 10/20 (50%)
Regionale verschillen. Drie onderwijsgemeenschappen (Vlaams, Frans, Duits) met eigen beleid. De 0-20 schaal in het hoger onderwijs is sterk beinvloed door het Franse systeem. Middelbaar onderwijs varieert: 0-10, 0-20, of percentages.
Bronnen: Wikipedia: Academic grading in Belgium25; Nuffic: Belgium Flemish Community26; EGRACONS Country Reports27
Niet-Europese systemen
Verenigde Staten (A-F)
Schaal:
| Cijfer | Percentage | GPA | Betekenis |
|---|---|---|---|
| A | 90-100% | 4.0 | Excellent |
| B | 80-89% | 3.0 | Goed |
| C | 70-79% | 2.0 | Gemiddeld |
| D | 60-69% | 1.0 | Onder gemiddeld |
| F | <60% | 0.0 | Gezakt |
Historische oorsprong. Het eerste beoordelingssysteem werd in 1785 door Yale-president Ezra Stiles ingevoerd: vier Latijnse beschrijvingen. In 1897 ontwikkelde Mount Holyoke College het eerste lettercijfersysteem (A-E). In 1898 werd E vervangen door F, omdat ouders de E verwarden met "Excellent." Pas in de jaren 1940 werd A-F dominant, samengesmolten met de 4.0 GPA-schaal (Schneider & Hutt, 2014).
De drijvende kracht achter standaardisatie was de explosieve groei door leerplicht (K-12), waardoor een uniform communicatiemiddel noodzakelijk werd.
Typisch gemiddelde: ~3.15 GPA (B-gemiddelde). Variatie per richting: onderwijs 3.36, scheikunde 2.78.
Grade inflation. Dramatisch bij elite-universiteiten:
- Harvard: 60% van alle cijfers zijn A's (was 33% in 1985)
- Yale: 79% A's (2022-23)
- Landelijk stijgen GPA's met 0,1 punt per decennium, al 30 jaar
Bronnen: Mount Holyoke College28; Schneider & Hutt (2014)8; BestColleges: grade inflation29; Harvard grade inflation report (ACTA, 2025)30
Verenigd Koninkrijk (Honours)
Schaal:
| Classificatie | Percentage | Betekenis |
|---|---|---|
| First Class Honours (1st) | 70%+ | Uitmuntend |
| Upper Second Class (2:1) | 60-69% | Goed |
| Lower Second Class (2:2) | 50-59% | Voldoende |
| Third Class (3rd) | 40-49% | Minimaal voldoende |
| Fail | <40% | Onvoldoende |
NB: Een 70% is "uitmuntend" in het VK, terwijl dat in veel andere landen slechts "gemiddeld" zou zijn.
Historische oorsprong. Ingevoerd in 1918 om academische prestaties te erkennen voorbij alleen examenresultaten. Criteriumgericht: beoordeling tegen vaste standaarden.
Statistieken (HESA, 2023/24): 29% First Class, 48% Upper Second (2:1), 20% Lower Second (2:2).
Grade inflation. Van 7% First Class in 1995/96 naar 29% in 2023/24 (piek 32,8% in 2021/22 door pandemie). De Office for Students stelt dat bijna de helft van de stijging niet verklaard kan worden.
Bronnen: Wikipedia: British undergraduate degree classification31; HESA (2023/24)32; Office for Students33; UK Standing Committee for Quality Assessment (2018)34
Japan
Traditioneel systeem:
| Japans | Romanisatie | Betekenis |
|---|---|---|
| 秀 | Shu | Superieur (S/A+) |
| 優 | Yu | Uitstekend (A) |
| 良 | Ryo | Goed (B) |
| 可 | Ka | Voldoende (C) |
| 不可 | Fuka | Onvoldoende (F) |
Voldoende: C (60%). In 2022 gebruikten 746 universiteiten (98,4%) het GPA-systeem.
Historische oorsprong. Sterk beinvloed door de Meiji-restauratie (1868), toen Japan westerse onderwijsmodellen overnam. Het GPA-systeem is pas recent wijdverspreid.
Bronnen: Wikipedia: Academic grading in Japan35; NIC-Japan36
China
Schaal:
| Percentage | Chinees | Betekenis | GPA |
|---|---|---|---|
| 90-100% | Youxiu (优秀) | Uitstekend | 4.0 |
| 80-89% | Lianghao (良好) | Goed | 3.0 |
| 70-79% | Zhongdeng (中等) | Gemiddeld | 2.0 |
| 60-69% | Jige (及格) | Voldoende | 1.0 |
| <60% | Bujige (不及格) | Gezakt | 0.0 |
Historische oorsprong. China heeft de langste traditie van formele examens ter wereld. Het keju-systeem (keizerlijk examensysteem) werd ingesteld tijdens de Sui-dynastie (605 n.Chr.) en duurde 1.300 jaar tot afschaffing in 1905. Het was bedoeld om overheidsfunctionarissen te selecteren op basis van kennis -- meritocratie in plaats van erfelijk privilege. De Gaokao (nationaal toelatingsexamen) werd door Deng Xiaoping in 1977 hersteld na de Culturele Revolutie.
Bronnen: Wikipedia: Imperial examination37; WES: The Gaokao38; Springer: Lessons from the Chinese Imperial Examination System39
India
Traditioneel (percentage):
| Percentage | Divisie |
|---|---|
| 75%+ | Distinction |
| 60-74% | First Division |
| 50-59% | Second Division |
| 40-49% | Third Division / Pass |
| <40% | Fail |
Modern CGPA (UGC 10-puntsschaal, sinds 2015): 4.0 = Pass, 9.0-10.0 = Outstanding.
Historische oorsprong. Diep geworteld in het Britse koloniale model. De overgang naar CGPA begon in 2009 (UGC-aanbeveling) en werd in 2015 landelijk uitgerold via het Choice Based Credit System (CBCS).
Bronnen: Wikipedia: Academic grading in India40; Vikaspedia: CBCS41
Australie
Schaal:
| Cijfer | Percentage | GPA (7-punt) |
|---|---|---|
| HD (High Distinction) | 85-100% | 7.0 |
| D (Distinction) | 75-84% | 6.0 |
| CR (Credit) | 65-74% | 5.0 |
| P (Pass) | 50-64% | 4.0 |
| F (Fail) | <50% | 0.0 |
Voldoende: 50%. Uniform systeem ingevoerd in 1994.
Filosofie. Combineert criteriumgerichte beoordeling met pragmatisme. Beroepsgerichte opleidingen (TAFE, VET) gebruiken pure competentiebeoordeling: "Competent" of "Not Yet Competent."
Bronnen: Wikipedia: Academic grading in Australia42; ANU Grading Scale43
Zuid-Korea
Universitaire schaal: A+ (4.5) tot F (0.0). Voldoende: D (60%).
CSAT (Suneung) -- toelatingsexamen: Stanine-systeem (9 niveaus), normaalverdeling:
- Niveau 1: top 4%
- Niveau 2: volgende 7%
- Niveau 3: volgende 12%
Historische oorsprong. Het traditionele Pyeongeoje-systeem (5-puntsschaal) werd overgenomen van het Japanse koloniale systeem (1943). Afgeschaft in basisscholen in 1998, middelbare scholen in 2012. Het huidige systeem is gemodelleerd naar het Amerikaanse model.
Bronnen: Wikipedia: Academic grading in South Korea44; Wikipedia: College Scholastic Ability Test45
Brazilie
Schaal: 0-10. Voldoende: 5.0 (sommige universiteiten 7.0).
Historische context. Sterk gedecentraliseerd: elke universiteit kiest haar eigen methode (percentage, numeriek, of letters). Het nationale evaluatie-instrument ENADE werd in 2004 ingevoerd.
Rusland
Schaal:
| Cijfer | Russisch | Betekenis |
|---|---|---|
| 5 | Otlichno (Отлично) | Uitstekend |
| 4 | Khorosho (Хорошо) | Goed |
| 3 | Udovletvoritelno (Удовлетворительно) | Voldoende |
| 2 | Neudovletvoritelno (Неудовлетворительно) | Onvoldoende |
| 1 | Plokho (Плохо) | Slecht (zelden gegeven) |
Voldoende: 3. In de praktijk worden alleen 3, 4 en 5 gebruikt.
Historische oorsprong. Ingevoerd in 1837 door het Ministerie van Onderwijs van het Russische Keizerrijk. Na de Oktoberrevolutie (1917) probeerde de Sovjet-regering het systeem af te schaffen -- dit experiment mislukte. In 1950 werd het hersteld en het overleefde de Sovjet-Unie zelf.
Filosofie. Opvallend smalle effectieve schaal: slechts drie niveaus van "geslaagd." Je beheerst het materiaal (in drie gradaties) of niet.
Bronnen: Wikipedia: Academic grading in Russia48; ITMO News49; Russia Beyond50
ECTS als Europese standaard
Tijdlijn
| Jaar | Gebeurtenis |
|---|---|
| 1989 | ECTS geintroduceerd als pilotproject binnen Erasmus |
| 1990 | ECTS-cijferschaal ingevoerd (A-E, normreferentie) |
| 1999 | Bolognaverklaring ondertekend door 29 landen |
| 2009 | Oude A-F ECTS-schaal afgeschaft |
| 2012-2015 | EGRACONS-project (12 universiteiten) |
| 2015 | Nieuwe ECTS Users' Guide met grading tables |
Oorspronkelijk systeem (1990-2009)
| ECTS | Percentage studenten | Betekenis |
|---|---|---|
| A | Top 10% | Excellent |
| B | Volgende 25% | Very Good |
| C | Volgende 30% | Good |
| D | Volgende 25% | Satisfactory |
| E | Laatste 10% | Sufficient |
Waarom het oude systeem werd afgeschaft
Het systeem was normreferentie (percentielrang binnen de groep), terwijl de meeste nationale systemen criteriumreferentie zijn (absolute leerdoelen). Dit maakte conversie conceptueel onjuist. Ter vervanging publiceren universiteiten nu cijferverdeling-tabellen waarmee de relatieve positie bepaald kan worden (Karran, 2005).
Bronnen: European Commission: ECTS51; Wikipedia: ECTS grading scale52; EGRACONS Project53; Karran (2005)54
Vergelijkende analyse
Mathematische eigenschappen
Absolute vs. relatieve beoordeling
| Type | Landen | Kenmerk |
|---|---|---|
| Criteriumgericht (absoluut) | NL, VK, AU, ZW (huidig) | Prestatie tegen vaste standaard |
| Normgericht (relatief) | KR (CSAT), oude ECTS | Positie t.o.v. peers |
| Mix | VS, JP | Combineert elementen |
Onderzoek toont dat criteriumgerichte beoordeling leidt tot hogere interbeoordelaarsbetrouwbaarheid (PMC, 2023) en dat normgerichte beoordeling mastery-goal orientatie verlaagt en zelfefficaciteit ondermijnt (ScholarWorks Indiana, 2024).
Granulariteit: betekenisvolle niveaus
Yorke (2011) introduceert het begrip measurement fallacy: fijnmazige schalen suggereren een precisie die in de praktijk niet bestaat. Sadler (2009) toont dat vooraf vastgestelde criteria onvermijdelijk overlappen door "fuzzy" grenzen.
In de praktijk:
- Nederland: effectief 4-5 niveaus (onvoldoende: 4-5, voldoende: 6, ruim voldoende: 7, goed: 8, uitstekend: 9-10)
- VS (A-F): 5 categorien, maar door inflatie effectief 3 (A, B, rest)
- Rusland: effectief 3 niveaus (3, 4, 5)
- 100-puntschaal: 100 mogelijke scores, maar de betrouwbaarheid rechtvaardigt dat niet
Verhouding voldoendes/onvoldoendes
| Systeem | Onvoldoende zone | Voldoende zone |
|---|---|---|
| Nederland (1-10) | 50% (1-5) | 50% (6-10) |
| VS (A-F) | 20% (F) | 80% (A-D) |
| Duitsland (1-6) | 33% (5-6) | 67% (1-4) |
| Frankrijk (0-20) | 50% (0-9) | 50% (10-20) |
| VK | 40% (<40%) | 60% (40%+) |
| Italie uni (0-30) | 60% (0-17) | 40% (18-30) |
Bronnen: Yorke (2011)55; Sadler (2009)56; Nuffic/Fulbright (2022)1
Grade inflation
Kerndata per regio
| Regio | Trend |
|---|---|
| VS | Mediaan GPA +21,5% over 30 jaar. A's vormen bijna helft van alle cijfers (Rojstaczer & Healy, 2012) |
| Harvard | 60% A's (2024), was 33% in 1985 |
| VK | First Class: 7% (1995) naar 29% (2023/24). Bijna helft onverklaard (Office for Students) |
| Europa | +0,075 punt/jaar op 20-puntschaal. Pandemie versnelde 10x (Francois et al., 2025) |
Oorzaken
- Consumentendruk: studenten als "klanten" die hogere cijfers verwachten
- Zelfselectie: studenten kiezen minder uitdagende vakken
- Pandemie-effect: wereldwijde piek door aangepaste toetsing
- Concurrentie tussen instellingen: Princeton schafte anti-inflatiebeleid af in 2014
Het U.S. Department of Education noemt het een collective action problem: geen enkele universiteit wil eenzijdig strenger worden.
Nederland als uitzondering
Het Nederlandse systeem vertoont minder grade inflation door:
- Geen "curve" (normreferencing)
- Toelating niet primair op basis van hoge cijfers maar op diplomabezit
- Culturele norm van streng beoordelen
Bronnen: Rojstaczer & Healy (2012)57; Francois et al. (2025)58; BestColleges29; U.S. Department of Education59
Psychologische en pedagogische effecten
Cijfers en motivatie
Self-Determination Theory (Deci & Ryan, 2000) identificeert drie basisbehoeften: autonomie, competentie en verbondenheid. Cijfers ondermijnen met name de autonomie-behoefte. Chamberlin, Yasue en Chiang (2023) bevestigden dat cijfers angst verhogen en dat studenten uitdagende vakken vermijden. Kohn (1993/2018) betoogt in "Punished by Rewards" dat cijfers het plezier in leren verminderen.
Pass/fail vs. numeriek
Spring et al. (2011) vonden in medisch onderwijs:
- Pass/fail studenten: significant hogere welzijnsniveaus
- Grotere tevredenheid met onderwijs en persoonlijk leven
- Geen significante verschillen in academische prestaties
Conclusie: pass/fail biedt duidelijke voordelen voor welzijn zonder afbreuk aan leerprestaties.
Norm- vs. criteriumgericht
Onderzoek met Zweedse pleegkinderen toonde dat de overgang van norm- naar criteriumgericht beoordelen (1998) leidde tot significante verschillen in onderwijsprestaties -- het systeem zelf beinvloedt uitkomsten, onafhankelijk van daadwerkelijke leerresultaten.
Bronnen: Ryan & Deci (2000)60; Chamberlin et al. (2023)61; Spring et al. (2011)62; Kohn (1993)63
Kritiek en alternatieven
Fundamentele kritiek
- Meetfout als feit (Yorke, 2011): cijfers suggereren precisie die niet bestaat
- Criterium-onbepaaldheid (Sadler, 2009): criteria overlappen onvermijdelijk
- Multidimensionaal construct (Brookhart et al., 2016): cijfers weerspiegelen kennis, inzet, gedrag en docentvoorkeuren
- Sociale ongelijkheid: beinvloed door sociaaleconomische status en vooroordelen
Alternatieven
| Alternatief | Beschrijving | Evidence |
|---|---|---|
| Narratieve beoordeling | Kwalitatieve beschrijvingen van sterktes en verbeterpunten | Hogere intrinsieke motivatie (PMC, 2013) |
| Portfolio-beoordeling | Verzameling werk dat groei demonstreert | Focus op ontwikkeling i.p.v. momentopnames |
| Ungrading (Stommel, 2023) | Minimaliseren/verwijderen van cijfers, focus op feedback | Groeiende evidence base |
| Standards-based grading | Beoordeling per leerdoel i.p.v. samenvattend cijfer | Preciezer inzicht per competentie |
Bronnen: Brookhart et al. (2016)64; Stommel (2023)65; Harvard Derek Bok Center66
Vergelijkingstabellen
Europa
| Land | Schaal | Voldoende | "Goed" | Top | Omgekeerd? | Gem. |
|---|---|---|---|---|---|---|
| Nederland | 1-10 | 5,5 (=6) | 7 | 9-10 | Nee | ~7 |
| Duitsland | 1-6 | 4 | 2 | 1-1,3 | Ja | ~3,0 |
| Frankrijk | 0-20 | 10 | 14 | 16-20 | Nee | ~10-12 |
| Italie (uni) | 0-30 | 18 | 25-27 | 30L | Nee | ~22-28* |
| Spanje | 0-10 | 5 | 7-8 | 9-10 | Nee | -- |
| Zweden | A-F | E | C | A | n.v.t. | -- |
| Denemarken | -3 t/m 12 | 02 | 7 | 12 | Nee | -- |
| Finland | 4-10 | 5 | 8 | 10 | Nee | -- |
| Belgie | 0-20 | 10 | 14-15 | 18-20 | Nee | -- |
* = niet geverifieerd
Wereldwijd
| Land | Schaal | Voldoende | Filosofie | Max GPA | Ingevoerd |
|---|---|---|---|---|---|
| VS | A-F + 4.0 GPA | D (60%) | Mix norm/criterium | 4.0 | 1897 |
| VK | 1st/2:1/2:2/3rd | 40% | Criteriumgericht | n.v.t. | 1918 |
| Japan | S/A/B/C/F | C (60%) | Criterium + competitief | 4.0-4.5 | Meiji-era |
| China | 0-100% + A-F | 60% | Meritocratisch | 4.0 | Keju: 605 |
| India | % + CGPA 10-punt | 40% / 4.0 | Percentagegericht | 10.0 | Koloniaal |
| Australie | HD/D/CR/P/F | 50% | Criterium + competentie | 7.0 | 1994 |
| Zuid-Korea | A+-F + 4.5 GPA | D (60%) | Normgericht (stanine) | 4.0-4.5 | 1943 |
| Brazilie | 0-10 / A-E | 5.0 | Gedecentraliseerd | n.v.t. | -- |
| Rusland | 5-2 (eff. 5-3) | 3 | Smalle schaal | n.v.t. | 1837 |
Verdieping: Het effect van het grote onvoldoende-bereik in Nederland
Structureel verschil
| Systeem | Onvoldoende zone | Voldoende zone | Ratio |
|---|---|---|---|
| Nederland (1-10) | 50% van de schaal (1-5) | 50% (6-10) | 1:1 |
| Duitsland (1-6) | 33% (5-6) | 67% (1-4) | 1:2 |
| VS (A-F) | 20% (F) | 80% (A-D) | 1:4 |
| VK | 40% (<40%) | 60% (40%+) | 2:3 |
1. Psychologische asymmetrie
De helft van de schaal is "faalzone" terwijl in de praktijk cijfers 1-4 nauwelijks worden gegeven. Het gevolg: er zijn 5 cijfers gereserveerd voor falen die vrijwel nooit worden gebruikt, terwijl de daadwerkelijke spreiding van voldoendes zich samenperst in 6-8 (drie cijfers voor 90%+ van de geslaagde studenten). Het systeem bestraft falen disproportioneel in de perceptie, terwijl het succes nauwelijks differentieert.
2. Compressie aan de bovenkant
Omdat 9 en 10 cultureel "verboden terrein" zijn, moeten alle betekenisvolle onderscheidingen tussen voldoende studenten gemaakt worden in het bereik 6-8. Dat zijn drie niveaus. Het Amerikaanse systeem heeft er vier bruikbare (A, B, C, D), het Duitse ook vier (1-4). Nederland heeft dus de minste differentiatie waar het ertoe doet.
3. Grade inflation als structurele onmogelijkheid
De keerzijde is positief: het systeem is inherent resistent tegen inflatie. Er is simpelweg geen ruimte om "omhoog te schuiven." In de VS kun je van B naar A opschuiven en het ziet er nog normaal uit. In Nederland zou de equivalente verschuiving van 7 naar 8 al opvallen als uitzonderlijk. De grote onvoldoende-zone fungeert als anker.
4. Internationale onderwaardering
Een Nederlandse 7 (meest voorkomende cijfer, "goed werk") valt bij directe conversie in de C-zone van het Amerikaanse systeem -- "gemiddeld." Een 8 ("uitstekend" in Nederlandse context) wordt een B. Dit benadeelt Nederlandse studenten bij internationale sollicitaties en graduate admissions waar GPA's letterlijk worden omgerekend zonder contextbegrip. Nuffic waarschuwt hier expliciet voor (Nuffic/Fulbright, 2022)1.
5. Motivatie-effect
De grote faalzone in combinatie met de culturele norm dat hoog scoren "niet hoort" creëert een systeem dat eerder straft dan beloont. In het Amerikaanse systeem is de default een voldoende (80% van de schaal), in Nederland is de default 50/50. Vanuit Self-Determination Theory (Ryan & Deci, 2000)60 ondermijnt dit de competentiebehoefte: studenten ervaren minder positieve bekrachtiging per eenheid inspanning.
Samengevat
Het grote onvoldoende-bereik maakt het Nederlandse systeem streng, inflatiebestendig en internationaal moeilijk vertaalbaar. De prijs is compressie aan de bovenkant (weinig differentiatie tussen goede en uitstekende studenten) en structurele onderwaardering bij internationale vergelijking. Of dat een prijs is die het waard is, hangt af van wat je waardeert: eerlijkheid van het signaal (Nederland) of motiverend vermogen (VS).
Conclusies
-
Geen systeem is objectief. Alle cijfersystemen zijn sociale constructies met inherente meetfouten. De illusie van precisie neemt toe met de granulariteit van de schaal, maar de werkelijke betrouwbaarheid niet (Yorke, 2011).
-
Distributies zijn niet vergelijkbaar. Het Nederlandse systeem concentreert zich bij 6-7 (onderkant voldoendes), het Amerikaanse bij A-B (bovenkant). Directe conversie is zonder distributioneelcontext misleidend (Nuffic, 2022).
-
Grade inflation is universeel -- in de VS, VK en (in mindere mate) Europa. Het Nederlandse systeem is structureel beter beschermd door absolute beoordeling en culturele normen.
-
Cijfers ondermijnen motivatie. Consistent in de literatuur: numerieke beoordeling verlaagt intrinsieke motivatie, verhoogt angst, en bevordert risicomijdend gedrag. Pass/fail levert betere welzijnsuitkomsten zonder prestatieverlies (Spring et al., 2011).
-
Conversie blijft onopgelost. Ondanks ECTS, EGRACONS en Nuffic bestaat er geen bevredigend universeel conversie-mechanisme. Percentielranking is de beste benadering.
-
Culturele wortels bepalen het systeem. Van het Nederlandse calvinisme (perfectie is Gods domein) via het Chinese keju (meritocratie via examinatie) tot het Russische pragmatisme (drie niveaus van beheersing): elk cijfersysteem weerspiegelt diepe culturele waarden.
Bronnen
Academische publicaties
Institutionele rapporten
Wikipedia & encyclopedieen
Overige bronnen
-
Nuffic/Fulbright (2022). "Grading systems in the Netherlands, the United States and the United Kingdom." PDF ↩︎ ↩︎ ↩︎
-
Schneider, J. & Hutt, E. (2023). "The Troubled History of Grades and Grading: A Historical Comparison of Germany and the United States." Formazione & Insegnamento. ResearchGate ↩︎
-
Schneider, J. & Hutt, E. (2014). "Making the Grade: A History of the A-F Marking Scheme." Journal of Curriculum Studies, 46(2). Taylor & Francis ↩︎ ↩︎
-
BestColleges. "Grade Inflation Trends and Causes." BestColleges ↩︎ ↩︎
-
ACTA (2025). "Harvard University: Damaging Grade Inflation." ACTA ↩︎
-
UK Standing Committee for Quality Assessment (2018). "The Drivers of Degree Classifications." PDF ↩︎
-
EGRACONS Project. egracons.eu ↩︎
-
Karran, T. (2005). "Pan-European Grading Scales: Lessons from National Systems and the ECTS." Higher Education in Europe, 30(1). Taylor & Francis ↩︎
-
Yorke, M. (2011). "Summative assessment: dealing with the 'measurement fallacy'." Studies in Higher Education, 36(3), 251-273. Taylor & Francis ↩︎
-
Sadler, D.R. (2009). "Indeterminacy in the use of preset criteria for assessment and grading." Assessment & Evaluation in Higher Education, 34(2), 159-179. Taylor & Francis ↩︎
-
Rojstaczer, S. & Healy, C. (2012). "Where A Is Ordinary: The Evolution of American College and University Grading, 1940-2009." Teachers College Record, 114(7). SAGE ↩︎
-
Francois et al. (2025). "A decade of grade inflation boosted by the COVID-19 pandemic." British Educational Research Journal. Wiley ↩︎
-
U.S. Department of Education. "Addressing the Grade Inflation Collective Action Problem." ED.gov ↩︎
-
Ryan, R.M. & Deci, E.L. (2000). "Self-Determination Theory and the Facilitation of Intrinsic Motivation." American Psychologist, 55(1), 68-78. PDF ↩︎ ↩︎
-
Chamberlin, K., Yasue, M. & Chiang, I-C.A. (2023). "The impact of grades on student motivation." Active Learning in Higher Education, 24(2). SAGE ↩︎
-
Spring, L. et al. (2011). "Impact of pass/fail grading on medical students' well-being and academic outcomes." Medical Education, 45(9), 867-877. PubMed ↩︎
-
Kohn, A. (1993/2018). Punished by Rewards. alfiekohn.org ↩︎
-
Brookhart, S.M. et al. (2016). "A Century of Grading Research." Review of Educational Research, 86(4). SAGE ↩︎
-
Stommel, J. (2023). Undoing the Grade: Why We Grade, and How to Stop. Hybrid Pedagogy Inc. jessestommel.com ↩︎
Reacties
Nog geen reacties. Wees de eerste.
Reageer