Scores van onderzoeks-evaluaties
In het kort
- De scores van alle criteria in 2015 zijn gestegen ten opzichte van 1994. Ook is de spreiding van de protocollen afgenomen.
- Eenheden binnen de HOOP-classificatie krijgen gemiddeld de hoogste score voor relevantie en de laagste score voor levensvatbaarheid.
- Natuur en Interdisciplinair scoren het hoogst op binnen de HOOP-classificatie.
Wat is de gemiddelde score per criterium per jaar?
Toelichting 2015*: De scores in 2014 van het SEP 2015-2021 zijn samengenomen met 2015, vanwege het lage aantal in 2014. De scores in 2017 van het SEP 2009-2015 zijn samengenomen met 2015, vanwege het lage aantal in 2017. Voor 2022 is er in totaal één evaluatie beschikbaar die ontbreekt in de figuur.
Inhoudelijke toelichting
In bovenstaande grafiek is de gemiddelde score per criterium per jaar te zien. Voor periode 1995-2015 is daarvoor gebruik gemaakt van de scores op basis van de protocollen van de Vereniging van Universiteiten (VSNU): VSNU 1994, VSNU 1998, SEP 2003-2009 en SEP 2009-2015. In deze protocollen is gescoord op een vijfpuntschaal van 1 (slecht/unsatisfactory) tot 5 (excellent). Voor de jaren 2015-2021 zijn de scores van het SEP 2015-2021 gebruikt. Dit SEP gebruikt een vierpuntschaal van 4 (unsatisfactory) tot 1 (world leading/excellent). Voor deze grafiek zijn de scores met het SEP 2015-2021 omgedraaid (een 4 wordt een 1 en een 1 een 4), zodat in de grafiek nog steeds geldt: hoe hoger de lijn, hoe beter de score.
Wat opvalt in de grafiek is dat de scores met de jaren steeds hoger worden. In de jaren tot en met 2015 stijgen de gemiddelde scores tot waarden tussen 4,35 (levensvatbaarheid) en 4,5 (relevantie). Als we kijken naar de gemiddelde scores per protocol is te zien dat de scores stijgen en dat de spreiding afneemt met de opeenvolgende protocollen. Bij het SEP 2009-2015 is de meest voorkomende score voor wetenschappelijke kwaliteit, wetenschappelijke productiviteit en relevantie een 5 (de hoogst mogelijke score) en voor levensvatbaarheid een 4.
Tot slot valt het op dat we in bovenstaande grafiek een dip in 2001 en 2013 zien en tussen. Een mogelijke verklaring hiervoor is dat de gemiddelden voor deze jaren voor meer dan 75% opgemaakt worden door scores binnen één HOOP-classificatie: voor 2001 is dat Gedrag en Maatschappij en voor 2013 is dat Taal en Cultuur. Deze beide HOOP-classificaties scoren gemiddeld per protocol lager dan het gemiddelde per protocol van alle HOOP-classificaties.
Wat is de gemiddelde score per HOOP-classificatie?
Inhoudelijke toelichting
In bovenstaande grafiek is de gemiddelde score per HOOP-classificatie te zien voor het SEP 2015-2021. Hierbij zijn de scores weer omgedraaid: een 1 wordt een 4 en een 4 wordt een 1. Dit is gedaan zodat een hogere staaf in de grafiek ook een hogere score representeert. De trend dat eenheden gemiddeld de hoogste score krijgen voor relevantie en de laagste score voor levensvatbaarheid is ook in de grafiek te zien. Dit geldt niet voor Natuur waar kwaliteit hoger scoort dan relevantie.
Verandering in de vergelijking
Verdeling eigenstandige en gezamenlijke evaluaties
Percentage eenheden eigenstandig geëvalueerd | Percentage eenheden gezamenlijk geëvalueerd | Aantal geëvalueerde eenheden | |
VSNU 1994 | 4 | 96 | 1257 |
VSNU 1998 | 4 | 96 | 1040 |
SEP 2003-2009 | 49 | 51 | 1367 |
SEP 2009-2015 | 42 | 58 | 740 |
SEP 2015-2021 | 76 | 27 | 613 |
SEP 2021-2027 | 78 | 22 | 122 |
Inhoudelijke toelichting
Met de komst van het SEP 2003-2009 is het systeem van vergelijkende beoordelingen op nationaal niveau losgelaten. Dit loste een belangrijk kritiekpunt op dat in discipline brede beoordelingen eenheden vergeleken werden die eigenlijk niet vergelijkbaar waren. In het SEP 2003-2009 is ongeveer de helft van de eenheden gezamenlijk geëvalueerd en de helft eigenstandig. Met het SEP 2015-2021 lijkt er een trend ingezet waarbij het merendeel van de evaluaties eigenstandig wordt gedaan. De aantallen in het SEP 2021-2027 zijn te klein om al uitspraken over te doen.
- De evaluatierapporten zijn van de websites van de instellingen gehaald. Omdat het sinds de introductie van het SEP ontbreekt aan een centraal overzicht van uitgevoerde en geplande evaluaties is niet met zekerheid vast te stellen of het overzicht compleet is.
- De betekenis van de oordelen op de vijfpuntsschaal (alle protocollen met uitzondering van het SEP 2015-2021) is een aantal keer gewijzigd. De scores zijn één op één overgenomen, zonder hiermee rekening te houden.
Voor meer informatie over onderzoeksevaluaties verwijzen we graag naar de Feiten en Cijfers publicatie van het Rathenau Instituut Twintig jaar onderzoeksevaluaties.
Voor een uitleg van de gebruikte definities en afkortingen verwijzen we graag naar de webpagina Definities en afkortingen.