Wie de recente discussies over AI in het onderwijs volgt, merkt hetzelfde patroon dat ik vorige week scherp benoemde in mijn blog naar aanleiding van een meta-review over dit onderwerp: veel AI-onderzoek toont vooral de technologische mogelijkheden, maar laat de didactische onderlaag grotendeels liggen. We experimenteren volop, maar vaak zonder helder zicht op wat leerlingen precies doen, hoeveel denkwerk ze nog zelf verrichten en welke leertheorie daaronder zou moeten liggen. In dat licht is de nieuwe studie van Pia Kreijkes en collega’s interessant, omdat ze niet vertrekt vanuit het enthousiasme over wat AI kan genereren, maar kijkt naar iets wat in veel onderzoeken ontbreekt: wat blijft er na een paar dagen effectief hangen wanneer leerlingen met een LLM leren.
Het opzet van de studie is relatief eenvoudig en precies daardoor sterk. Meer dan driehonderd Britse vijftienjarigen lazen twee moeilijke geschiedenisfragmenten. Voor één van de twee teksten moest elke leerling altijd met de chatbot werken om uitleg te krijgen, begrippen te laten toelichten of een samenvatting te genereren. De andere tekst werd, afhankelijk van de toegewezen conditie, óf uitgewerkt met alleen notities óf met een combinatie van LLM en notities. Zo konden de onderzoekers vergelijken hoeveel leerlingen leerden van zelf noteren, van AI-ondersteuning of van de combinatie. Drie dagen later volgden testen op feitelijke kennis, begrip en vrije reproductie. Dit was dus geen demonstratie van wat AI kan produceren. Het was wel een experiment dat vraagt wat leerlingen nog weten wanneer de schermen al even dicht zijn.
De kernresultaten zullen ervaren lesgevers wellicht niet verrassen. Wie zelf notities maakt, leert meer. Bijna alle uitkomsten tonen dat actief verwerken krachtiger is dan wat leerlingen spontaan met een LLM doen. De combinatie van LLM en notities levert wel een kleine extra winst op ten opzichte van enkel de LLM, maar die blijft veel kleiner dan het voordeel van gewoon noteren. Meteen zie je waarom dit werk relevant is. Leerlingen vonden werken met de LLM leuker en makkelijker, maar besteedden minder moeite en minder tijd. Dat klinkt bijna te mooi als een voorbeeld uit een theorieboek over leerpsychologie, maar hier komt het gewoon terug in de data. Dingen die makkelijk voelen, zijn niet per se de dingen die beklijven.
Toch verdient de studie lof omdat ze zorgvuldig is opgebouwd. De teksten zijn op voorhand gematcht op lengte, moeilijkheid en conceptdichtheid. Alle stappen binnen het onderzoek werden op voorhand geregistreerd. De open antwoorden zijn gescoord door drie onafhankelijke beoordelaars met bijna perfecte overeenstemming. En de onderzoekers gaan niet alleen in op leerprestaties, maar ook op hoe leerlingen met de AI communiceren. Interessant daarbij is dat in de combinatieconditie veel leerlingen gewoon knip en plakgedrag vertoonden. Hun notities waren soms letterlijk stukken LLM-output. HIerdoor gaat precies datgene verloren wat noteren krachtig maakt: actief selecteren en zelf formuleren. Of ook wel: denken.
Net daardoor vallen de beperkingen duidelijk op. De studie bevat geen passieve leesconditie. Hierdoor weten we niet of LLM-gebruik beter of slechter is dan gewoon lezen zonder strategie. Het experiment blijft smal: één leeftijd, één vak, twee korte sessies, één model dat intussen verouderd is. Wat leerlingen doen met AI in een langere leercyclus, met begeleiding of in andere domeinen, blijft buiten beeld. En hoewel de studie zorgvuldig is, vergelijkt ze eigenlijk een goed uitgewerkte leerstrategie met een vrij ongestuurde manier van AI gebruiken. Dat zegt veel over spontaan gebruik, maar nog weinig over hoe we bij sterke didactiek AI nuttig zou kunnen integreren. En de onderzoekers zijn ook wel verbonden aan Microsoft en Cambridge University Press & Assessment,
Het meest opvallende blijft misschien wel deze tegenstelling: notities zonder LLM werkten het best, maar leerlingen hadden er het minst zin in. Dat is geen klein detail. Het toont opnieuw hoe groot het verschil kan zijn tussen wat comfortabel voelt en wat effectief is. Technologie kan die spanning verkleinen, maar ze heft ze niet op.