In mijn werk probeer ik nuchter te zijn over AI. Soms wordt dit door voorstanders als te kritisch ervaren, soms door tegenstanders als te positief. Die laatste groep zal wellicht vandaag aan zijn of haar trekken komen met een nieuwe studie van Sean Walton en collega’s die toont wat er gebeurt als mensen met AI werken. Niet in theorie, maar in de praktijk. En het resultaat is tegelijk hoopgevend als het gaat over meer effect door samenwerking, maar ook wel wat ontnuchterend.
Laat me beginnen met wat hier wél duidelijk naar voren komt. Mensen die actief samenwerken met AI om een virtuele auto te ontwerpen, doen het beter dan wanneer ze het systeem gewoon laten draaien. In deze studie: wie niets deed, haalde gemiddeld zo’n 124% verbetering. Wie zelf begon te sleutelen aan ontwerpen, zat rond 243%. Maar wie ook gebruik maakte van AI-gegenereerde suggesties, ging naar gemiddeld 420%.
En het blijft niet bij output. Mensen die met die AI-suggesties werken, blijven ook langer bezig en ondernemen meer acties. Met andere woorden: ze zijn meer betrokken. Niet alleen gedragsmatig, maar ook cognitief. Ze kijken, kiezen, proberen, passen aan. Dat is misschien nog belangrijker dan die eindscore. Want wie leert, doet dat zelden passief.
Interessant is ook dat niet elke vorm van AI evenveel oplevert. De studie vergelijkt “slimme” AI-suggesties met willekeurige voorbeelden. Beide krijgen evenveel aandacht van gebruikers, maar de slimme varianten leiden tot meer acties en betere resultaten. Niet omdat mensen ze noodzakelijk beter vinden, maar omdat ze er blijkbaar meer mee kunnen doen. De onderliggende algoritmes lijken dus echt voor verbetering te zorgen.
En daar zit een kleine verrassing. Wat objectief werkt, voelt niet altijd zo voor wie het gebruikt. De deelnemers zijn verdeeld in hun oordeel. Sommigen vinden de AI-suggesties duidelijk beter, anderen geven de voorkeur aan willekeur, nog anderen zien weinig verschil. Dat is herkenbaar. In onderwijs zien we dat ook: wat effectief is, wordt niet altijd zo ervaren.
Maar voor je hier conclusies uit trekt, hoog tijd voor de nuance. Dit is geen onderzoek in een klassetting. Het gaat dus niet over leerlingen die moeten leren voor een toets, geen leraar die keuzes maakt onder tijdsdruk. Het is een ontwerp-taak in een relatief gecontroleerde omgeving. Interessant, maar niet zomaar te vertalen naar onderwijs.
Ook de deelnemers zijn geen doorsnede van een klas. Ze kiezen er zelf voor om mee te doen. Ze hebben tijd, interesse en vaak ook een zekere technische affiniteit. En zelfs dan doet de helft… niets. Ze laten het systeem gewoon lopen. Dat is misschien wel het meest veelzeggende resultaat van allemaal. Technologie kan nog zo goed zijn, als mensen er niets mee doen, gebeurt er ook niets.
Methodologisch zijn er nog wat kanttekeningen. Het grootste deel van de data komt uit een open veldstudie. Dat geeft schaal qua steekproef, maar minder controle. Je weet niet exact wie wat doet of hoe consistent deelnemers zijn. De aanvullende labstudie brengt meer controle, maar met twaalf deelnemers is die vooral verkennend.
En dan is er nog hoe “beter” wordt gemeten. Hier gaat het om verbetering ten opzichte van een startpunt. Dat maakt vergelijking lastig. Wie slecht begint, kan sneller grote sprongen maken. Wie al goed zit, heeft minder marge. De onderzoekers erkennen dat zelf, maar het blijft iets om mee in het achterhoofd te houden.
Wat kunnen we dan leren van deze studie? Niet dat AI werkt. Maar wanneer ze kan werken. Dat is dus niet als vervanger, niet als automatische oplossing, maar als onderdeel van een interactie. Mensen die actief met AI aan de slag gaan, halen er iets uit. Mensen die dat niet doen, niet.
Misschien halen de voorstanders van AI nu de schouders op omdat het banaal lijkt te klinken. Maar in het debat over AI in onderwijs is dat net wat vaak verdwijnt. We praten over tools, systemen en mogelijkheden. Minder over wat mensen er effectief mee doen. Deze studie legt dat vrij droog bloot. AI kan helpen. Soms zelfs behoorlijk. Maar alleen als iemand de moeite doet om ermee te werken. En zelfs dan blijft het verschil afhankelijk van hoe die interactie eruitziet.
Maar hebben zij iets geleerd?