Stel je voor: een student die een semester lang nauwelijks zelf werkt, maar wél met gemak een B haalt in een universitair vak. Alleen niet door zelf te blokken… maar door ChatGPT te laten werken. Een doembeeld voor veel docenten, maar kan het ook echt?
Onderzoekers van de University of Illinois onder leiding van Gokul Puthumanaillam hebben precies dat getest. Ze vroegen zich af: hoe goed kan een taalmodel zoals ChatGPT een écht technische opleiding doorlopen? Niet zomaar losse vragen oplossen, maar alles: meerkeuzevragen, zware wiskundige afleidingen, uitgebreide programmeerprojecten en lange theoretische essays.
Het resultaat? Met minimale inspanning – gewoon opdrachten kopiëren en plakken zonder extra uitleg – slaagde ChatGPT er gemiddeld in om 82,24% te halen. Dat is nét onder het gemiddelde van de echte studenten, die op 84,99% zaten. Vooral in gestructureerde opdrachten zoals meerkeuzevragen en standaardexamens scoorde het model erg goed. In creatieve of open opdrachten, zoals het bouwen van controle-algoritmes of het schrijven van technische rapporten, liep het wél duidelijk achter.
Interessant: zelfs als de onderzoekers ChatGPT een beetje hielpen door relevante college-aantekeningen mee te sturen, verbeterde het model maar beperkt. Vooral in programmeerprojecten viel op hoe ChatGPT vaak brute-force oplossingen gaf die technisch werkten, maar weinig robuust of elegant waren. Alsof je een IKEA-kastje bouwt zonder ooit naar de handleiding te kijken: het staat, maar wie weet hoe lang.
De studie zegt eigenlijk vooral: AI kan veel, maar mist nog de échte intuïtie die mensen leren. En het roept een belangrijke vraag op: als AI steeds beter wordt in standaard taken, hoe moeten we dan onderwijs anders gaan inrichten? Misschien moeten we studenten niet alleen toetsen op juiste antwoorden, maar veel meer op hun redenatie, hun keuzes, en hun vermogen om complexe problemen vanuit verschillende hoeken te bekijken.
In plaats van AI-gebruik te verbieden, stelt dit onderzoek voor om onderwijs slim te hervormen. Minder simpele multiple-choice, meer echte projecten en open vragen die AI niet zomaar kan faken. Want precies daar ligt nog altijd het verschil tussen een goede ingenieur en een slimme chatbot.
Dus ja: ChatGPT haalde bijna een B. Maar gelukkig is excellentie nog altijd iets wat uit echte nieuwsgierigheid en kritisch denken komt – niet alleen uit slimme algoritmes.
Abstract van het onderzoek:
This paper presents a comprehensive investigation into the capability of Large Language Models (LLMs) to successfully complete a semester-long undergraduate control systems course. Through evaluation of 115 course deliverables, we assess LLM performance using ChatGPT under a “minimal effort” protocol that simulates realistic student usage patterns. The investigation employs a rigorous testing methodology across multiple assessment formats, from auto-graded multiple choice questions to complex Python programming tasks and long-form analytical writing. Our analysis provides quantitative insights into AI’s strengths and limitations in handling mathematical formulations, coding challenges, and theoretical concepts in control systems engineering. The LLM achieved a B-grade performance (82.24%), approaching but not exceeding the class average (84.99%), with strongest results in structured assignments and greatest limitations in open-ended projects. The findings inform discussions about course design adaptation in response to AI advancement, moving beyond simple prohibition towards thoughtful integration of these tools in engineering education. Additional materials including syllabus, examination papers, design projects, and example responses can be found at the project website: https://gradegpt.github.io.