Wat een Science-artikel over topprestaties wel en niet zegt

File:Chess pieces close up.jpgEind vorig jaar verscheen in Science een reviewartikel dat bijzonder veel aandacht kreeg. Het stuk van Arne Güllich n collega’s bundelt onderzoek naar de ontwikkeling van uitzonderlijke prestaties in domeinen als topsport, wetenschap, muziek en schaken, en trekt een opvallende conclusie: vroege uitblinkers blijken zelden dezelfde personen te zijn als degenen die later tot de absolute wereldtop behoren. Vroege specialisatie en snelle vooruitgang zouden zelfs negatief samenhangen met latere topprestaties. Maar wacht laten we even stilstaan bij wat dit science-artikel over topprestaties wel en niet zegt.

Het artikel werd gretig gedeeld. Niet onterecht. Het brengt een indrukwekkende hoeveelheid data samen en stelt vragen die in het onderzoek naar expertise lang onderbelicht bleven. Tegelijk is een publicatie in een  dergelijk toptijdschrift geen vrijgeleide voor ongenuanceerde conclusies (zie ook eerder hier). Dat beseffen de auteurs zelf ook, en dat blijkt bovendien uit de commentaren die na het artikel verschenen.

Wat het artikel laat zien

De auteurs syntheseren gegevens van meer dan 34.000 internationale toppresteerders: Olympische kampioenen, Nobelprijswinnaars, topschakers en gerenommeerde componisten. Over die domeinen heen zien ze een terugkerend patroon. Wie op jonge leeftijd tot de absolute top behoort, blijkt meestal niet dezelfde persoon te zijn als wie later op het hoogste niveau presteert. In veel gevallen presteren latere wereldtoppers in hun jeugd zelfs minder goed dan leeftijdsgenoten die uiteindelijk ‘net onder de top’ blijven hangen.

Daarnaast onderscheiden de auteurs twee verschillende ontwikkelingspaden. Vroege toppresteerders kenmerken zich door vroege start, snelle progressie en veel domeinspecifieke oefening. Latere wereldtoppers daarentegen laten vaker een trager begin zien, combineren hun hoofddiscipline met andere activiteiten en specialiseren later.

Dat patroon is intrigerend, en het doorbreekt het idee dat vroege selectie en maximale versnelling vanzelfsprekend de beste weg naar excellentie zijn.

Wat de auteurs zelf expliciet nuanceren

Opvallend is dat het artikel zelf al vrij voorzichtig is in zijn claims, terwijl die voorzichtigheid al snel verloren ging op wie het onderzoek deelde. Het gaat om een review van bestaande datasets, niet om nieuw experimenteel onderzoek. De auteurs benadrukken dat hun bevindingen beschrijvend zijn: ze tonen samenhangen, geen causale mechanismen. Dat vroege specialisatie samenhangt met lagere kans op latere wereldtop, betekent niet automatisch dat vroege specialisatie die uitkomst veroorzaakt.

Daarnaast wijzen ze erop dat het onderzoek zich noodgedwongen richt op domeinen waarin prestaties goed meetbaar en internationaal vergelijkbaar zijn. Dat maakt de bevindingen robuust binnen sport, schaken en bepaalde academische contexten, maar het beperkt de generaliseerbaarheid naar andere domeinen waar prestaties diffuser zijn of later zichtbaar worden.

Ook benadrukken ze dat veel latere wereldtoppers wel degelijk bovengemiddeld presteren in hun jeugd. Het gaat dus niet om een romantisch verhaal van ‘middelmatigheid die vanzelf boven komt drijven’, maar om subtiele verschillen binnen een al sterk geselecteerde groep.

De commentaren: waarom voorzichtigheid nodig blijft

Maar er verscheen ook al snel wetenschapplijk commentaar op het artikel. Niet in de marge, maar precies op het punt dat het meest werd opgepikt in de publieke discussie: de negatieve samenhang tussen vroege prestaties en latere topprestaties.

In een korte maar scherpe analyse wijst Michel Nivard erop dat dit patroon zeer waarschijnlijk verklaard kan worden door collider bias. Dat is een vorm van selectiebias die ook bekendstaat als Berkson’s paradox. Zelf kende ik vooral een specifieke variant daarvan, namelijk survivor bias. Het probleem is conceptueel eenvoudig en tegelijk methodologisch verraderlijk.

Wanneer je alleen kijkt naar een sterk geselecteerde groep, in dit geval mensen die het tot de absolute top hebben geschopt, en die selectie afhangt van zowel vroege als latere prestaties, kan er binnen die groep een kunstmatige negatieve samenhang ontstaan. Zelfs als vroege en latere prestaties in de volledige populatie juist positief samenhangen.

Nivard illustreert dit met simulaties. In de volledige populatie lopen vroege en latere prestaties netjes samen op. Maar zodra je conditioneert op elite-status, kantelt het verband. Binnen de geselecteerde groep lijkt het dan alsof vroege prestaties latere prestaties ondermijnen, terwijl dat statistisch gezien een mechanisch gevolg is van de selectie zelf. Niet van een ander ontwikkelingspad.

Dat heeft belangrijke gevolgen. Het betekent dat de vaststelling dat latere wereldtoppers gemiddeld minder uitblinken in hun jeugd, descriptief correct kan zijn binnen de elitegroep, maar niet zonder meer mag worden geïnterpreteerd als bewijs voor verschillende causale mechanismen van talentontwikkeling. De data tonen wie er overblijft na selectie, niet noodzakelijk waarom die selectie zo uitpakt. Er kunnen dus ook andere verklaringen meespelen.

De kritiek gaat bovendien verder dan één correlatie. Nivard laat zien dat dezelfde vertekening ook doorwerkt in analyses van verklarende factoren, zoals hoeveelheid oefening of type training. In elitesamples worden effecten afgevlakt, instabiel of zelfs omgekeerd, terwijl diezelfde factoren in de volledige populatie wel coherent samenhangen met prestaties. Zonder een expliciet model van het selectieproces dreigt men dergelijke vertekening te verwarren met inzicht.

Wat dat betekent voor de interpretatie

Belangrijk. Deze kritiek ontkracht het artikel niet. Ze stelt niet dat de beschreven patronen fout zijn, noch dat vroege specialisatie per definitie de beste route is. Wat ze wel doet, is waarschuwen tegen te sterke conclusies over ontwikkelingsmechanismen op basis van elitesamples alleen.

Ironisch genoeg sluit die waarschuwing goed aan bij de voorzichtigheid die de auteurs in het oorspronkelijke artikel zelf al aan de dag leggen, maar die in de discussie vaak genegeerd werd. Hun bevindingen zijn robuust als beschrijving van wat we zien bij de wereldtop. Ze worden problematisch wanneer ze gelezen worden als directe aanwijzingen voor beleid, selectie of opvoeding.

De echte les zit dus niet in de slogan die eruit werd gedestilleerd, maar in het ongemakkelijke midden. Talentontwikkeling laat zich niet reduceren tot vroege versnelling of late bloei. En wie uitsluitend kijkt naar wie het gehaald heeft, de survivor bias waar het hier in essentie om draait, loopt altijd het risico verkeerd te begrijpen waarom anderen het niet haalden.

Dat maakt dit Science-artikel geen eindpunt, maar een goed begin. Mits we bereid zijn ook de methodologische voetnoten even serieus te nemen als de grafieken die zo gretig werden gedeeld.

Afbeelding: https://commons.wikimedia.org/wiki/File:Chess_pieces_close_up.jpg

Geef een reactie