Voorpagina Hans van Maanen
klikklikklikklik

Knijp in een bal, dat weet je het wel

De Volkskrant, 4 mei 2013

Kan een enkele proefpersoon een heel experiment redden, de kranten halen en ook nog het halve internet op stelten zetten? Wel als het om neuropsychologie gaat.

Vorige week publiceerden Amerikaanse onderzoekers onder leiding van Ruth Propper een artikel in PLoS One, waarin zij wilden aantonen dat handenarbeid het brein stimuleert: wie op het juiste moment in een balletje knijpt, scoort hoger op een geheugentest.

Er is namelijk een theorie die zegt dat de linker voorste hersenschors zorgt voor de opslag van informatie, en de rechter bij het ophalen ervan. Onomstreden is de theorie niet, maar dat doet er nu niet toe. Een tweede theorie zegt dat de linker hersenhelft wordt gestimuleerd door de rechterhand te ballen, en de rechter door de linkerhand. Onomstreden, enzovoort, maar Propper waagde de sprong: maak rechts een vuist kort voordat je woorden moet onthouden en links voordat je ze weer moet ophoesten, en je score zal flink omhooggaan.

Voor haar onderzoek vond ze 40 vrouwen en 10 mannen van rond de 23 jaar geschikt. Ze kregen allemaal een roze rubberen balletje van vijf centimeter doorsnee: 9 deelnemers moesten anderhalve minuut met de rechterhand in het balletje knijpen voordat ze probeerden een lijst met 36 woorden te onthouden en met de linkerhand voor het opschrijven, 11 rechts-rechts, 11 links-rechts en 9 links-links. En 10 in de controlegroep, die hoefden het roze balletje alleen maar vast te houden.

Heel erg goed waren de vrijwilligers niet in het onthouden: het gemiddelde over alle groepen kwam niet boven de 8 correcte woorden uit die 36, ook al wisten ze dat ernaar gevraagd zou worden. Maar uit vergelijking van de groepen kwam, met enig statistisch duw- en trekwerk, wel uit wat de onderzoekers hoopten: rechts-links scoorde inderdaad gemiddeld hoger dan alle andere groepen. Significant was het niet, dus toeval valt niet helemaal uit te sluiten, maar het effect was zo sterk dat de onderzoekers niet aarzelen de resultaten 'frappant' en 'opvallend' te noemen.

Eerder kunnen ze 'vreemd' of 'onbegrijpelijk' worden genoemd. Uit de tabel en de figuren blijkt namelijk iets heel anders. Het gemiddelde in de controlegroep was 7,6 (totaal 86 goede antwoorden, 10 strafpunten voor zelfbedachte woorden, is 76 punten met 10 mensen). De groep waar het allemaal om ging, rechts-links, scoorde 9,1 (91 goed min 9 fout met 9 mensen). De onderzoekers vergelijken echter die twee niet met elkaar, maar steeds de andere groepen. En die scoorden juist beneden het gemiddelde: rechts-rechts 7,1, links-rechts 5,4, en links-links zelfs maar 4,7. Niet de rechts-linksen scoorden heel goed, de anderen deden het heel slecht. En ondertussen wordt het geringe verschil tussen controlegroep en rechts-links - netto 6 woorden meer in de hele groep - stelselmatig niet genoemd. Dat is vreemd.

Onbegrijpelijk wordt het, als we de cijfers van die rechts-links-groep nader bekijken. Die hoge score van 9,1 moet - het kan haast niet anders* maar de onderzoekers maken er geen woord aan vuil - zijn bereikt doordat een of twee vrouwen (dit groepje bestond uit 9 vrouwen) werkelijk keien waren: de rest scoorde gewoon, zeg 6 of 7 woorden, maar die bollebozen wisten nog zeker 12 van de 36 woorden. Misschien was een proefopzet waarin ieders geheugen eerst zonder en dan met balletje was gemeten, achteraf toch beter geweest? Hoe dan ook, als de bollebozen toevallig in een andere groep hadden gezeten, zouden we vast nooit meer iets van het experiment hebben gehoord.

Nu leidde het nog tot enig rumoer in het wetenschappelijke hoekje van het internet. Al snel verscheen een snerpend neurologisch commentaar bij het artikel, en ook bloggers lieten zich niet onbetuigd. Niet iedereen bleek gediend van de scherpe toon, en de onderzoekers zelf reageerden netjes maar licht gepikeerd op de kritiek. Het was toch goedgekeurd door de peer-review, hielden ze vol, en de effecten waren zo groot dat het er niet toe deed of het een toevalstreffer was of niet. De kranten maakte dat toch al niet uit.

* In de tabel staan de scores met tussen haakjes de standaardfouten - dat is ongebruikelijk, je zou standaardafwijkingen verwachten. Die van Renc/Lrec is met 2,02 opmerkelijk hoog, dat wijst erop dat er een of twee uitbijters zijn (de controlegroep lijdt aan hetzelfde euvel maar in mindere mate). In het meest extreme, maar ook meest logische, geval zouden dit gemiddelde en deze standaardfout gehaald kunnen worden als iedereen 6 of 8 scoorde en één vrouw 25, maar het kan ook dat twee vrouwen hoog zaten en zeven wat lager. Ik had hier aanvankelijk ook voorgerekend hoe groot de kans is op een verdeling met gemiddelde 9,1 en standaardfout 2,02, maar dat werkt bij nader inzien niet: die kans is altijd (voor elke SF) klein. De kans op een verdeling met een standaardfout kleiner dan 2,025 is ongeveer 1 op 10, maar dan krijg je de wildste verdelingen. Het maakt benieuwd naar de oorspronkelijke gegevens, maar dat gaat zomaar niet: het onderzoek is door de overheid gefinancierd, dus er moet een officieel verzoek op officieel briefpapier komen.