Pe de o parte, testarea inteligenței este unul dintre marile succese ale psihologiei (Hunt, 2011). Rezultatele testelor de inteligență prezic multe fenomene din lumea reală și au multe utilizări practice bine validate (Gottfredson, 1997; Deary et al., 2010). Scorurile testelor de inteligență se corelează, de asemenea, cu parametrii structurali și funcționali ai creierului evaluați prin neuroimagistică (Haier et al., 1988; Jung și Haier, 2007; Deary et al., 2010; Penke et al., 2012; Colom et al., 2013a) și cu genele (Posthuma et al., 2002; Hulshoff Pol et al., 2006; Chiang et al., 2009, 2012; Stein et al., 2012). Pe de altă parte, scorurile obținute la testele de inteligență sunt adesea greșit înțelese și pot fi utilizate în mod abuziv. Această lucrare se concentrează asupra unei neînțelegeri de bază care pătrunde în multe dintre rapoartele recente privind creșterea inteligenței în urma unui antrenament cognitiv pe termen scurt. Mai multe dintre aceste rapoarte au fost publicate în reviste de renume și au primit o atenție publică largă (Jaeggi et al., 2008, 2011; Mackey et al., 2011).
Înțelegerea greșită de bază constă în presupunerea că scorurile de la testele de inteligență sunt unități de măsură precum inci sau litri sau grame. Ele nu sunt. Inch, litri și grame sunt scale de raport în care zero înseamnă zero și 100 de unități sunt de două ori 50 de unități. Scorurile testelor de inteligență estimează un construct folosind scale de interval și au semnificație doar în raport cu alte persoane de aceeași vârstă și sex. Persoanele cu scoruri ridicate se descurcă, în general, mai bine la o gamă largă de teste de abilități mentale, dar o persoană cu un scor IQ de 130 nu este cu 30% mai deșteaptă decât o persoană cu un scor IQ de 100. Un scor de 130 plasează persoana în cei mai buni 2% din populație, în timp ce un scor de 100 se situează la a 50-a percentila. O schimbare de la un scor IQ de la 100 la 103 nu este același lucru cu o schimbare de la 133 la 136. Acest lucru face imposibilă interpretarea simplă a modificărilor scorurilor din testele de inteligență.
Majoritatea studiilor recente care au susținut creșteri ale inteligenței după o intervenție de antrenament cognitiv se bazează pe compararea unui scor la un test de inteligență înainte de intervenție cu un al doilea scor după intervenție. Dacă există o creștere medie a scorului de schimbare pentru grupul de instruire care este semnificativă din punct de vedere statistic (folosind un test t dependent sau un test statistic similar), aceasta este tratată ca o dovadă că inteligența a crescut. Acest raționament este corect în cazul în care se măsoară scări de raport, cum ar fi centimetri, litri sau grame, înainte și după o anumită intervenție (presupunând instrumente adecvate și fiabile, cum ar fi riglele, pentru a evita concluziile eronate asemănătoare fuziunii la rece, care se pare că s-au bazat pe o măsurare defectuoasă a căldurii); nu este corect pentru scorurile testelor de inteligență pe scări de interval care estimează doar o ordine relativă de clasament, mai degrabă decât să măsoare construcția inteligenței. Chiar dacă estimarea are o valoare predictivă considerabilă și se corelează cu măsurile cerebrale și genetice, nu este o măsurătoare în același mod în care măsurăm distanța, lichidul sau greutatea, chiar dacă scorurile individuale de schimbare sunt folosite într-un design pre-post.
SAT, de exemplu, scorurile SAT, sunt foarte corelate cu scorurile testelor de inteligență (Frey și Detterman, 2004). Imaginați-vă că un elev dă examenul SAT când este destul de bolnav. Scorurile sunt probabil o estimare proastă a capacității elevului. Dacă elevul dă din nou testul ceva mai târziu, când se simte bine, o creștere a scorului înseamnă că inteligența elevului a crescut sau că scorul mai nou este acum doar o estimare mai bună? Același lucru este valabil și pentru schimbările de scor în urma cursurilor de pregătire pentru SAT. Multe colegii și universități permit candidaților să prezinte mai multe scoruri la SAT, iar cel mai mare scor are, de obicei, cea mai mare greutate; există multe motive false pentru scoruri mici, dar mult mai puține pentru scoruri mari. Schimbarea scorurilor de la cel mai mic la cel mai mare are o pondere mică sau chiar deloc. În schimb, schimbarea greutății unei persoane după o anumită intervenție este lipsită de ambiguitate.
În studiile privind efectul antrenamentului cognitiv asupra inteligenței, este, de asemenea, important să înțelegem că toate rezultatele testelor de inteligență includ o anumită cantitate de imprecizie sau eroare. Aceasta se numește eroarea standard de măsurare și poate fi cuantificată ca o estimare a unui scor „adevărat” pe baza scorurilor observate. Eroarea standard de măsurare a centimetrilor sau a litrilor este de obicei zero, presupunând că dispuneți de dispozitive de măsurare perfect fiabile și standard. Testele de inteligență prezintă, în general, o fiabilitate ridicată a testării, dar au, de asemenea, o eroare standard, iar eroarea standard este adesea mai mare pentru scorurile mai mari decât pentru cele mai mici. Orice modificare a scorului unui test de inteligență după o intervenție trebuie să fie luată în considerare în raport cu eroarea standard a testului. Studiile care folosesc un singur test pentru a estima inteligența înainte și după o intervenție folosesc scoruri mai puțin fiabile și mai variabile (erori standard mai mari) decât studiile care combină scorurile de la o baterie de teste.
Scorurile de schimbare nu sunt niciodată ușor de interpretat și necesită metode statistice sofisticate și proiecte de cercetare cu grupuri de control adecvate. Dacă încercați o intervenție de formare la persoane care au toate scorurile de dinainte de intervenție sub media populației, de exemplu, o nouă testare, cu sau fără intervenție, poate avea ca rezultat scoruri mai mari datorită fenomenului statistic de regresie la medie sau datorită unei simple practici de testare, mai ales dacă nu sunt folosite forme alternative echivalente ale testului. Proiectele cvasi-experimentale, cum ar fi cele de tip post-test numai cu eșantioane mari și repartizare aleatorie, nu au toate aceleași dificultăți de interpretare ca și proiectele pre-post. Acestea sunt promițătoare, dar majoritatea evaluatorilor sunt mai înclinați să aprecieze schimbările pre-post. Tehnicile cu variabile latente evită, de asemenea, multe dintre dificultățile legate de modificările scalei de interval pre-post și sunt promițătoare în cazul eșantioanelor mari (Ferrer și McArdle, 2010).
Când se utilizează scoruri de schimbare, este important să se identifice diferențele individuale chiar și în cadrul unui grup în care scorul mediu de schimbare crește statistic după o intervenție. Imaginați-vă că un grup de 100 de elevi a primit un antrenament cognitiv și alți 100 au primit o intervenție de control. Este posibil ca scorul mediu de schimbare în grupul de instruire să prezinte, din punct de vedere statistic, o creștere mai mare decât în cazul celor de control. Câte dintre cele 100 de persoane care au beneficiat de instruire prezintă de fapt o creștere? Diferă aceștia în vreun fel de indivizii din același grup care nu prezintă o creștere? Analiza itemilor arată dacă scorurile crescute se datorează mai mult itemilor de test ușori sau celor dificili? Ce se întâmplă cu persoanele din grupul de control care prezintă creșteri ale scorului de schimbare la fel de mari ca cele din grupul de formare? Dacă toți cei 200 de participanți primesc, în cele din urmă, aceeași formare, va fi ordinea indivizilor în funcție de scorul de după formare diferită de ordinea în funcție de scorurile de dinaintea formării? În caz contrar, ce s-a realizat? Majoritatea studiilor nu raportează astfel de analize, deși studiile de formare mai noi abordează aspecte legate de evaluarea prin măsurători multiple a inteligenței și a diferențelor individuale (Colom et al., 2013b; Jaeggi et al., 2013). Burgaleta et al. oferă un bun exemplu de evidențiere a modificărilor IQ-ului subiect cu subiect (Burgaleta et al., 2014).
Cu toate acestea, ideea principală este că, pentru a aduce cel mai convingător argument că inteligența crește după o intervenție, este necesară o scală de proporții a inteligenței. Nu există încă niciuna, iar un progres semnificativ ar putea necesita un nou mod de a defini inteligența pe baza unor variabile măsurabile ale creierului sau ale procesării informației. De exemplu, densitatea materiei cenușii și albe în regiuni specifice ale creierului, evaluată prin imagistică și exprimată ca un profil de scoruri standard bazate pe un grup normativ, ar putea înlocui scorurile testelor de inteligență (Haier, 2009). Lucrările lui Engle și ale colegilor sugerează că capacitatea memoriei de lucru și viteza de percepție sunt modalități posibile de evaluare a inteligenței fluide (Broadway și Engle, 2010; Redick et al., 2012), pe baza unui număr mare de cercetări care arată că o viteză de procesare mentală mai rapidă și o capacitate de memorie crescută sunt legate de o inteligență mai mare.
Jensen a scris pe larg despre o evoluție de la psihometrie la „cronometrie” mentală – utilizarea timpului de răspuns în milisecunde pentru a măsura procesarea informațiilor într-un mod standard (Jensen, 2006). El a susținut că constructul de inteligență ar putea fi înlocuit în favoarea unor măsuri pe scară de proporții ale vitezei de procesare a informației evaluate în timpul unor sarcini cognitive standardizate precum paradigma Hick. Astfel de măsuri, de exemplu, ar contribui la avansarea cercetărilor privind neurofiziologia care stă la baza vitezei mentale și ar putea duce la o definiție mai avansată a inteligenței. Jensen și-a încheiat cartea despre cronometrie cu acest îndemn la acțiune: „… cronometria oferă științelor comportamentale și cerebrale o scală absolută universală pentru a obține măsurători extrem de sensibile și frecvent repetabile ale performanței unui individ în sarcini cognitive special concepute. A sosit timpul său. Să trecem la treabă!” (p. 246).
Aceasta este o provocare formidabilă și o prioritate majoră pentru cercetătorii din domeniul inteligenței. Colaborarea dintre psihometriști și psihologii cognitivi va fi esențială. Există în prezent o serie de studii care nu reușesc să reproducă afirmațiile privind creșterea inteligenței după antrenarea memoriei pe termen scurt și sunt propuse diverse motive (Colom et al., 2013b; Harrison et al., 2013). Având în vedere concentrarea noastră restrânsă aici, observăm că un eșec de replicare a evaluat, de asemenea, capacitatea memoriei de lucru și viteza perceptivă; nu au fost găsite efecte de transfer (Redick et al., 2013) și există motive pentru a sugera că alte studii de transfer pozitiv ar putea fi eronate (Tidwell et al., 2013). Deocamdată, rezultatele antrenamentului cognitiv sunt mai mult inconsecvente decât nepotrivite, în special în ceea ce privește presupusele creșteri ale inteligenței. Cu toate acestea, este încurajator faptul că cercetătorii în domeniul cognitiv lucrează la aceste aspecte, în ciuda unei indiferențe omniprezente sau a unei negativități față de cercetarea inteligenței în psihologie în general și pentru multe agenții de finanțare.
Într-un context mai larg, inteligența include mai mult de o componentă. Cu toate acestea, constructul de interes este de obicei definit prin metode psihometrice ca un factor general comun tuturor abilităților mentale numit factorul g (Jensen, 1998). Inteligența fluidă, asupra căreia se concentrează mai multe studii de formare cognitivă, este unul dintre mai mulți factori generali de inteligență și este puternic corelat cu g. Factorul g este estimat de testele de inteligență, dar nu este sinonim cu IQ sau cu orice alt scor de test; unele teste sunt mai încărcate de g decât altele. După cum s-a menționat, un scor la un test de inteligență are puțină semnificație dacă nu este comparat cu scorurile altor persoane. Acesta este motivul pentru care toate testele de inteligență au nevoie de grupuri normative pentru comparație și de ce grupurile normative trebuie actualizate periodic, așa cum demonstrează efectul Flynn de creștere graduală, pe generații, a scorurilor la testele de inteligență; deși nu s-a stabilit încă dacă g prezintă efectul Flynn (te Nijenhuis și van der Flier, 2013). Estimările psihometrice ale lui g și ale altor factori de inteligență au generat constatări empirice puternice cu privire la natura inteligenței și a diferențelor individuale, bazate în principal pe studii de corelație. Cu toate acestea, aceste evaluări pe intervale de timp nu sunt suficiente pentru a duce cercetarea la următorul pas, cel al intervențiilor experimentale pentru creșterea inteligenței.
Spunând despre știință, Carl Sagan a observat că afirmațiile extraordinare necesită dovezi extraordinare. Până în prezent, nu le avem pentru afirmațiile privind creșterea inteligenței în urma antrenamentului cognitiv sau, de altfel, pentru orice altă manipulare sau tratament, inclusiv pentru educația în copilăria timpurie. Mici schimbări semnificative din punct de vedere statistic în rezultatele testelor pot fi observații importante despre atenție sau memorie sau despre o altă variabilă cognitivă elementară sau despre o abilitate mentală specifică evaluată cu o scală de raport, cum ar fi milisecundele, dar nu reprezintă o dovadă suficientă că inteligența generală s-a schimbat. Ca în toate ramurile științei, progresul depinde de măsurători din ce în ce mai sofisticate care conduc la definiții mai precise – gândiți-vă la evoluția definiției pentru o „genă” sau un „atom”. Chiar și cu tehnici sofisticate de evaluare bazate pe intervale (Ferrer și McArdle, 2010), până când vom avea măsuri mai bune, în special scări de raport, trebuie să recunoaștem problema fundamentală de măsurare și să dăm dovadă de multă reținere atunci când raportăm creșteri sau scăderi presupuse ale inteligenței.
În viitor, ar putea exista raționamente empirice puternice pentru a cheltui sume mari de bani pentru formarea cognitivă sau alte intervenții menite să îmbunătățească abilitățile mentale specifice sau rezultatele școlare (pe lângă argumentele morale convingătoare pentru a face acest lucru), dar creșterea inteligenței generale este destul de dificil de demonstrat cu testele actuale. Cu toate acestea, creșterea inteligenței este un obiectiv meritoriu care ar putea fi atins prin intervenții bazate pe progresele sofisticate ale neuroștiințelor în analiza ADN-ului, neuroimagistica, psihofarmacologia și chiar stimularea directă a creierului (Haier, 2009, 2013; Lozano și Lipsman, 2013; Santarnecchi et al., 2013; Legon et al., 2014). Dezvoltarea unui raport la fel de sofisticat de măsurare a inteligenței trebuie să meargă mână în mână cu dezvoltarea unor intervenții promițătoare.