Zvýšená inteligence je (zatím) mýtus

Na jedné straně je testování inteligence jedním z největších úspěchů psychologie (Hunt, 2011). Výsledky testů inteligence předpovídají mnoho jevů v reálném světě a mají mnoho dobře ověřených praktických využití (Gottfredson, 1997; Deary et al., 2010). Výsledky inteligenčních testů také korelují se strukturálními a funkčními parametry mozku hodnocenými pomocí neurozobrazování (Haier et al., 1988; Jung a Haier, 2007; Deary et al., 2010; Penke et al., 2012; Colom et al., 2013a) a s geny (Posthuma et al., 2002; Hulshoff Pol et al., 2006; Chiang et al., 2009, 2012; Stein et al., 2012). Na druhou stranu jsou výsledky inteligenčních testů často špatně chápány a mohou být zneužívány. Tento článek se zaměřuje na základní nedorozumění, které prostupuje mnoha nedávnými zprávami o zvýšení inteligence po krátkodobém kognitivním tréninku. Několik těchto zpráv bylo publikováno ve významných časopisech a dostalo se jim široké pozornosti veřejnosti (Jaeggi et al., 2008, 2011; Mackey et al., 2011).

Základním nedorozuměním je předpoklad, že výsledky inteligenčních testů jsou měrné jednotky jako palce, litry nebo gramy. Tak tomu není. Palce, litry a gramy jsou poměrové stupnice, kde nula znamená nulu a 100 jednotek je dvakrát 50 jednotek. Výsledky inteligenčních testů odhadují konstrukt pomocí intervalových stupnic a mají význam pouze ve vztahu k ostatním lidem stejného věku a pohlaví. Lidé s vysokým skóre si obecně vedou lépe v široké škále testů duševních schopností, ale člověk se skóre IQ 130 není o 30 % chytřejší než člověk se skóre 94. Skóre 130 řadí člověka mezi 2 % nejvyšší populace, zatímco skóre 100 je na 50. percentilu. Změna skóre IQ ze 100 na 103 není stejná jako změna skóre ze 133 na 136. To znemožňuje jednoduchou interpretaci změn skóre v inteligenčních testech.

Většina nedávných studií, které tvrdí, že došlo ke zvýšení inteligence po intervenci v oblasti kognitivního tréninku, se opírá o porovnání skóre v inteligenčním testu před intervencí s druhým skóre po intervenci. Pokud dojde ke zvýšení průměrného skóre změny u tréninkové skupiny, které je statisticky významné (pomocí závislého t-testu nebo podobného statistického testu), je to považováno za důkaz, že se inteligence zvýšila. Tato úvaha je správná, pokud se měří poměrové stupnice, jako jsou palce, litry nebo gramy, před a po nějakém zásahu (za předpokladu vhodných a spolehlivých nástrojů, jako jsou pravítka, aby se předešlo chybným závěrům podobným studené fúzi, které byly zřejmě založeny na chybném měření tepla); není správná pro výsledky testů inteligence na intervalových stupnicích, které pouze odhadují relativní pořadí, nikoli měří konstrukt inteligence. Přestože má odhad značnou prediktivní hodnotu a koreluje s mozkovými a genetickými měřeními, nejedná se o měření stejným způsobem, jakým měříme vzdálenost, tekutinu nebo hmotnost, a to ani v případě, že jsou výsledky individuálních změn použity v pre-post designu.

SAT skóre je například vysoce korelováno s výsledky testů inteligence (Frey a Detterman, 2004). Představte si, že student skládá testy SAT, když je zcela nemocný. Výsledky jsou pravděpodobně špatným odhadem studentových schopností. Pokud si student test zopakuje někdy později, když je v pořádku, znamená zvýšení skóre, že se zvýšila jeho inteligence, nebo že novější skóre je nyní jen lepším odhadem? Totéž platí pro změny skóre po přípravných kurzech k maturitě. Mnoho vysokých škol a univerzit umožňuje uchazečům předložit více výsledků testu SAT a nejvyšší skóre má obvykle největší váhu; existuje mnoho falešných důvodů pro nízké skóre, ale mnohem méně pro vysoké skóre. Změny skóre od nejnižšího po nejvyšší mají malou váhu, pokud vůbec nějakou. Naproti tomu změna hmotnosti člověka po nějakém zásahu je jednoznačná.

Ve studiích vlivu kognitivního tréninku na inteligenci je také důležité si uvědomit, že všechny výsledky inteligenčních testů obsahují určitou míru nepřesnosti nebo chyby. Ta se nazývá standardní chyba měření a lze ji kvantifikovat jako odhad „skutečného“ skóre na základě pozorovaných výsledků. Standardní chyba měření v palcích nebo litrech je obvykle nulová za předpokladu, že máte dokonale spolehlivé, standardní měřicí přístroje. Testy inteligence obecně vykazují vysokou testovou spolehlivost, ale mají také standardní chybu a standardní chyba je často větší u vyšších skóre než u nižších skóre. Jakoukoli změnu skóre testu inteligence po zásahu je třeba brát v úvahu ve vztahu ke standardní chybě testu. Studie, které k odhadu inteligence před a po intervenci používají jediný test, používají méně spolehlivé a variabilnější výsledky (větší standardní chyby) než studie, které kombinují výsledky z baterie testů.

Změnu výsledků není nikdy snadné interpretovat a vyžaduje sofistikované statistické metody a výzkumné plány s vhodnými kontrolními skupinami. Pokud například vyzkoušíte vzdělávací intervenci u jedinců, z nichž všichni měli před intervencí skóre nižší než průměr populace, může opakované testování s jakoukoli intervencí nebo bez ní vést k vyššímu skóre v důsledku statistického jevu regrese k průměru nebo v důsledku prostého nácviku testu, zejména pokud nejsou použity rovnocenné alternativní formy testu. Kvaziexperimentální designy, jako je pouze post-test s velkými vzorky a náhodným přiřazením, nemají všechny stejné interpretační potíže jako pre-post designy. Jsou slibné, ale většina recenzentů se přiklání spíše k oceňování pre-post změn. Techniky latentních proměnných se také vyhýbají mnoha obtížím intervalových škál pre-post a jsou slibné u velkých vzorků (Ferrer a McArdle, 2010).

Při použití skóre změny je důležité identifikovat individuální rozdíly i v rámci skupiny, kde se průměrné skóre změny po intervenci statisticky zvyšuje. Představte si, že skupina 100 studentů obdržela kognitivní trénink a 100 dalších obdrželo nějakou kontrolní intervenci. Průměrné skóre změny u tréninkové skupiny může statisticky vykazovat větší nárůst než u kontrolní skupiny. Kolik ze 100 jedinců, kteří absolvovali školení, skutečně vykazuje zvýšení? Liší se nějak od jedinců ve stejné skupině, kteří zvýšení nevykazují? Ukazuje položková analýza, zda je zvýšení skóre způsobeno spíše lehkými nebo těžkými testovými položkami? Co jedinci v kontrolní skupině, kteří vykazují stejně velké zvýšení skóre jako jedinci v tréninkové skupině? Pokud všech 200 účastníků nakonec absolvuje stejné školení, bude se pořadí jednotlivců na základě skóre po školení lišit od pořadí na základě skóre před školením? Pokud ne, čeho bylo dosaženo? Většina studií takové analýzy neuvádí, ačkoli novější školicí studie se zabývají otázkami hodnocení inteligence pomocí více měřítek a individuálními rozdíly (Colom et al., 2013b; Jaeggi et al., 2013). Burgaleta et al. poskytují dobrý příklad zobrazení změn IQ po jednotlivých subjektech (Burgaleta et al., 2014).

Navzdory tomu je hlavní, že pro co nejpřesvědčivější argument, že se inteligence po intervenci zvyšuje, je zapotřebí poměrná škála inteligence. Žádná zatím neexistuje a smysluplný pokrok může vyžadovat nový způsob definování inteligence založený na měřitelných proměnných mozku nebo zpracování informací. Například hustota šedé a bílé hmoty v určitých oblastech mozku hodnocená pomocí zobrazovacích metod a vyjádřená jako profil standardních skóre na základě normativní skupiny by mohla nahradit výsledky testů inteligence (Haier, 2009). Práce Engla a jeho kolegů naznačuje, že kapacita pracovní paměti a rychlost vnímání jsou možnými způsoby hodnocení fluidní inteligence (Broadway a Engle, 2010; Redick et al., 2012) na základě velkého množství výzkumů, které ukazují, že vyšší rychlost mentálního zpracování a zvýšená kapacita paměti souvisí s vyšší inteligencí.

Jensen rozsáhle psal o vývoji od psychometrie k mentální „chronometrii“ – použití doby odezvy v milisekundách k měření zpracování informací standardním způsobem (Jensen, 2006). Tvrdil, že konstrukt inteligence by mohl být nahrazen ve prospěch poměrových měřítek rychlosti zpracování informací hodnocených během standardizovaných kognitivních úloh, jako je Hickovo paradigma. Taková měření by například pomohla pokročit ve výzkumu neurofyziologie, která je základem rychlosti myšlení, a mohla by vést k pokročilejší definici inteligence. Jensen svou knihu o chronometrii uzavřel touto výzvou k akci: „… chronometrie poskytuje behaviorálním vědám a vědám o mozku univerzální absolutní měřítko pro získání vysoce citlivých a často opakovatelných měření výkonu jedince ve speciálně navržených kognitivních úlohách. Její čas nadešel. Pusťme se do práce!“ (str. 246).

Jedná se o obrovskou výzvu a hlavní prioritu pro výzkumníky inteligence. Klíčová bude spolupráce mezi psychometriky a kognitivními psychology. V současné době existuje řada studií, které nedokázaly potvrdit tvrzení o zvýšení inteligence po tréninku krátkodobé paměti, a navrhují se různé důvody (Colom et al., 2013b; Harrison et al., 2013). Vzhledem k našemu úzkému zaměření zde uvádíme, že jedna neúspěšná replikace hodnotila také kapacitu pracovní paměti a rychlost vnímání; žádné efekty přenosu nebyly zjištěny (Redick et al., 2013) a existují důvody domnívat se, že další studie pozitivního přenosu mohou být chybné (Tidwell et al., 2013). Prozatím jsou výsledky kognitivního tréninku spíše rozporuplné než ne, zejména pokud jde o domnělé zvýšení inteligence. Nicméně je povzbudivé, že výzkumníci v oblasti kognitivních funkcí na těchto otázkách pracují navzdory všudypřítomnému nezájmu nebo negativnímu postoji k výzkumu inteligence v psychologii obecně a u mnoha financujících agentur.

V širším kontextu zahrnuje inteligence více než jednu složku. Konstrukt, který nás zajímá, je však obvykle definován psychometrickými metodami jako obecný faktor společný všem mentálním schopnostem, který se nazývá g-faktor (Jensen, 1998). Fluidní inteligence, na kterou se zaměřuje několik studií kognitivního tréninku, je jedním z několika širokých faktorů inteligence a je silně korelována s g. Faktor g se odhaduje pomocí testů inteligence, ale není synonymem pro IQ nebo jiný výsledek testu; některé testy jsou více zatíženy g než jiné. Jak již bylo uvedeno, skóre v inteligenčním testu má jen malý význam bez porovnání s výsledky jiných lidí. Proto všechny inteligenční testy vyžadují pro srovnání normativní skupiny a proto je třeba normativní skupiny pravidelně aktualizovat, jak ukazuje Flynnův efekt postupného generačního nárůstu skóre v inteligenčních testech; ačkoli otázka, zda g vykazuje Flynnův efekt, není dosud vyřešena (te Nijenhuis a van der Flier, 2013). Psychometrické odhady g a dalších faktorů inteligence přinesly silné empirické poznatky o povaze inteligence a individuálních rozdílech, většinou založené na korelačních studiích. Tyto intervalové odhady však nestačí k tomu, aby se výzkum posunul k dalšímu kroku experimentálních zásahů ke zvýšení inteligence.

Když mluvil o vědě, Carl Sagan poznamenal, že mimořádná tvrzení vyžadují mimořádné důkazy. Zatím je nemáme pro tvrzení o zvýšení inteligence po kognitivním tréninku nebo, když na to přijde, pro jakoukoli jinou manipulaci či léčbu, včetně vzdělávání v raném dětství. Malé statisticky významné změny ve výsledcích testů mohou být důležitým zjištěním o pozornosti, paměti nebo nějaké jiné elementární kognitivní proměnné či konkrétní mentální schopnosti hodnocené pomocí poměrové škály, jako jsou milisekundy, ale nejsou dostatečným důkazem, že se změnila obecná inteligence. Stejně jako ve všech vědních oborech závisí pokrok na stále dokonalejších měřeních, která vedou k přesnějším definicím – vzpomeňte si na vývoj definice „genu“ nebo „atomu“. I při použití sofistikovaných technik hodnocení založených na intervalech (Ferrer a McArdle, 2010) musíme, dokud nebudeme mít k dispozici lepší měřítka, zejména poměrové škály, uznat základní problém měření a zachovávat hojnou zdrženlivost při oznamování údajného zvýšení nebo snížení inteligence.

V budoucnu mohou existovat silné empirické důvody pro vynakládání velkých částek peněz na kognitivní trénink nebo jiné intervence zaměřené na zlepšení konkrétních mentálních schopností nebo školních výsledků (kromě přesvědčivých morálních argumentů, proč tak činit), ale zvýšení obecné inteligence je se současnými testy poměrně obtížné prokázat. Zvýšení inteligence je však důstojným cílem, kterého by bylo možné dosáhnout intervencemi založenými na sofistikovaných pokrocích neurověd v oblasti analýzy DNA, neurozobrazování, psychofarmakologie a dokonce i přímé stimulace mozku (Haier, 2009, 2013; Lozano a Lipsman, 2013; Santarnecchi et al., 2013; Legon et al., 2014). Vývoj stejně sofistikovaného poměrového měření inteligence musí jít ruku v ruce s vývojem slibných intervencí.

Wzrost

PMC

admin

Napsat komentář Zrušit odpověď na komentář

Wzrost