Toisaalta älykkyystestaus on yksi psykologian suurista menestyksistä (Hunt, 2011). Älykkyystestien pisteet ennustavat monia reaalimaailman ilmiöitä, ja niillä on monia hyvin validoituja käytännön käyttötarkoituksia (Gottfredson, 1997; Deary ym., 2010). Älykkyystestien pisteet korreloivat myös neurokuvantamisella arvioitujen aivojen rakenteellisten ja toiminnallisten parametrien (Haier ym., 1988; Jung ja Haier, 2007; Deary ym., 2010; Penke ym., 2012; Colom ym., 2013a) ja geenien kanssa (Posthuma ym., 2002; Hulshoff Pol ym., 2006; Chiang ym., 2009, 2012; Stein ym., 2012). Toisaalta älykkyystestien pisteet ymmärretään usein väärin ja niitä voidaan käyttää väärin. Tässä artikkelissa keskitytään perustavanlaatuiseen väärinkäsitykseen, joka läpäisee monia viimeaikaisia raportteja älykkyyden lisääntymisestä lyhytaikaisen kognitiivisen harjoittelun jälkeen. Useat näistä raporteista on julkaistu tunnetuissa lehdissä, ja ne ovat saaneet laajaa julkista huomiota (Jaeggi ym., 2008, 2011; Mackey ym., 2011).

Perusväärinkäsitys on oletus siitä, että älykkyystestien pisteet ovat mittayksikköjä kuten tuumat tai litrat tai grammat. Ne eivät ole. Tuumat, litrat ja grammat ovat suhdeasteikkoja, joissa nolla tarkoittaa nollaa ja 100 yksikköä on kaksi kertaa 50 yksikköä. Älykkyystestien tulokset arvioivat konstruktiota käyttäen intervalliasteikkoja, ja niillä on merkitystä vain suhteessa muihin samanikäisiin ja samaa sukupuolta oleviin ihmisiin. Ihmiset, joilla on korkea älykkyysosamäärä, pärjäävät yleensä paremmin monenlaisissa älykkyystesteissä, mutta henkilö, jonka älykkyysosamäärä on 130, ei ole 30 prosenttia älykkäämpi kuin henkilö, jonka älykkyysosamäärä on 100. Pistemäärä 130 sijoittaa henkilön väestön korkeimpaan 2 prosenttiin, kun taas pistemäärä 100 on 50. prosenttiyksikkö. Muutos älykkyysosamäärässä 100:sta 103:een ei ole sama kuin muutos 133:sta 136:een. Tämä tekee älykkyysosamäärän muutosten yksinkertaisen tulkinnan mahdottomaksi.

Useimmissa viimeaikaisissa tutkimuksissa, joissa on väitetty älykkyyden lisääntyneen kognitiivisen harjoittelun jälkeen, verrataan älykkyystestin pistemäärää ennen toimenpidettä toiseen pistemäärään toimenpiteen jälkeen. Jos harjoitteluryhmässä tapahtuu tilastollisesti merkitsevä keskimääräinen pistemäärän nousu (käyttämällä riippuvaista t-testiä tai vastaavaa tilastollista testiä), tätä pidetään todisteena siitä, että älykkyysosamäärä on kasvanut. Tämä päättely on oikein, jos mitataan suhdelukuja, kuten tuumaa, litraa tai grammaa, ennen ja jälkeen intervention (olettaen, että käytetään sopivia ja luotettavia välineitä, kuten viivoittimia, jotta vältetään Kylmäfuusion kaltaiset virheelliset johtopäätökset, jotka ilmeisesti perustuivat virheellisiin lämpömittauksiin); se ei pidä paikkaansa älykkyystestien pistemäärissä, jotka on laskettu intervalliasteikoilla, joilla vain arvioidaan suhteellista järjestystä eikä mitata älykkyysosamäärää. Vaikka estimaatilla on huomattavaa ennustearvoa ja se korreloi aivojen ja geneettisten mittareiden kanssa, se ei ole mittaus samalla tavalla kuin mittaamme etäisyyttä, nestettä tai painoa, vaikka yksilöllisiä muutospisteitä käytettäisiin pre-post-suunnittelussa.

SAT-pisteet esimerkiksi korreloivat voimakkaasti älykkyystestien pisteiden kanssa (Frey ja Detterman, 2004). Kuvitellaan, että opiskelija osallistuu SAT-kokeeseen melko sairaana. Pisteet ovat todennäköisesti huono arvio oppilaan kyvyistä. Jos oppilas tekee testin uudelleen joskus myöhemmin terveenä, tarkoittaako pistemäärän nousu sitä, että oppilaan älykkyysosamäärä on kasvanut, vai sitä, että uudempi pistemäärä on nyt vain parempi arvio? Sama pätee SAT-valmennuskurssien jälkeisiin pistemäärän muutoksiin. Monet korkeakoulut ja yliopistot sallivat hakijoiden toimittaa useita SAT-pisteitä, ja korkeimmalla pistemäärällä on yleensä suurin painoarvo; alhaisille pistemäärille on monia valheellisia syitä, mutta korkeille pistemäärille paljon vähemmän. Pisteiden muutoksilla alhaisimmasta korkeimpaan on vain vähän tai ei lainkaan painoarvoa. Sitä vastoin henkilön painon muutos jonkin toimenpiteen jälkeen on yksiselitteinen.

Kognitiivisen harjoittelun vaikutusta älykkyyteen koskevissa tutkimuksissa on myös tärkeää ymmärtää, että kaikkiin älykkyystestien tuloksiin sisältyy tietty määrä epätarkkuutta tai virhettä. Tätä kutsutaan mittauksen standardivirheeksi, ja se voidaan kvantifioida ”todellisen” pistemäärän arviona havaittujen pistemäärien perusteella. Tuumien tai litrojen mittauksen vakiovirhe on yleensä nolla, jos oletetaan, että käytössäsi on täysin luotettavat, vakiomittauslaitteet. Älykkyystesteillä on yleensä korkea testin ja uusintatestin välinen luotettavuus, mutta niillä on myös keskivirhe, ja keskivirhe on usein suurempi korkeammilla pistemäärillä kuin matalammilla pistemäärillä. Älykkyystestin pistemäärän muutosta toimenpiteen jälkeen on tarkasteltava suhteessa testin keskivirheeseen. Tutkimuksissa, joissa älykkyysosamäärän arvioimiseksi ennen interventiota ja sen jälkeen käytetään yhtä ainoaa testiä, käytetään vähemmän luotettavia ja vaihtelevampia tuloksia (suuremmat keskivirheet) kuin tutkimuksissa, joissa yhdistetään useiden testien tulokset.

Muutospisteitä ei ole koskaan helppo tulkita, ja ne edellyttävät kehittyneitä tilastollisia menetelmiä ja tutkimussuunnitelmia, joissa on asianmukaiset kontrolliryhmät. Jos koulutustoimenpidettä kokeillaan esimerkiksi yksilöillä, joiden kaikkien ennen toimenpidettä saamat pisteet ovat alle populaation keskiarvon, uusintatestaukset toimenpiteen kanssa tai ilman toimenpidettä voivat johtaa korkeampiin pisteisiin, mikä johtuu tilastollisesta regressiosta keskiarvoon tai yksinkertaisesta testikäytännöstä, erityisesti jos testin vastaavia vaihtoehtoisia muotoja ei käytetä. Kvasikokeelliset mallit, kuten pelkkä jälkitesti, jossa on suuret otokset ja satunnaisjako, eivät aiheuta samoja tulkintaongelmia kuin pre-post-mallit. Ne ovat lupaavia, mutta useimmat arvioijat ovat taipuvaisempia arvostamaan pre-post-muutoksia. Latenttimuuttujatekniikoilla vältetään myös monet pre-post-intervalliasteikollisten muutosten vaikeudet, ja ne ovat lupaavia suurissa otoksissa (Ferrer ja McArdle, 2010).

Kun käytetään muutospisteitä, on tärkeää tunnistaa yksilölliset erot myös ryhmän sisällä, jos keskimääräinen muutospistemäärä kasvaa tilastollisesti intervention jälkeen. Kuvitellaan, että 100 oppilaan ryhmä sai kognitiivista harjoittelua ja 100 muuta sai jonkin kontrolliintervention. Koulutusryhmän keskimääräinen muutospistemäärä voi tilastollisesti osoittaa suurempaa nousua kuin kontrolliryhmän. Kuinka moni 100:sta koulutusta saaneesta henkilöstä todella osoittaa nousua? Eroavatko he millään tavalla niistä saman ryhmän henkilöistä, jotka eivät ole saaneet parannusta? Osoittaako tehtäväanalyysi, johtuuko pistemäärien nousu enemmän helpoista vai vaikeista testitehtävistä? Entä onko kontrolliryhmässä sellaisia henkilöitä, joiden pistemäärät ovat nousseet yhtä paljon kuin koulutusryhmässä? Jos kaikki 200 osallistujaa saavat lopulta saman koulutuksen, poikkeaako yksilöiden järjestys koulutuksen jälkeisten pisteiden perusteella mitenkään järjestyksestä, joka perustuu ennen koulutusta saatuihin pisteisiin? Jos ei, mitä on saavutettu? Useimmissa tutkimuksissa ei raportoida tällaisia analyysejä, vaikka uudemmissa koulutustutkimuksissa käsitellään älykkyyden monimittaiseen arviointiin ja yksilöllisiin eroihin liittyviä kysymyksiä (Colom et al., 2013b; Jaeggi et al., 2013). Burgaleta et al. antavat hyvän esimerkin älykkyysosamäärän muutosten osoittamisesta koehenkilökohtaisesti (Burgaleta et al., 2014).

Keskeinen pointti on kuitenkin se, että jotta voidaan esittää mahdollisimman vakuuttavia väitteitä siitä, että älykkyysosamäärä kasvaa intervention jälkeen, tarvitaan älykkyysosamäärän suhdeasteikko. Sellaista ei ole vielä olemassa, ja mielekäs edistys saattaa edellyttää uutta tapaa määritellä älykkyys, joka perustuu mitattaviin aivojen tai tiedonkäsittelyn muuttujiin. Esimerkiksi harmaan ja valkoisen aineen tiheys tietyillä aivoalueilla, jota arvioidaan kuvantamalla ja joka ilmaistaan normatiiviseen ryhmään perustuvien standardipisteiden profiilina, voisi korvata älykkyystestien pisteet (Haier, 2009). Englen ja kollegoiden työ viittaa siihen, että työmuistin kapasiteetti ja havaintonopeus ovat mahdollisia tapoja arvioida nestemäistä älykkyyttä (Broadway ja Engle, 2010; Redick ym., 2012) perustuen laajaan tutkimukseen, joka osoittaa, että nopeampi henkinen prosessointinopeus ja lisääntynyt muistin kapasiteetti liittyvät korkeampaan älykkyysosamäärään.

Jensen on kirjoittanut laajalti evoluutiosta psykometriikan kehittymisestä mentaaliseen ”kronometriikkaan” – vasteaikojen käyttämiseen millisekunneissa mitattaessa informaationkäsittelyä standardoidulla tavalla (Jensen, 2006). Hän väitti, että älykkyyden konstruktio voitaisiin korvata suhdelukuasteikollisilla tiedonkäsittelyn nopeuden mittauksilla, joita arvioidaan standardoitujen kognitiivisten tehtävien, kuten Hickin paradigman, aikana. Tällaiset mittaukset auttaisivat esimerkiksi edistämään tutkimusta henkisen nopeuden taustalla olevasta neurofysiologiasta ja saattaisivat johtaa älykkyyden kehittyneempään määritelmään. Jensen päätti kronometriaa käsittelevän kirjansa tähän kehotukseen: ”… kronometria tarjoaa käyttäytymis- ja aivotieteille universaalin absoluuttisen asteikon, jonka avulla voidaan saada erittäin herkkiä ja usein toistettavia mittauksia yksilön suorituskyvystä erityisesti suunnitelluissa kognitiivisissa tehtävissä. Sen aika on koittanut. Ryhdytään töihin!” (s. 246).

Tämä on valtava haaste ja älykkyystutkijoille tärkeä prioriteetti. Psykometristen ja kognitiivisten psykologien yhteistyö on avainasemassa. Nyt on olemassa useita tutkimuksia, jotka eivät pysty toistamaan väitteitä älykkyyden lisääntymisestä lyhytkestoisen muistin harjoittelun jälkeen, ja niihin on esitetty erilaisia syitä (Colom ym., 2013b; Harrison ym., 2013). Koska keskitymme tässä suppeasti, huomaamme, että yhdessä replikoinnin epäonnistumisessa arvioitiin myös työmuistikapasiteettia ja havaintonopeutta; siirtovaikutuksia ei havaittu (Redick ym., 2013), ja on syytä olettaa, että muut positiiviset siirtotutkimukset saattavat olla virheellisiä (Tidwell ym., 2013). Toistaiseksi kognitiivisen harjoittelun tulokset ovat enemmän epäjohdonmukaisia kuin epäjohdonmukaisia, erityisesti oletetun älykkyyden lisääntymisen osalta. Siitä huolimatta on rohkaisevaa, että kognitiiviset tutkijat työskentelevät näiden kysymysten parissa huolimatta yleisestä välinpitämättömyydestä tai negatiivisuudesta älykkyystutkimusta kohtaan psykologiassa yleensä ja monissa rahoittajissa.

Laaja-alaisemmassa kontekstissa älykkyys sisältää useamman kuin yhden komponentin. Kiinnostava konstruktio määritellään kuitenkin yleensä psykometrisin menetelmin kaikille henkisille kyvyille yhteiseksi yleiseksi tekijäksi, jota kutsutaan g-tekijäksi (Jensen, 1998). Fluidinen älykkyys, joka on useiden kognitiivisen harjoittelun tutkimusten kohteena, on yksi monista laajoista älykkyystekijöistä, ja se korreloi vahvasti g:n kanssa. g-faktoria arvioidaan älykkyystesteillä, mutta se ei ole synonyymi ÄO:n tai minkään muun testituloksen kanssa; jotkin testit ovat g-kuormittavampia kuin toiset. Kuten todettiin, älykkyystestin pistemäärällä ei ole juurikaan merkitystä, jos sitä ei verrata muiden ihmisten pistemääriin. Tästä syystä kaikki älykkyystestit edellyttävät normatiivisia ryhmiä vertailua varten ja siksi normiryhmiä on päivitettävä määräajoin, kuten Flynnin vaikutus osoittaa älykkyystestien pistemäärien asteittaisesta sukupolvien välisestä noususta; tosin se, näkyykö g:ssä Flynnin vaikutus, on edelleen epäselvää (te Nijenhuis ja van der Flier, 2013). Psykometriset arviot g:stä ja muista älykkyystekijöistä ovat tuottaneet vahvoja empiirisiä havaintoja älykkyyden luonteesta ja yksilöllisistä eroista, jotka perustuvat useimmiten korrelaatiotutkimuksiin. Nämä intervalliarviot eivät kuitenkaan riitä viemään tutkimusta seuraavaan vaiheeseen eli kokeellisiin interventioihin älykkyyden lisäämiseksi.

Tieteestä puhuessaan Carl Sagan totesi, että poikkeukselliset väitteet vaativat poikkeuksellisia todisteita. Toistaiseksi meillä ei ole sitä väitteistä, jotka koskevat älykkyyden lisääntymistä kognitiivisen harjoittelun jälkeen tai muutenkaan minkään muun manipulaation tai hoidon jälkeen, varhaiskasvatus mukaan lukien. Pienet tilastollisesti merkitsevät muutokset testituloksissa voivat olla tärkeitä havaintoja tarkkaavaisuudesta tai muistista tai jostakin muusta kognitiivisesta perusmuuttujasta tai tietystä henkisestä kyvystä, jota arvioidaan suhdeasteikolla, kuten millisekunneilla, mutta ne eivät ole riittävä todiste siitä, että yleinen älykkyys on muuttunut. Kuten kaikilla tieteenaloilla, edistys on riippuvainen yhä kehittyneemmistä mittauksista, jotka johtavat entistä tarkempiin määritelmiin – ajatelkaapa ”geenin” tai ”atomin” määritelmän kehittymistä. Vaikka käytössä on kehittyneitä intervallipohjaisia arviointitekniikoita (Ferrer ja McArdle, 2010), niin kauan kuin meillä ei ole parempia mittareita, erityisesti suhdelukuasteikkoja, meidän on tunnustettava perustavanlaatuinen mittausongelma ja suhtauduttava erittäin pidättyvästi ilmoittaessamme älykkyyden oletetusta lisääntymisestä tai vähenemisestä.

Tulevaisuudessa voi olla vahvoja empiirisiä perusteluja sille, että käytämme paljon rahaa kognitiiviseen harjoitteluun tai muuhun interventioon, jonka tarkoituksena on parantaa tiettyjä älyllisiä kykyjä tai koulusaavutuksia (pakottavien moraalisten perustelujen lisäksi), mutta yleisen älykkyyden lisääminen on melko vaikeaa osoittaa nykyisten testien avulla. Älykkyyden lisääminen on kuitenkin varteenotettava tavoite, joka voitaisiin saavuttaa DNA-analyysin, neurokuvantamisen, psykofarmakologian ja jopa suoran aivostimulaation hienostuneisiin neurotieteellisiin edistysaskeliin perustuvilla interventioilla (Haier, 2009, 2013; Lozano ja Lipsman, 2013; Santarnecchi et al., 2013; Legon et al., 2014). Älykkyyden yhtä kehittyneiden suhdemittausten kehittämisen on kuljettava käsi kädessä lupaavien interventioiden kehittämisen kanssa.

admin

Vastaa

Sähköpostiosoitettasi ei julkaista.

lg