Z jednej strony, testowanie inteligencji jest jednym z wielkich sukcesów psychologii (Hunt, 2011). Wyniki testów inteligencji przewidują wiele zjawisk w świecie rzeczywistym i mają wiele dobrze uzasadnionych zastosowań praktycznych (Gottfredson, 1997; Deary et al., 2010). Wyniki testów inteligencji korelują również ze strukturalnymi i funkcjonalnymi parametrami mózgu ocenianymi za pomocą neuroobrazowania (Haier i in., 1988; Jung i Haier, 2007; Deary i in., 2010; Penke i in., 2012; Colom i in., 2013a) oraz z genami (Posthuma i in., 2002; Hulshoff Pol i in., 2006; Chiang i in., 2009, 2012; Stein i in., 2012). Z drugiej strony, wyniki testów inteligencji są często źle rozumiane i mogą być niewłaściwie wykorzystywane. Niniejszy artykuł koncentruje się na podstawowym nieporozumieniu, które przenika wiele z ostatnich doniesień o wzroście inteligencji w następstwie krótkoterminowego treningu poznawczego. Kilka z tych raportów zostało opublikowanych w znaczących czasopismach i uzyskało szeroką uwagę publiczną (Jaeggi i in., 2008, 2011; Mackey i in., 2011).

Podstawowym nieporozumieniem jest założenie, że wyniki testu inteligencji są jednostkami miary takimi jak cale, litry czy gramy. Nie są. Cale, litry i gramy są skalami proporcji, gdzie zero oznacza zero, a 100 jednostek to dwa razy 50 jednostek. Wyniki testów inteligencji szacują konstrukt przy użyciu skal interwałowych i mają znaczenie tylko w odniesieniu do innych ludzi w tym samym wieku i płci. Ludzie z wysokimi wynikami generalnie radzą sobie lepiej w szerokim zakresie testów zdolności umysłowych, ale ktoś z wynikiem IQ 130 nie jest o 30% mądrzejszy od kogoś z wynikiem IQ 100. Wynik 130 stawia osobę w najwyższych 2% populacji, podczas gdy wynik 100 jest na 50-tym percentylu. Zmiana wyniku IQ z 100 na 103 nie jest taka sama jak zmiana z 133 na 136. To sprawia, że prosta interpretacja zmian w wynikach testów inteligencji jest niemożliwa.

Większość ostatnich badań, w których stwierdzono wzrost inteligencji po interwencji treningu poznawczego, opiera się na porównaniu wyniku testu inteligencji przed interwencją z drugim wynikiem po interwencji. Jeśli średni wzrost wyniku w grupie szkoleniowej jest istotny statystycznie (przy użyciu zależnego testu t lub podobnego testu statystycznego), jest to traktowane jako dowód, że inteligencja wzrosła. Takie rozumowanie jest poprawne, jeśli mierzy się skale proporcji, takie jak cale, litry lub gramy przed i po interwencji (zakładając odpowiednie i wiarygodne instrumenty, takie jak linijki, aby uniknąć błędnych wniosków podobnych do Cold Fusion, które najwyraźniej opierały się na wadliwym pomiarze ciepła); nie jest ono poprawne dla wyników testu inteligencji na skalach interwałowych, które jedynie szacują względną kolejność w rankingu, a nie mierzą konstruktu inteligencji. Nawet jeśli oszacowanie ma znaczną wartość predykcyjną i koreluje z pomiarami mózgowymi i genetycznymi, nie jest to pomiar w taki sam sposób, w jaki mierzymy odległość, płyn lub wagę, nawet jeśli indywidualne wyniki zmian są używane w projekcie pre-post.

Wyniki testu SAT, na przykład, są wysoce skorelowane z wynikami testu inteligencji (Frey i Detterman, 2004). Wyobraźmy sobie, że uczeń podchodzi do testów SAT, kiedy jest bardzo chory. Wyniki prawdopodobnie są złym oszacowaniem zdolności ucznia. Jeśli uczeń powtórzy test jakiś czas później, kiedy czuje się dobrze, czy wzrost wyniku oznacza, że inteligencja ucznia wzrosła, czy że nowy wynik jest teraz tylko lepszym oszacowaniem? To samo dotyczy zmian wyniku po kursach przygotowawczych do SAT. Wiele college’ów i uniwersytetów pozwala kandydatom na złożenie wielu wyników SAT, a najwyższy wynik zazwyczaj ma największą wagę; istnieje wiele fałszywych powodów dla niskich wyników, ale znacznie mniej dla wysokich. Zmiana wyników od najniższego do najwyższego ma niewielką wagę, jeśli w ogóle. Dla kontrastu, zmiana w wadze osoby po jakiejś interwencji jest jednoznaczna.

W badaniach wpływu treningu poznawczego na inteligencję, ważne jest również, aby zrozumieć, że wszystkie wyniki testów inteligencji zawierają pewną ilość niedokładności lub błędu. Nazywa się to standardowym błędem pomiaru i może być określone ilościowo jako oszacowanie „prawdziwego” wyniku na podstawie zaobserwowanych wyników. Błąd standardowy pomiaru cali lub litrów jest zazwyczaj równy zero, zakładając, że posiadasz doskonale wiarygodne, standardowe urządzenia pomiarowe. Testy inteligencji generalnie wykazują wysoką rzetelność test-retest, ale mają również błąd standardowy, a błąd standardowy jest często większy dla wyższych wyników niż dla niższych. Każda zmiana wyniku testu inteligencji po interwencji musi być rozpatrywana w odniesieniu do błędu standardowego testu. Badania, w których do oszacowania inteligencji przed i po interwencji użyto jednego testu, są mniej wiarygodne i bardziej zmienne (większe błędy standardowe) niż badania, w których połączono wyniki z zestawu testów.

Zmiany wyników nigdy nie są łatwe do interpretacji i wymagają wyrafinowanych metod statystycznych i projektów badawczych z odpowiednimi grupami kontrolnymi. Jeśli na przykład wypróbujesz interwencję szkoleniową na osobach, z których wszystkie mają przed interwencją wyniki poniżej średniej populacji, ponowne testowanie z lub bez interwencji, może skutkować wyższymi wynikami z powodu statystycznego zjawiska regresji do średniej lub z powodu prostej praktyki testowej, szczególnie jeśli równoważne alternatywne formy testu nie są używane. Projekty quasi-eksperymentalne, takie jak post-test tylko z dużymi próbami i losowym przydziałem, nie mają wszystkich tych samych trudności interpretacyjnych jak projekty pre-post. Są one obiecujące, ale większość recenzentów jest bardziej skłonna doceniać zmiany pre-post. Techniki zmiennych latentnych również unikają wielu trudności związanych ze zmianami w skali interwałowej pre-post i są obiecujące w dużych próbach (Ferrer i McArdle, 2010).

Gdy używane są wyniki zmian, ważne jest, aby zidentyfikować indywidualne różnice nawet w grupie, gdzie średni wynik zmiany statystycznie wzrasta po interwencji. Wyobraźmy sobie, że grupa 100 studentów otrzymała trening poznawczy, a 100 innych otrzymało interwencję kontrolną. Średni wynik zmiany w grupie uczestniczącej w treningu może statystycznie wykazywać większy wzrost niż w grupie kontrolnej. Ile ze 100 osób, które otrzymały trening rzeczywiście wykazało wzrost? Czy różnią się one w jakikolwiek sposób od osób z tej samej grupy, które nie wykazały wzrostu? Czy analiza elementów pokazuje, czy wzrost wyników jest spowodowany bardziej łatwymi czy trudnymi elementami testu? Co z osobami w grupie kontrolnej, które wykazują wzrost punktacji zmiany tak duży jak w grupie szkoleniowej? Jeśli wszyscy 200 uczestnicy ostatecznie przejdą to samo szkolenie, czy kolejność osób w rankingu na podstawie wyników po szkoleniu będzie inna niż kolejność na podstawie wyników przed szkoleniem? Jeśli nie, to co zostało osiągnięte? Większość badań nie przedstawia takich analiz, chociaż nowsze badania szkoleniowe odnoszą się do kwestii oceny inteligencji za pomocą wielu miar i różnic indywidualnych (Colom i in., 2013b; Jaeggi i in., 2013). Burgaleta i wsp. dostarczają dobrego przykładu pokazania zmian IQ subject-by-subject (Burgaleta i wsp., 2014).

Niemniej jednak głównym punktem jest to, że aby przedstawić najbardziej przekonujący argument, że inteligencja wzrasta po interwencji, wymagana jest skala ilorazowa inteligencji. Żadna jeszcze nie istnieje, a znaczący postęp może wymagać nowego sposobu definiowania inteligencji opartego na mierzalnych zmiennych mózgu lub przetwarzania informacji. Na przykład, gęstość istoty szarej i białej w określonych regionach mózgu, oceniana za pomocą obrazowania i wyrażona jako profil wyników standardowych opartych na grupie normatywnej, mogłaby zastąpić wyniki testów inteligencji (Haier, 2009). Praca Engle’a i współpracowników sugeruje, że pojemność pamięci roboczej i szybkość percepcji są możliwymi sposobami oceny inteligencji płynnej (Broadway i Engle, 2010; Redick i in., 2012) w oparciu o szeroki zakres badań, które wykazują, że większa szybkość przetwarzania umysłowego i zwiększona pojemność pamięci są związane z wyższą inteligencją.

Jensen obszernie pisał o ewolucji od psychometrii do umysłowej „chronometrii” – wykorzystania czasu reakcji w milisekundach do pomiaru przetwarzania informacji w standardowy sposób (Jensen, 2006). Przekonywał, że konstrukt inteligencji może zostać zastąpiony na rzecz miar szybkości przetwarzania informacji w skali ilorazowej, ocenianych podczas standaryzowanych zadań poznawczych, takich jak paradygmat Hicka. Takie miary, na przykład, pomogłyby rozwinąć badania nad neurofizjologią leżącą u podstaw szybkości umysłowej i mogłyby doprowadzić do bardziej zaawansowanej definicji inteligencji. Jensen zakończył swoją książkę o chronometrii takim oto wezwaniem do działania: „… chronometria dostarcza naukom behawioralnym i naukom o mózgu uniwersalnej skali absolutnej do uzyskiwania wysoce czułych i często powtarzalnych pomiarów wydajności jednostki w specjalnie opracowanych zadaniach poznawczych. Jej czas nadszedł. Bierzmy się do pracy!” (s. 246).

Jest to ogromne wyzwanie i główny priorytet dla badaczy inteligencji. Współpraca pomiędzy psychometrykami i psychologami poznawczymi będzie kluczowa. Obecnie istnieje wiele badań, które nie potwierdzają twierdzeń o zwiększonej inteligencji po treningu pamięci krótkotrwałej i proponowane są różne powody (Colom i in., 2013b; Harrison i in., 2013). Biorąc pod uwagę nasz wąski zakres zainteresowań, zauważamy, że w jednym z badań, w którym nie udało się uzyskać replikacji, oceniano również pojemność pamięci roboczej i szybkość percepcji; nie stwierdzono efektów przeniesienia (Redick i in., 2013) i istnieją powody, by sugerować, że inne badania dotyczące pozytywnego przeniesienia mogą być błędne (Tidwell i in., 2013). Jak na razie wyniki treningu poznawczego są bardziej niespójne niż niespójne, zwłaszcza w przypadku domniemanego wzrostu inteligencji. Niemniej jednak zachęcające jest to, że badacze kognitywni pracują nad tymi zagadnieniami pomimo wszechobecnej obojętności lub negatywności wobec badań nad inteligencją w psychologii w ogóle i dla wielu agencji finansujących.

W szerszym kontekście, inteligencja obejmuje więcej niż jeden komponent. Jednak konstrukt będący przedmiotem zainteresowania jest zwykle definiowany metodami psychometrycznymi jako ogólny czynnik wspólny dla wszystkich zdolności umysłowych, zwany czynnikiem g (Jensen, 1998). Inteligencja płynna, na której koncentruje się kilka badań dotyczących treningu poznawczego, jest jednym z kilku szerokich czynników inteligencji i jest wysoce skorelowana z g. Czynnik g jest szacowany za pomocą testów inteligencji, ale nie jest to synonim IQ ani żadnego innego wyniku testu; niektóre testy są bardziej obciążone g niż inne. Jak zauważono, wynik w teście inteligencji ma niewielkie znaczenie bez porównania go z wynikami innych osób. Dlatego właśnie wszystkie testy inteligencji wymagają grup normatywnych do porównań i dlatego grupy normatywne muszą być okresowo aktualizowane, co pokazuje efekt Flynna, polegający na stopniowym pokoleniowym wzroście wyników w testach inteligencji; chociaż to, czy g wykazuje efekt Flynna, jest wciąż nierozstrzygnięte (te Nijenhuis i van der Flier, 2013). Psychometryczne oszacowania g i innych czynników inteligencji przyniosły silne ustalenia empiryczne dotyczące natury inteligencji i różnic indywidualnych, w większości oparte na badaniach korelacji. Te interwałowe oceny nie są jednak wystarczające, aby przenieść badania do następnego kroku, jakim są eksperymentalne interwencje mające na celu zwiększenie inteligencji.

Mówiąc o nauce, Carl Sagan zauważył, że nadzwyczajne twierdzenia wymagają nadzwyczajnych dowodów. Jak dotąd, nie mamy ich dla twierdzeń o zwiększeniu inteligencji po treningu poznawczym lub, dla tej sprawy, jakiejkolwiek innej manipulacji lub leczenia, w tym wczesnej edukacji. Małe, statystycznie istotne zmiany w wynikach testów mogą być ważnymi obserwacjami na temat uwagi lub pamięci albo jakiejś innej elementarnej zmiennej poznawczej lub specyficznej zdolności umysłowej ocenianej za pomocą skali proporcji, takiej jak milisekundy, ale nie są wystarczającym dowodem na to, że ogólna inteligencja uległa zmianie. Jak we wszystkich gałęziach nauki, postęp zależy od coraz bardziej wyrafinowanych pomiarów, które napędzają bardziej precyzyjne definicje – pomyśl o ewolucji definicji „genu” lub „atomu”. Nawet w przypadku zaawansowanych technik oceny opartych na interwałach (Ferrer i McArdle, 2010), dopóki nie będziemy dysponować lepszymi miarami, zwłaszcza skalami ilorazowymi, musimy uznać podstawowy problem pomiaru i zachować daleko idącą powściągliwość w informowaniu o domniemanych wzrostach lub spadkach inteligencji.

W przyszłości mogą istnieć silne empiryczne przesłanki do wydawania dużych sum pieniędzy na treningi poznawcze lub inne interwencje mające na celu poprawę konkretnych zdolności umysłowych lub osiągnięć szkolnych (oprócz przekonujących argumentów moralnych, by tak czynić), ale wzrost ogólnej inteligencji jest dość trudny do wykazania za pomocą obecnych testów. Zwiększanie inteligencji jest jednak szczytnym celem, który może zostać osiągnięty dzięki interwencjom opartym na zaawansowanych osiągnięciach neuronauki w zakresie analizy DNA, neuroobrazowania, psychofarmakologii, a nawet bezpośredniej stymulacji mózgu (Haier, 2009, 2013; Lozano i Lipsman, 2013; Santarnecchi i in., 2013; Legon i in., 2014). Opracowanie równie wyrafinowanych wskaźników pomiaru inteligencji musi iść w parze z opracowaniem obiecujących interwencji.

.

admin

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

lg