Kedvezőtlen megfigyelések elvetéseSzerkesztés

Szerk:

Egy vállalatnak mindössze annyit kell tennie egy semleges (haszontalan) termék népszerűsítéséhez, hogy például 40 tanulmányt talál vagy végez 95%-os megbízhatósági szinttel. Ha a termék valóban haszontalan, akkor ez átlagosan egy olyan tanulmányt eredményezne, amely kimutatja, hogy a termék hasznos, egy olyan tanulmányt, amely kimutatja, hogy káros, és harmincnyolc nem meggyőző tanulmányt (38 a 40-ből 95%). Ez a taktika annál hatékonyabb, minél több tanulmány áll rendelkezésre. Azok a szervezetek, amelyek nem tesznek közzé minden általuk elvégzett tanulmányt, például a dohányzás és a rák közötti kapcsolatot tagadó dohányipari vállalatok, a dohányzásellenes érdekvédelmi csoportok és a dohányzás és a különböző betegségek közötti kapcsolatot bizonyítani próbáló médiumok, vagy a csodaszerek forgalmazói valószínűleg ezt a taktikát alkalmazzák.

Ronald Fisher ezt a kérdést vette figyelembe híres, hölgykóstolós teapéldakísérletében (1935-ben megjelent, The Design of Experiments című könyvéből). Az ismételt kísérletekkel kapcsolatban azt mondta: “Egyértelműen törvénytelen lenne, és megfosztaná számításainkat az alapjától, ha a sikertelen eredményeket nem vennénk mind figyelembe.”

Egy másik, ezzel a fogalommal kapcsolatos kifejezés a cherry picking.

Fontos jellemzők figyelmen kívül hagyásaSzerkesztés

A többváltozós adathalmazok két vagy több jellemzővel/dimenzióval rendelkeznek. Ha ezek közül a jellemzők közül túl keveset választunk ki az elemzéshez (például ha csak egy jellemzőt választunk ki, és többszörös lineáris regresszió helyett egyszerű lineáris regressziót végzünk), az eredmények félrevezetőek lehetnek. Ezáltal az elemző kiszolgáltatottá válik a különböző statisztikai paradoxonok bármelyikének, vagy néhány (nem minden) esetben hamis kauzalitásnak, mint alább.

Betöltött kérdésekSzerkesztés

Főcikk: Feltöltött kérdés

A felmérések válaszai gyakran manipulálhatók a kérdés olyan módon történő megfogalmazásával, hogy a válaszadóból egy bizonyos válasz felé való hajlamot idézzenek elő. Például egy háború támogatásának felmérésekor a következő kérdések:

  • Szurkol-e az USA azon kísérletének, hogy a világ más részein szabadságot és demokráciát teremtsen?
  • Szurkol-e az USA provokálatlan katonai akciójának?

valószínűleg különböző irányba torzított adatokat fognak eredményezni, bár mindkettő a háború támogatásáról kérdez. A kérdés jobb megfogalmazása lehetne: “Támogatja-e Ön az USA jelenlegi külföldi katonai akcióját?”. A kérdés még közel semlegesebb megfogalmazása a következő: “Mi a véleménye a jelenlegi külföldi amerikai katonai akcióról?”. A lényeg az kell legyen, hogy a megkérdezettnek ne legyen módja kitalálni a megfogalmazásból, hogy a kérdező mit akarhat hallani.

Egy másik lehetőség, hogy a kérdést olyan információkkal előzzük meg, amelyek alátámasztják a “kívánt” választ. Például a “Tekintettel a középosztálybeli családok növekvő adóterheire, támogatja-e Ön a jövedelemadó csökkentését?” kérdésre valószínűleg többen fognak igennel válaszolni, mint a “Tekintettel a növekvő szövetségi költségvetési hiányra és a több bevétel kétségbeesett szükségességére, támogatja-e Ön a jövedelemadó csökkentését?” kérdésre.”

A kérdések megfelelő megfogalmazása nagyon finom lehet. Két kérdésre adott válaszok drámaian eltérhetnek attól függően, hogy milyen sorrendben teszik fel őket. “Egy felmérés, amely a “részvénytulajdonlásra” kérdezett rá, azt találta, hogy a legtöbb texasi farmernek vannak részvényei, bár valószínűleg nem olyanok, amelyekkel a New York-i tőzsdén kereskednek.”

Túl általánosításSzerkesztés

A túl általánosítás olyan tévedés, amikor egy adott populációra vonatkozó statisztikáról azt állítják, hogy egy olyan csoport tagjaira is érvényes, amelyre az eredeti populáció nem reprezentatív minta.

Tegyük fel például, hogy az alma 100%-a nyáron piros. Az “Minden alma piros” állítás a túlzott általánosítás példája lenne, mivel az eredeti statisztika csak az almák egy bizonyos részhalmazára (a nyári almákra) igaz, amelyről nem várható, hogy reprezentatív az almák teljes populációjára nézve.

A túlzott általánosítás tévedésének egy valós példája megfigyelhető a modern közvélemény-kutatási technikák műtárgyaként, amelyek tiltják a mobiltelefonos telefonos politikai közvélemény-kutatásokat. Mivel a fiatalok más demográfiai csoportoknál nagyobb valószínűséggel nem rendelkeznek hagyományos “vezetékes” telefonnal, egy olyan telefonos felmérés, amely kizárólag vezetékes telefont hívó válaszadókat kérdez meg, a felmérés eredményei alulmintázhatják a fiatalok véleményét, ha nem tesznek más intézkedéseket a mintavétel torzításának figyelembevételére. Így a fiatalok szavazási preferenciáit ezzel a technikával vizsgáló közvélemény-kutatás nem biztos, hogy tökéletesen pontosan, túl általánosítás nélkül reprezentálja a fiatalok valódi szavazási preferenciáit az egész népességben, mivel a felhasznált minta kizárja a csak mobiltelefont hordó fiatalokat, akiknek szavazási preferenciái eltérhetnek a lakosság többi részétől, vagy nem.

A túl általánosítás gyakran előfordul, amikor az információ nem technikai forrásokon, különösen a tömegmédián keresztül jut el az emberekhez.

Elfogult mintákSzerkesztés

Főcikk: Elfogult minta

A tudósok nagy áldozatok árán megtanulták, hogy nehéz jó kísérleti adatokat gyűjteni a statisztikai elemzéshez. Példa: A placebo hatás (elme a test felett) nagyon erős. Az alanyok 100%-a kiütést kapott, amikor egy tévesen mérges szömörcének nevezett inert anyaggal érintkeztek, míg kevesen kaptak kiütést egy “ártalmatlan” tárgytól, amely valójában mérges szömörce volt. A kutatók kettős-vak randomizált összehasonlító kísérletekkel küzdenek ez ellen a hatás ellen. A statisztikusok általában jobban aggódnak az adatok érvényessége miatt, mint az elemzés miatt. Ezt tükrözi a statisztikán belül a kísérletek tervezésének nevezett tudományterület.

A közvélemény-kutatók nagy áldozatok árán megtanulták, hogy nehéz jó felmérési adatokat gyűjteni a statisztikai elemzéshez. A mobiltelefonok szelektív hatása az adatgyűjtésre (amelyet a Túl általánosítás fejezetben tárgyaltunk) az egyik lehetséges példa; ha a hagyományos telefonnal rendelkező fiatalok nem reprezentatívak, a minta torz lehet. A mintavételes felméréseknek számos buktatója van, és nagy körültekintést igényelnek a kivitelezés során. Az egyik próbálkozás során közel 3000 telefonhívásra volt szükség ahhoz, hogy 1000 választ kapjunk. A populáció egyszerű véletlenszerű mintája “nem egyszerű, és nem biztos, hogy véletlenszerű.”

A becsült hiba téves jelentése vagy félreértéseSzerkesztés

Ha egy kutatócsoport azt szeretné megtudni, hogy 300 millió ember hogyan vélekedik egy bizonyos témáról, nem lenne praktikus megkérdezni mindenkit. Ha azonban a csapat kiválaszt egy körülbelül 1000 fős véletlenszerű mintát, akkor meglehetősen biztosak lehetnek abban, hogy az e csoport által adott eredmények reprezentatívak arra nézve, hogy mit mondott volna a nagyobb csoport, ha mindannyiukat megkérdezték volna.

Ez a megbízhatóság tulajdonképpen számszerűsíthető a központi határértéktétel és más matematikai eredmények segítségével. A bizalmat annak valószínűségeként fejezik ki, hogy a valódi eredmény (a nagyobb csoportra vonatkozóan) a becslés (a kisebb csoportra vonatkozó adat) egy bizonyos tartományán belül van. Ez a statisztikai felméréseknél gyakran megadott “plusz vagy mínusz” érték. A megbízhatósági szint valószínűségi részét általában nem említik; ha igen, akkor feltételezik, hogy ez egy standard szám, például 95%.

A két szám összefügg. Ha egy felmérés becsült hibája 95%-os megbízhatóság mellett ±5%, akkor 99%-os megbízhatóság mellett is ±6,6%-os becsült hibával rendelkezik. ± x {\displaystyle x}

% 95%-os megbízhatóság mellett mindig ± 1,32 x {\displaystyle 1,32x}

% 99%-os megbízhatósággal egy normális eloszlású populáció esetén.

Minél kisebb a becsült hiba, annál nagyobb a szükséges minta egy adott megbízhatósági szint mellett.

95,4%-os megbízhatóság mellett:

±1%-hoz 10 000 emberre lenne szükség.
±2%-hoz 2 500 emberre.
±3%-hoz 1 111 emberre.
±4%-hoz 625 emberre.
±5%-hoz 400 emberre.
±10%-hoz 100 emberre.
±20%-hoz 25 emberre lenne szükség.
±25%-hoz 16 főre lenne szükség.
±50%-hoz 4 emberre lenne szükség.

Az emberek feltételezhetik, hogy – mivel a megbízhatósági adatot kihagyták – 100%-os bizonyossággal feltételezhető, hogy a valós eredmény a becsült hibán belül van. Ez matematikailag nem helyes.

Nem biztos, hogy sokan felismerik, hogy a minta véletlenszerűsége nagyon fontos. A gyakorlatban sok közvélemény-kutatást telefonon végeznek, ami többféleképpen torzítja a mintát, például kizárják azokat az embereket, akiknek nincs telefonjuk, előnyben részesítik azokat, akiknek egynél több telefonjuk van, előnyben részesítik azokat, akik hajlandóak részt venni egy telefonos felmérésben azokkal szemben, akik elutasítják, stb. A nem véletlenszerű mintavételezés megbízhatatlanná teszi a becsült hibát.

Másrészt az emberek úgy gondolhatják, hogy a statisztikák eleve megbízhatatlanok, mert nem mindenkit hívnak fel, vagy mert őket magukat soha nem kérdezik meg. Az emberek azt gondolhatják, hogy lehetetlen néhány ezer ember megkérdezésével több tucat millió ember véleményéről adatokat szerezni. Ez szintén pontatlan. Egy tökéletesen elfogulatlan mintavétellel és igaz válaszokkal végzett közvélemény-kutatásnak van egy matematikailag meghatározott hibahatára, amely csak a megkérdezettek számától függ.

Egy felmérésnél azonban gyakran csak egy hibahatárt közölnek. Ha a népesség alcsoportjaira vonatkozó eredményeket közölnek, akkor nagyobb hibahatár alkalmazandó, de ezt nem feltétlenül teszik világossá. Például egy 1000 fős felmérés tartalmazhat 100 főt egy bizonyos etnikai vagy gazdasági csoportból. Az erre a csoportra összpontosító eredmények sokkal kevésbé megbízhatóak, mint a teljes népességre vonatkozó eredmények. Ha a teljes minta hibahatára mondjuk 4%, akkor az ilyen alcsoportra vonatkozó hibahatár 13% körül lehet.

A népességfelmérésekben számos más mérési probléma is felmerül.

A fent említett problémák minden statisztikai kísérletre vonatkoznak, nem csak a népességfelmérésekre.

Bővebb információ: Közvélemény-kutatás és statisztikai felmérés

Hamis kauzalitásSzerkesztés

Főcikk: Correlation does not imply causation

Ha egy statisztikai teszt korrelációt mutat A és B között, általában hat lehetőség van:

  1. A okozza B-t.
  2. B okozza A-t.
  3. A és B részben okozza egymást.
  4. A-t és B-t egy harmadik tényező, C okozza.
  5. B-t C okozza, amely korrelál A-val.
  6. A megfigyelt korreláció pusztán a véletlennek köszönhető.

A hatodik lehetőség statisztikai tesztekkel számszerűsíthető, amelyekkel kiszámítható annak a valószínűsége, hogy a megfigyelt korreláció akkora lenne, mint amekkora pusztán a véletlen folytán, ha valójában nincs kapcsolat a változók között. Azonban még ha ennek a lehetőségnek kicsi is a valószínűsége, akkor is ott van a másik öt.

Ha a strandon fagylaltot vásárlók száma statisztikailag összefügg a strandon vízbe fulladók számával, akkor senki sem állítaná, hogy a fagylalt okozza a vízbe fulladást, mert nyilvánvaló, hogy ez nem így van. (Ebben az esetben mind a vízbefulladás, mind a fagylaltvásárlás nyilvánvalóan összefügg egy harmadik tényezővel: a strandon tartózkodó emberek számával).

Ezt a tévhitet használhatjuk például annak bizonyítására, hogy egy vegyi anyagnak való kitettség rákot okoz. Cserélje ki a “fagylaltot vásárló emberek számát” az “X vegyi anyagnak kitett emberek számával”, és a “vízbe fulladó emberek számát” a “rákot kapó emberek számával”, és sokan hinni fognak Önnek. Ilyen helyzetben akkor is lehet statisztikai összefüggés, ha nincs valódi hatás. Ha például az a megítélés alakul ki, hogy egy vegyi anyag telephelye “veszélyes” (még akkor is, ha valójában nem az), akkor az ingatlanok értéke a környéken csökkenni fog, ami több alacsony jövedelmű családot csábít arra a területre költözni. Ha az alacsony jövedelmű családok nagyobb valószínűséggel kapnak rákot, mint a magas jövedelmű családok (például a rosszabb táplálkozás vagy az orvosi ellátáshoz való rosszabb hozzáférés miatt), akkor a rákos megbetegedések aránya emelkedni fog, még akkor is, ha maga a vegyi anyag nem veszélyes. Úgy vélik, hogy pontosan ez történt néhány korai tanulmány esetében, amelyek összefüggést mutattak ki a villanyvezetékekből származó EMF (elektromágneses mezők) és a rák között.

A jól megtervezett tanulmányokban a hamis okozati összefüggés hatása kiküszöbölhető azzal, hogy néhány embert véletlenszerűen egy “kezelési csoportba” és néhány embert egy “kontrollcsoportba” sorolnak, és a kezelési csoportnak adják a kezelést, a kontrollcsoportnak pedig nem adják a kezelést. A fenti példában a kutató az emberek egyik csoportját kiteheti az X vegyszernek, a másik csoportot pedig érintetlenül hagyhatja. Ha az első csoportban magasabb volt a rákos megbetegedések aránya, a kutató tudja, hogy nincs olyan harmadik tényező, amely befolyásolta volna, hogy egy személy ki volt-e téve, mert ellenőrizte, hogy ki volt kitéve, és ki nem, és véletlenszerűen osztotta be az embereket a kitett és a nem kitett csoportba. Sok esetben azonban egy kísérlet ilyen módon történő elvégzése vagy megfizethetetlenül drága, vagy kivitelezhetetlen, vagy etikátlan, illegális, vagy egyenesen lehetetlen. Például nagyon valószínűtlen, hogy egy IRB elfogadna egy olyan kísérletet, amely során az embereket szándékosan kiteszik egy veszélyes anyagnak, hogy teszteljék annak toxicitását. Az ilyen típusú kísérletek nyilvánvaló etikai következményei korlátozzák a kutatók képességét az ok-okozati összefüggések empirikus vizsgálatára.

A nullhipotézis bizonyításaSzerkesztés

A statisztikai tesztekben a nullhipotézis ( H 0 {\displaystyle H_{0}}}

) mindaddig érvényesnek tekinthető, amíg elegendő adat nem bizonyítja, hogy téves. Ekkor H 0 {\displaystyle H_{0}}

elvetjük, és az alternatív hipotézist ( H A {\displaystyle H_{A}}

) tekintjük igazoltnak. Véletlenül ez megtörténhet, bár a H 0 {\displaystyle H_{0}}

igaz, az α {\displaystyle \alpha }-val jelölt valószínűséggel.

(a szignifikancia szint). Ez összehasonlítható az igazságszolgáltatási eljárással, ahol a vádlottat addig tekintjük ártatlannak ( H 0 {\displaystyle H_{0}}

), amíg bűnössége ( H A {\displaystyle H_{A}}}

) minden kétséget kizáróan ( α {\displaystyle \alpha }

) be nem bizonyosodik.

De ha az adatok nem adnak elegendő bizonyítékot ahhoz, hogy elutasítsuk, hogy H 0 {\displaystyle H_{0}}

, ez nem bizonyítja automatikusan, hogy H 0 {\displaystyle H_{0}}

helyes. Ha például egy dohánygyártó be akarja bizonyítani, hogy a termékei biztonságosak, könnyen elvégezhet egy tesztet a dohányosok egy kis mintáján a nemdohányzók egy kis mintájával szemben. Nem valószínű, hogy bármelyiküknél is tüdőrák alakul ki (és ha mégis, a csoportok közötti különbségnek nagyon nagynak kell lennie ahhoz, hogy a H 0 {\displaystyle H_{0}} elvethető legyen.

). Ezért valószínű – még akkor is, ha a dohányzás veszélyes -, hogy tesztünk nem fogja elutasítani a H 0 {\displaystyle H_{0}}

. Ha H 0 {\displaystyle H_{0}}

elfogadjuk, ebből nem következik automatikusan, hogy a dohányzás ártalmatlannak bizonyul. A teszt nem elég erős ahhoz, hogy a H 0 {\displaystyle H_{0}}

, így a teszt használhatatlan, és a H 0 {\displaystyle H_{0}} “bizonyításának” értéke

értéke szintén nulla.

Ez – a fenti igazságügyi analógiát használva – összevethető a valóban bűnös vádlottal, akit csak azért engednek szabadon, mert a bizonyíték nem elegendő a bűnös ítélethez. Ez nem a vádlott ártatlanságát bizonyítja, hanem csak azt, hogy nincs elég bizonyíték a bűnös ítélethez.”

“…a nullhipotézist a kísérletezés során soha nem bizonyítják vagy állapítják meg, hanem esetleg cáfolják. Minden kísérletről elmondható, hogy csak azért létezik, hogy a tényeknek esélyt adjon a nullhipotézis megcáfolására”. (Fisher in The Design of Experiments) A félreértésnek számos oka van, többek között a kettős negatív logika használata és a Fisher-féle “szignifikancia vizsgálat” (ahol a nullhipotézist soha nem fogadják el) és a “hipotézis vizsgálat” (ahol valamilyen hipotézist mindig elfogadnak) összevonásából eredő terminológia.

A statisztikai szignifikancia összekeverése a gyakorlati szignifikanciávalSzerkesztés

A statisztikai szignifikancia a valószínűség mérőszáma; a gyakorlati szignifikancia a hatás mérőszáma. A kopaszság gyógyítása akkor statisztikailag szignifikáns, ha a korábban csupasz fejbőrt általában ritkás barackbunda fedi. A kúra gyakorlatilag szignifikáns, ha hideg időben már nincs szükség sapkára, és a fodrász megkérdezi, mennyit kell levenni a tetejéről. A kopaszok olyan gyógymódot akarnak, amely statisztikailag és gyakorlatilag is jelentős; Valószínűleg működni fog, és ha működik, akkor nagy szőrös hatása lesz. A tudományos publikáláshoz gyakran csak a statisztikai szignifikancia szükséges. Ez olyan panaszokhoz vezetett (az elmúlt 50 évben), hogy a statisztikai szignifikancia vizsgálata visszaélés a statisztikával.

AdatkitermelésSzerkesztés

Főcikk: Adatkotrás

Az adatkotrás az adatbányászattal való visszaélés. Az adatkotrás során nagy adathalmazokat vizsgálnak meg összefüggés keresése céljából, a vizsgálandó hipotézis előre meghatározott kiválasztása nélkül. Mivel a két paraméter közötti kapcsolat megállapításához szükséges konfidenciaintervallumot általában 95%-ban határozzák meg (ami azt jelenti, hogy 95% az esélye annak, hogy a megfigyelt kapcsolat nem a véletlen műve), így 5% az esélye annak, hogy korrelációt találnak két teljesen véletlen változóhalmaz között. Tekintettel arra, hogy az adatkitermelési erőfeszítések jellemzően nagy, sok változót tartalmazó adathalmazokat, és így még több változópárt vizsgálnak, hamis, de látszólag statisztikailag szignifikáns eredményeket szinte biztosan találnak bármely ilyen vizsgálat során.

Megjegyzendő, hogy az adatkitermelés egy lehetséges hipotézis megtalálásának érvényes módja, de ezt a hipotézist ezután az eredeti kitermelés során nem használt adatokkal kell tesztelni. A visszaélés akkor következik be, amikor ezt a hipotézist további validálás nélkül tényként állítják be.

“Nem lehet jogszerűen tesztelni egy hipotézist ugyanazokon az adatokon, amelyek először sugallták ezt a hipotézist”. A megoldás egyértelmű. Ha már van egy hipotézise, tervezzen meg egy vizsgálatot, hogy kifejezetten azt a hatást keresse, amelyről most úgy gondolja, hogy létezik. Ha ennek a tesztnek az eredménye statisztikailag szignifikáns, akkor végre valódi bizonyítéka van.”

AdatmanipulációSzerkesztés

Nem tévesztendő össze az adatfeldolgozással, adatelőkészítéssel vagy adatfeldolgozással, amelyek egymást átfedő kifejezések, amelyeket gyakran általánosan “adatmanipulációként” emlegetnek.

Informálisan “az adatok meghamisításának” nevezik, ez a gyakorlat magában foglalja a szelektív jelentéstételt (lásd még: publikációs torzítás) és akár egyszerűen hamis adatok kitalálását is.

A szelektív jelentéstételre számos példa van. A legegyszerűbb és leggyakoribb példák közé tartozik, hogy olyan eredmények egy csoportját választják ki, amelyek a preferált hipotézisnek megfelelő mintát követnek, miközben figyelmen kívül hagynak más eredményeket vagy “adatfutásokat”, amelyek ellentmondanak a hipotézisnek.

A pszichikus kutatók régóta vitatják azokat a tanulmányokat, amelyek ESP képességgel rendelkező embereket mutatnak ki. A kritikusok azzal vádolják az ESP-pártiakat, hogy csak a pozitív eredményeket mutató kísérleteket teszik közzé, a negatív eredményeket mutató kísérleteket pedig félreteszik. A “pozitív eredmény” olyan tesztfuttatás (vagy adatfuttatás), amelyben az alany a véletlennél sokkal nagyobb gyakorisággal talál ki egy rejtett kártyát stb.

A tudósok általában megkérdőjelezik az olyan vizsgálati eredmények érvényességét, amelyeket más kutatók nem tudnak reprodukálni. Egyes tudósok azonban nem hajlandók közzétenni adataikat és módszereiket.

Az adatmanipuláció a legőszintébb statisztikai elemzéseknél is komoly kérdés/megfontolás tárgya. A kiugró értékek, a hiányzó adatok és a nem normális adatok mind hátrányosan befolyásolhatják a statisztikai elemzés érvényességét. Helyénvaló az adatok tanulmányozása és a valós problémák javítása az elemzés megkezdése előtt. “Minden szórásdiagramban lesz néhány, a felhő fő részétől többé-kevésbé elszakadt pont: ezeket a pontokat csak okkal szabad elvetni.”

Egyéb tévedésekSzerkesztés

A pszeudoreplikáció a varianciaanalízishez kapcsolódó technikai hiba. A bonyolultság elrejti azt a tényt, hogy a statisztikai elemzést egyetlen mintán (N=1) próbálják elvégezni. Erre az elfajult esetre a variancia nem számítható ki (osztás nullával). Egy (N=1) mindig a legnagyobb statisztikai korrelációt adja a kutatónak a szándékos torzítás és a tényleges eredmények között.

A szerencsejátékos tévedése azt feltételezi, hogy egy esemény, amelynek jövőbeli valószínűsége mérhető, ugyanolyan valószínűséggel következett be, ha már bekövetkezett. Így ha valaki már feldobott 9 érmét, és mindegyik fejet hozott, az emberek hajlamosak azt feltételezni, hogy annak a valószínűsége, hogy a tizedik dobás is fej lesz, 1023:1 ellenében van (ami az első érme feldobása előtt volt), holott valójában a tizedik fej esélye 50% (feltételezve, hogy az érme elfogulatlan).

Az ügyész tévedése vezetett az Egyesült Királyságban ahhoz, hogy Sally Clarkot tévesen ítélték el két fia meggyilkolásáért. A bíróságon a Sir Roy Meadow professzor által megadott alacsony statisztikai valószínűséget (1:73 millióhoz), hogy a nő két gyermeke hirtelen csecsemőhalál szindrómában halt meg, úgy értelmezték félre, hogy az a nő ártatlanságának alacsony valószínűségére utalt. Még ha a kettős SIDS valószínűsége, amelyet később a Királyi Statisztikai Társaság megkérdőjelezett, helyes is lenne, akkor is mérlegelni kell az összes lehetséges magyarázatot egymással szemben, hogy következtetést lehessen levonni arra vonatkozóan, hogy melyik okozta a legvalószínűbben a két gyermek megmagyarázhatatlan halálát. A rendelkezésre álló adatok azt sugallják, hogy a kettős SIDS esélye kilencszer nagyobb a kettős gyilkossághoz képest”. Sally Clark elítélését végül hatályon kívül helyezték.

A ludikus tévedés. A valószínűségek egyszerű modelleken alapulnak, amelyek figyelmen kívül hagyják a valós (ha távoli) lehetőségeket. A pókerjátékosok nem veszik figyelembe, hogy az ellenfél kártya helyett fegyvert húzhat. A biztosítottak (és a kormányok) feltételezik, hogy a biztosítók fizetőképesek maradnak, de lásd AIG és rendszerkockázat.

A visszaélések egyéb típusaiSzerkesztés

Az egyéb visszaélések közé tartozik az alma és narancs összehasonlítása, a rossz átlag használata, a regresszió az átlag felé, és a garbage in, garbage out (szemét be, szemét ki) ernyőmondat. Egyes statisztikák egyszerűen irrelevánsak egy kérdés szempontjából.

Anscombe kvartettje egy kitalált adathalmaz, amely jól példázza az egyszerű leíró statisztika hiányosságait (és az adatok ábrázolásának értékét a numerikus elemzés előtt).

admin

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.

lg