Variancia analízis

Történet , Elvi alapok , terminológia , Terv  , Transzformációk , H0 , Modellek: I vagy II , ANOVA tábla ,
Többszörös összehasonlítás módszerei: tervezett és post hoc összehasonlítások , Képletek

Bevezetés

Példa: Szövettenyészetben tartott melanotróp mirigysejteken vizsgálták különböző életkorok hatását a sejtplazma szabad kalcium szintjére. A sejtplazma kalcium szintjét fluoreszcens festék segítségével optikai módszerrel folyamatosan regisztrálták és az átlagos koncentrációt sejtenként feljegyezték.
Az így kapott érték minden sejtre egy értéket adott. Összesen 409 sejtet vizsgáltak, és életkoronként 48 - 302 sejten végeztek megfigyeléseket.

Az eredményeket az alábbi táblázatban foglaltuk össze.

1. táblázat. Az életkor hatása a melanotróp sejtek citoplazma kalcium szintjére
(Némethy et al. 1999)
 
 
Életkor 
Kalcium szint (nMol/L)* 
esetszám 
2 napos 
156,5+-12,1 
59 
10 napos 
187,2+-3,9 
302 
40 napos 
 222,8+-13,4 
 48 

* átlag +- az átlag hibája

Ez a legegyszerűbb többcsoportos vizsgálat, melyben 3 egymástól függetlenül vett minta értékeit vizsgáljuk és hasonlítjuk össze.

Ha a vizsgálati eredmények olyan minták, melyek eloszlásáról ismereteink alapján feltételezhetjük, hogy megfelelnek a paraméteres statisztikai elemző módszerek kiinduló feltételezéseinek, akkor a legegyszerűbb esetben 2 mintánk van. Két minta esetében azok átlagának eltérése (valamelyik) t próbával elemezhető.
Ebben az összetettebb esetben 3 mintánk van, melyek egyidejű vizsgálata indokolt.

Ilyenkor nem ismételjük az egyszerű esetben használt eljárást ( t próba) minden lehetséges, vagy a kutatás számára érdekes összehasonlítás elvégzésére, helyette együtt vizsgájuk a minták tulajdonságait:

Az általánosítás egyik módja az ANOVA használata. (Terminológia: Szórás elemzés, Variancia analízis, analysis of variance=ANOVA)

Az ANOVA-k csoportosíthatók egyszempontú, több szempontú, hierarchikus, random blokkos, több dimenziós ANOVA-kra, valamint regresszió, és kovariancia analízisekre.

Miért jobb egy ilyen kísérleti terv, mint a két, vagy több független kísérlet elvégzése, a több t próba alkalmazásával folyó kísérletezés?
  1. Lehetővé teszi a kontroll és az N (=2) kezelés egymáshoz hasonlítását is, kísérletenkénti korrekt elsőfajú hibával ( a ).
  2. Gazdaságosabb az erőforrások felhasználása, nem kell kísérletenként külön kontrollt használnunk.
  3. Jobb a csoportokon belüli szórás becslés, mert azt több megfigyelésre alapozhatjuk, más szóval pontosabb becslést kapunk a populációról.
  4. további előnye: a  hatások kombinációban történő együttes tesztelésének lehetősége. Jó hatásfokú módszerek állnak rendelkezésünkre a kísérletenkénti szignifikancia szint melletti hipotézisvizsgálatra.

Története

Az ANOVA alkotója R.A. Fisher (egy angliai mezőgazdasági kísérleti állomáson).   Zseniális felismerése: Több csoporton együtt végzett kísérletben a null hipotézis, H0 úgy is vizsgálható, hogy kiszámítjuk (egymástól függetlenül) két módszerrel a populáció varianciájának becslését. Egyik módszerrel a csoportokon belüli szóródásból, a másik módszerrel a csoportok közötti szóródásból. H0érvényessége esetén a kettő ugyanannak a mennyiségnek két becslése. Ha ez nem valószínű, akkor arra következtetünk, hogy a H0 elvetendő: azaz a csoportok között van különbség. A különbség lehet az átlagokban, vagy a szórásban.

Elnevezés: nem szerencsés, "misnomer". Valójában additív faktorokat vizsgálunk, a varianciák elemzésének eszközét felhasználva, tehát az analízisnek nem célja, hanem eszköze a varianciák elemzése.

Lap teteje

Az eljárás lényege, elnevezések, konvenciók.

Az első lépésben arra vagyunk kíváncsiak: van-e különbség a csoportok között, vagy pedig azok mind egy populációból származó minták? Más szóval: elvetjük-e a H0 -t, vagy a H0 -t érvényesnek tekintjük, mert nem vetjük el

A minta elemek szórásának vizsgálata során először a négyzetes eltéréseket, majd az összegzett négyzetes eltéréseket vizsgáljuk. Az "átlagos" négyzetes eltérés a variancia, ennek négyzetgyöke a szórás (standard deviáció).

A mintaelemekből számított teljes négyzetes összeg olyan N-1 összeadandóból áll, amelyek egyes tagjai a szóródást létrehozó különféle tényezőkről, "okokról" tájékoztatnak. A négyzetes összeg particionálható, felbontható (additív) komponensekre. (Az átlagolt négyzetes összegek (variancia=szórásnégyzet) nem additívak, hanem súlyozottan átlagoltaknak minősíthetők.)

Osztályozó (csoportosító) változónak nevezzük azt a változót (független változó), mely tartalmazza a kísérletező által meghatározott beavatkozások jellemzőit.

Függő változó(k) tartalmazza(k)  a mért, vagy megfigyelt adatokat; minta értékeit.

Elkerüljük az adatok külön oszlopokban történő megadását, ilyent csak a blokk elrendezés esetén ("repeated measures") használunk. Ennek okai:

  1. bár 1 szempontnál (egyszeres osztályozás) szemléletes, de nem segít, sőt hátráltat a kettő vagy több  szempontnál.
  2. ellentétben áll a legtöbb statisztikai program gyakorlatával
  3. Nehezen általánosítható, 3 vagy 4 szempont esetében igen nehézkes lenne.

Lap teteje

Terminológia

Később tárgyaljuk a kettős csoportosítás, két csoportosító változó, többes csoportosítás, több csoportosító változó eseteit.

Az egy szempontú ANOVA-nál általában igaz, hogy az egyes minták, csoportok elemszáma lehet változó, a hiányzó adatok nem zavarnak az elemzésben, az egyenlőtlen elemszámokra is van könnyen számolható képlet. Azonban az ANOVA után alkalmazott többszörös páros összehasonlítások közül azok, amelyeknél az egyes csoportok szórása és elemszáma nem kerül felhasználásra, kiértékelésre, azok hiányos adatok, nem szimmetrikus elrendezés esetében hibás következtetésekre vezethetnek.

Lap teteje

A kísérleti terv

Lap teteje

Feltételek

  1. Normális eloszlás
  2. véletlen mintavétel
  3. a hiba varianciák függetlensége
  4. a varianciák homogenitása, egyformasága (homoscedaszcitás)
Ezek a feltételek a H0 érvényessége esetében (triviálisan) teljesülnek.

A feltételek teljesülése vizsgálandó. Eszköze az adatelemző grafikus ábrázolás (EDA), az előzetes statisztikai tesztek.

A feltételek nem teljesülése esetén mit tegyünk? Az ANOVA robusztus eljárás, azaz a feltételek kisebb-nagyobb mértékű nem teljesülése nem rontja el a következtetések érvényésségét, nem növeli meg  jelentősen a hibás döntések számát. Ezzel azonban nem szabad visszaélni!

  1. Véletlen mintavétel Tőlünk függ.
  2. Normális eloszlás. Gyakran a mintából nem dönthető el. Viszonylag nagy elemszám kell a megbízható vizsgálatához, hosszabb tapasztalat, irodalmi ismeretek alapján lehet véleményezni. Nagy elemszámoknál segít a centrális határelosztás tétele.Vizsgálatára az egyes csoportokon belüli residuális-okat képezünk, és teszteljük eloszlásuk normalitását.
  3. A minták függetlensége. Összefüggő adat csoportok esetében a függőség jellege szerint kell a statisztikai eljárásokat megválasztani. Az egyszempontos ANOVA esetében a kísérlet, a mintavétel és a mérés tervezése során kell biztosítani a mintákat alkotó adatok függetlenségét.
  4. A variancia egyformasága (homogenitása). Ellentéte a heteroscedascitás, a varianciák inhomogenitása. A kísérleti csoportokon belüli variancia a viszonyítási alap, ehhez mérjük hozzá a csoportok közötti átlagos négyzetösszegeket, vajon ez utóbbiak lehetnek e a populáció varianciájának becslései.Az ANOVA erre (is) robusztus.
Egy kivétel: Korrelált átlagok és szórások. Sok csoportból kevésre egyszerre igaz, hogy például nagy átlagú és nagy szórású. A veszély oka: a nagy szórású átlag bizonytalan becslést ad. Ez lehet jelentősen gyengébb, mint az átlagos variancia alapján készített becslés, így erre vigyázni kell.

Lap teteje

Transzformációk

Ha az adatok vizsgálata során kiderül, hogy a varianciák homogenitásának feltétele nem teljesül, akkor az első teendőnk annak vizsgálata, hogy transzformálással elérhető-e a varianciák homogenitása?

Ha a minták szórásai úgy viszonylanak egymáshoz, mint az:


átlagaik négyzetgyöke, akkor a megfelelő transzformáció
átlagaik, akkor a megfelelő transzformáció
átlagaik négyzete, akkor a megfelelő transzformáció
A transzformációk gyakran a mintának több, az ANOVA kiinduló feltételezéseit megsértő tulajdonságát egyszerre közelítik a feltételezettekhez.
A transzformáció és az additivitás viszonya: esetenként átgondolandó. A visszatranszformálás ezekben az esetekben lehetséges. A transzformált adatok használatánál a kezelések additivitása az ANOVA modelljében mást jelent, mint az eredeti adatok esetében. Ez különös súllyal veendő figyelembe akkor, ha az ANOVA nullhipotézisét elvetjük, és az egyes minták különbségeit kezdjük vizsgálni.

Lap teteje

Az egyszempontú ANOVA nullhipotézise

n csoport esetén, ha m-el az átlagokat jelöljük, akkor

H0 = m1, m2, m3, ... ,m n átlagok mind egy populáció várható értékének becslései.

Az alternatív hipotézis. HA = m1, m2 , m3, ... ,mn átlagok nem mind egy populáció várható értékének becslései. Másképen fogalmazva, az átlagok közül legalább 1 nem a többi minta populációjából származik. Azaz a minták legalább két (de lehet, hogy több) populációból származnak-

A modell

Minden egyes adat modellje (összetevői): Adat  = (nagy átlag) + (kezelési átlag) + szórás (reziduális, véletlen tényező)

Eljárás, alapelv

Az adatok összes szóródását mérő variancia (szórásnégyzet) különböző elemeket tartalmaz. Más szóval az összes szóródás specifikus jelentést hordozó összetevőkre bontható. Ha a null hipotézis teljesül, akkor minden független komponens ugyanazon populáció szórásának a független becslése.

Itt a variancia kiszámításánál használt négyzetes összeg felbonthatóságának tételét alkalmazzuk.

Megjegyzés: a négyzetes összeg a távolság mérték jellegzetes és intuitíven megszokott tulajdonságaival rendelkezik.

Az egyik lehetséges felbontás: A csoportokon belüli szórás összevonható, és a közös szórásbecslés ugyanannak a populációnak a szórását becsüli, mint az átlagokból származtatott szórásbecslés, ami az adatmodellben a (kezelési átlag)-ok szóródása. A nullhipotézis teljesülése esetén a a kezelési átlagok valódi értékei mind nullák! Szóródásukban csak a minta véletlen szóródásból eredő változékonysága jelentkezik.

A két szórásbecslés hányadosa, mint statisztika az F eloszlást követi (a számlálóban és a nevezőben lévő szórásbecslések szabadságfokaival jellemzett F eloszlást).

Ha az F statisztika értéke nagyobb vagy egyenlő az eloszlásból számított küszöbértéknél, akkor a null hipotézist elvetjük. Miután már korábban teszteltük, hogy a szórásokra fennáll a homogenitás, azaz a szórások egy közös populáció szórásának becsléseiként foghatók fel, ezért az F próba szignifikanciájából következik, hogy az átlagok nem egyetlen populáció várható értékének becslései, azaz legalább egy átlag egy másik populációból származik, azaz eltér a többitől.

Ha az ANOVA szignifikáns F értéket ad, akkor a további lépésekben a következő technikákat használhatjuk::

Különbséget kell tennünk az "a priori", és az "a posteriori", vagy "post hoc"  többszörös összehasonlítások között. Hatásfokuk, a próba ereje mind különböző, és itt különösen hasznos a gondos kísérlettervezés.

ANOVA tábla

A végeredményt hagyományosan egy ANOVA táblában foglalják össze.
Egyszeres osztályozás (egy szempontos variancia analízis, one-way ANOVA)
h darab kezelés, kezelésenként nem szükségképpen azonos esetszámmal
Lap teteje

I és II Modell

Ha elvetettük a H0-t, akkor a kérdés lehet, az átlagok, vagy a szóródás eltérése miatt vetettük-e el.

Model I.  ahol az  -k fix értékek, rögzített, fix és ismételhető hatások, a kísérletező kontrollja alatt.  valószínűségi változó, , rögzített érték.

Model II.  ahol  valószínűségi változó,  valószínűségi változó , rögzített érték.

A Modell II esetére példa: Genetikus és fenotipikus változékonyság, családokon belül és között. Módszertani tanulmányok, minőségellenőrzés.

Lap teteje

H0 elvetése utáni analízis

Ekkor elővehetjük előzetes kérdéseinket, tovább elemezhetjük adatainkat, vizsgálhatjuk előzetesen megfogalmazott statisztikai hipotéziseinket. Van arra is módszer, hogy a kísérlet adatainak utólagos tanulmányozása során felmerült kérdéseinket is statisztikai hipotézisvizsgálat tárgyává tegyük.
 

Előzetes kérdések (a priori) esete

  1. Használhatjuk a Bonferroni, vagy a Holm féle eljárásokat a k előre elhatározott összehasonlításra. Kis számú összehasonlításra jó hatásfokúak, nagyobb szám esetében a többi alkalmazható eljáráshoz viszonyítva gyengébb hatásfokúak.
  2. Ha h darab csoportunk van, és volt max. h-1 feltételezésünk (csak egymástól függetlenek), akkor tervezett kontrasztokat vizsgálhatunk. Ez igen jó hatásfokú analízis, jobb mint a többszörös összehasonlítások elvégzése. De nem lehet az összes lehetséges páros összehasonlítást előre eltervezni, csak egymástól függetlenek lehetnek, korlátozott számban. Pl. három csoport esetében 3 a lehetséges páros összehasonlítások száma, kettő tervezhető előre. Nagyobb csoport számoknál az eltérés rohamosan nő! Több előre tervezett (a priori) feltevésünk.
  3. Használhatjuk a Dunn kontrasztokat (páros, vagy többes kontrasztokra) (A STATISTICA program az eljárást nem tartalmazza, könnyen számolható, táblázattal összevethető statisztikát eredményez)
  4. Speciális eset: egy kontrollhoz több kezelés. Erre szolgál a Dunnett-féle próba.


Az utóbbi esetben a Dunnett próbához az elemszámok aránya optimalizálható.  Ebben a kísérleti tervben nem az az optimális, ha minden csoport egyforma elemszámú. A legjobb akkor a hatásfok, ha a kontroll csoportban nagyobb az elemszám, mint az egyes kezelt csoportokban. Ennek az oka az, hogy a kontroll csoport minden vizsgálandó összehasonlításban szerepel, érdemes róla jobb hatásfokú becslést készíteni, mint az egyes "kezelt" csoportokra. Ha a kezelt csoportok esetében az elemszám mind j, akkor a kontroll elemszáma legyen j*négyzetgyök(m) .
 

Elemszámok a Dunnett-féle eljáráshoz
Csoport 
Csoportok száma 
Csoportokon belüli elemszám 
Kontroll 
j*négyzetgyök(m)
Kezelt 
j

Lap teteje

Utólagos kérdések (a posteriori, post hoc) esete

Az adatok ismeretében, az adatok által sugallt kérdések megválaszolásához használhatók, utólagos hipotézisek vizsgálhatók
  1. Általános, sokcélú kontrasztok (kettőnél több csoportból is képezhető): Scheffé, Tukey eljárásai
  2. Páros összehasonlításokra (két tagú kontrasztok) Bonferroni t, Sidak, Student-Neuman-Keuls, Tukey féle honest significant difference (HSD), REGWF (Ryan, Einot, Gabriel, and Welsch F test, jobb mint a Scheffe, de ugyanúgy nem tér el az ANOVA F hipotézisétől, azaz konzisztens).. Ezek mind alkalmas eljárások.
  3. Duncan féle teszt, és a  LSD (least significant difference) módszer a szignifikancia szint korrekciója nélkül nem ajánlhatók, mert túl elnézőek, sokkal több hibához vezethetnek, mint amit a névleges  szignifikancia szint alapján elképzelünk.
  4. Bonferroni vagy Holm féle korrekcióval számított szigorúbb szignifikancia szinttel végzünk páros összehasonlításokat (ekkor felhasználhatjuk az LSD modul által adott számokat, mint a Holm eljárás során vizsgálandó p értékeket), úgy, hogy ne haladjuk túl a kísérletenkénti 0.05, vagy 0.01 szignifikancia szintet. Ez az eljárás (különösen nagyobb csoportszámoknál) eléggé konzervatív, növeli a másodfajú hibát, mert az "a posteriori" alkalmazás esetén az összes lehetséges összehasonlítást kell a k értéknek vennünk. Például a bevezetőben bemutatott 3 csoportos kísérletben a k=3 akkor is, ha utólagos döntéssel 2 összehasonlítást végzünk el (a lehetséges 3 független összehasonlításból).
Vegyes kérdések

Az ANOVA tervezhető mérete. Ne legyen 6-nál több faktor, 10-nél több szint. Ne legyen túl sok függő változó.

A gyakorlatban az ANOVA elvégzése során 3 fázist kell végigcsinálni. A statisztikai terv elkészítése, változók kijelölése, Kimenet megadása. Analízis, részletek elemzése.

Lap teteje

Hasznos képletek

1. t próba

2. Dunn próba (többszörös összehasonlítás, tetszés szerinti kontrasztokra, a priori eldöntött esetekre)

ahol , sb a közös szórásbecslés

Akkor használható, ha a tervezés szakaszában (az eredmények ismertté válása előtt) eldöntik, melyek lesznek a kiszámítandó összehasonlítások. Nem elég megmondani a darabszámot! A képletből kiszámított statisztikát Dunn cikkében lévő táblázattal kell összevetni.

3. Dunnett próba (1 kontrollhoz hasonlítható az összes többi, de egymáshoz nem)
k darab csoport, ahol az 1. számú a kontroll:

Egyenlőtlen elemszámoknál akkor optimális az elrendezés, ha

  és 
Más jelölésekkel ugyanezt mondja a fenti táblázat is. Az ANOVA közös szórásbecslését használjuk (s)

4. Scheffé féle páros összehasonlítás (post hoc)

az i-edik és j-edik csoportok esetére. Az ANOVA közös variancia becslését használjuk

5. Scheffé féle kontraszt általános esete (három, vagy több csoport egy kontrasztban történő post hoc összehasonlítására)

ahol  ortogonális kontrasztok koefficiensei, azaz 
Az ANOVA közös variancia becslését használjuk. Egyenlőtlen csoportok belüli elemszámok esetében is jól használható.