Összetettebb ANOVA elrendezések

Randomizált blokk Randomizált blokk tábla  ANOVA cellánként 1 esettel Kovariancia analízis Három szempontú ANOVA ANOVA tábla Faktoriális ANOVA Inkomplett elrendezések Hierarchikus ANOVA Feltételek ANOVA rangszámokon

Randomizált blokk elrendezés

"Rejtett" kétszempontú ANOVA, ahol a blokk-ok adják az egyik szempont szerinti elrendezést, a kezelések pedig a másikat.

Célja

Ismert, vagy ismeretlen szisztémás faktorok kiszûrése, a variancia egy részének a véletlenszerü, csoportokon belüli varianciától való elkülönítése.

Valamilyen ismert tényezô szerint homogén blokkokat képezünk, a blokkokon belül a kezeléseket (mindegyikbôl azonos számút) randomizáltan osztjuk el.
i darab kezelés az A szempont szerint (azaz egy szempontos a kezelésekre),
j darab blokk a B szempont szerint, kezelésenként (cellánként) n megfigyelés esete.
 

Példa: 3*4-es tábla
Blokk1 A1 A2 A3 A4
Blokk2 A1 A3 A4 A2
Blokk3 A3 A2 A4 A1

A modell:

Az xij megfigyelés additív összetevôi:

Egy cella értéke = M + Ai + Blokkj + Ai*Blokkj +
(ahol AxBlokk jelöli az Ai és Bj interakcióját)

Randomizált blokk ANOVA tábla

i darab kezelés, j darab randomizált blokkban vizsgálva, kezelésenként és blokkonként (cellénként) n darab megfigyeléssel.
Randomizált blokk ANOVA tábla
Forrás sz.fok(df) Négyzetes összeg variancia F P
A kezelés i-1 QA   (SSA) s2A    (MSA) s2A/s2b 0,....
Blokk j-1 Q(SSBlokk) s2B    (MSBlokk) s2B/s2b 0,.... 
AxBlokk interakció (i-1)(j-1) QAB  (SSABlokk) s2AB   (MSABlokk) s2AB/s2b  0,....
Mintákon belül ij(n-1) Qb   (SSwithin)(SSerror) s2b     (MSwithin)    
Összes ijn-1 Qö   (SStotal) s2ö    

Négyzetes összeg= Sum of Squares (SS)
Variancia=Mean Squares(MS) (SSwithin) másképpen (SSerror)

Feltételezések

  1. A mérések populációi normális eloszlásúak
  2. A mérések populációinak eloszlásai homogének
  3. A megfigyelések egymástól függetlenek.

Értelmezés, az interakció kezelése

Két kezelés esetében az egymintás t próbával equivalens.

Az analízis célja az A kezelés vizsgálata, azon belül, szignifikáns F érték esetében a többszörös összehasonlítás.

Az esetleges interakció problémás, mert akkor jó az ilyen elrendezés, ha a blokkokban csoportosított tulajdonság nincs interakcióban a kezelésekkel. Ha mégis lenne interakció akkor észlelésekor annak okát fel kell deríteni, és az adatokat a teljesen randomizált, nem blokk elrendezés szerint értékelni.

Javaslatok, ajánlások

Az elemzés során, ha az interakció nem szignifikáns, akkor annak szabadságfokát, és négyzetes összegét a véletlennek tulajdonítható particióba vonhatjuk be ( angolul pool, pooling), ezzel is javitjuk a véletlen ingadozás becslését. A STATISTICA program erre ad lehetôséget.

Ismétlés nélküli 2 szempontú ANOVA
 
Az összes szóródás felbontásának illusztrációja
A faktor
B faktor
AXB interakció= belsô szórás

Ebben az esetben a cellákon belül lévô 1-1 adatból nem lehet a véletlen szóródást becsülni. A megoldás: feltételezik, hogy nincs a két szempont között interakció (az egyik szempont lehet blokk is) és igy az interakciós komponsbe particionált szóródás a véletlennek tulajdonitható szóródás becslésére használható.
 

Kovariancia analízis

Ennek az eljárásnak a lényege akkor érthetõ meg, ha a regresszió elemzést már megértettük.

Ez az eljárás akkor használható, ha a szóródás egy részének eredete ismert.  Ha a szóródás eredetét valamilyen méréssel lehet észlelni, jellemezni, és a független változó a mért értékkel lineáris összefüggést mutat, de nem lehet, vagy nem célszerû blokk képzéssel kontrollálni ezt az összetevõt, akkor jól használható. A mért értéket kovariánsnak nevezzük.

Ebben az esetben a mért értéket az analízisben felhasználhatjuk arra, hogy segítségével kiszámoljuk azt, hogy ennek az összefüggésnek mekkora szerepe van a szóródásban. A véletlennek csak azt a szóródást tulajdonítjuk, amit a kovariánssal való regresszióval nem lehet megmagyarázni.

Ez akkor hasznos, ha a kovariáns, és a kisérlet függô változója között statisztikailag szignifikáns összefüggés észlelehetô.

Három szempontú osztályozás

Ha három egymástól független szemponton belüli kezelések és azok kombinációjának hatását kivánjuk vizsgálni.

A modell, a logika, a kiinduló feltételezések mind analógok a kétszempontú osztályozás esetében tárgyaltakkal.

Három szempontos ANOVA tábla

A, B és C jelzi a 3 szempontot, i,j, és k darab kezeléssel, kezelésenként n megfigyeléssel (cellánkénti elemszám).
Három szempontos ANOVA tábla
Forrás sz.fok(df) Négyzetes összeg variancia F P
A kezelés(ek) i-1 QA    (SSA) s2A    (MSA) s2A/s2b  0,...
B kezelés(ek) j-1 QB    (SSB) s2B    (MSB) s2B/s2b  0,...
C kezelés(ek) k-1 QC   (SSC) s2C    (MSC) s2C/s2b  0,...
AxB interakció (i-1)(j-1) QAB  (SSAB) s2AB   (MSAB) s2AB/s2b  0,...
AxC interakció (i-1)(k-1) QAC   (SSAC) s2AC   (MSAC) s2AC/s2b  0,...
BxC interakció (j-1)(k-1) QBC   (SSBC) s2BC   (MSBC) s2BC/s2b  0,...
AxBxC interakció (i-1)(j-1)(k-1) QABC (SSABC) s2ABC (MSABC) s2ABC/s2b  0,...
Mintákon belül ijk(n-1) Qb(SSwithin) s2b(MSwithin)    
Összes ijkn-1 Qö(SStotal) s2ö    

Négyzetes összeg = Sum of Squares (SS)
Variancia=Mean Squares(MS), (SSwithin) másképpen (SSerror)

Feltételezések

Az xij megfigyelés additív összetevôi:
xijk=Nagyátlag+Ai+Bj+Ci+(AxB)ij+(AxC)ik+(BxC)jk+(AxBxC)ijkijk
ahol AxB stb. a faktorok interakciója, fix összetevõ
és a véletlen hiba  normális eloszlású, nulla várható értékû valószínûségi változó
  1. A mérések populációi normális eloszlásúak
  2. A mérések populációinak eloszlásai homogének
  3. A megfigyelések egymástól függetlenek.

Hipotézis(ek)

A nullhipotézis Ai=Bj=Ck, (AiBj)=0, AiCk=0 , BjCk=0, ijk várható értéke =0,
minden i-re és j-re

Az alternativ hipotézis Ai, Bj, stb (AiBj), stb <0, ijk várható értéke =0 legalább egy i-re, j-re, vagy k-ra.

Megjegyzések

Sok mérés kell hozzá. Minél több a faktor, annál nehezebb az egyöntetûség biztosítása.
Többszintû interakciók lehetnek szignifikánsak ebben a kísérleti elrendezésben, ezek néha nehezen értelmezhetôk.

Faktoriális ANOVA

Célja

Számos faktor hatásainak és interakciójának szimultán vizsgálata. A legegyszerübb erendezésben k darab faktort, mindegyiket 2 szinten vizsgálunk, azaz az elrendezése 2k faktort használ.

Ez az önkontrollos kisérletezésnek az az esete, amikor minden egyes kisérleti alanyon több mérést végeznek, és a kisérleti kezelések (szempontok) egy része az egyes alanyokon végzett több mérésre vonatkozik. Példáúl a különbözô kezelések ugyanazon alanyok ismétlôdnek, esetleg az egyik kisérleti szempont a kezelés(ek) hatásának idôbeli alakulása.
 

Nem teljes többszempontos ANOVA-k

Ezek esetében valahol a teljes, szimmetrikus tervbôl egyes kezelések, kombinációk hiányoznak.Azaz a táblázat egyes cellái üresek. Az a jó eljárás, ha a hiányt a kisérlet tervezésekor már figyelembe vesszük, és a hiányzó csoportoknak megfelelôen végezzük el a kisérlet tervezését is. Értékelésében nagy gonddal kell eljárni, a feladat megoldása egyes statisztikai programokkal lehetséges, másokkal nem.Amikor a hiány jellege olyan, hogy a modellbõl a megszerzett adatokkal nem lehet értékelést csinálni, akkor visszatérünk az olyan modellekhez, amelyeket tudunk értékelni.
Példák nem teljes elrendezésekre:
Latin négyzet
Latin-görög négyzet
Split plot

Ezek használatához professzionális tanácsra van szükség. Ha valamilyan okból nem lehet a teljes értékû kísérletet elvégezni, és mégis maximalizálni kívánjuk a kapható információt. Feltételezzük, hogy az interakciókkal nem kell számolnunk, és az interakciók varianciáját bevonjuk a "belsõ" varianciába.

Hierarchikus ANOVA (nested ANOVA).

Célja: Vegyes modell. A véletlenszerû komponenseket tovább analizálja, összetevôkre bontja. îgy a hiba variancia pontosabban meghatározható, leválasztható belôle az a komponens ami a különbözô összetevôknek tulajdonítható.

Felhasználása módszertanban, minôségellenôrzésben, genetikában.

Elrendezése (terv): Lehet 2 vagy több szintû hierarchikus elrendezés

Lényeges, hogy az egyszempontos elrendezésbôl a továbblépés itt a véletlen hiba pontosabb vizsgálata, további particionálása irányába megyünk, új osztályozást oda vezetve be. A csoportosítás célja, hogy többet tudjunk meg a variancia összetevôirôl. Itt a meglévô osztályozást úgy finomítjuk, hogy random felbontását veszünk az összetevôknek.

Ha a hiba véletlen komponensét pontosabban ismerjük és az kisebb, akkor pontosabbna tudjuk megítélni a kezelések hatásosságát ill. véletlen voltát.

Példa: a máj DNS szintjének meghatározása, 5 patkányból, állatonként 3 mintából, mintánként 2 párhuzamos méréssel.

Ha a 3 párhuzamos minta (egyes májlebenyekbôl tûbiopszia) szintjén szignifikáns variancia komponenst észlelünk, akkor vagy a mintavétel módszere (pl. a súlymérés) jár nagy hibával, vagy az állatok közül esetleg némelyiknek inhomogén a mája pl. göbös elváltozást mutat, vagy változó mértékû kötôszövetfelszaporodást.

A lényeges elvi tényezô, hogy a hierarchia szintjén a csoportosítás nem szisztémás, hanem véletlenszerû.

Feltételek mindegyik ANOVA fajtához, kísérleti elrendezéshez

Az ANOVA-nál szokásos feltételezések itt is érvényesek (véletlen mintavétel, normális eloszlás, a véletlen okozta, a csoportokon belüli szóródás: egymástól független és azonos eloszlású, a kezelések hatása additiv)

Additivitás, akkor válik fontossá, ha többszempontú analízist végzünk és elvetjük a H0-t.

Ha a fôhatásokra vonatkozó hipotéziseket kívánunk tesztelni, akkor az additivitásnak teljesülnie kell, azaz nem szabad, hogy "szignifikáns" interakciót találjunk.

Az interakciónak sokféle oka lehet. A vizsgált rendszer alapvetô tulajdonságáról lehet szó, mint például a kezelések közötti szinergizmus, vagy feltételes hatás. De lehet oka egy aberráns megfigyelés, beteg állat az egészségesek között, egy megfigyelési hiba. végül az interakció oka lehet, ha A és B hatása nem additiv, hanem multiplikativ (ezt log transzformálással ki lehet használni...).

Rangokon végzett ANOVA-k

Végül ha az ANOVA feltételeit nem tudjuk biztosítani transzformációval, semmilyen próbálkozásunk nem vezet eredményre, akkor nem paraméteres eljárást alkalmazunk.

Ha nincs nevesített (pl. Kruskal-Wallis, Friedman) eljárásunk, akkor szakember segítségét kérjük.

Ha az adott kísérleti elrendezésre szakember sem tud ajánlani a statisztikai irodalomban elfogadott, leirt, kidolgozott nemparaméteres eljárást, akkor a következôképen járhatunk el-- elôször elvégezzük azt a paraméteres eljárást, amelynek feltételeinek nem teljesülésérôl meg vagyunk gyôzôdve. Után elvégzünk egy rangsorolásos transzformációt, és a rangtranszformáció eredményeképen kapott mintákon elvégezzük ugyanazt az analízist (ANOVA-t), amelyet az eredeti adatokon végeztünk el. Ha a kettô egyezik, megnyugszunk abban, hogy a paraméteres eljárás alkalmazható. Ha a kettô nem egyezik, akkor felhasználjuk a rangtranszformált adatok analízisének eredményeit.

A lap teteje | Az elõzõ lap  |  az ANOVA bevezetése