Nem-paraméteres eljárások

Két független minta összehasonlítása

Mann-Whitney-Wilcoxon próba , Kolmogorov-Smirnov féle kétmintás próba , Medián próba , Wald-Wolfowitz sorozatpróba
Két normális eloszlású minta összehasonlítására a t próba (paraméteres próba) különbözo változatai szolgálnak. Ezek a két populáció várható értékének (átlagának) azonosságát, vagy különbözőségét vizsgálják, és a H0 a két átlag azonossága. Ha a H0-t elvetjük, csak annyit állapíthatunk meg, hogy a két populáció átlaga eltér, de a két populáció jellegére vonatkozóan nem tudunk a t próbából következtetni. éppen ellenkezőleg, a T próba alapesetének az a kiindulópontja, hogy a két vizsgált minta normális eloszlásból származik, és még szórásuk sem tér el egymástól, egyedül az átlagok között lehet különbség.

A nem paraméteres próbák a kérdést másképpen teszik fel, és a próbák elvégzése után kapott válaszok értelmezése sem azonos. Erre még a próbák tárgyalása után visszatérünk.

A Mann-Whitney-Wilcoxon próba

Példa:

Fehér patkányokon vizsgálták egy hormon (tesztoszteron) hatását az agresszív magatartásra. A hormon adása után 8-9 nappal történt a vizsgálat. Az agresszív cselekedetek előfordulását vizsgálták videofelvételeken 15 percen keresztül.
A # jelű oszlopban az állatok sorszáma, melletük pedig a "verekedések" száma látható a táblázatban
 
 
1. csoport
 
2. csoport
 
1. 
csoport
 
2. 
csoport
 
1. 
csoport
 
2. 
csoport
 
1. 
csoport
 
2. 
csoport
#
Kontroll 
#
Teszto 
szteron
#
 foly- 
tatás
#
foly- 
tatás
#
foly- 
tatás 
#
foly- 
tatás
#
foly- 
tatás 
#
foly- 
tatás 
1
0
1
2
6
0
6
0
11
1
1
27
16
0
16
6
2
4
2
0
7
1
7
4
12
3
12
9
17
1
17
5
3
1
3
3
8
0
8
2
13
9
13
0
18
1
18
8
4
0
4
2
9
3
9
0
14
0
14
7
19
1
19
 
5
0
5
0
10
1
10
0
15
0
15
26
 
 
 
 
A vereked.zip adatfile letöltése   vereked.sta letöltése

Technikai tippek: 3 féleképen is próbálható:

A példa esetében a számolást (STATISTICA program, Nonparametric Statistics modul) elvégezve: A nullhipotézist nem vetjük el, mert a p érték nagyobb, mint a (0.05) szignifikancia szint, bár igen közel van hozzá!
Megjegyzés: A p  érték figyelembevételével indokoltnak látszik további vizsgálatokat végeznünk, melyet itt részleteiben nem tárgyalunk. A Kolmogorov-Smirnov teszt, valamint a Wald-Wolfowitz teszt alkalmazása szignifikáns eredményeket adott. Arra következtetünk, hogy ebben az esetben valószínuleg nem a két minta mediánja, hanem az eloszlás alakja különbözik.
Az eljárásnak több neve van, és a több név alatt lényegében ugyanazon eljárásról van szó (Mann-Whitney U test, , vagy Mann-Whitney-Wilcoxon rangösszeg próba [rank-sum test]).

Ezen eljárás a null hipotézise

(Ho:) szerint a két medián egyenlő, azaz nem az átlagok egyenlőségét vizsgálja, mint a két mintás t teszt. Az alternatív hipotézis

(HA:) szerint a két minta mediánja nem egyenlő.

Feltételek:

  1. Független minták,
  2. folytonos és diszkrét valószínuségi változók esetében is használható.
Kísérleti elrendezés: Ketto független, véletlen (random) minta.

Számitása nehézkes volt, amig a statisztikai programcsomagok nem voltak hozzáférhetok.

A gondolatmenet a következo:
Elvégezzük a rangtranszformációt.

Rangtranszformáció: Az összes adatot (a csoporthoz való tartozástól függetlenül) nagysága szerint sorba állítjuk, az adatok helyébe azok rangszámát helyettesítjük.
Ha két, vagy több azonos adatot találunk, akkor azok helyébe az átlagos rangszámokat írjuk. Az így kapott rangszámokat az eredeti csoportokra  szétbontjuk. Ez a transzformáció az eredeti megfigyeléseket az ordinális skálán fejezi ki.
Ha a két csoport középértéke (mediánja) között nincs különbség ( azaz H0 teljesül), akkor mind a két csoportban lesznek alacsony és magas rangszámú megfigyelések, és az átlagos rangszám értékek is közel azonosak lesznek.

Ha H0 -t elvetjük, akkor az egyik csoportban nagy valószínüséggel nagyobb lesz az átlagos rangszám, mint a másik csoportban.
 

Ez az eljárás hatékonyabb, mint a t próba, ha a t próba feltételei nem teljesülnek. Ha pl. az adatok eloszlása ferde, nem csak elvileg helytelen a t próbát felhasználni, hanem a hibásan használt t próba téves következtetésekre is vezethet.
Ha sok az azonos rangsorú érték, ezeket a teszt nem veszi figyelembe, és ezért ilyenkor kissé alulértékeli a szignifikancia szintet.  A STATISTICA programban többféle p értéket számolunk ki, melyek közül az egyik kis elemszámok esetére szóló korrekciót tartalmaz.

További eljárások 2 eloszlás azonosságának tesztelésére

A Kolmogorov-Smirnov féle kétmintás próba

Feltétel: A próba csak folytonos valószínuségi változók esetén alkalmazható.

Két minta eloszlásának azonosságát általánosabban teszteli. A két eloszlást F(x) és G(x)-el jelölve

H0: F(x) azonos G(x)
HA: F(x) nem azonos G(x)

Ha a H0:-t elvetjük, ez lehet a két eloszlás bármilyen tulajdonságának meg nem egyezése miatt, lehet különbözo a két eloszlás várható értéke, mediánja, alakja, stb.

A vizsgált statisztika a két empírikus eloszlásfüggvény közötti maximális eltérés, azaz D(max(Fm(x)-Gn(x)).
Ennek értékeinek eloszlását Kolmogorov munkája alapján ismerjük, kvantiliseit táblázatba foglalták, illetve ki lehet számítani.

A STATISTICA program segítségével történo számitás szignifkancia szintet ad, nem pontos valószínuséget.

A próba szignifikáns volta esetén részletesebben érdemes vizsgálni a két minta tulajdonságait.

Medián teszt

A medián teszt gondolatmenete egyszerű. A két csoport összes adatának mediánját könnyü meghatározni. Ha a két csoport között nincs különbség (azaz H0 teljesül), akkor a közös medián alatt és felett nagyjából hasonló arányban oszlanak meg a megfigyelések. A megoszlásokat egy 2x2-es táblában foglalhatjuk össze, és máris visszavezettük a kérdés megoldását a Khi-négyzet próbára, vagy a Fisher féle exakt tesztre, amelyeket a kontingencia táblák körében kell tárgyalni.

Wald-Wolfowitz sorozatpróba

Angol neve "Wald-Wolfowitz runs test".
Egy alternatív jellemzo, mely valószínuségi változó, példáúl fej, vagy írás a pénzfeldobásnál, vagy A és B egy sorozata, mint jelek sorozata szemlélheto. Egy ilyen sorozatban az egynemu jelek sorozata egy szakasznak nevezheto. A szakaszok számát a véletlenszeruség méroszámának tekinthetjük.

A nagyon sok (rövid) szakasz azt jelentené, hogy egy megfigyelés bekövetkezte a másik tipusú megfigyelés elofordulását valószínubbé teszi, ha kevés szakasz fordul elo, akkor egy megfigyelés elofordulása esetén az azonos típusú megfigyelés elofordulása nagyobb valószínuségu.

Feltétel: a minták folytonos eloszlású, és legalább ordinális skálán mérheto valószinüségi változók

H0: A kísérletsorozat véletlenszerü folyamat
HA: A folyamatban lévo valószínüségi változók vagy sztochasztikusan nem függetlenek, vagy nem azonos eloszlásúak.

A statisztika a szakaszok száma (T). Ennek a statisztikának eloszlása függ a szakaszok számának páros, vagy páratlan voltától is.

Vissza a lap tetejére , a Nem-paraméteres eljárásokhoz