Nemparaméteres módszerek

Több csoport összehasonlítása nem paraméteres módszerrel

Kruskal-Wallis próba , Friedman próba
Ha kettõnél több csoporton végzett mérések adatait kell egymással összehasonlítani, akkor figyelembe kell venni, a végezhetõ összes összehasonlítást, és azt, hogy a szignifikancia tesztek halmozásával hogyan változik a kísérletenkénti elsõfajú hiba. Ezen kérdéskört nevezik a többszörös összehasonlitás problémájának.

Összefoglalóan azt mondhatjuk, hogy ha egy kísérleten belül többször alkalmazzák az eddig ismertetett módszereket, akkor alkalmazni kell a Bonferroni vagy a Holm eljárást, mely során a küszöbértékeket úgy határozzuk meg, hogy az elsõfajú hiba együttesen ne haladja meg a választott szignifikancia szintet.

Több csoport együttes összehasonlítására szolgál a Kruskal-Wallis módszer, vagy a Friedman próba.
 

Kruskal-Wallis próba

Az eljárás célja összehasonlítani 3, vagy több populációt, melyekbõl véletlen (random) egyváltozós (univariate) mintát vettünk.

Feltételek:

Hipotézis
H0: A minták eloszlása nem különbözik egymástól
HA: Legalább két eloszlás különbözik egymástól.

Ha elvetjük H0-t, akkor arra következtetünk, hogy a vizsgált populációk között vannak különbségek.
Bár nem tudjuk, hogy milyen különbségek vannak a populációk eloszlásai között, de ismert, hogy ez a próba különösen érzékeny a lokációs paraméter változásaira (medián)

Ha elvetettük H0-t, akkor a Wilcoxon rank sum tesztet kell használnunk a páros összehasonlításokra, és a szignifikáncia szint meghatározásánál a Bonferroni (alfa/k) vagy a Holm eljárást kell követnük.

Az eljárás során a mintákat egyesítjük, elvégezzük a rangszámok meghatározását, majd a rangokat az eredetieknek megfelelõ csoportokra bontjuk. Az azonos mérések esetében az átlag rangok módszerével látjuk el  a transzformált értékeket (Rangtranszformáció).

A rangszámokból csoportonként egy W statisztikát számolunk, mely eloszlásának kvantilis értékeit táblázatból megkaphatjuk.
 

Friedman próba

Példa (Vincze-Varbanova 1993; p.111)

12 különbözõ helyen, helyenként 4 üvegházban négyféle paprikát termesztenek. Minden helyen minõsítik a paprika fajtákat, 1 pontot ér a leggyengébb, ... , 4 pontot ér a legjobb termõképességû paprika.
Kérdés: Van-e különbség a 4 paprika fajta termõképessége között?
 
 
Termõhely
Fajták
  Fajta-1 Fajta-2 Fajta-3 Fajta-4
1
4
3
2
1
2
4
2
3
1
3
3
1
2
4
4
3
1
2
4
5
4
2
1
3
6
3
1
2
4
7
1
3
2
4
8
2
4
1
3
9
3
1
2
4
10
4
1
3
2
11
4
2
3
1
12
3
1
2
4
Rangszámok összege
38
22
25
35
A példában a cellékban már eleve a rangszámok kerültek, melyek azonosak a "mérésekkel"

Ennek az eljárásnak a célja hogy n>=2 blockba rendezett megfigyelések esetében vizsgálja 3, vagy több minta (csoport) eloszlásának esetleges különbözõségét.

Feltételek:
Független minták, ahol az egyes blokkokba tartozó mérések r-változós szimmetriájúak.
A mérések legalább ordinális skálán történtek.

Az adatok transzformálhatók, és a transzformáció különbözhet blokkonként.

Hipotézis
H0: Az r darab kezeléshez tartozó megfigyelések blokkonként nem különböznek egymástól
HA: Legalább egy blokk esetében az r kezelésnek megfelelõ eloszlások között van eltérõ.

Ha H0-t elvetjjük, akkor páros összehasonlításokkall kell felderítenünk a csoportok közötti esetleges különbségeket. Erre az elõjel próbát kell használnunk, és a szignifikancia szintet a Bonferroni, vagy Holm eljárásnak megfelelõen alakítjuk ki.

Az eljárás kis mintaszámok eseténben:

1. megválasztjuk a szignifikancia szintet.
2. töröljük azokat a blokkokat, amelyekben minden megfigyelés egyenlõ értékû
3. Minden blokkon belül rangtranszformációt végzünk. Ha vannak azonos rangszámok, akkor korrekciót kell alkalmazni.
4. Az oszlopokon belüli rangszámok összegét kiszámoljuk, négyzetre emeljük, majd  minden csoportra összegezzük (W). A W statisztika eloszlásának kvantilis értékeit táblázatból megkaphatjuk.

Ha a mérések csak két értéket vehetnek fel, és két csoport van, akkor a módszer a McNemar próbával equivalens.
A lap tetejére