Nemparaméteres eljárások

A párosított minták esete

Előjel próba , Wilcoxon-féle előjeles rangszámösszeg próba

Az előjel próba: a legegyszerűbb nem-paraméteres teszt

Pszichológiai vizsgálatokban, közvéleménykutatásokban gyakori, hogy azt vizsgálják, hogy egy minta egyedei két lehetőség közül melyiket preferálják. Például a televízió esti főműsoridejében sport műsort, vagy játékfilmet néznének-e a nézők szívesebben. A két lehetőség közötti választás, vagy két (egymást kizáró) esemény előfordulásának valószínűsége elvileg azonos jellegű probléma. Például egy adott beteg populációban a született gyermekek között a fiúk és a lányok aránya azonos-e? Mindezekben az esetekben az egyik esemény előjelét pozitivnak, a másik előjelét negatívnak nevezzük, és nem engedünk meg eldöntetlen esetet. Mindezen vizsgálatok eredményét értékelhetjük az előjel próbával.

Az előjel próbának nincs (elterjedt, ismert) megfelelője a paraméteres próbák között, bár egyes esetekben az [egymintás t próba] egyszerűsítve visszavezethető az előjel próba esetére, bár ilyen esetekben - ha lehet - a [Wilcoxon-féle előjeles rangszám próba alkalmazandó.

Könnyen észrevehető hogy az előjel próbával értékelhető adatok esete lényegében véve azonos a pénzfeldobási kísérlet kimenetélének vizsgálata esetével, amelyet a binomiális eloszlás írt le.

Lehetnek olyan esetek, amikor nem lehet egyértelműen eldönteni az előjelet. Ezekben az eldöntetlen esetekben a megfigyelést nem vesszük figyelembe egyikfajta előjelek számlálása során sem. Ez [triviális] megközelítés, mégis érdemes kimondanunk.

Kis elemszámú minták esete (n<=20).

Kis számú minta esetében a binomiális eloszlás tuljdonságait használjuk fel a helyzet vizsgálatához. Két lehetőséget veszünk figyelembe:

A null hipotézis:

H0: p=0.5, és az alternatíva:
Ha: p <> 0.5 esetét

ahol (<> jelzi a "nem egyenlő" esetet).

A binomiális eloszlás tulajdonságaiból kiszámították és táblázatba foglalták minden szóbajövő n-re az egyik előjel minden előfordulási gyakoriságának valószínűségét.
 
 

 
n
n
n
n
n
n
n
n
n
n
 
K
1
2
3
4
5
6
7
8
9
10
 
0.5
0.25
0.125
0.063
0.031
0.016
0.008
0.004
0.002
0.001
 
1
0.5
0.50
0.375
0.250
0.156
0.094
0.055
0.031
0.018
0.010
 
2
 
0.25
0.375
0.375
0.313
0.234
0.164
0.109
0.070
0.044
 
3
   
0.125
0.250
0.313
0.313
0.273
0.219
0.164
0.117
 
4
     
0.063
0.156
0.234
0.273
0.273
0.246
0.205
 
5
       
0.031
0.094
0.164
0.219
0.246
0.246
 
6
         
0.016
0.055
0.109
0.164
0.205
 
7
           
0.008
0.031
0.070
0.117
 
8
             
0.004
0.018
0.044
 
9
               
0.002
0.010
 
10
                 
0.001
 
                       
Ahol:                      
n
a megfigyelések száma              
k
a pozitiv (vagy a negativ) előjelek száma          
p
a táblázatban feltüntetett számok            
  A piros számok a szignifikáns p (valószínűség) értékeket jelzik (kétoldalas próba !)    

Nagy elemszámú minta esete (n>20).

Az előjelek mintabeli eloszlásának megközelítésére a normális eloszlás felhasználható, nevezetesen az a tulajdonság, hogy n>20 esetében
Ezen alapulva használhatjuk a z transzformációt arra, hogy kiszámítsuk azokat a határokat, amelyeken belül eső számú + előjel esetében az észlelt + előjelek száma nem tér el a H0-tól, azaz a két előjel előfordulásának valószínűsége egyenlő.

Egy másik példa az előjel próba használatára, amikor egy megfigyelés sorozat (minta) mediánját, nem pedig az átlagát kivánjuk egy ismert értékhez (ami lehet nulla, vagy egy jól megalapozott referencia érték) hasonlítani. Elvégezzük a méréseket, rögzítjük az adatokat, majd meghatározzuk, hogy a referencia érték alatt, vagy felett helyezkednek el az egyes mérési adatok. Az előjeleket megszámoljuk, és az előjel próbát az ismert módon alkalmazzuk.

A Wilcoxon-féle előjeles rang próba

Papp Miklós (MTA KOKI) vizsgálataiban arra keresett választ, hogy a noradrenalin hatására a vér mellett a máj nyirokban is változik-e a szabad zsirsav (non-esterified fatty acids, NEFA) koncentrációja. Az adatokat a táblázatban mutatjuk be.
 
NEFA koncentráció 
aequ/l 
NE előtt
NEFA koncentráció 
aequ/l 
NE után
Különbség Rang szám Előjeles 
rang szám
780
1182 402 4 4
784
680 -104 1 -1
1077
1488 411 5 5
780
1195 415 6 6
945
1340 395 3 3
1114 1448 334 2 2
Az adatfile letöltése nefa.zip formában , nefa.sta formában

Technikai tippek: 3 féleképen is próbálható:

A próba eredménye (a STATISTICA Nonparametric Statistics modulban számolva): Ez a próba olyan kísérleti helyzetekben alkalmazható, ahol a mintavétel a páros megfigyelésen alapul, ahol 2 összefüggő változóból mintavétel történik, úgy, hogy mindegyikből egy-egy jut egy megfigyelési egységbe. Az ilyen kisérleti elrendezésből eredő adatok kiértékelésére a paraméteres próbák közül az egymintás t próba alkalmazható, ha annak feltételei teljesülnek (intervallum skálán mérhető adatok, melyek különbségeinek eloszlása normális).

Ha a feltételek nem teljesülnek, példáúl, mert a mérés skálája ordinális, vagy a különbségek eloszlása ferde, akkor alkalmazható a Wilcoxon féle előjeles rang próba.

Ha a t próba feltételei nem teljesülnek, akkor a Wilcoxon-féle előjeles rang próba ereje (power) nagyobb, mint a t próbáé. Tehát ez a próba minden szempontból jobb, ha nem alkalmazható az egymintás t próba.

A próba feltételei:

  1. Ordinális skálán mérhető folytonos valószínűségi változók esetén akkor alkalmazható,
  2. ha a különbségek is ordinális skálán mérhetőek.
  3. Erősen asszimmetrikus eloszlás esetén nem alkalmazható.
A kísérleti elrendezés: Valamilyen szempontból párosított megfigyeléseket végzünk úgy, hogy a párok egyes tagjai között a különbség csak a kezelésben legyen. Ez a randomizált blokk elrendezés legegyszerübb esete.

A próba esetében az alábbi két hipotézis között kell választanunk:

**H0: a két populáció eloszlása azonos (0: Null hipotézis)

**HA: a két populáció eloszlása nem azonos (A: Alternatív hipotézis)

A gondolatmenet a következő: A mérések különbségeit (előjelüktől átmenetileg eltekintve) rangsorba állítjuk, és a különbségek helyébe azok rangsorát (rangszámát) írjuk, majd a rangszámokat ellátjuk az eredeti különbségek előjelével. Ha a két minta azonos populációból származik, akkor az előjeles rangok összegének várható értéke 0. Wilcoxon kimutatta, hogy n>=10 esetében a rangok mintaeloszlásának szigma szórása n ismeretében kiszámolható, képlete: **négyzetgyök{(n+1)(2n+1)/6}, és az eloszlás megközelítően normális. Ennek alapján elvégezhető a z transzformáció, és a standard normális eloszlás tulajdonságait (táblázatát) felhasználva kiszámíthatjuk annak valószínűségét, hogy a megfigyelt átlagolt előjeles rangszámérték előfordul a H0 mellett.

Egy másik gondolatmenet szerint az eredeti adatokat rangokká transzformáljuk, majd a rangszámokkal végezzük el az egy mintás t próbát. Ez egy közelítő eljárás, és mint ilyen, elvileg és gyakorlatilag is elfogadható. Ez az eljárás nem egyszerűbb, mint az előjeles rangpróba, azért a t próbával közelítést nem ajánljuk.

Régebben ez a módszer nem volt népszerű, valószínűleg a számolási nehézkesség, vagy a szükséges táblázatok hiánya miatt, ma azonban a próba elvégzésére szinte minden statisztikai programcsomagban találunk lehetőséget.

A lap teteje , A többi nemparaméteres eljárások , Előjel próba , Wilcoxon-féle előjeles rangszámösszeg próba