Nem-paraméteres módszerek

 
Bevezetés A nominális változók elemzése Nem-paraméteres összefüggés vizsgálatok
Választás a nem-paraméteres próbák között   Többszörös összehasonlítások nem-paraméteres módszerek esetében
Megfigyeléspárok , párosított minták összehasonlítása Két független csoport (minta) 3,vagy több csoport

Bevezetés

A legtöbb statisztikai módszer olyan feltételezéseken (assumptions) alapul, amelyek a módszer alkalmazhatóságának sarokkövei. Elvileg ezek a módszerek csak akkor alkalmazhatók (fenntartások nélkül), ha a kiinduló feltételezések teljesülnek. Ennek az az oka, hogy a feltételezésekbõl kiindulva olyan valószínúségszámítási ismereteket, tételeket használunk fel (rejtett formában) melyek nem érvényesek, ha a feltételezések nem teljesülnek. A feltételek hiányában a próba validitása megkérdõjelezhetõ, sok esetben a próba félrevezetõ.

Könnyú példákat sorolni arra, hogy az élet dolgaiban milyen súlyos tévedések történhetnek, ha nem követeljük meg érveléseinkben a kiinduló pont(ok) valósságát. Hasonló a helyzet a matematikai gondolatmenetekben, így számos biometriában használatos módszer esetében is. Valószínúleg a helyzet meg nem értésébõl ered az a néha megfigyelhetõ gyakorlat, hogy a kiindulási feltételek súlyos megsértések mellett próbálnak statisztikai eljárásokat alkalmazni. Ez azért is hiba, mert vannak kevés feltételezésen alapuló eljárások is.

Számos olyan eljárás, amely a folytonos intervallum skálákon mérhetõ valószínúségi változók tulajdonságain alapul, az adatoknak egy adott tipusú (leggyakrabban a normális) eloszláshoz való illeszkedését tételezi fel.

Tekintsük át újra a mérési skálákra vonatkozó ismereteinket! Az intervallum vagy a hányados skálán végzett méréseknél az adatokból számolhatunk átlagot, szórásnégyzetet, szórást. Fontos módszerek alapulnak ezeknek a 'származtatott paramétereknek' a matematikai, logikai tulajdonságain; ezeket a módszereket paraméteres módszereknek nevezik.

Könnyú belátni, hogy például a nominális skálán mért adatok esetében nem helyénvaló átlagot számítani, és - következésképpen - nem alkalmazhatók a paraméteres statisztikai módszerek. Példáúl, ha egy mintában csak fekete és szõke hajú egyének vannak, akkor a mintára vonatkozóan nem lehet átlagos (pl. barna) hajszínrõl beszélni.

A nominális és az ordinális skálán mért adatokkal számos módszer alkalmazható, melyek egyik közös tulajdonsága, hogy nem kell hozzájuk az, hogy az adatokból átlag, vagy szórás számolható legyen. általában mondható, hogy ezek a módszerek nem az ismert nevezetes eloszlás, a normális eloszlás paramétereinek tulajdonságain alapulnak, ezért is szokás õket nem-paraméteres módszereknek nevezni.

Közös tulajdonságuk ezeknek a módszereknek, hogy nem tételezik fel azt sem, hogy az adatok egy adott populáció egy specifikus eloszlásához illeszkednek, szemben a paraméteres módszerekkel, melyek esetében fontos elõfeltétel, hogy eloszlásuk a módszerben feltételezett tulajdonságokkal rendelkezzen. Ezért szokták ezeket a módszereket összevontan eloszlás-mentes módszereknek is nevezni.

A nem paraméteres módszerek az alábbi esetek közül valamelyikre vonatkoznak.

1. Nominális skálán mért adatokon elvégezhetõ.

2. Ordinális (rendezett) skálán mért adatokon elvégezhetõ.

3. Intervallum skálán mért adatokon anélkül végezhetõ el, hogy azt kellene feltételeznünk, hogy az adatok egy adott tulajdonságokkal rendelkezõ eloszlásból származnak. Ebben az esetben az adatokat rangtranszformációnak vetjük alá. Ez azt jelenti, hogy az intervallum skálán tett megfigyeléseket az ordinális skálán értékeljük ki.

A nem-paraméteres módszerek csoportjai

Rang-korrelációs tesztek.
Ezek esetében a korrelációs vizsgálat gondolatmenetét az eredeti adatok helyett azokból a rangtranszformációval nyert számokra alkalmazzuk. Ebben a fejezetben nem tárgyaljuk õket. 


Hogyan válasszunk a paraméteres és nem-paraméteres módszerek között ?

A nem-paraméteres módszerek elõnyei

Nem követünk el hibát a próba feltételek nem teljesülése miatt.

A nem-paraméteres próba viszonylagos ereje nagyobb, mint a (korrektül nem alkalmazható) paraméteres próba ereje.

Nem csak az átlag különbségeit tudjuk vizsgálni, hanem az eloszlás más tulajdonságának (példáúl ferdeség fellépése kezelés hatására) változását is.

A paraméteres módszerek elõnyei.

Ha feltételeik teljesülnek, a paraméteres próbák nagyobb erejüek, mint a helyettük alkalmazható nem-paraméteres próbák. Ha az adatok normális eloszlásúak, akkor ettõl az információtól való eltekintés jelentõs információ veszteséggel jár. Ha nincs rá okunk, ne mondjunk le a paraméteres próbák elõnyeirõl.

A paraméteres próbák esetében a null hipotézisek gyakran többet mondanak, mint a nem-paraméteres próbák null hipotézisei.

Választás az alkalmazható nem-paraméteres próbák között.

Ne ragadjunk le megszokásból sem a paraméteres, sem pedig a nem-paraméteres próbák mellett.

Ha csak az a kérdésünk, hogy két csoport között van-e bármilyen különbség, akkor bármelyik próbát alkalmazhatjuk. Tudnunk kell azonban, hogy a nem-paraméteres próbák, ellentétben a t próbával, nem a két csoport átlagának a különbségét vizsgálják, hanem a csoportok más tulajdonságait, mégpedig próbánként különbözõ tulajdonságait. Igy aztán a szignifikáns különbség nem biztosan jelenti azt, hogy a két csoport átlaga (várható értéke) is különbözik, mert lehet, hogy a két vizsgált populáció eloszlásának valamilyen más tulajdonsága különbözik, nem a várható értékük.

A megfelelõ próba kiválasztásának lépései:
(Néhány egyszerü esetben, néhány lehetõség felsorolása.  Nem mindegyik próba leírása található meg ebben a fejezetben!)
 
A skála 
legalább
Egy minta Párositott minta Két független minta
Ordinális Elõjel próba Elõjel próba
Wilcoxon elõjeles rang próba
Mann-Whitney-Wilcoxon próba
Kolmogorov-Szmirnov próba
Wald-Wolfowitz sorozatpróba 
Nominális - McNemar teszt Fisher 2x2 tábla