Bevezetés | A nominális változók elemzése | Nem-paraméteres összefüggés vizsgálatok |
Választás a nem-paraméteres próbák között | Többszörös összehasonlítások nem-paraméteres módszerek esetében | |
Megfigyeléspárok , párosított minták összehasonlítása | Két független csoport (minta) | 3,vagy több csoport |
|
||
|
||
Könnyú példákat sorolni arra, hogy az élet dolgaiban milyen súlyos tévedések történhetnek, ha nem követeljük meg érveléseinkben a kiinduló pont(ok) valósságát. Hasonló a helyzet a matematikai gondolatmenetekben, így számos biometriában használatos módszer esetében is. Valószínúleg a helyzet meg nem értésébõl ered az a néha megfigyelhetõ gyakorlat, hogy a kiindulási feltételek súlyos megsértések mellett próbálnak statisztikai eljárásokat alkalmazni. Ez azért is hiba, mert vannak kevés feltételezésen alapuló eljárások is.
Számos olyan eljárás, amely a folytonos intervallum skálákon mérhetõ valószínúségi változók tulajdonságain alapul, az adatoknak egy adott tipusú (leggyakrabban a normális) eloszláshoz való illeszkedését tételezi fel.
Tekintsük át újra a mérési skálákra vonatkozó ismereteinket! Az intervallum vagy a hányados skálán végzett méréseknél az adatokból számolhatunk átlagot, szórásnégyzetet, szórást. Fontos módszerek alapulnak ezeknek a 'származtatott paramétereknek' a matematikai, logikai tulajdonságain; ezeket a módszereket paraméteres módszereknek nevezik.
Könnyú belátni, hogy például a nominális skálán mért adatok esetében nem helyénvaló átlagot számítani, és - következésképpen - nem alkalmazhatók a paraméteres statisztikai módszerek. Példáúl, ha egy mintában csak fekete és szõke hajú egyének vannak, akkor a mintára vonatkozóan nem lehet átlagos (pl. barna) hajszínrõl beszélni.
A nominális és az ordinális skálán mért adatokkal számos módszer alkalmazható, melyek egyik közös tulajdonsága, hogy nem kell hozzájuk az, hogy az adatokból átlag, vagy szórás számolható legyen. általában mondható, hogy ezek a módszerek nem az ismert nevezetes eloszlás, a normális eloszlás paramétereinek tulajdonságain alapulnak, ezért is szokás õket nem-paraméteres módszereknek nevezni.
Közös tulajdonságuk ezeknek a módszereknek, hogy nem tételezik fel azt sem, hogy az adatok egy adott populáció egy specifikus eloszlásához illeszkednek, szemben a paraméteres módszerekkel, melyek esetében fontos elõfeltétel, hogy eloszlásuk a módszerben feltételezett tulajdonságokkal rendelkezzen. Ezért szokták ezeket a módszereket összevontan eloszlás-mentes módszereknek is nevezni.
A nem paraméteres módszerek az alábbi esetek közül valamelyikre vonatkoznak.
1. Nominális skálán mért adatokon elvégezhetõ.
2. Ordinális (rendezett) skálán mért adatokon elvégezhetõ.
3. Intervallum skálán mért adatokon anélkül végezhetõ el, hogy azt kellene feltételeznünk, hogy az adatok egy adott tulajdonságokkal rendelkezõ eloszlásból származnak. Ebben az esetben az adatokat rangtranszformációnak vetjük alá. Ez azt jelenti, hogy az intervallum skálán tett megfigyeléseket az ordinális skálán értékeljük ki.
Ezt a matematikai statisztika szokásos tárgyalásának megfelelõen külön fejezetben tárgyaljuk [lásd: Kontingencia táblák (készülõben..)]
Rang-korrelációs tesztek.
Ezek esetében a korrelációs vizsgálat gondolatmenetét az eredeti adatok helyett azokból a rangtranszformációval nyert számokra alkalmazzuk. Ebben a fejezetben nem tárgyaljuk õket.
- Az ordinális skálán mért változók mintáinak különbözõsége
A továbbiakban ezeket az eljárásokat tárgyaljuk.
Megkülönböztetjük a párosított mintákra vonatkozó eljárásokat a független minták esetén alkalmazható eljárásoktól.
Hogyan válasszunk a paraméteres és nem-paraméteres módszerek között ?A nem-paraméteres módszerek elõnyei
Nem követünk el hibát a próba feltételek nem teljesülése miatt.A nem-paraméteres próba viszonylagos ereje nagyobb, mint a (korrektül nem alkalmazható) paraméteres próba ereje.
Nem csak az átlag különbségeit tudjuk vizsgálni, hanem az eloszlás más tulajdonságának (példáúl ferdeség fellépése kezelés hatására) változását is.
A paraméteres módszerek elõnyei.
Ha feltételeik teljesülnek, a paraméteres próbák nagyobb erejüek, mint a helyettük alkalmazható nem-paraméteres próbák. Ha az adatok normális eloszlásúak, akkor ettõl az információtól való eltekintés jelentõs információ veszteséggel jár. Ha nincs rá okunk, ne mondjunk le a paraméteres próbák elõnyeirõl.A paraméteres próbák esetében a null hipotézisek gyakran többet mondanak, mint a nem-paraméteres próbák null hipotézisei.
Választás az alkalmazható nem-paraméteres próbák között.
Ne ragadjunk le megszokásból sem a paraméteres, sem pedig a nem-paraméteres próbák mellett.Ha csak az a kérdésünk, hogy két csoport között van-e bármilyen különbség, akkor bármelyik próbát alkalmazhatjuk. Tudnunk kell azonban, hogy a nem-paraméteres próbák, ellentétben a t próbával, nem a két csoport átlagának a különbségét vizsgálják, hanem a csoportok más tulajdonságait, mégpedig próbánként különbözõ tulajdonságait. Igy aztán a szignifikáns különbség nem biztosan jelenti azt, hogy a két csoport átlaga (várható értéke) is különbözik, mert lehet, hogy a két vizsgált populáció eloszlásának valamilyen más tulajdonsága különbözik, nem a várható értékük.
A megfelelõ próba kiválasztásának lépései:
- Ha az a gyanúnk, hogy a mediánok különböznek, akkor a Mann-Whitney próbát válasszuk.
- Ha viszont az a gyanúnk, hogy a beavatkozásunk az eloszlás jellegét (is) megváltoztatja, akkor a Kolmogorov-Smirnov próba, esetleg a Wolf-Wolfowitz próba elõnyösebb.
(Néhány egyszerü esetben, néhány lehetõség felsorolása. Nem mindegyik próba leírása található meg ebben a fejezetben!)
A skála
legalábbEgy minta Párositott minta Két független minta Ordinális Elõjel próba Elõjel próba
Wilcoxon elõjeles rang próbaMann-Whitney-Wilcoxon próba
Kolmogorov-Szmirnov próba
Wald-Wolfowitz sorozatpróbaNominális - McNemar teszt Fisher 2x2 tábla