Bevezetés a Biometriába

 

Témák


Célkitûzések

Szeretnénk a biometria fogalmait, szóhasználatát, a segitségével megoldható feladatokat úgy megismertetni, hogy kezdetben az elemi matematikai ismereteken túl mást ne kelljen tudnia az olvasónak. Elsõsorban a fogalmak, a gondolkodásmód, a módszerek lehetõségei és korlátai megismertetését szeretnénk elérni, a számolást ma már számos program, programcsomag segiti elvégezni.

Elsõsorban a szó és a kép dominál, nem a képlet és a formalizmus. Ez persze önmagában nem teszi könnyüvé a gondolatok megértését, az változatlanul erõfeszitést követel.

Ez az tananyag azoknak készült, akik egyetemi tanulmányaik során a statisztikai alapfogalmakat tanulják, vagy akik a tudományos kutatás módszertanával kezdenek ismerkedni. Tapasztalt orvosok, kutatók számára is hasznos lehet az alapfogalmak felfrissítésére.

Jó lenne, ha a biometriai alapfogalmakat az élettudományokkal foglalkozó minden egyetemet végzett ember ismerné. Sajnos sok magyar egyetem tanrendjében minimális szerepet kap a statisztikai alapismeretek oktatása.

Megszerezhetõ ismeretenyag, készségek

Aki elsajátítja ezt az anyagok, az alábbi ismeretekkel fog rendelkezni: ->>[Ismeret lista]


Hogyan használjuk ezt a tananyagot tanulásra?


A tananyag legjobban számítógép segítségével használható. Természetesen az anyag minden egyes része kinyomtatható, megfelelõ nyomtató, némi türelem és ügyesség szükségeltetik hozzá. A nyomtatott változatból azonban hiányzik mindaz a lehetõség, amit a hipertext flexiblitása és az anyagba tervezett ugrások adnak, és ami (reményeink szerint) könnyebb tanulást eredményez.

Ha valami nem tetszik, vagy hibás, akkor kérjük, hogy a böngészõ program levelezõ részével azon nyomban irják meg véleményüket, és jelezzék az észlelt hiányosságot. Az ilyen visszajelzés nyomán kialakuló eszmecsere segitheti mindenki  tanulását. (Makara Gábor, Szilágyi Nóra, Tornóczi László EMail cimei)

Feltételezett ismeretanyag

Feltételeztük az alapmüveletek ismerete mellett a négyzetre emelés, a négyzetgyökvonás, a logaritmus függvény ismeretét, az egyszerü egyenletbe való behelyettesités készségét, a matematikai szimbolumok közül pedig az összegzés (Summa) és az indexelés (x1, x2, ..., xn) ismeretét. (Ugrás mellékletbe)

Flexibilitás

A számitógéppel megvalósított hipertext forma a szöveg igen változatos használatát teszi lehetõvé. Ha valaki mindig saját számítógépén dolgozik, akkor a böngészõ program (Netscape, MS Internet Explorer, Mosaic, vagy más program) nyomonköveti a már megnyitott részeket, és színjelzéssel mutatja a már "meglátogatott" részeket. Vigyázzunk, mert a nyomkövetés nem tesz különbséget a pár másodpercre megnyitott anyagrész és az alaposan áttanulmányozott rész között.

A hipertext legfõbb elõnye, hogy az ugrási lehetõségek tudatos felhasználásával a fogalmak, a példák, a párhuzamos anyagrészek közötti váltással az anyag gyorsabb és/vagy mélyebb megértéséhez lehet hozzájutni. Ahol hasznos váltásra láttunk lehetõséget, oda ugrási lehetõséget iktattunk be.

Technikai tudnivalók

A hipertext elõnyei csak kellõ kiépítésû számítógép segítségével használhatók ki. Érdemes egérrel, és jóminõségû színes monitorral ellátott számítógéppel használni.

A technikai leirás a programmok leggyakoribb, standard beállitására vonatkozik. A böngészõ programokat nagyon sokféleképen lehet beállitani (konfigurálni), és a számitógép korábbi használói elállithatták a beállítást, igy az itt leirtak esetleg az adott helyzetre nem érvényesek. Ebben az esetben a számitógép gazdájától kérhetünk esetleg segitséget.

Minden olyan szövegrész, ahonnan célzottan lehet máshova átugrani, rendszerint kék színnel kiemelve jelenik meg a képernyõn (a standard beállitás esetében), és a kurzor rávitele után a képernyõ legalsó sorában megjelenik az adott elágazás számítógépes cimzése, az innen elérhetõ szövegelem lelõhelyének cime. Az ugrás után (az olvasó tetszése szerint) vissza lehet térni az ugrás elõtti pontra, vagy az új irányban lehet tovább haladni. A visszatéréshez a böngészõ program [Back] funkcióját használjuk (A Netscape böngészõ esetén ez az [Alt]+balra nyil billentyû segitségével a legegyszerübb). Az ugrás történhet egy szövegrészen belül, vagy különbözõ részek között.

Miután a navigálás a legtöbb böngészõ programban kissé más megoldásokkal történik, ezért nem adunk általánosnak szánt használati utasítást, mindenki a rendelkezésére álló számítógépen, és az ott megtalálható böngészõ programmal rövid ismeretség után már olvashat, tanulhat is.

Külön ikon jelzi, ha az ugrás definicióra történik, ha az ugrás példára, vagy  párhuzamos, hasonló témáju anyagrészre történik.

A tananyag szerkezete

A tananyag témakörei részben egymásra épülnek. Feltételeztük, hogy legalábbis elõször az olvasó az elsajátitásban az anyag sorrendjében halad, az egyes témákat egymásután veszi. A flexibilitás adta lehetõségek a témakörökön belül segitik a jobb megértést. Addig ne menjünk tovább egy részbõl, amig a kérdéseken elgondolkodva nem értjük az adott rész gondolatmenetét. Lehetséges, hogy a megértés kulcsa egy korábbi részben kifejtett gondolatban van.

Ne nézzük meg elõre a kérdések után következõ magyarázatot, megoldást, az nem a tanulást, hanem az önellenõrzést szolgálja.

Valószinüleg szükség lesz egy második olvasásra is, ekkor már érdemes szabadon élni a hipertext adta lehetõségekkel.

A legfontosabb fogalmak meghatározását (definíció) ->>[fogalomjegyzékben] írtuk le. A fogalomjegyzékben kikeresett fogalom legrészletesebb tárgyalását adó anyagrészhez gyakran adunk ugrási lehetõséget.

A ->>[Szótárban] adjuk meg a legfontosabb kifejezések angol megfelelõjét. Erre mindazoknak szükségük lehet, akik angolnyelvû tudományos irodalmat olvasnak.

A ->>[Szimbólumjegyzékben] adjuk meg a statisztikában és ebben a szövegben leggyakrabban használt egyezményes jelöléseket, a görög betûk kiejtését.

Minden fontosabb eljáráshoz példákat adunk meg, és a fejezetek végén gyakorló feladatok segítik a az anyagrész megértésének önellenõrzését.

Leghasznosabb ->>[könyvek jegyzéke] olyan bevezetõ jellegû könyveket sorol fel, melyeket az érdeklõdõ mélyebb matematikai ismeretek nélkül is használni tud.

Máshol elérhetõ angolnyelvû tananyagok internet cimét is felsoroljuk, de figyelemmel kell lennünk arra, hogy az internet cimek változhatnak (és gyakran változnak is) ezért ezen cimek, kapcsolatok (link) használhatóságáért nem vállalunk felelõsséget.

->>[Statisztikai program csomagok] rövid felsorolása és bemutatása során a kivonatos véleményünket írjuk meg azoknak, akik munkájuk során választhatnak abban, hogy milyen programokat használnak.

Az egyes témakörök szerkezete


A biometriáról

Mi a biometria ?

**A ->>[biometria] módszertani tudomány az élõvilággal kapcsolatos, a véletlen által befolyásolt jelenségeket elemzõ módszerekkel foglalkozik. A biometria része a matematikai statisztikának, szokás még biostatisztikának is nevezni.

A statisztika szónak több (legalább 4) jelentése van. A többféle szóhasználat ismerete segíthet a tudományos közlemények olvasása során. A latin status (állapot, helyzet) szóból származik, és az ókori  földmérõk (az állapotok, a helyzet felmérésével foglalkozó szakemberek) munkája volt az elsõ statisztikai tevékenység.

A statisztika szó jelentései:

  1. A statisztika, mint tudományág.
  2. A statisztikai módszerek összessége.
  3. Egy kimutatás, egy statisztika (pl. Magyarország statisztikai leírása a népszámlálási adatok alapján).
  4. A statisztika tudományán belül adatokból, ->>[valószínûségi változókból] számított változó (mennyiség). Például a ->> t-statisztika.

A statisztika, mint tudományág megfigyelési adatok feldolgozásával, és az azokból levonható következtetésekkel foglalkozik.

A valószínûségszámítás tudományága olyan jelenségek törvényszerûségével foglalkozik, melyek lefolyását a számbavehetõ körülmények nem határozzák meg egyértelmûen.

A biometria szerepe, feladatai

A statisztika célja, hogy a véletlennek kitett megfigyelésekbõl ismert megbizhatóságú következtetésekre, szabályszerûségekre jussunk. A tudományos kutatás széleskörben használható módszere, eszköze.

A biometria és a tudományos módszertan viszonya: Az élettudományok területén, a biológiai, orvosbiológiai kutatásokban a biometriának különösen fontos szerepe van. Az élõvilág, annak minden egyede igen változékony, komplex rendszer, melynek vizsgálata során igen gyakran nehéz az egyöntetûséget biztosítani, ezért is nagy a mérések szóródása. Más szóval, a véletlen szóródás különösen jellemzõ a biológiában.

A statisztikai módszertan és gondolkodás egyre fontosabb a modern biológiában, orvostudományban és különösen a kutatásban. Rengeteg információ áll statisztikai köntösben (összefoglalva, kivonatolva, kondenzálva, statisztikai paraméterekkel jellemezve) rendelkezésünkre. A jelentések, közlemények sokasága,  sõt sok szakembernek szánt hirdetés is használ (jól, vagy rosszul) statisztikából származó szakkifejezéseket. Így a szakmai  információk megértéséhez és elsajátításához, kritikai értékeléséhez kell ismerni a statisztikai gondolkodásmódot. Számos döntés elõkészítéséhez további vizsgálódás kell, adatokat kell gyûjteni és elemezni, ehhez is kell a statisztikai gondolkodásmód. Tehát a statisztikát nem csak a statisztikusoknak kell ismerniük!

A statisztika számos ironikus megjegyzés tárgya. Disraeli például a következõt írta: There are three kinds of lies: lies, damned lies and statistics. E megjegyzések alapja az, hogy kevés dologgal éltek vissza annyiszor, mint a statisztikával. Sajnálatos, hogy statisztikai hiba, félrevezetõ információ néha tudományos közleményben is elõfordul.

A statisztika a valóság tükre. A tükör rosszul használva torzít. A torzítás, a félrevezetés sokféle. Ezek egy kis részére a továbbiakban még kitérünk.

Az ->>[adatgyûjtés] megtervezése, és értékelése mind a gyakorlati életben mind pedig a tudományos kutatásban feltételez statisztikai ismereteket. Az adatok értékelésénél ismernünk kell azok statisztikus tulajdonságait. Ha ->>[méréseket] végzünk, vagy végeztetünk, ha mérési eredményeket tanulmányozunk, akkor tudnunk kell a mérések statisztikus tulajdonságairól, az értékelés korlátairól. Ha mérési adatokon alapuló leírásokat, tanulmányokat (közlemények, gyógyszerismertetõk, epidemiológiai helyzetkép) olvasunk, ismernünk kell azok alapjait, megbízhatóságuk korlátait, kritikai értékelésének lehetõségeit, a leggyakrabban elkövetett hibákat, a leselkedõ hibalehetõségeket.

A vizsgálódás különbözõ formái, fajtái

A véletlennek tulajdonítható változékonyság a vizsgálatok eredményeit jelentõsen torzíthatja, ezért a változékonyság tanulmányozása az adott vizsgálat keretei között is igen fontos. Ezt szolgálják a kontroll vizsgálatok, melyben olyan egyedeket, személyeket vizsgálunk, amelyek, vagy akik a vizsgálat szempontjából viszonyítási alapként (referenciaként) szolgálhatnak, akiken gyûjtött adatokhoz hasonlíthatjuk vizsgálatunk alanyain gyûjtött adatainkat. A referencia, vagy a kontroll megfigyelések igen fontosakak a tévedések elkerüléséhez minden vizsgálódási formánál.

A vizsgálatok különféle típusainak tervezésére és kivitelezésére részletes információkat számos könyvben találunk, és a haladó biometriai oktatás során ezekkel részletesen kell foglalkozni.

A vizsgálatok csoportosítása azért fontos, mert az adatok értéke, használhatósága alapvetõen függ azok gyûjtésének módjától, valamint az adatok jellegétõl, feldolgozásuk módjától.
 

Megfigyelések

A megfigyelésekre alapozott adatgyûjtést az különbözteti meg a kísérletek során történõ adatgyûjtéstõl, hogy a megfigyelések során a vizsgálat tárgyát megfigyeljük, különféle méréseket végzünk, megfigyelünk szándékos beavatkozásokat is, de (mint kísérletezõ) nem avatkozunk be a megfigyelések megváltoztatására.

Egységes, logikailag zárt osztályozás helyett most a megfigyelésre alapozott leggyakoribb vizsgálati típusokat soroljuk fel.

Egyedi esetek megfigyelése, leírása

Érdekes, vagy fontosnak tekintett megfigyelés(ek) , leírása, amely definició szerint nem terjed ki kontrollokon végzett megfigyelésekre, de gyakran vezet további, tervszerûen kontrollált megfigyelésekhez, kisérleti jellegû vizsgálatokhoz.

Megfigyelések hasonlítása kontrollokhoz

Kontroll és beteg csoportok megfigyelése úgy, hogy a valamilyen esemény vagy jelenség alapján kiválasztjuk megfigyeléseink tárgyát, például egy csoport beteget. Ezután olyan kontollokat választunk ki, akik (amelyek) a másik csoportban meglévô jelenséget nem mutatják, de lehetôleg más jellemzôkben nem különböznek a vizsgálati csoporttól. Ezután a két csoportban különbözô jellemzôket vizsgálnak meg, azzal a céllal, hogy minél jobban jellemezzék a két csoport eltéréseit, és ebbôl következtessenek a vizsgált jelenség, pl. betegség jellemzôire, vagy okára. A jellemzô kérdés: Mi történt ? A tanulmány legtöbbször retrospektiv.

Felmérések

Ebben az esetben a vizsgálat jellemzô kérdése: Mi a helyzet ? Mi történik ? Az érdeklôdés tárgya valamilyen állapot, betegség, amelynek az elôfordulása, vagy hiánya szerint választják szét a felmérésben résztvevô alanyokat. Igen gyakori ezen eljárás egy diagnosztikus eljárás hasznosságának vizsgálata esetén, Gyakoriak a felmérések a társadalom, vagy egyes rétegei állapotának, vagy az emberek véleményének megismerésére. Elôfordul, hogy korábban gyüjtött (meglévô) adatokat dolgoznak fel ujra, máskor a felmérési terv alapján történik új adatok gyüjtése.

Kohort tanulmányok (prospektiv vizsgálatok)

Kohortoknak neveznek olyan embercsoportokat, amelyen valamilyen tulajdonságukban közösek, és amelyeket hosszabb idôn keresztül szándékoznak (a jövõben) nyomon követni. A fô kérdés: Mi fog történni ? Ezek prospektiv tanulmányok, amelyeknek az egyik legjobban ismert példája a kardiovaszkuláris betegségek Framingham (MA, USA) városában végzett felmérés, melynek során 2 évente vizsgáltak közel 6000 lakost. Jól vizsgálható a rizikófaktorok szerepe, vagy a betegségek lefolyása.

Kísérletek

Az experimentum (kisérlet) során egy természetes folyamatot úgy idézünk elõ,
- hogy annak feltételei lehetõleg pontosan ellenõrizhetõk legyenek,
- hogy a kísérlet során végzett beavatkozásokkal a feltételeket úgy manipuláljuk, hogy ezeknek a manipulációknak, beavatkozásoknak a hatásából, a megfigyelésekbõl (a gyûjtött adatokból) a folyamatot meghatározó törvényszerûségekre következtetni lehessen.

Kisérlet kontroll nélkül

Viszonylag ritka kutatási eljárás, csak referens értékek (például fizikai, biológiai kémiai állandók) meghatározásánál elfogadható. Ilyenkor a mérési eljárás hitelesítése helyettesíti a kontroll megfigyelést. A hitelesítést a mérés elõtt és után egyaránt el kell végezni, és a mérési eljárás stabilitását dokumentálni kell.

Elôfordul, hogy egy orvosi eljárást kontroll nélkül próbálnak ki, mert az eljárást végzôk meggyôzôdése szerint az adott eljárás a legjobb. Ha az eljárás sikeresnek minôsül. utána igen nehéz ugyanerre az eljárásra kontrollált vizsgálatot végezni, és meggyôzôdni arról, hogy valóban eredményes eljárásról van szó.

Kontrollált vizsgálatok, szimultán kontrollal

Igen gyakori vizsgálati forma, amikor jól meghatározott körülmények között megfigyeléseket végzünk egy ellenõrzõ kontroll csoporton, és ezzel egyidõben valamilyen (kísérleti) beavatkozás hatását vizsgáljukegy vagy több másik csoporton.

Randomizált

A kísérleti egységek (egyedek) besorolása csoportokba a véletlennek felel meg, azaz valamilyen véletlen eljárással (pl. véletlen számok táblázata, sorsolás) biztosítjuk, hogy a besorolás véletlenszerû legyen, ne érvényesüljön semmilyen szisztémás hatás a besorolás során. A kísérlet során egymástól független megfigyelések, adatok keletkeznek.

A vizsgálat (kísérlet) lehet nyilt, vagy ugynevezet vak, vagy kettôs vak kontrollal elvégzett. Leggyakrabban gyógyszerek kipróbálásánál alkalmazzák, és a "vak" kísérleteket akkor, ha a megfigyelésekben erôs lehet a szubjektiv elem, vagy a placebo hatás.

Nemrandomizált

Gyakran elôfordul, hogy kisérlet alanyainak csoportokba sorolásánál nem alkalmaznak véletlenszerû kiválasztást. Ezek komparatív vizsgálatok, amelyeknek az eredményei sok kritikát kaphatnak, sokkal kevésbé hihetôk, mint a megfelelôen kontrollált randomizált tanulmányok. Ilyenkor gyakori, hogy az esetek szétválogatásakor a szubjektiv tényezôk szerepet kapnak, és az egész vizsgálat kimenetelét befolyásolják.

Szekvenciális kontrollal

A kísérleti egységek nem egyszerre állnak rendelkezésre, és ezért elõször váltakozva végeznek kisérleti és kontrol megfigyeléseket.

Önkontrollos

A kísérleti beavatkozás hatását minden egyeden megvizsgálják, és összehasonlításra, kontrollnak a beavatkozás elõtti, vagy a beavatkozás hatásának vélhetõ elmulása utáni megfigyelést veszik. Ilyenkor a kontroll és a kísérleti megfigyelések egymástól nem függetlenek, ezért az ilyen kísérletek értékelésére olyan eljárásokat kell alkalmazni, amelyek nem feltételezik a megfigyelések függetlenségét (repeated measures analysis).

A kisérleti kontollok választásának egyes speciális esetei:

Külsõ kontrollal, részben korábbi kontrollal, szekvenciális kontroll, önkontrollos vizsgálatok, történelmi kontrollok. Ezek kiértékelése is speciális eljárásokat igényelhet.

Biometria a laboratóriumi kutatásban

A különbözõ kutatási területeken a keletkezõ adatok jellegzetességei gyakran eltérõek. Széles körben ismert, hogy a fizikai, kémiai mérések gyakran sokkal pontosabbak mint a biológiában lehetséges mérések, a jelenségek jobban ellenõrizhetõk, kézben tarthatók, igy az eredmények szóródása is kisebb. Az elméletek gyakran segítenek a model felállításában, megjósolják a szóródás jellegét. A tudományos kutatás azonban a fizikában és más "exakt" természettudományban is gyakran erõsen ingadozó, a véletlennek kitett mérési eredményekkel dolgozik.

A biológián belül általában nagyobb a szóródás, de az egyes szakterületeken a mérhetõ adatok jellege jelentõsen különböznek. Nem csak az adatok, a kutatói szokások, a hagyományok is különbözõek lehetnek.

Típusos eljárások egyes területeken

A biokémiai kutatásban, a gyógyszerkutatásban, vagy a kísérletes pszichológiában sok az olyan módszer, amelyeket más területeken alig használnak. A biokémiai, élettani kutatásokban sok a viszonylag pontosan mért, gyakran ->>[normális eloszlás]hoz illeszkedõ adat. A gyógyszerkutatásban, a toxikológiában gyakori az 50% hatékony (pl. letális) adag meghatározása. A kísérletes pszichológiában az adatok egy részét nem tudják pontosan mérni, és az adatok eloszlása is gyakran jelentõsen eltér a normális eloszlástól. Ezek a különbségek is indokolják az eltérõ statisztikai módszerek alkalmazását.

Klasszikus biometria feladatok

Két mintában mért két adathalmaz egyezésének vagy eltérésének vizsgálata, a mezõgazdaságban mûvelési eljárások összehasonlítása ->>[variancia] analízissel (szórás elemzéssel), vagy két mért változó összefüggésének vizsgálata (a korreláció vagy regresszió elemzésével) mind a klasszikus feladatok közé tartozik.

Jel vizsgálatok

Biológiai jelek (pl. EKG, EEG, nyomás regisztárumok) idõbeli lefolyásának vizsgálata, összetevõinek elemzése külön kutatási terület, mellyel ez az anyag nem foglalkozik.

Képelemzés

A technika fejlõdésével egyre gyakoribb a képi formában megjelenõ nagymennyiségû információ, a kísérleti adatok képeken való rögzítése. A fényképeken, videofelvételeken rögzített információk elemzése, a kapott adatok statisztikai elemzése számos új, speciális problémát vet fel, melyeket ezen anyagban nem tárgyalunk.

Biometria a klinikumban, terminológia

A klinikai biokémiai laboratórium

Az orvosi, állatorvosi adatgyûjtés egyik igen fontos területe a klinikai biokémiai laboratórium. A laboratóriumi mérések során a módszerek tulajdonságainak a dokumentálása, a referencia érték (hibás szóhasználattal: a normál érték), a referencia tartomány meghatározása, a módszer ->>[érzékenysége] és ->>[pontossága], a mérési módszerek minõségének ellenõrzése, újabb módszerek bevezetése és a korábbiakhoz hasonlítása mind statisztikai módszerek segítségével történik.

Élettani, biokémiai mérések a kutatásban és a klinikumban

Az egészséges vagy a kóros szervezetet jellemzõ mérések megtervezése és értékelése nem nélkülözheti a biometriai értékelést. Az adatgyûjtés módja szoros összefüggésben lehet a késõbben alkalmazandó statisztikai eljárásokkal.

Klinikai epidemiológiai vizsgálatok

Populációkra vonatkozó információk felhasználása egyes betegek ügyében hozott döntésekhez.

Terápiák, gyógyszerek kipróbálása

Állatkísérletes vizsgálatokban az egyes eljárások eredményességének, a potenciális gyógyszerek hatásosságának mérése igényli a biometriai értékelést. A vizsgálatok megbízhatóságának biztosításában, az erõforrások optimális felhasználásában a kísérlettervezési és értékelési módszerek igen fontosak.

Az embereken végzett vizsgálatok esetében különösen fontos, hogy minél kevesebb idõ alatt, minél kisebb kockázattal, meghatározható pontossággal jussanak el megbízható eredményekhez. A kutatást folytató személyek elfogultságának hatását is ki kell küszöbölni. Erre is a biometria ad módszert.


Az adatgyûjtés

Az adat fogalma

Mit nevezünk adatnak ?

Az adat fogalmáról mindenkinek van valamilyen képe, és pontos meghatározása a biometria használatához nem elengedhetetlen. A mérések, megfigyelések során adatokhoz jutunk.

[D] Az adat mindig valamilyen mérés (kísérlet, megfigyelés, vizsgálat) eredményeként keletkezik, és rendszerint szám formájában jelentkezik. A valamilyen formában rögzített megfigyelést, vagy rögzített mérést nevezzük adatnak (->>[Hajtman, 1968]).

Mérés során valamilyen skálán mérjük megfigyelésünk eredményét. A mérés pontossága, a mérési skála jellegzetességei kölcsönösen meghatározzák egymást.

A leíró statisztika

A leíró statisztika vagy a teljes populációt vizsgálja, vagy egy mintát vizsgál, de nem általánosít tovább a populáció irányába. Példa a népszámlálás, amikor a teljes népességet (populációt) mérik fel. Számos esetben a teljes populáció könnyen meghatározható, és tanulmányozható is. Több esetben azonban a teljes populáció vizsgálata a gyakorlatban nem lehetséges, ilyenkor a populációra csak a belõle vett ->>[minta] vizsgálata alapján következtethetünk.

Az induktív statisztika a ->>[D] [populációra] (más szóval alapsokaságra) következtet, egy vagy több minta alapján.

Adatgyûjtés, minta, mintavétel, populáció.

A ->>[minta] a populáció egy részhalmaza, melyet úgy kell(ene) kiválasztani, hogy az egész populációra jellemzõ tulajdonságú legyen.

Megjegyzendõ, hogy gyakran hibásan használják a populáció kifejezést olyan dologra, ami igazából egy minta.

A reprezentativ minta

A reprezentativ minta hûen képviseli a teljes populáció tulajdonságait.

Legtöbbször az adatgyüjtés célja, hogy az adatokból általános(abb) következtetéseket vonjunk le. ehhez az kell, hogy a vizsgálatunkban megcélzott populációból jellemzô mintát vegyünk. A minta akkor lesz jellemzô, reprezentativ, ha a minta és a populáció ismert jellemzôinek eloszlása jó megközelítéssel azonos. Sok esetben az a paradox helyzet, hogy a reprezentativ minta vételéhez többet kellene tudnunk a populációról, amelyet vizsgálni azért tervezünk, mert keveset tudni róla.

A reprezentativitás biztosításához józan ész és szakmai tudás kell, a döntés nem statisztikai, de a minta és a populáció ismert statisztikai jellemzôit fel lehet használni a minta reprezentativ voltának ellenôrzésére.

Fontos, hogy a reprezentativ minta mindig véletlenszerû kiválasztás eredménye. Továbbá a populációról már meglévõ ismereteinknek megfelelõ tulajdonságú. Ha tudjuk, hogy a populáció összetett részhalmazokól áll (példáúl egy ország népessége férfiakból, nõkbõl, gyermekekbõl, fiatal felnõttekbõl és idõs felnõttekbõl, stb) akkor a reprezentativ mintavétel minden ismert részhalmazra ki kell terjedjen, mindegyikbõl megfelelõ számú mintát kell venni.

Gyakori az orvosi, állatorvosi gyakorlatban, hogy a vizsgált minta nem véletlenszerûen kiválasztott, hanem példáúl egy adott helyen jelentkezett betegekkel, mint mintával foglalkoznak. (Azt is mondhatjuk, ilyenkor a minta választja ki saját magát). Ilyenkor mindig külön meg kell vizsgálni, hogy mennyiben képviseli az igy adódó minta a teljes populációt, pontosabban szólva: az adott minta valójában milyen populációt reprezentál?

A biológiai gyakorlatban a minta nem az összes létezõ egyedek populációjára vonatkozó minta, hanem sokkal szûkebb értelembe vett populációból vett minta.  Az ilyen mintából levont következtetések általánositásához további populációkból vett minták vizsgálata kell.

A mintavételt több okból is elõnyben részesítik a teljes populáció vizsgálatánál.

  1. 1. A minta gyorsabban vizsgálható, mert kisebb létszámú.
  2. 2. A minta vizsgálata olcsóbb.
  3. 3. A populáció néha nem vizsgálható teljes egészében.
  4. 4. Néha a mintából levont következtetések pontosabbak, mint a teljes populáció vizsgálatának eredményei. Ennek oka lehet, hogy korlátozott erõforrások birtokában a minta pontosabban vizsgálható, mint a teljes populáció (amelynek azonos pontosságú vizsgálatára sokkal nagyobb erõforrások kellhetnek). A több nem mindig eredményez jobbat.

A véletlenszerû mintavétel módszerei

Egy gyógyszer kipróbálására választunk ki kisérleti állatok közül véletlenszerüen 2 tizes elemszámú csoportot.

A rendelkezésünkre álló vizsgálati egyedeket megszámozzuk, vagy másmilyen azonositóval ellátjuk, majd listát készítünk. tegyük fel, hogy 30 egyedünk van.  30 db kártyára felirjuk egy egy állat sorszámát, majd a kártyákat megkeverve kihuzzuk az elõ 10 kártyát, és az azokon lévõ sorsyámú állatokat helyezzük az elsõ csoportba, majd a második 10 kártya kihúzásával kialakitjuk a második csoportot.

2. példa.
 Van 60 darab kisérleti állatunk, 100 és 200 g közötti testsúllyal. Osszuk be õket 6 olyan véletlenszerûen kiválasztott csoportba, melyek átlagos testtömege azonos.

Számozzuk be mind a 60 kisérleti állatot. Mérjük meg õket és irjuk a testömeget a sorszám mellé. Rendezzük át a táblázatot úgy, hogy az állatok csökkenõ (vagy emelkedõ) testtömegük szerint legyenek listázva. Bontsuk a listát 10 darab hatos csoportra (ezek egymás melleti súlyúak). Mindegyik csoportból sorsoljunk ki egy-egy állatot a a 6 kisérleti csoport egyikébe. A kapott csoportok testtömegre kiegyensúlyozottak lesznek, ugyanakkor a sorsolás fogja eldönteni, hogy egy adott állat melyik csoport tagjává válik.

A sorsolást végezhetjük kocka dobással, vagy a véletlen számok táblázatával, vagy az számok véletlenszerü permutációjának táblázatával, vagy példáúl a számolótábla véletlenszám generátorával.

Vannak más módszerek is a véletlen mintavételre. Gyakori sajnos a kényelmi mintavétel, például, amikor minden párost az egyik csoportba, minden páratlant a másik csoportba sorolnak. Ez azért sem jó, mert ciklikus eljárás, ami szisztámás hibát okozhat. Máskor egyszerüen valamilyen természetes csoportosulást használnak fel csoportositásra. A csoportosulás azonban gyakran nem véletlenszerû, hanem rejtett tényezõk hatására jön létre, ami a vizsgálat eredményeit eltorzithatja, hibás következtetéseket eredmnyezhet.

Az adatgyûjtés problémái, nehézségei

A kontroll és a kezelt. Összehasonlító adatok

Korábban már említettük a kontroll vizsgálatok fontosságát. A mérési eljárás során a legkisebb a tévedési esély, ha a vizsgálat tárgyák képezõ mérések mellett elegendõ, egyidejû kontroll megfigyelést végzünk. Ha a kísérleti és a kontroll méréseket azonos körülmények között, véletlen sorrendben végezzük, akkor a legkisebb a torzítás, az észrevétlen szisztémás hiba veszélye. A véletlen okozta változékonyság még mindig megmarad, de ezt a biometriai módszerek felhasználásával kezelni tudjuk, a tévedés valószínûségét számszerûsíteni tudjuk.

Hitelesítés, nemzetközi etalonok

Az abszolut mérés, azaz a nem összehasonlító mérés is visszavezethetõ összehasonlitásra. Valójában egy nemzetközi etalonnal való összehasonlítás. A mérõmûszereket bonyolult, hatóságilag elõírt, szabványos eljárásokkal hitelesítik. A hiteles mûködést a mérést végzõnek idõrõl idõre ellenõriznie kell, a hitelességet dokumentálni kell (a szabványos eljárások, az ugynevezett Good Laboratory Practice, GLP fontos eleme a hitelesités és annak dokumentálása).

A változékonyság és a hiba természete

A hiba (error) szót a statisztikában, a biometriában többféle jelentéssel használják. A véletlen hatására megjelenõ (ismeretlen tényezõk okozta) változékonyság leírására gyakran a véletlen hiba megnevezést használják.

A statisztikai szóhasználatban laikus értelmezésében gyakran igen zavaró a véletlen hiba (angolul random error, hiba variancia) megjelölés és ennek más változatai. Tudatában kell lennünk annak, hogy a hétköznapi értelemben vett hiba nem azonos egy mérési eljárás során megnevezhetõ sokféle (technikai jellegû) hibával. A technikai hibát meg kell különböztetni az eljárás során keletkezõ véletlen ingadozástól, ami gyakran nem azonos az egyes statisztikai eljárásokban hiba szóval jelölt komponenssel. A statisztikai terminus technicus-ok, a zsargon sok nehézség forrása lehet, és a hiba szó statisztikai szövegkörnyezetben történõ alkalmazásánál mindig gondolnunk kell arra, hogy milyen hibáról beszélünk, a az adott közönség mire fog gondolni, ha a hiba szót hallja?

Kiküszöbölhetõ és ki nem küszöbölhetõ hiba.

Az adatokban (természetüknél fogva) megjelenõ változékonyságot nem szabad összetévesztenünk a hiba szó hétköznapi értelembe vett jelentésével. Ezek a felismerhetõ, vagy észlelhetõ hibák, amelyek esetleg lehetetlennek minõsíthetõ adatokat produkálhatnak, vagy amelyeket gondos, ellenõrzött adatgyûjtéssel elkerülhetünk.

A szisztémás hiba a megfigyelések, kísérletek során jelentkezõ olyan hiba, ami a folyamat során nem állandó, egyes méréseket másképpen érint, mint másokat. Jellemzõ szisztémás hibát okozhat a vizsgálati egységek idõben, vagy térben jelentkezõ inhomogenitása. Példáúl sorozatban végzett vizsgálatok során az idõ függvényében változhatnak a vizsgált egyedek, és az elsõ és az utolsó jellegzetesen különbözõ lehet, függetlenül attól, hogy bármi más különbség is lenne közöttük, mint a sorrend. Másik példa szerint a térben egymás mellett lévõ vizsgálati egyedek, példáúl földparcellák egymáshoz hasonlóak, de jelentõsen eltérhetnek a távolabb elhelyezkedõktõl. Ha tehát egy méréshez földparcellákat kell választanunk (példáúl két mûtrágya összehasonlításához) akkor biztosítanunk kell, hogy mind a két anyag egyforma eséllyel kerüljön kipróbálásra bármelyik parcellán, másszóval nem járhatunk úgy el, hogy az egyik kipróbálandó anyagot (kényelmi okokból) a parcellák egyik topográfiailag közellévõ csoportján, és a másik anyagot egy másik csoport parcellán alkalmazzuk. ebben az esetben ugyanis nem tudhatjuk, hogy  nem keverjük-e össze a vizsgálandó anyagunk hatását a parcellák csoportjai között esetleg meglévõ (szisztémás) különbséggel.

A szisztémás hiba a szó hétköznapi értelmében is hiba, csak gyakran nem tudjuk, hogy pontosan mi is az oka. Ennek ellenére védekezhetünk ellene a kísérlet tervezés ismert módszereivel, a kísérleti egységek (egyedek) és a megfigyelési csoportok véletlenszerü párosításával, másszóval a randomizálással.

Randomizálás

A randomizálás legegyszerübb módja két csoport esetén az, hogy a rendelkezésünkre álló kísérleti egyedeket megszámozzuk, majd sorsolással, vagy a véletlen számok táblázatának használatával döntjük el, hogy melyik sorszámú egység (egyed) melyik kezelést kapja (melyik kísérleti csoportba kerül). Komplex kutatási feladatoknál, embereken végzett vizsgálatoknál a kísérleti egyedek csoportokba sorolása fontos és kényes feladat, melynek végrehajtására számos jó tervezési eljárás ismert.

Kiegyensúlyozás, rétegezett mintavétel

A véletlen mintavételnél sokszor arra kell törekednünk, hogy valamilyen, a kisérlet eredményét befolyásoló, de most nem vizsgálandó faktor hatását semlegesítsük úgy, hogy a vizsgálati csoportokban egyszerre biztosítsuk a véletlen mintavételt, és a nem vizsgálandó faktor szempontjából a kiegyensúlyozottságot.

Az ismert faktorok (pl. nem, testsúly, életkor) alapján homogén rétegekre (blokkokra) bontjuk a lehetséges mintát, és az egyes rétegeken belül biztosítjuk a véletlen mintavételt.

Pontosság, gazdaságosság, látszat pontosság

A hétköznapi életben használt pontosság kifejezést a biometriában többféleképpen használják.

A számolás pontossága.

Nem tévesztendô össze a mérés, az eljárás pontosságával. A modern számítógépes eljárások a legtöbb esetben elkerülik a számolás pontatlanságából adódó hibákat. Ezt a programmozóknak kell biztosítaniuk. A kutatónak a felhasznált adatok pontosságát több síkon kell vizsgálnia. A mérô berendezések, a számolási eljárások gyakran adnak nagyon sok számjegyet, és a kutató döntése alapján kell ezekbôl annyit feljegyezni, megtartani, amennyiben valóban meg lehet bízni. Hiba lehet a mérésekben meglévô részletektôl, információtól eltekinteni, példáúl felnôttek testtömegét 5 vagy 10 kilóra kerekíteni, ahelyett, hogy tized kilogramra adnánk meg. Nem érdemes felnõttek testtömegét tizedgram pontossággal mérni.

Koraszülöttek testtömegét viszont gram pontossággal lehet és érdemes nyomonkövetni. Ugyanakkor lenne nem érdemes és célravezetô koraszülöttek testtömegét miligram pontossággal mérni, és feljegyezni. Gyakran elegendô a 3 vagy 4 értékes jegy pontossággal jegyezni a biológiai mérési adatokat, de vannak olyan változók, amelyek pontosabban mérhetôk, és mérendôk is. Az értékes jegyet gyakran angolul "significant digit" jelzi, ami zavart kelthet, ha a "significant" jelzõ más, statisztikai használatával összetévesztjük.

Az értékes jegy fogalma: Az értékes jegy alatt azt értjük, ami mérési eredményként, és nem a nagyságrend megmutatása okából kerül feljegyzésre. Az értékes jegy elhagyásával, vagy kerekítésével információt vesztünk.

Accuracy: pontosság, szabatosság, hitelesség

Precision: pontosság, szabatosság, a véletlennek tulajdonítható változékonyság. Bias: eltérés , egyoldalúság, a szisztémás eltérés jelenléte. Szisztémás eltérés: gyakran nevezik biasnak, inaccuracynak. Véletlen eltérés, szóródás:. gyakran összekeverik a szisztémás eltéréssel. A véletlen szóródásnak tulajdonítható ingadozást a párhuzamos mérések számának növelésével csökkenteni lehet. A szisztémás eltérés a mérések számával nem változik, rendszerint a mérési vagy a mintavételi eljárás saját tulajdonsága.

A mérés reprodukálhatósága

A valódi értéktôl való eltérés, vagy szisztémás hiba.

A mérési ingadozást a mérô eljárás javításával lehet csökkenteni. Általában a pontosabb mérés egyben költségesebb is, és a kívánatos mérési pontosság attól is függ, hogy mekkora a mérendô tulajdonság biológiai változékonysága. Egy nagyon változékony tulajdonságot gyakran nem érdemes a változékonyságnál sokkal nagyobb pontossággal mérni.



 

Mérési skálák

Nominális skála

A legegyszerûbb mérés a csoportokba, kategóriákba sorolás, amikor megfigyeléseinket kettõ, vagy több osztályba soroljuk. Ekkor alkalmazzuk a nominális mérési skálát.

A nominális skálán a megállapítható adatokat, a kategorizált adatokat mérjük.

A biológiában gyakori a megfigyelés tárgyának kvalitativ jellemzése, ahol a megfigyeléseket a kategóriákban való megoszlás százalékával, vagy arányokkal jellemezzük. A nominális skálán mért adatok jellegzetes elemzõ módszere a kontingencia tábla, jellemzõ ábrázolás módja az oszlopdiagram, vagy a kör diagram.

Ábrát beilleszteni: Oszlopdiagram, kördiagram példa bemutatása.

Rendezett skála

Ha a besorolás során a használt kategóriák nagyság szerint rendezettek, akkor a mérést a rendezett,  ->>[D] ordinális skálán végezzük. Másszóval: Rendezett az a skála, amelyen értelmezhetõ a kisebb, nagyobb viszony, de például az additivitás már nem biztosítható.  Ilyenek:

  1. (1) az intelligencia hányados (quotiens, röviditve IQ)
  2. (2) az iskolai  3 vagy 5 fokozatú osztályzati skála. Triviális hogy az iskolában a 3-as osztályzatú tanuló teljesítménye jobb, mint a 2-es osztályzatot kapó tanulóé, de egy 2-es és egy 3-as osztályzat együtt nem ér egy 5-ös osztályzatot.

Numerikus skála

Diszkrét numerikus skálán mérhetõ például a család mérete, ahol egy család lehet 1,2,3,stb tagú, de nem lehet 2,5-tagú család.

Folytonos, intervallum skálán mérjük pl az idõt, a hõmérsékletet (ha C-ban, vagy Fahrenheit fokban mérjük, ahol a nulla pont választásunktól függ).

Folytonos, abszolut skálán (az angolszász irodalomban ratio scale) a nulla pont jól meghatározott, és az adatok hányadosa jól értelmezhetõ mennyiség (pl. a tömeg, vagy a Kelvin fokban mért hõmérséklet).

A biometria számára fontos, hogy a skála nominális, ordinális, diszkrét, vagy folytonos numerikus skála-e. A többi részismeret kevésbé fontos. Az egyes mérési skálák tulajdonságai meghatározzák, hogy milyen biometriai módszereket alkalmazhatunk a rajtuk mért adatok esetében.

Transzformációk és skálák

A mérési folyamatok során az elsõdlegesen megfigyelt, mért tulajdonságokból többé-kevésbé bonyolult összefüggések felhasználásával jutunk el a mért adatig. Egyszerû példa, hogy a hagyományos óra esetében a mutatók szögelfordulásával mérjük az idõt, egy biokémiai eljárásban egy oldat fényáteresztõ képességébõl, esetleg zavarosságából következtetünk az oldott anyag koncentrációjára, az izotópok bomlását a mérõrendszerben elektromos impulzusok jelenléte mutatja. A mérési folyamat során az eredeti megfigyelésbõl gyakran többszörös átalakítással, azaz transzformációval lesz a mérési adat. Másképen: egy transzformáció a megfigyeléseket egy másik skálán fejezi ki.

Egy adott mérési adat halmaz statisztikai tulajdonságai esetleg olyanok, hogy jó hatásfokú statisztikai eljárások feltételeit nem elégítik ki, de matematikai eljárásokkal, további átalakítással, ->>[transzformáció]val olyan formára hozható, hogy a származtatott (transzformált) adatok fontos tulajdonságai nem torzulnak, de statisztikai kezelhetõsége megváltozik, optimális, vagy megszokott eljárásokat alkalmazhatunk.

Gyakori például hogy az (intervallum skálán mért) adatok helyett azok logaritmusát használjuk a statisztikai értékelésben. Ez a logaritmus transzformáció, ami a megfigyeléseket az eredeti lineáris skáláról egy logaritmikus skálára viszi át. Miután a (pozitiv) számok, és azok logaritmusai között kölcsönösen egyértelmû az átalakítás, ezért statisztikai gondolatmenetünk eredménye nem csak a logaritmusokra, hanem az eredeti mérési adatokra is érvényesek lehetnek.