3. ValĂłszĂ­nĹąsĂŠgszĂĄmĂ­tĂĄs

3.1. BevezetĂŠs

A valószínűségszámítás a matematikának egy önállóan fejlődő ága és erre a fogalomrendszerre épül a matematikai statisztika (biometria) is. A modern valószínűségszámítás kidolgozása Kolmogorov orosz matematikus nevéhez fűződik, aki ebben 1930-ban fektette le a valószínűségszámítás alapjait.

A valĂłszĂ­nĹąsĂŠgszĂĄmĂ­tĂĄs csak egy eszkĂśz a dĂśntĂŠseinkhez. Egy olyan eszkĂśz, mely szĂĄmszerĹąsĂ­ti egy esemĂŠny bekĂśvetkezĂŠsĂŠnek az esĂŠlyĂŠt, ĂŠs ezen ĂŠrtĂŠk alapjĂĄn dĂśnteni lehet az esemĂŠnyre bekĂśvetkezĂŠsĂŠre vagy be nem kĂśvetkezĂŠsĂŠre vonatkozĂłan.

A valószínűségszámítás a következő fogalmakra épül.

3.2. Kombinatorika

A kombinatórika (kapcsolástan) az elemek csoportosításával foglalkozik. Elsődleges feladata az elemek csoportjainak előállítása, valamint a csoportok számának meghatározása. Az elemek egy elrendezését komplexiónak nevezzük.

Az elemek elrendezĂŠsĂŠnek hĂĄrom legfontosabb fogalma a permutĂĄciĂł, a variĂĄciĂł ĂŠs a kombinĂĄciĂł tĂŠmakĂśrĂŠhez tartozik.

3.2.1. PermutĂĄciĂłk

Ha az elrendezendő (n db) elemek mind különbözők, akkor ismétlés nélküli, ha az elemek között azonosak is vannak, akkor ismétléses permutációról beszélhetünk. Megegyezés szerint az azonos elemek felcserélését nem tekintjük különböző sorrendnek.

Az ismĂŠtlĂŠs nĂŠlkĂźli permutĂĄciĂłk szĂĄma:

Pn = 1 2 3 ...  n =n! vagy röviden Pn = n!

JelĂślĂŠsben n! (ejtsd: n faktoriĂĄlis), ami az n elem faktoriĂĄlis ĂŠrtĂŠkĂŠt jelĂśli. MegĂĄllapodĂĄs szerint 0! = 1.

IsmĂŠtlĂŠses permutĂĄciĂłk szĂĄma:

ahol k1,k2,k3,...,kn az egymás közt megegyező elemek számát jelöli.

PĂŠldĂĄk

1. Hány hatjegyű szám állítható elő a 0, 1, 4, 5, 6, 8 számjegyekből?

MegoldĂĄs

P6 - P5 = 6! - 5! = 720 - 120= 600

2. HĂĄny hatjegyĹą szĂĄmot kĂŠpezhetĂźnk az 1, 1, 3, 3, 3, 6 szĂĄmokbĂłl?

MegoldĂĄs

A szĂĄmok ismĂŠtlĂŠses permutĂĄciĂł adja a megoldĂĄst

3.2.2. VariĂĄciĂłk

Ha n számú különböző elemből kiválasztunk k(k  n) számú elemet úgy, hogy figyelembe vesszük ezek sorrendjét is, akkor n elem k–ad osztályú variációjáról beszélünk. Az összes variáció számát a

kifejezĂŠs adja.

Ha az n elemből úgy választunk k elemet tartalmazó csoportokat, hogy a csoportban egy elem többször is szerepelhet és az elemek sorrendje is fontos, akkor az n elem k–ad osztályú ismétléses variációját határozzuk meg:

A felső indexben az i betű jelöli az ismétléses variációt.

PĂŠldĂĄk

1. Négy sebész kettesével, felváltva használja a műtőt úgy, hogy az egyikük a vezető sebész legyen. Adjuk meg a lehetséges beosztást.

MegoldĂĄs

Legyen A, B, C, D a négy sebész. A vezető mindig az első helyre kerül, amire 4 lehetőség adódik. A “beosztott” sebészt a maradó 3 fő közül választhatjuk ki. Így a lehetőségek száma

4*3 = 12

A pĂĄrok tehĂĄt:

AB, AC, AD, BA, BC, BD, CA, CB, CD, DA, DB, DC

2. A METRO aluljárójában 4 ablaknál lehet bérletet, jegyet venni. Az egyszerre odaérkező 8 fő, hányféle módon kereshet ablakot magának?

MegoldĂĄs

Ugyanannál az ablaknál való elhelyezkedés is megengedett, tehát 4 elemből (ablakból) kell 8-as csoportokat képezni a sorrend beszámításával. A csoportok számát az ismétléses variáció adja:

3.2.3. KombinĂĄciĂłk

Ha az n számú különböző elemből úgy választunk ki k (k n) számút minden lehetséges módon, hogy a kiválasztás során a csoportokon belül az elemek sorrendje nem fontos, akkor n elem k–ad osztályú kombinációjáról beszélünk. Az összes lehetséges kiválasztás száma:

Az jelĂślĂŠst Ăşgy olvassuk, hogy "n alatt a k".

Ha a k elem között egy elem többször is előfordulhat, akkor n elem k–ad osztályú ismétléses kombinációjáról beszélünk. Az összes kiválasztási lehetőségek száma:

PĂŠldĂĄk

1. Az egyetemi menza két ételkiadó ablakához 6 hallgató érkezik. Hányféle módon választhatják ki maguk közül az első két hallgatót?

MegoldĂĄs

A kiválasztásnál a sorrend nem fontos. A csoportok számát a 6 fő 2-od osztályú kombinációja adja

2. Egy ĂśttagĂş csalĂĄdnĂĄl a telefon 4-szer szĂłlalt meg TV nĂŠzĂŠs kĂśzben. Egy szemĂŠly 3-szor is odamehetett a kĂŠszĂźlĂŠkhez. A sorrendet nem figyelve, hĂĄnyfĂŠle mĂłdon vehettĂŠk fel a kagylĂłt?

MegoldĂĄs

A csoportok száma 5 elem (fő) 3-ad osztályú ismétléses kombinációja

3.3. BinomiĂĄlis egyĂźtthatĂłk tulajdonsĂĄgai

Az olyan kifejezéseket amelyek két tagból állnak binomiális kifejezéseknek nevezzük, pl. (a+b) vagy (a–b). Vegyük az (a + b) binom hatványait sorba egészen a 3. hatványig (n = 0,1,2,3):

(a + b)0 = 1

(a + b)1 = a + b

(a + b)2 = a2 + 2ab + b2

(a + b)3 = a3 + 3a2b + 3ab2 + b3

Ha az egyes tagok együtthatóit egymás alá írjuk, akkor az ún. Pascal háromszöget kapjuk, ahol a külső szárak mentén csak 1–es áll. A háromszög belsejében álló bármely szám a közvetlen felette lévő és attól balra álló két szám összege:

VezessĂźk be az jelĂślĂŠseket ĂŠs Ă­rjuk fel a Newton–fĂŠle binomiĂĄlis tĂŠtelt:

ahol az egyĂźtthatĂłkat binomiĂĄlis egyĂźtthatĂłknak nevezzĂźk.

A tĂŠtelt a kifejtett binomiĂĄlis egyĂźtthatĂłkkal is felĂ­rhatjuk:

A tĂŠtelnek egy kĂśvetkezmĂŠnye az alĂĄbbi kifejezĂŠs:

(1+x)n  1+nx (nx közel van a 0–hoz)

3.4. KĂ­sĂŠrlet ĂŠs esemĂŠny

KĂ­sĂŠrletnek lehet tekinteni egyrĂŠszt minden olyan tevĂŠkenysĂŠget, amit valamilyen cĂŠl ĂŠrdekĂŠben hajtunk vĂŠgre.

A kísérlet egyes lehetséges kimeneteleit elemi eseményeknek nevezzük. Az eseményeket az ABC nyomtatott nagybetűivel jelöljük. Két eseményt azonosnak tekintünk, ha egy kísérlet minden lehetséges kimenetelét figyelembe véve vagy mindkettő bekövetkezik, vagy egyik sem. Ha két esemény A és B olyan kapcsolatban van egymással, hogy A csak akkor következhet be, ha B is bekövetkezik, akkor azt mondjuk, az A esemény maga után vonja a B eseményt. Az ilyen eseményeket a következő módon jelöljük:

A  B

Egy kísérlet összes elemi eseményeinek a halmaza az eseménytér ( ).

Az elemi esemĂŠnyekkel kapcsolatos hĂĄrom tovĂĄbbi fogalom:

a) lehetetlen esemény ( ): sohasem következhet be a kísérlet folyamán,

b) biztos esemény ( ): mindig bekövetkezik,

c) ellentett (komplementer) esemĂŠny () csak akkor kĂśvetkezhet be, ha az A esemĂŠny nem kĂśvetkezik be.

3.4.1. EsemĂŠnyalgebra

3.4.1.1. Összeadás

Az A ĂŠs B esemĂŠnyek Ăśsszege az a C esemĂŠny, amely akkor kĂśvetkezik be, ha az A ĂŠs B esemĂŠnyek kĂśzĂźl legalĂĄbb az egyik bekĂśvetkezik:

A + B = C

3.4.1.2. KivonĂĄs

Az A és B események különbsége az a A–B esemény, amely akkor következik be, amikor az A esemény teljesül, de a B esemény nem:

A – B = F = A

3.4.1.3. SzorzĂĄs

A G ĂŠs H esemĂŠnyek szorzatĂĄn azt az esemĂŠnyt (jelĂślĂŠsben AG) ĂŠrtjĂźk, amely csak akkor kĂśvetkezik be, ha a G ĂŠs H esemĂŠny is bekĂśvetkezik:

K = GH

Ha a B ĂŠs C esemĂŠnyre igaz, hogy szorzatuk a lehetetlen esemĂŠnyt adja akkor a kĂŠt esemĂŠny kizĂĄrja egymĂĄst:

BC = 

Egy A eseményre vonatkozóan az alábbi műveletek végezhetők el:

Összeadás
SzorzĂĄs
Komplementer mĹąvelet
A + A = A
A   = 
Ic = 
A + Ac = I
A + I = I
A  A = A
 c = I
A  Ac = 
A +  = A
A  I = A
(Ac)c = A
 

Az eseményekkel végezhető műveleteket összefoglalóan Boole–algebrának hívják. A gyakorlatban főleg a logikai áramkörökben fontosak az ún. de Morgan–azonosságok ( az események fölött a vonás a komplementer jele):

ĂŠs 

Ezek a kifejezések több tagra is érvényesek és kiterjeszthetők.

3.4.1.4. Összetett esemény

Egy A esemény összetett vagy felbontható esemény, ha legalább két, tőle különböző esemény összegeként egyértelműen előállítható.

K = G + H K  G és K  H

Egy elemi esemény nem állítható elő ilyen alakban.

3.4.1.5. Teljes esemĂŠnyrendszer

Az A1, A2, A3, ..., An esemĂŠnyek teljes esemĂŠnyrendszert kĂŠpeznek ha igazak rĂĄjuk az alĂĄbbi feltĂŠtelek:

a) A1 + A2 + A3 + ... + An = I
b) AiAj = O ha i j (i = 1, 2, 3, ..., n és j = 1, 2, 3, ..., n)

3.5. A valĂłszĂ­nĹąsĂŠg fogalma

A mindennapi életben igen gyakran használjuk ezt a fogalmat, amikor egy esemény bekövetkezési esélyét próbáljuk számszerűen meghatározni. A lehetetlen esemény valószínűsége 0, a biztos esemény valószínűsége 1, és a két szélső érték között a valószínűségi skála egyéb értékei szerepelnek. Minél nagyobb egy esemény bekövetkezésének az esélye, valószínűsége annál inkább közelíti az 1 értéket. A valószínűségi értékeket p–vel jelöljük.

A valószínűség másik ismert megadási módja a százalékos forma, amikor pl. p = 0.5 helyett 50 %–os esélyt mondunk egy esemény bekövetkezésére. Ha magát az A eseményt is jelöljük a valószínűségével együtt, akkor a P(A) jelölést használjuk.

3.5.1. Kolmogorov–axiómák és következményei

Egy esemĂŠny valĂłszĂ­nĹąsĂŠgĂŠre az alĂĄbbiak ĂŠrvĂŠnyesek:

1) 0  P(A)  1

Egy esemĂŠny valĂłszĂ­nĹąsĂŠge csak 0 ĂŠs 1 kĂśzĂśtti szĂĄm lehet.

2.) P(0) = 0

A lehetetlen esemĂŠny valĂłszĂ­nĹąsĂŠge 0.

2.) P(I) = 1

A biztos esemĂŠny valĂłszĂ­nĹąsĂŠge 1.

3) Ha az A ĂŠs B egymĂĄst kizĂĄrĂł esemĂŠnyek (vagyis AB = 0) akkor az A ĂŠs B esemĂŠnyekre igaz:

P(A+B) = P(A) + P(B)

Az axiĂłmĂĄk kĂśvetkezmĂŠnyei:

a.) Ha az A esemĂŠny maga utĂĄn vonja a B esemĂŠnyt, akkor a valĂłszĂ­nĹąsĂŠgeikre teljesĂźl, hogy:

P(A)  P(B)

b) Az A esemĂŠnyre ĂŠs ellentĂŠtjĂŠre az â€“ra igaz, hogy:

P(A)+ = 1

c) KĂŠt esemĂŠny fĂźggetlen egymĂĄstĂłl, ha szorzatukra igaz, hogy

P(A B) = P(A) P(B)

d) Ha az A1,A2,A3,...,An esemĂŠnyek pĂĄronkĂŠnt kizĂĄrjĂĄk egymĂĄst, akkor igaz az alĂĄbbi felbontĂĄs:

P(A1 + A2 + A3 + ... + An) = P(A1)+ P(A2)+ P(A3)+...+P(An)

Ennek az additivitĂĄsnak egy fontos esete az, ha a A1 + A2 + A3 + ... + An esemĂŠnyek teljes esemĂŠnyrendszert alkotnak, akkor:

P(A1)+ P(A2)+ P(A3)+...+P(An) = 1

3.5.2. Klasszikus valĂłszĂ­nĹąsĂŠgi modell

A valĂłszĂ­nĹąsĂŠget az egyes esemĂŠnyek relatĂ­v gyakorisĂĄga alapjĂĄn hatĂĄroztuk meg, amit Ăşgy szĂĄmĂ­tunk, hogy:

vagy

P(A) = 

PĂŠlda

1. Egy dobozban 5 piros, 3 fehĂŠr, 2 kĂŠk tabletta van.

Mi a valĂłszĂ­nĹąsĂŠge a kĂŠk tabletta hĂşzĂĄsĂĄnak?

MegoldĂĄs

Az összes lehetőségek száma n = 10. A kedvező lehetőségek száma k = 2

P(A) = 
 
 

3.5.3. FeltĂŠteles valĂłszĂ­nĹąsĂŠg

Legyen A és B két esemény és P(B)  0. Az A eseménynek a B esemény melletti feltételes valószínűsége az A esemény bekövetkezésének a valószínűségét jelenti, ha a B esemény mint feltétele az A eseménynek bekövetkezett:

P(A  B) = 

KĂśvetkezmĂŠny:

P(AB) = P(A  B)  P(B)

Ezt az egyenlőséget felhasználva, az A1,A2,A3,...,An események szorzatára kapjuk, hogy:

P(A1  A2  A3  ...  An) = P(An  A1A2A3...An–1)  P(An–1  A1A2A3...An–2)  ...  P(A2  A1)  P(A1)

PĂŠlda

Mennyi annak a valĂłszĂ­nĹąsĂŠge, hogy egy kĂŠtgyermekes csalĂĄdban mindkĂŠt gyermek fiĂş, ha

a) az idősebb gyermek fiú

b) legalĂĄbb az egyikĂźk fiĂş

(A fiĂş ĂŠs leĂĄny szĂźletĂŠsĂŠnek valĂłszĂ­nĹąsĂŠge azonos.)

MegoldĂĄs

Legyen A az az esemény, hogy az idősebb gyermek fiú, B a fiatalabb gyermek fiú. Ekkor a keresett feltételes valószínűségek

a) P(AB|A) = 
 
 

b) P(AB|A+B)=

3.5.4. NagyszĂĄmok gyenge tĂśrvĂŠnye

A kĂ­sĂŠrlet sorĂĄn az A esemĂŠny bekĂśvetkezĂŠsi valĂłszĂ­nĹąsĂŠge legyen

P(A) = p

ĂŠs az ellentett esemĂŠny () valĂłszĂ­nĹąsĂŠge:

P()= 1–p= q

Legyen  >0 tetszőleges valós szám, ekkor a nagy számok gyenge törvénye szerint:

A törvényt Bernoulli–féle törvénynek is nevezik. A törvény azt fejezi ki, hogy a kísérletszám (N) növelésével egyre kisebb lesz annak valószínűsége, hogy valamely esemény relatív gyakorisága és valószínűsége között nagy a különbség.

3.5.5. FĂźggetlensĂŠg

P(AB)=P(A)P(B)

3.5.6. Teljes valĂłszĂ­nĹąsĂŠg tĂŠtele

Ha a B1, B2, B3, ..., Bn események teljes eseményrendszert alkotnak és igaz továbbá, hogy P(Bi)  0 ,akkor tetszőleges A esemény valószínűségére igaz az alábbi kifejezés:

P(A) = 

vagyis az A esemĂŠny valĂłszĂ­nĹąsĂŠge a Bi esemĂŠnyek feltĂŠtele mellett meghatĂĄrozhatĂł.

PĂŠlda

Az anatĂłmia vizsgĂĄn az A csoport hallgatĂłinak 60% -a, a B csoport hallgatĂłinak 80%-a sikerrel szerepel. Az A csoport az ĂŠvfolyam 15%-ĂĄt teszi ki. Mi a valĂłszĂ­nĹąsĂŠge annak, hogy egy vĂŠletlenĂźl kivĂĄlasztott hallgatĂł sikeresen vizsgĂĄzik?

MegoldĂĄs

EsemĂŠnyek:

a) Legyen A a vizsgĂĄlt esemĂŠny.

b) Legyen C1 az az esemĂŠny, hogy a kivĂĄlasztott egyĂŠn A csoport beli. Ennek kivĂĄlasztĂĄsĂĄra az esĂŠly

P(C1) = 

c) Legyen C2 az az esemĂŠny, hogy a B csoportbĂłl vĂĄlasztottunk. Erre az esĂŠly

P(C2) = 

A sikeres vizsgĂĄzĂĄs valĂłszĂ­nĹąsĂŠge csoportonkĂŠnt

A csoport:

P(A|C1) = %

B csoport:

P(A|C2) = %

A teljes valĂłszĂ­nĹąsĂŠg tĂŠtele szerint

P(A) = P(A|C1)P(C1) + P(A|C2)P(C2) =

= 0.6*0.15 + 0.8*0.85 = 0.77

3.5.7. Bayes–tétel

Ha a B1, B2, B3, ..., Bn események teljes eseményrendszert alkotnak és igaz továbbá, hogy P(Bi)  0 és egy tetszőleges A eseményre P(A)  0,akkor a Bi eseményekre igaz az alábbi kifejezés:

Tehát a Bi események valószínűsége az A esemény bekövetkezése esetén mint feltétel mellett a formula segítségével meghatározható. A kifejezésben a P(Bi) valószínűséget priori valószínűségeknek nevezzük. A Bayes–tétel fontos alkalmazási területe a szakértői rendszerek világa. Pl. egy diagnosztikus folyamat leírása ezen az úton valósulhat meg.

PĂŠlda

Atomrobbanás környezetében háromzónát különböztetnek meg. Ezekben a túlélő lakosságnak 15, 40, 45 százaléka lakik. Az első zónában minden túlélő sugársérülést szenved, a második illetve a harmadik zónában 60 illetve 25 százalék ez az arány.

Mi a valószínűsége annak, hogy véletlenszerűen kiválasztva egy sugársérülést szenvedett egyént, az az első zónából való?

MegoldĂĄs

EsemĂŠnyek

A1: első zónából való

A2: mĂĄsodik zĂłnĂĄbĂłl valĂł

A3: harmadik zĂłnĂĄbĂłl valĂł

B : az illető sugársérült

Bayes tĂŠtele szerint

P(A1|B) = = 0.299  0.3
 
 

3.6. ValĂłszĂ­nĹąsĂŠgi vĂĄltozĂłk jellemzĂŠse

A biometriai vizsgálatok során megfigyelt vagy mért értékek véletlentől függő mennyiségek, amelyekhez számértékeket rendelünk. Ezeket a véletlen által befolyásolt értékeket közös néven valószínűségi változóknak (random variable) nevezzük. A változó név onnan származik, hogy az értéke megfigyelési egyedenként más és más értéket vehet fel, vagyis az érték egyedenként változik. Ezeket az értékeket bizonyos valószínűségek mellett veszik fel a változók, ezért használhatjuk a valószínűségi változó elnevezést.

A valĂłszĂ­nĹąsĂŠgi vĂĄltozĂłknak kĂŠt formĂĄjĂĄt ismerjĂźk: diszkrĂŠt ĂŠs folytonos valĂłszĂ­nĹąsĂŠgi vĂĄltozĂłkat.

3.6.1. DiszkrĂŠt valĂłszĂ­nĹąsĂŠgi vĂĄltozĂłk

Ha a  valószínűségi változó értékkészlete véges vagy megszámlálhatóan végtelen xk számsorozat, akkor magát a  –t diszkrét valószínűségi változónak nevezzük. Ha az Ak   olyan részhalmaz, amelynek elemi eseményeihez a  hozzárendeli az xk számsorozat értékeit, akkor az egyes események valószínűségeit (pk) a:

pk = P(Ak) = P( = xk)

formulåval lehet megadni. Az így meghatårozott valószínŹsÊgeket a  våltozó eloszlåsånak nevezzßk. A kÊplet azt fejezi ki, hogy a  valószínŹsÊgi våltozó az egyes xk ÊrtÊkeket milyen valószínŹsÊggel veszi fel.

Egy  valószínűségi változó eloszlásfüggvényét (distribution function) F(x) jelöljük és annak valószínűségét adja meg, hogy a  milyen valószínűséggel vesz fel egy tetszőleges x értéknél kisebb értéket. Jelölésben:

F(x) = P( < x)

Megjegyzendő, hogy a diszkrét valószínűségi változó F(x) eloszlásfüggvénye lépcsős alakú függvény.

Az F(x) eloszlĂĄsfĂźggvĂŠny tulajdonsĂĄgai az ĂĄbrĂĄrĂłl is leolvashatĂłk:

 balról folytonos,
 monoton növekedő,
 értéke 0 és l közötti.

3.6.2. Folytonos valĂłszĂ­nĹąsĂŠgi vĂĄltozĂłk

A valĂłszĂ­nĹąsĂŠgi vĂĄltozĂłk azon csoportjĂĄt, amelyek ĂŠrtĂŠkkĂŠszlete vĂŠges vagy nem megszĂĄmlĂĄlhatĂłan vĂŠgtelen, folytonos valĂłszĂ­nĹąsĂŠgi vĂĄltozĂłknak nevezzĂźk.

Az ilyen tĂ­pusĂş vĂĄltozĂł eloszlĂĄsfĂźggvĂŠnyĂŠnek meghatĂĄrozĂĄsa ĂŠppen a vĂŠgtelen ĂŠrtĂŠkkĂŠszlete miatt nehezebb mint diszkrĂŠt vĂĄltozĂł esetĂŠben. Az egyes tartomĂĄnyok (szakaszok) valĂłszĂ­nĹąsĂŠgĂŠnek megadĂĄsa ugyanis kĂśzvetlenĂźl nem lehetsĂŠges. EzĂŠrt kerĂźlt bevezetĂŠsre a sĹąrĹąsĂŠgfĂźggvĂŠny (f(x)) hasznĂĄlata, amelynek rĂŠvĂŠn minden szakasz valĂłszĂ­nĹąsĂŠge megadhatĂł a szakaszhoz tartozĂł fĂźggvĂŠnygĂśrbe alatti terĂźlet (integrĂĄljĂĄnak) nagysĂĄgĂĄval.

Az is mondható, hogy az eloszlåsfßggvÊny (F(x)) a sŹrŹsÊgfßggvÊny f(x) integrålja. Folytonos valószínŹsÊgi våltozók esetÊben mindig lÊtezik a  valószínŹsÊgi våltozónak sŹrŹsÊgfßggvÊnye. A sŹrŹsÊgfßggvÊny tulajdonsåga, hogy

 értéke  0 (hiszen a valószínűség nem lehet negatív értékű),

 a függvény görbe alatti területe = l (a valószínűség max. értéke csak 1 lehet).

Némely esetben a sűrűségfüggvény meghatározása nem egyszerű, mert ha ismerjük is, nem könnyű elvégezni a függvény integrálását. Ezért a biometriában leggyakrabban használt folytonos függvényekre mint pl. 2 eloszlás, normális eloszlás, F eloszlás, t eloszlás, stb. eloszlástáblázatokat készítettek éppen a gyakorlati munka megkönnyítése miatt. Ezekből a táblázatokból a kívánt valószínűségeket egyszerű módon ki lehet olvasni.

3.6.3. ValĂłszĂ­nĹąsĂŠgi vĂĄltozĂłk vĂĄrhatĂł ĂŠrtĂŠke

Ha egy kĂ­sĂŠrletet sokszor megismĂŠtlĂźnk ĂŠs mindegyik kĂ­sĂŠrletet egymĂĄstĂłl fĂźggetlenĂźl hajtjuk vĂŠgre, akkor a valĂłszĂ­nĹąsĂŠgi vĂĄltozĂłnak az egyes kĂ­sĂŠrletek sorĂĄn felvett ĂŠrtĂŠkei egy jĂłl meghatĂĄrozott ĂŠrtĂŠk kĂśrĂźl ingadoznak. Ezt az ĂŠrtĂŠket vĂĄrhatĂł ĂŠrtĂŠknek nevezzĂźk. DiszkrĂŠt valĂłszĂ­nĹąsĂŠgi vĂĄltozĂł esetĂŠn a vĂĄrhatĂł ĂŠrtĂŠk vĂŠges k esetĂŠn:

Folytonos eloszlású valószínűségi változó esetén az f(x) függvény – –től + –ig integrálja adja a várható értéket. Ennek meghatározása az esetek többségében nem könnyű feladat.

3.6.4. ValĂłszĂ­nĹąsĂŠgi vĂĄltozĂłk szĂłrĂĄsa

Egy valószínŹsÊgi våltozó ÊrtÊkeinek a vårható ÊrtÊke kÜrßli elhelyezkedÊsÊt, szóródåsåt nevezzßk a våltozó szóråsånak. JelÜlve D( ). Ennek nÊgyzete a variancia ami a  våltozó Ês vårható ÊrtÊke kßlÜnbsÊgÊnek a nÊgyzete, illetve ennek vårható ÊrtÊke:

Var( ) = D2( ) = M[ ( –M( ))2] = M( )–[ M( )2]

A szĂłrĂĄs nyilvĂĄn csak akkor van ĂŠrtelmezve, ha a vĂĄrhatĂł ĂŠrtĂŠk is lĂŠtezik.

DiszkrĂŠt valĂłszĂ­nĹąsĂŠgi vĂĄltozĂł esetĂŠn a szĂłrĂĄsnĂŠgyzet (variancia):

Var( ) = D2( ) = 

Folytonos valószínŹsÊgi våltozó esetÊn a Var( ) kÊtszeri integrålåssal hatårozható meg.

3.6.5. Nevezetes diszkrĂŠt eloszlĂĄsok

3.6.5.1. BinomiĂĄlis eloszlĂĄs

VĂŠgezzĂźnk el egy kĂ­sĂŠrletet n–szer egymĂĄstĂłl fĂźggetlenĂźl. A kĂ­sĂŠrlet sorĂĄn egy A esemĂŠny bekĂśvetkezĂŠsĂŠnek valĂłszĂ­nĹąsĂŠge legye P(A) = p ĂŠs az ellentett esemĂŠny valĂłszĂ­nĹąsĂŠge pedig = q = 1–p. A p–ről feltesszĂźk, hogy konstans a kĂ­sĂŠrlet folyamĂĄn. A  valĂłszĂ­nĹąsĂŠgi vĂĄltozĂł az A esemĂŠny bekĂśvetkezĂŠseinek a szĂĄmĂĄt jelenti. Ekkor annak valĂłszĂ­nĹąsĂŠge, hogy a kĂ­sĂŠrlet sorĂĄn az A esemĂŠny k–szor kĂśvetkezik be a kĂśvetkező alakban adhatĂł meg:

pk = P( = k) =  (k = 0, 1, 2, ..., n)

A  valószínŹsÊgi våltozó eloszlåsåt binomiålis eloszlåsnak nevezzßk, amelynek vårható ÊrtÊke:

M( ) = n p

ĂŠs szĂłrĂĄsa:

D( ) = 

formĂĄban hatĂĄrozhatĂł meg.

PĂŠlda

1. Egy bizonyos betegség a hagyományos terápiával az esetek egynegyed részében gyógyítható. Új kezelést akarnak bevezetni, melyet előzőleg 10 betegen kipróbálnak. Ha legalább heten meggyógyulnak, akkor az új kezelést bevezetik. Ha legfeljebb hárman gyógyulnak meg, akkor az új eljárást elvetik. Ha 4, 5, vagy 6 beteg gyógyul meg, akkor az eljárást tovább vizsgálják.

A kezelĂŠs hatĂĄsa a rĂŠgi terĂĄpiĂĄs eljĂĄrĂĄssal azonos. HatĂĄrozzuk meg a hĂĄrom esethez tartozĂł valĂłszĂ­nĹąsĂŠgeket.

MegoldĂĄs

JelĂśljĂźk a vizsgĂĄlt esemĂŠnyeket A, B, C betĹąkkel. Az esemĂŠnyek binomiĂĄlis eloszlĂĄst kĂśvetnek, Ă­gy

P(A)= 

P(B)=

P(C)=1-(P(A)+P(B)=1-(0.0035 + 0.7759) = 0.2206

3.6.5.2. Poisson–eloszlás

A

pk = P( = k) =  (k = 0, 1, 2, ...)

eloszlást a  valószínűségi változó Poisson–eloszlásának nevezzük, ahol  >0 egy tetszőleges valós szám.

Poisson eloszlást követnek pl. a kalácsban egy adott területre eső mazsolák száma, a lehulló hópelyhek száma egy adott tartományon, baktériumok, sejtek száma.egy adott téfogatban, balesetek száma egy időintervallumban, stb.

A Poisson–eloszlás és a binomiális eloszlás között szoros a kapcsolat. Ha a binomiális eloszlásban n nagy és a vizsgált esemény valószínűsége a p értéke 0–hoz közeli érték (az n p szorzat értéke < 5), ilyenkor a  = n p választással a binomiális eloszlás jól közelíthető a Poisson–eloszlással:

A Poisson–eloszlás várható értéke:

M( ) = 

szĂłrĂĄsa:

D( ) = 

PĂŠlda

Egy vizsgálat kimutatta, hogy egy adott tóban a baktériumok 2 baktérium/cm3 sűrűséggel fordulnak elő, és Poisson-típusú eloszlást követnek. Mi a valószínűsége, hogy egy 2 cm3 nagyságú minta

a) baktĂŠriummentes

b) legalĂĄbb kĂŠt baktĂŠriumot tartalmaz?

MegoldĂĄs

A mintåban 4 baktÊrium van, így  =4 paramÊterŹ Poisson-eloszlåssal van dolgunk.

a) P(k=0)=e-4=0.0183
 
 

b) 1-(P(k=0)+P(k=1))=1-5e-4=0.9080

3.7. Nevezetes folytonos eloszlĂĄsok

3.7.1. Egyenletes eloszlĂĄs

Az egyenletes eloszlĂĄs sĹąrĹąsĂŠgfĂźggvĂŠnye ĂŠs grafikonja:

f(x) = 

EloszlĂĄsfĂźggvĂŠnye:

F(x) = P( <x) = 

A vĂĄrhatĂł ĂŠrtĂŠk ĂŠs szĂłrĂĄs:

M( ) =  ĂŠs D( ) = 

3.7.2. ExponenciĂĄlis eloszlĂĄs

Az exponenciĂĄlis eloszlĂĄs sĹąrĹąsĂŠgfĂźggvĂŠnye:

f(x) = 

ahol x>0 tetszőleges pozitív szám.

Az exponenciĂĄlis eloszlĂĄsfĂźggvĂŠny alakja

F(x) = P( <x) = 

A vĂĄrhatĂł ĂŠrtĂŠk ĂŠs szĂłrĂĄs:

M( ) =  ĂŠs D( ) = 

ExponenciĂĄlis eloszlĂĄst kĂśvetnek pl. a radioaktĂ­v bomlĂĄsi folyamatok, az alkatrĂŠszek ĂŠlettartamai stb.

Az exponenciális eloszlás általánosított alakja a Weibull–eloszlás, amelynek sűrűségfüggvénye (c > 0 és  > 0 állandók):

f(x) = 

EloszlĂĄsfĂźggvĂŠnye:

F(x) = 

A Weibull–eloszlás egyik sajátságos felhasználási területe a gyógyszerkinetikai vizsgálatok.

3.7.3. NormĂĄlis eloszlĂĄs

A statisztikai vizsgálatok szempontjából az egyik legfontosabb eloszlás a normális eloszlás. Központi helyet foglal el a vizsgálatok között mivel számos statisztikai eljárás ezen az eloszlástípuson alapszik. Maga az elnevezés is arra utal, hogy a mért adatainktól az várjuk, hogy ilyen módon viselkedjenek, mert az a természetes, a normális viselkedése az adatoknak. Az eloszlás többféle elnevezéssel is használatos: Gauss–eloszlás, harang–görbe elnevezések szinonimái a normális jelzőnek.

Egy tetszőleges  valószínűségi változó normális eloszlású, ha sűrűségfüggvényére igaz az alábbi kifejezés:

f(x) = 

A kifejezésben a  és  az eloszlás két paramétere, ahol  tetszőleges valós szám, a  tetszőleges pozitív szám. Ez a két paraméter határozza meg, hogy a végtelen sok eloszlást tartalmazó ún. normális eloszláscsaládnak éppen melyik tagját vizsgáljuk.

Az ilyen típusú eloszlások szimmetrikus, egycsúcsú eloszlások, amelynek szárai a – és + –hez tartoznak. A függvények az X–tengelyt csak aszimptótikusan közelítik, de azt soha nem érintik. A görbe maximum helye az X–tengelyen a  értéknél van. A  paraméter a görbe szélességét, vagyis az adatok elhelyezkedését határozza meg.

Az eloszlĂĄs vĂĄrhatĂł ĂŠrtĂŠke ĂŠs szĂłrĂĄsa:

M( ) =  Ês D( ) = 

A harang–görbe csúcsa az eloszlás várható értékénél a  értéknél található.

Bármely normális eloszlásra igaz, hogy az adatok 68 %–a a várható értéktől a  – és  + távolságon belül helyezkednek el, vagyis az adatok a várható érték körül tömörülnek. További jellegzetessége az eloszlásnak, hogy az adatok 95 %–a a  –2 és  +2 értékek közt van és az adatok 5 %–a helyezkedik el ezen távolságokon kívül. Ez a rész az ún. farok rész (tail) a szignifikancia vizsgálatokban kap igen fontos szerepet. Ebbe a részbe csak kis valószínűséggel esnek adatok, s ezt a tulajdonságot használjuk fel döntéseinkhez.

Mivel a normális eloszlások átszámolhatók az egyikből a másikba, minden eloszlás azonos alakra hozható az ún. standardizálási eljárással. Az így kapott normális eloszlást standard normális eloszlásnak nevezzük, és igaz rá, hogy az eloszlás várható értéke a  = 0, szórása  = 1. A standardizálási formula, amellyel bármelyik  normális eloszlású változót egy új z változóba standardizálhatjuk:

zi

A kifejezés azt jelenti, hogy minden mért xi értékből levonjuk az eredeti normális eloszlás várható értékét és a különbséget osztjuk a szórással. Az így kapott zi értékek eloszlása standard normális eloszlású lesz. Az eljárás eredményeképpen az eloszlás szimmetria–tengelye az Y–tengely lesz és a szórások egységnyi távolságban helyezkednek el az origó körül. A standard normális eloszlás sűrűségfüggvénye:

 (x) = 

A standard normålis eloszlås sŹrŹsÊgfßggvÊnyÊre a  (x), az eloszlås fßggvÊnyÊre a  (x) jelÜlÊseket hasznåljuk.

A fĂźggvĂŠny tulajdonsĂĄgai az alĂĄbbiak szerint foglalhatĂł Ăśssze:

a) szimmetrikus függvény az y–tengelyre (az y tengely a szimmetria tengelye)

 (x) =  (–x) és  (–x) = 1– (x)

b) a fĂźggvĂŠny legmagasabb pontjĂĄnak koordinĂĄtĂĄi:

(0, ) ĂŠrtĂŠkek

c) a függvény görbe alatti területe = 1, ami azt jelenti, hogy egy standard normál eloszlású valószínűségi változó értékei 1 valószínűséggel a (– , + ) tartományból származnak

f) az a) ĂŠs e) pontok ĂŠrtelmĂŠben az y tengelytől jobbra ĂŠs balra első terĂźletek nagysĂĄga: 

g) egy tetszőleges ( , ) paraméterű normális eloszlású valószínűségi változó sűrűség és eloszlásfüggvénye kifejezhető a standard normális eloszlás hasonló függvényeivel:

sĹąrĹąsĂŠgfĂźggvĂŠny: f(x) = 

eloszlĂĄsfĂźggvĂŠny: F(x) = 

h) a binomiĂĄlis eloszlĂĄs tagjait jĂł megkĂśzelĂ­tĂŠssel meghatĂĄrozhatjuk a standard normĂĄlis eloszlĂĄs segĂ­tsĂŠgĂŠvel, ha az n nagy ĂŠs a p, q ĂŠrtĂŠkek nincsenek szorosan a 0 kĂśzelĂŠben, akkor:

a közelítés akkor jó, ha az n p>5 és n q>5 egyenlőtlenség teljesül.

Hasonló kapcsolat van a Poisson–eloszlás és standard normális eloszlás között is, ha a  elég nagy, akkor a Poisson–eloszlás jól közelíthető a standard normális eloszlással:

Példa. Tegyük fel, hogy a sorozáson megjelenő férfiak körében a systoles vérnyomásérték várható értéke 130 Hgmm és a szórása 12 Hgmm. Várhatóan a férfiaknak hány %–a esik a 140–150 Hgmm tartományba, ha a vérnyomás értékek eloszlása normális eloszlást követ?

Megoldås. A feladat ÊrtelmÊben a  = 130 Ês a  = 12. Transzformåljuk åt az ÊrtÊkeket z eloszlåsba, hogy a standard normålis eloszlås tåblåzatåt tudjuk hasznålni.

z1

z2

A keresett arĂĄnyt a z1 ĂŠs z2 ĂŠrtĂŠkek kĂśzĂśtti terĂźlet nagysĂĄga adja meg:

A terĂźlet megĂĄllapĂ­tĂĄsĂĄhoz hasznĂĄljuk az I. tĂĄblĂĄzatot:

T = z1.67 – z0.83 = 0.4554 – 0.2881 = 0.1673

vagyis

P(140  x  150) = 0.1673

Tehát várhatóan a férfiaknak 16.7 %–a esik az enyhe hipertóniás kategóriába.

3.8. CentrĂĄlis hatĂĄreloszlĂĄs tĂŠtele

A statisztikában oly fontos normális eloszlást a valószínűség számítás egyik alapvető tétele a központi (centrális) határeloszlás tétele biztosítja. A tétel szerint – szabad megfogalmazásban – egymástól független sok apró hatás együttes eredményeként keletkezett értékek eloszlása normális eloszlást követ függetlenül az összetevők eloszlásától.

Különösen fontos a tétel alkalmazhatósága az élettani folyamatok esetén, hiszen itt egy–egy jelenség számos független hatás eredőjeként alakul ki.

3.9. SzabadsĂĄgfok fogalma

A szabadságfok fogalmát Sir R.A. Fisher vezette be. Egy statisztika szabadságfokát – amelyet df–el (degrees of freedom) jelölünk a továbbiakban –, úgy definiáljuk, hogy az N mintaszámból levonjuk az adott statisztika kiszámításhoz szükséges, az adatokból már meghatározott paraméterek k számát.

df = N – k

A példa kedvéért az alább bemutatott statisztikák a későbbi fejezetekben részletesen tárgyalásra kerülnek.

PĂŠlda. Az n szĂĄmĂş minta adatbĂłl szĂĄmĂ­tott szĂĄmtani ĂĄtlag szabadsĂĄgfoka n, mivel az ĂĄtlag kiszĂĄmĂ­tĂĄsĂĄhoz csak a minta adatokat hasznĂĄljuk fel, a kĂŠpletben nincs olyan paramĂŠter, amit az adatokbĂłl szĂĄmolnĂĄnk ki:

A számlálóban csak a minta adatai, a nevezőben a minta száma szerepel.