- Formule i jednadžbe
- Važne statističke varijable
- Model i svojstva
- Glavna svojstva hipergeometrijske distribucije
- Približavanje primjenom binomne distribucije
- Primjer 2
- Riješene vježbe
- Vježba 1
- Riješenje
- Vježba 2
- Riješenje
- Vježba 3
- Rješenje za
- Rješenje c
- Reference
Hipergeometrijska distribucija je diskretna statistička funkcija, pogodan za izračun vjerojatnosti u randomiziranim pokusima s dva moguća ishoda. Uvjet koji se zahtijeva da se primijeni je da su to male populacije u kojima se povlačenja ne zamjenjuju i vjerojatnosti nisu stalne.
Stoga, kad se odabere element populacije koji će znati rezultat (istinit ili lažan) određene karakteristike, taj se isti element ne može ponovno odabrati.

Slika 1. U ovoj populaciji bolta sigurno ima neispravnih primjeraka. Izvor: Pixabay.
Dakako, vjerojatnije je da će sljedeći odabrani element dobiti pravi rezultat, ako je prethodni element imao negativan rezultat. To znači da vjerojatnost varira kako se elementi uzimaju iz uzorka.
Glavne primjene hipergeometrijske distribucije su: kontrola kvalitete u procesima s malo populacije i proračun vjerojatnosti u igrama na sreću.
Što se tiče matematičke funkcije koja definira hipergeometrijsku distribuciju, ona se sastoji od tri parametra koji su:
- Broj elemenata populacije (N)
- Veličina uzorka (m)
- Broj događaja u čitavoj populaciji s povoljnim (ili nepovoljnim) rezultatom proučavane karakteristike (n).
Formule i jednadžbe
Formula hipergeometrijske raspodjele daje vjerojatnost P da se pojave x povoljni slučajevi određene karakteristike. Način matematičkog pisanja na temelju kombinatornih brojeva je:

U prethodnom izrazu N, n i m su parametri, a x je sama varijabla.
- Ukupan broj stanovnika je N.
- Broj pozitivnih rezultata određene binarne karakteristike u odnosu na ukupnu populaciju je n.
-Kvalitet elemenata u uzorku je m.
U ovom je slučaju X slučajna varijabla koja uzima vrijednost x, a P (x) ukazuje na vjerojatnost pojave x povoljnih slučajeva ispitivane karakteristike.
Važne statističke varijable
Ostale statističke varijable za hipergeometrijsku distribuciju su:
- Srednje μ = m * n / N
- Varijanca σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Standardno odstupanje σ što je kvadratni korijen varijance.
Model i svojstva
Da bismo došli do modela hipergeometrijske distribucije, polazimo od vjerojatnosti dobivanja x povoljnih slučajeva u uzorku veličine m. Ovaj uzorak sadrži elemente koji se podudaraju sa svojstvom koji se proučava i elemente koji nemaju.
Podsjetimo da n predstavlja broj povoljnih slučajeva u ukupnoj populaciji N elemenata. Tada bi se vjerojatnost izračunala ovako:
Izražavajući gore navedeno u obliku kombinatornih brojeva, postiže se sljedeći model raspodjele vjerojatnosti:

Glavna svojstva hipergeometrijske distribucije
Oni su kako slijedi:
- Uzorak mora uvijek biti mali, čak i ako je populacija velika.
- Elementi uzorka izvlače se jedan po jedan bez uključivanja natrag u populaciju.
- Svojstvo koje se proučava je binarno, to jest može uzeti samo dvije vrijednosti: 1 ili 0, ili istinito ili lažno.
U svakom koraku ekstrakcije elementa vjerojatnost se mijenja ovisno o prethodnim rezultatima.
Približavanje primjenom binomne distribucije
Drugo svojstvo hipergeometrijske distribucije je da se ona može aproksimirati binomnom raspodjelom, označenom Bi, sve dok je populacija N velika i najmanje 10 puta veća od uzorka m. U ovom bi slučaju izgledalo ovako:
Vjerojatnost da su x = 3 vijka u uzorku neispravna je: P (500, 5, 60, 3) = 0,0129.
Sa svoje strane, vjerojatnost da je x = 4 vijka od šezdeset uzorka neispravna je: P (500, 5, 60; 4) = 0,0008.
Konačno, vjerojatnost da su x = 5 vijaka u tom uzorku neispravna je: P (500, 5, 60; 5) = 0.
Ali ako želite znati vjerojatnost da u tom uzorku ima više od 3 neispravna vijka, tada morate dobiti kumulativnu vjerojatnost dodajući:
Ovaj je primjer prikazan na slici 2, dobivenom upotrebom GeoGebre, besplatnog softvera koji se široko koristi u školama, institutima i na sveučilištima.

Slika 2. Primjer hipergeometrijske distribucije. Pripremio F. Zapata s GeoGebrom.
Primjer 2
Španjolska paluba ima 40 karata, od kojih 10 ima zlato, a preostalih 30 nema. Pretpostavimo da je iz te palube nasumično izvučeno 7 karata koje nisu ponovno uključene u špil.
Ako je X broj zlata prisutnih u izvučenih 7 karata, vjerojatnost da ćete imati x zlata u izvlačenju sa 7 karata dana je hipergeometrijskom raspodjelom P (40,10,7; x).
Pogledajmo ovo ovako: da bismo izračunali vjerojatnost 4 zlata u izvlačenju sa 7 karata, koristimo formulu hipergeometrijske distribucije sa sljedećim vrijednostima:

A rezultat je: 4,57% vjerojatnost.
Ali ako želite znati vjerojatnost dobivanja više od 4 kartice, tada morate dodati:
Riješene vježbe
Sljedeći skup vježbi namijenjen je ilustraciji i asimilaciji pojmova koji su predstavljeni u ovom članku. Važno je da ih čitatelj pokuša riješiti sam, prije nego što pogleda rješenje.
Vježba 1
Tvornica kondoma utvrdila je da je na svakih 1000 kondoma proizvedenih od određenog stroja 5 neispravnih. Za kontrolu kvalitete uzima se nasumično 100 kondoma, a serija se odbacuje ako postoji barem jedan ili više neispravnih. Odgovor:
a) Koja je mogućnost da će puno 100 biti odbačeno?
b) Je li ovaj kriterij kontrole kvalitete učinkovit?
Riješenje
U ovom će se slučaju pojaviti vrlo veliki kombinatorički brojevi. Proračun je težak, osim ako nemate odgovarajući softverski paket.
Ali s obzirom da je riječ o velikoj populaciji i da je uzorak deset puta manji od ukupne populacije, moguće je upotrijebiti aproksimaciju hipergeometrijske distribucije binomnom raspodjelom:
U gornjem izrazu C (100, x) je kombinatorni broj. Tada će se vjerojatnost pojavljivanja više od jednog oštećenog izračunati ovako:
To je izvrsna aproksimacija u usporedbi s vrijednošću dobivenom primjenom hipergeometrijske distribucije: 0,4102
Može se reći da s 40% vjerojatnosti treba odbaciti seriju od 100 profilaktičkih lijekova, što nije baš učinkovito.
Ali, ako ste malo manje zahtjevni u procesu kontrole kvalitete i odbacite seriju 100 samo ako postoje dva ili više nedostataka, vjerojatnost da se lota odbaci, pala bi na samo 8%.
Vježba 2
Stroj za plastični blok djeluje na takav način da za svakih 10 komada jedan izlazi deformiran. U uzorku od 5 komada, koliko je vjerojatno da je samo jedan komad neispravan?
Riješenje
Stanovništvo: N = 10
Broj n kvarova za svako N: n = 1
Veličina uzorka: m = 5

Stoga postoji 50% vjerojatnost da će se u uzorku 5 deformirati blok.
Vježba 3
Na sastanku mladih maturanata gimnazije dolazi 7 dama i 6 gospode. Među djevojčicama 4 studije humanističkih znanosti i 3 znanosti. U dječačkoj skupini 1 studij humanističkih znanosti i 5 znanosti. Izračunajte sljedeće:
a) Nasumično odabir tri djevojke: koliko je vjerojatno da sve proučavaju humanističke znanosti?
b) Ako su nasumično izabrana tri sudionika sastanka prijatelja: Koja je mogućnost da njih troje, bez obzira na spol, prouče sve tri znanosti ili humanističke znanosti?
c) Sada odaberite nasumično dva prijatelja i nazovite x slučajnu varijablu "broj onih koji proučavaju humanističke znanosti". Između dva odabrana odredi srednju ili očekivanu vrijednost x i varijancu σ ^ 2.
Rješenje za
Vrijednosti koje sada treba koristiti su:
-Populacija: N = 14
-Kvaliteta koja proučava slova je: n = 6 i
- Veličina uzorka: m = 3.
-Broj prijatelja koji studiraju humanističke znanosti: x
Prema ovom, x = 3 znači da sve tri proučavaju humanističke znanosti, ali x = 0 znači da nijedna ne proučava humanističke znanosti. Vjerojatnost da sva tri studija proučavaju isto je dana zbrojem:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Tada imamo 21% vjerojatnosti da će tri sudionika sastanka, izabrana nasumično, proučiti istu stvar.
Rješenje c
Ovdje imamo sljedeće vrijednosti:
N = 14 ukupna populacija prijatelja, n = 6 ukupan broj u populaciji koja proučava humanističke znanosti, veličina uzorka je m = 2.
Nada je:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
I varijanca:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / (13) = 0,4521
Reference
- Diskretne distribucije vjerojatnosti Oporavak od: biplot.usal.es
- Statistika i vjerojatnost. Hipergeometrijska distribucija. Oporavak od: projectdescartes.org
- CDPYE-UGR. Hipergeometrijska distribucija. Oporavak od: ugr.es
- GeoGebra. Klasična geogebra, proračun vjerojatnosti. Oporavak s geogebra.org
- Pokušajte jednostavno. Riješeni problemi hipergeometrijske distribucije. Oporavak od: probafacil.com
- Minitab. Hipergeometrijska distribucija. Oporavilo od: support.minitab.com
- Sveučilište u Vigu. Glavne diskretne distribucije. Oporavak od: anapg.webs.uvigo.es
- Vitutor. Statistika i kombinatorika. Oporavilo od: vitutor.net
- Weisstein, Eric W. Hipergeometrijska distribucija. Oporavak od: mathworld.wolfram.com
- Wikipedia. Hipergeometrijska distribucija. Oporavak od: es.wikipedia.com
