- Formula
- Karakteristike normalne distribucije
- Intervali povjerenja
- Primjene normalne distribucije
- Primjer
- Vježba riješena
- Reference
Normalna distribucija ili Gaussova distribucija je distribucija vjerojatnosti u kontinuiranom varijablom, u kojem je funkcija gustoće vjerojatnosti je opisao eksponencijalna funkcija kvadratna i negativne argumente, koji dovodi do oblika zvona.
Naziv normalne distribucije proizlazi iz činjenice da je ta distribucija ona koja se odnosi na najveći broj situacija u kojima je neka kontinuirana slučajna varijabla uključena u određenu skupinu ili populaciju.
Slika 1. Normalna raspodjela N (x; μ, σ) i njegova gustoća vjerojatnosti f (s; μ, σ). (Vlastita obrada)
Primjeri gdje se primjenjuje normalna raspodjela su: visina muškaraca ili žena, promjene u mjeri neke fizičke veličine ili u mjerljivim psihološkim ili sociološkim osobinama kao što su intelektualni kvocijent ili potrošačke navike određenog proizvoda.
S druge strane, naziva se Gaussovom distribucijom ili Gaussovim zvonom, jer je taj njemački matematički genij zaslužan za svoje otkriće za uporabu koju je dao za opisivanje statističke pogreške astronomskih mjerenja još u 1800. godini.
Međutim, navodi se da je ovu statističku raspodjelu još prije 1733. objavio drugi veliki matematičar francuskog podrijetla, poput Abraham de Moivre.
Formula
Funkcija normalne raspodjele u kontinuiranoj varijabli x, s parametrima μ i σ, označava se sa:
N (x; µ, σ)
i izričito je napisano ovako:
N (x; µ, σ) = ∫ -∞ x f (s; µ, σ) ds
gdje je f (u; μ, σ) funkcija gustoće vjerojatnosti:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2))
Konstanta koja množi eksponencijalnu funkciju u funkciji gustoće vjerojatnosti naziva se konstanta normalizacije, a odabrana je na način da:
N (+ ∞, μ, σ) = 1
Prethodni izraz osigurava da je vjerojatnost da je slučajna varijabla x između -∞ i + ∞ jednaka, odnosno 100% vjerojatnost.
Parametar μ je aritmetička sredina kontinuirane slučajne varijable x i σ standardno odstupanje ili kvadratni korijen varijance te iste varijable. U slučaju da su μ = 0 i σ = 1, tada imamo standardnu normalnu distribuciju ili tipičnu normalnu distribuciju:
N (x; μ = 0, σ = 1)
Karakteristike normalne distribucije
1- Ako slučajna statistička varijabla slijedi normalnu raspodjelu gustoće vjerojatnosti f (s; μ, σ), većina podataka je grupirana oko srednje vrijednosti μ i raštrkana je oko nje na način da je malo više od ⅔ podataka je između μ - σ i μ + σ.
2- Standardno odstupanje σ uvijek je pozitivno.
3- Oblik funkcije gustoće f sličan je obliku zvona, zbog čega se ova funkcija često naziva Gaussovo zvono ili Gaussova funkcija.
4- U Gaussovoj distribuciji prosjek, medijan i način podudaraju se.
5- Točke pregiba funkcije gustoće vjerojatnosti nalaze se točno na μ - σ i μ + σ.
6- Funkcija f je simetrična u odnosu na os koja prolazi kroz njezinu srednju vrijednost μ i ima asimptotički nulu za x ⟶ + ∞ i x ⟶ -∞.
7- Što je veća vrijednost σ, veća je disperzija, buka ili udaljenost podataka oko srednje vrijednosti. Drugim riječima, što je σ oblik zvona veći, σ je otvoreniji. S druge strane, σ mala označava da su kockice blizu srednje vrijednosti, a oblik zvona je zatvoreniji ili šiljastiji.
8- Funkcija raspodjele N (x; μ, σ) ukazuje na vjerojatnost da je slučajna varijabla manja ili jednaka x. Na primjer, na slici 1 (gore) vjerojatnost P da je varijabla x manja ili jednaka 1,5 iznosi 84% i odgovara području pod funkcijom gustoće vjerojatnosti f (x; μ, σ) iz -∞ do x.
Intervali povjerenja
9 - Ako podaci slijede normalnu distribuciju, tada je 68,26% između μ - σ i μ + σ.
10- 95,44% podataka koji slijede normalnu raspodjelu nalazi se između μ - 2σ i μ + 2σ.
11- 99.74% podataka koji slijede normalnu raspodjelu nalazi se između μ - 3σ i μ + 3σ.
12- Ako slučajna varijabla x slijedi raspodjelu N (x; μ, σ), tada je varijabla
z = (x - µ) / σ slijedi standardnu normalnu raspodjelu N (z; 0,1).
Promjena varijable x u z naziva se standardizacijom ili tipkanjem i vrlo je korisna kod primjene tablica standardne distribucije na podatke koji slijede nakon nestandardne normalne distribucije.
Primjene normalne distribucije
Za primjenu normalne raspodjele potrebno je proći kroz izračun integrala gustoće vjerojatnosti, što s analitičkog stajališta nije lako i ne postoji uvijek računalni program koji omogućava njegovo numeričko izračunavanje. U tu svrhu koriste se tablice normaliziranih ili standardiziranih vrijednosti, a to je ništa više od normalne raspodjele u slučaju μ = 0 i σ = 1.
Standardizirana tablica normalne distribucije (dio 1/2)
Standardizirana tablica normalne distribucije (dio 2/2)
Treba napomenuti da ove tablice ne uključuju negativne vrijednosti. Međutim, koristeći svojstva simetrije funkcije Gaussove gustoće vjerojatnosti, mogu se dobiti odgovarajuće vrijednosti. Dolje riješena vježba ukazuje na uporabu tablice u tim slučajevima.
Primjer
Pretpostavimo da imate skup slučajnih podataka x koji slijede normalnu raspodjelu srednje vrijednosti 10 i standardne devijacije 2. Od vas se traži da pronađete vjerojatnost da:
a) Slučajna varijabla x je manja ili jednaka 8.
b) je manji ili jednak 10.
c) da je varijabla x ispod 12.
d) Vjerojatnost da je x vrijednost između 8 i 12.
Riješenje:
a) Da biste odgovorili na prvo pitanje, jednostavno morate izračunati:
N (x; µ, σ)
S x = 8, μ = 10 i σ = 2. Shvaćamo da je riječ o integralu koji u elementarnim funkcijama nema analitičko rješenje, ali je rješenje izraženo funkcijom funkcije pogreške erf (x).
S druge strane, postoji mogućnost rješavanja integrala u numeričkom obliku, što čine mnogi kalkulatori, proračunske tablice i računalni programi poput GeoGebre. Sljedeća slika prikazuje numeričko rješenje koje odgovara prvom slučaju:
Slika 2. Gustoća vjerojatnosti f (x; μ, σ). Osjenčano područje predstavlja P (x ≤ 8). (Vlastita obrada)
a odgovor je da je vjerojatnost da je x ispod 8:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
b) U ovom slučaju pokušavamo pronaći vjerojatnost da je slučajna varijabla x ispod srednje vrijednosti, što u ovom slučaju vrijedi 10. Za odgovor nije potrebno nikakvo izračunavanje, jer znamo da je polovica podataka ispod prosjek, a druga polovica iznad prosjeka. Stoga je odgovor sljedeći:
P (x ≤ 10) = N (x = 10; µ = 10, σ = 2) = 0,5
c) Da bismo odgovorili na ovo pitanje, moramo izračunati N (x = 12; μ = 10, σ = 2), što se može učiniti pomoću kalkulatora koji ima statističke funkcije ili pomoću softvera kao što je GeoGebra:
Slika 3. Gustoća vjerojatnosti f (x; μ, σ). Osjenčano područje predstavlja P (x ≤ 12). (Vlastita obrada)
Odgovor na dio c može se vidjeti na slici 3 i glasi:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.
d) Da bismo pronašli vjerojatnost da je slučajna varijabla x između 8 i 12, možemo koristiti rezultate dijelova a i c kako slijedi:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Vježba riješena
Prosječna cijena dionica tvrtke iznosi 25 USD uz standardno odstupanje od 4 USD. Odredite vjerojatnost da:
a) Trošak akcije iznosi manje od 20 USD.
b) Trošak veći od 30 USD.
c) Cijena je između 20 i 30 dolara.
Za pronalaženje odgovora koristite standardne normalne tablice raspodjele.
Riješenje:
Da biste iskoristili tablice, potrebno je prijeći na normaliziranu ili tipkanu varijablu z:
$ 20 u normaliziranoj varijabli jednak je z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 i
30 dolara u normaliziranoj varijabli jednako je z = (30 USD - 25 USD) / $ 4 = +5/4 = +1,25.
a) $ 20 je jednaka -1,25 u normaliziranoj varijabli, ali tablica nema negativne vrijednosti, pa lociramo vrijednost +1,25 koja daje vrijednost 0,8944.
Ako se od ove vrijednosti oduzme 0,5, rezultat će biti područje između 0 i 1,25 koje je usput identično (po simetriji) području između -1,25 i 0. Rezultat oduzimanja je 0,8944 - 0,5 = 0,3944 što je područje između -1,25 i 0.
Ali zanimljivo je područje od -∞ do -1,25, što će biti 0,5 - 0,3944 = 0,1056. Stoga je zaključeno da je vjerojatnost da dionica bude ispod 20 dolara iznosi 10,56%.
b) 30 $ u tipkanoj varijabli z je 1,25. Za ovu vrijednost u tablici se prikazuje broj 0,8944, što odgovara području od -∞ do +1,25. Područje između +1,25 i + ∞ je (1 - 0,8944) = 0,1056. Drugim riječima, vjerojatnost da neki udio košta više od 30 USD iznosi 10,56%.
c) Vjerojatnost da akcija ima trošak između 20 i 30 USD izračunava se na sljedeći način:
100% -10,56% - 10,56% = 78,88%
Reference
- Statistika i vjerojatnost. Normalna distribucija. Oporavak od: projectdescartes.org
- GeoGebra. Klasična geogebra, proračun vjerojatnosti. Oporavak s geogebra.org
- MathWorks. Gausova distribucija. Oporavak od: es.mathworks.com
- Mendenhall, W. 1981. Statistika za menadžment i ekonomiju. 3.. izdanje. Grupo Uredništvo Iberoamérica.
- Stat Trek. Naučite se statistike. Poissonova distribucija. Oporavak od: stattrek.com,
- Triola, M. 2012. Osnovna statistika. 11.. Ed. Pearson Education.
- Sveučilište u Vigu. Glavne kontinuirane distribucije. Oporavak od: anapg.webs.uvigo.es
- Wikipedia. Normalna distribucija. Oporavilo sa: es.wikipedia.org