- Vrste stupnjeva slobode
- U mehaničkom slučaju
- U skupu slučajnih vrijednosti
- Primjeri
- Varijansa i stupnjevi slobode
- U distribuciji kvadrata Chi
- U testu hipoteze (s riješenim primjerom)
- Reference
U stupnjeva slobode u statistici su broj nezavisnih komponenti slučajnog vektora. Ako vektor ima n komponenti i postoje p linearne jednadžbe koje se odnose na njegove komponente, tada je stupanj slobode np.
Pojam stupnjeva slobode pojavljuje se i u teorijskoj mehanici, gdje su otprilike jednaki dimenziji prostora u kojem se čestica kreće, umanjenom broju veza.
Slika 1. Njihalo se kreće u dvije dimenzije, ali ima samo jedan stupanj slobode jer se prisiljava na pomicanje u luku radijusa L. Izvor: F. Zapata.
Ovaj će članak govoriti o konceptu stupnjeva slobode koji se primjenjuju na statistiku, ali mehanički je primjer lakše vizualizirati u geometrijskom obliku.
Vrste stupnjeva slobode
Ovisno o kontekstu u kojem se primjenjuje, način izračunavanja stupnjeva slobode može varirati, ali temeljna ideja je uvijek ista: ukupne dimenzije, manji broj ograničenja.
U mehaničkom slučaju
Razmotrimo oscilirajuću česticu vezanu uz niz (klatno) koji se kreće u vertikalnoj xy ravnini (2 dimenzije). Međutim, čestica se prisiljava kretati se po krugu polumjera jednakom duljini akorda.
Kako se čestica može kretati samo po toj krivulji, broj stupnjeva slobode je 1. To se može vidjeti na slici 1.
Način izračunavanja stupnja slobode je uzimanje razlike broja dimenzija umanjenih za broj ograničenja:
stupnjeva slobode: = 2 (dimenzije) - 1 (ligatura) = 1
Drugo objašnjenje koje nam omogućuje postizanje rezultata je sljedeće:
-Znamo da je položaj u dvije dimenzije predstavljen točkom koordinata (x, y).
-Ali budući da točka mora biti u skladu s jednadžbom obima (x 2 + y 2 = L 2) za zadanu vrijednost varijable x, varijabla y se određuje navedenom jednadžbom ili ograničenjem.
Na taj je način samo jedna od varijabli neovisna i sustav ima jedan (1) stupanj slobode.
U skupu slučajnih vrijednosti
Da bismo ilustrirali što pojam znači, pretpostavimo da je vektor
x = (x 1, x 2,…, x n)
Predstavlja uzorak od n normalno raspodijeljenih slučajnih vrijednosti. U ovom slučaju slučajni vektor x ima n neovisnih komponenti, pa je rečeno da x ima n stupnjeva slobode.
Konstruirajmo sada vektor r reziduala
r = (x 1 -
Gdje
Dakle zbroj
(x 1 -
To je jednadžba koja predstavlja ograničenje (ili vezanje) u elementima vektora r ostataka, jer ako su poznate n-1 komponente vektora r, jednadžba restrikcije određuje nepoznatu komponentu.
Stoga je vektor r dimenzije n s ograničenjem:
∑ (x i -
Ima (n - 1) stupnjeva slobode.
Opet se primjenjuje da je izračun broja stupnjeva slobode:
stupnjeva slobode: = n (dimenzije) - 1 (ograničenja) = n-1
Primjeri
Varijansa i stupnjevi slobode
Varijansa s 2 je definirana kao sredina kvadrata odstupanja (ili reziduala) uzorka n podataka:
s 2 = (r • r) / (n-1)
gdje je r vektor zaostataka r = (x1 -
s 2 = ∑ (x i -
U svakom slučaju, treba imati na umu da se prilikom izračuna srednje vrijednosti kvadrata zaostataka dijeli s (n-1), a ne s n, jer kao što je rečeno u prethodnom odjeljku, broj stupnjeva slobode vektora r je (n-1).
Ako bi se za izračun varijance podijelila s n umjesto s (n-1), rezultat bi imao pristranost koja je vrlo značajna za vrijednosti n manje od 50.
U literaturi se formula varijance također pojavljuje s djeliteljem n umjesto (n-1) kada je u pitanju varijanca populacije.
Ali skup slučajne varijable zaostataka, predstavljen vektorom r, iako ima dimenziju n, ima samo (n-1) stupnjeva slobode. Međutim, ako je broj podataka dovoljno velik (n> 500), obje formule konvergiraju se istom rezultatu.
Kalkulatori i proračunske tablice daju obje verzije varijance i standardno odstupanje (što je kvadratni korijen varijance).
Naša preporuka, s obzirom na ovdje predstavljenu analizu, je uvijek odabrati verziju s (n-1) svaki put kad je potrebno izračunati odstupanje ili standardno odstupanje, kako bi se izbjegli pristrani rezultati.
U distribuciji kvadrata Chi
Neke raspodjele vjerojatnosti u kontinuiranoj slučajnoj varijabli ovise o parametru koji se zove stupanj slobode, ovo je slučaj Chi distribucije (χ 2).
Naziv ovog parametra dolazi upravo od stupnjeva slobode temeljnog slučajnog vektora na koji se odnosi ova distribucija.
Pretpostavimo da imamo g populacije, iz kojih su uzeti uzorci veličine n:
X 1 = (x1 1, x1 2,…..x1 n)
X2 = (x2 1, x2 2,…..x2 n)
….
X j = (xj 1, xj 2,…..xj n)
….
Xg = (xg 1, xg 2,…..xg n)
Populacija j koja ima značenje
Standardizirana ili normalizirana varijabla zj i definirana je kao:
zj i = (xj i -
I vektor Zj je definiran ovako:
Zj = (zj 1, zj 2,…, zj i,…, zj n) i slijedi standardiziranu normalnu distribuciju N (0,1).
Dakle varijabla:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
slijedi χ 2 (g) distribucija koja se naziva hi-kvadratna distribucija sa stupnjem slobode g.
U testu hipoteze (s riješenim primjerom)
Kad želite testirati hipoteze na temelju određenog skupa slučajnih podataka, morate znati broj stupnjeva slobode g da biste primijenili Chi-kvadrat test.
Slika 2. Postoji li veza između preferiranog sladoleda GLASOVA i kupca SPOJA? Izvor: F. Zapata.
Kao primjer, analizirat će se podaci prikupljeni o preferencijama čokoladnog ili jagodnog sladoleda kod muškaraca i žena u određenom salonu sladoleda. Učestalost kojom muškarci i žene biraju jagode ili čokoladu sažet je na slici 2.
Prvo se izračunava tablica očekivanih frekvencija koja se priprema množenjem ukupnog broja redaka s ukupnim stupcima, podijeljenim s ukupnim podacima. Rezultat je prikazan na sljedećoj slici:
Slika 3. Izračun očekivanih frekvencija na temelju promatranih frekvencija (vrijednosti plave boje na slici 2). Izvor: F. Zapata.
Tada se izračunava Chi kvadrat (iz podataka) koristeći sljedeću formulu:
χ 2 = ∑ (F o - F e) 2 / F e
Gdje su F o promatrane frekvencije (slika 2) i F e su očekivane frekvencije (slika 3). Zbroj ide preko svih redaka i stupaca koji u našem primjeru daju četiri pojma.
Nakon obavljenih operacija dobivate:
χ 2 = 0,2043.
Sada je potrebno usporediti s teorijskim Chi kvadratom, koji ovisi o broju stupnjeva slobode g.
U našem slučaju ovaj se broj određuje na sljedeći način:
g = (# redaka - 1) (# stupaca - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Ispada da je broj stupnjeva slobode g u ovom primjeru 1.
Ako želite provjeriti ili odbaciti nultu hipotezu (H0: ne postoji povezanost TASTE i Spol) s razinom značaja od 1%, teorijska Chi-kvadratna vrijednost izračunava se sa stupnjem slobode g = 1.
Traži se vrijednost koja čini akumuliranu frekvenciju (1 - 0,01) = 0,99, to jest 99%. Ova vrijednost (koja se može dobiti iz tablica) je 6.636.
Kako teorijski Chi premašuje izračunati, tada je nulta hipoteza provjerena.
Drugim riječima, sa prikupljenim podacima ne opaža se odnos između varijabli TASTE i GENDER.
Reference
- Minitab. Koji su stupnjevi slobode? Oporavilo od: support.minitab.com.
- Moore, David. (2009) Osnovna primijenjena statistika. Antoni Bosch urednik.
- Leigh, Jennifer. Kako izračunati stupnjeve slobode u statističkim modelima. Oporavilo od: geniolandia.com
- Wikipedia. Stupanj slobode (statistika). Oporavak od: es.wikipedia.com
- Wikipedia. Stupanj slobode (fizički). Oporavak od: es.wikipedia.com