- Formule i jednadžbe
- Kako izračunati grešku uzorkovanja
- Za razinu samopouzdanja
- Primjeri
- - Primjer 1
- Riješenje
- - Primjer 2
- Riješenje
- - Primjer 3
- Riješenje
- - Primjer 4
- Riješenje
- - Vježba 5
- Riješenje
- Reference
Uzorkovanja pogreška ili uzorkovanje greška u statistici je razlika između srednje vrijednosti uzorka i srednje vrijednosti ukupnog stanovništva. Da bismo ilustrirali ideju, zamislimo da je ukupno stanovništvo grada milijun ljudi, od čega želite prosječnu veličinu cipela za koju se uzima slučajni uzorak od tisuću ljudi.
Prosječna veličina koja proizlazi iz uzorka neće se nužno podudarati s veličinom ukupne populacije, iako ako uzorak nije pristran, vrijednost mora biti blizu. Ova razlika između srednje vrijednosti uzorka i ukupne populacije predstavlja grešku uzorkovanja.

Slika 1. Budući da je uzorak podskupina ukupne populacije, prosjek uzorka ima granicu pogreške. Izvor: F. Zapata.
Srednja vrijednost ukupne populacije općenito je nepoznata, ali postoje tehnike za smanjenje ove pogreške i formule za procjenu margine pogreške uzorkovanja koja će se raspravljati u ovom članku.
Formule i jednadžbe
Recimo da želimo znati srednju vrijednost određene mjerljive karakteristike x u populaciji veličine N, ali budući da je N veliki broj, nije izvedivo istraživanje na ukupnoj populaciji, a zatim nastavljamo s slučajnim uzorkom veličina n <
Srednja vrijednost uzorka označena je sa
Pretpostavimo da su uzeti m uzorci iz ukupne populacije N, svi jednake veličine n sa srednjim vrijednostima
Te srednje vrijednosti neće biti jednake jednakoj drugoj i sve će se kretati oko prosječne vrijednosti μ. Granica pogreške uzorkovanja E označava očekivano odvajanje srednjih vrijednosti
Standardna margina pogreške ε uzorka veličine n je:
ε = σ / √n
gdje je σ standardno odstupanje (kvadratni korijen varijance), koje se izračunava sljedećom formulom:
σ = √
Značenje standardne margine pogreške ε je sljedeće:
Srednja vrijednost
Kako izračunati grešku uzorkovanja
U prethodnom odlomku dana je formula za pronalaženje standardne granice pogreške na uzorku veličine n, gdje riječ standard označava da je riječ o granici pogreške s 68% pouzdanosti.
To ukazuje da će, ako je uzeto više uzoraka iste veličine n, 68% dati srednje vrijednosti
Postoji jednostavno pravilo, zvano pravilo 68-95-99.7, koje nam omogućava da lako pronađemo graničnu pogrešku uzorkovanja za razine pouzdanosti od 68%, 95% i 99.7%, budući da je ta granica 1⋅ ε, 2 ⋅ ε i 3⋅ ε.
Za razinu samopouzdanja
Ako razina pouzdanosti γ nije jedna od gore navedene, pogreška uzorkovanja je standardno odstupanje σ pomnoženo s faktorom Zγ, dobivenim sljedećim postupkom:
1.- Prvo, određuje se razina značajnosti α koja se izračunava iz razine pouzdanosti γ putem sljedećeg odnosa: α = 1 - γ
2.- Zatim moramo izračunati vrijednost 1 - α / 2 = (1 + γ) / 2, koja odgovara akumuliranoj normalnoj frekvenciji između -∞ i Zγ, u normalnoj ili Gaussovoj distribuciji tipiziranoj F (z), čija je definicija može se vidjeti na slici 2.
3. - Jednadžba F (Zγ) = 1 - α / 2 rješava se pomoću tablica normalne raspodjele (kumulativne) F, ili pomoću računalne aplikacije koja ima inverznu Gaussovu funkciju F -1.
U potonjem slučaju imamo:
Zγ = G -1 (1 - α / 2).
4.- Konačno, ova se formula primjenjuje za pogrešku uzorkovanja s razinom pouzdanosti γ:
E = Zγ ⋅ (σ / √n)

Slika 2. Tabela normalne raspodjele. Izvor: Wikimedia Commons.
Primjeri
- Primjer 1
Izračunajte standardnu granicu pogreške u srednjoj težini uzorka od 100 novorođenčadi. Izračun prosječne težine bio je
Riješenje
Standardna dopuštena pogreška je ε = σ / √n = (1.500 kg) / √100 = 0.15 kg. To znači da se s ovim podacima može zaključiti da je težina 68% novorođenčadi između 2950 kg i 3,25 kg.
- Primjer 2
Odredite granicu uzorkovanja pogreške E i raspon mase 100 novorođenčadi s razinom pouzdanosti od 95% ako je srednja težina 3.100 kg sa standardnim odstupanjem σ = 1.500 kg.
Riješenje
Ako se primjenjuje pravilo 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, imamo:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Drugim riječima, 95% novorođenčadi imat će težinu između 2.800 kg i 3.400 kg.
- Primjer 3
U primjeru 1 odredite raspon težine novorođenčadi s pouzdanošću od 99,7%.
Riješenje
Pogreška uzorkovanja s pouzdanošću od 99,7% je 3 σ / √n, što je za naš primjer E = 3 * 0,15 kg = 0,45 kg. Odavde proizlazi da će 99,7% novorođenčadi imati težinu između 2.650 kg i 3.550 kg.
- Primjer 4
Odredite faktor Zγ za razinu pouzdanosti od 75%. Odredite marginu pogreške uzorkovanja s ovom razinom pouzdanosti za slučaj predstavljen u primjeru 1.
Riješenje
Razina pouzdanosti je γ = 75% = 0,75, što se odnosi na razinu značajnosti α kroz odnos γ = (1 - α), tako da je razina značajnosti α = 1 - 0,75 = 0, 25.
To znači da je kumulativna normalna vjerojatnost između -∞ i Zγ:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Što odgovara vrijednosti Zγ od 1.1503, kao što je prikazano na slici 3.

Slika 3. Određivanje faktora Zγ koji odgovara nivou pouzdanosti od 75%. Izvor: F. Zapata kroz Geogebru.
Drugim riječima, pogreška uzorkovanja je E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Kada se primijeni na podatke iz primjera 1, daje pogrešku:
E = 1,15 * 0,15 kg = 0,17 kg
S razinom pouzdanosti od 75%.
- Vježba 5
Kolika je razina pouzdanosti ako je Z α / 2 = 2,4?
Riješenje
P (Z ≤ Z α / 2) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Razina značajnosti je:
α = 0,0164 = 1,64%
I na kraju, razina povjerenja ostaje:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Reference
- Canavos, G. 1988. Vjerojatnost i statistika: Primjene i metode. McGraw Hill.
- Devore, J. 2012. Vjerojatnost i statistika za inženjerstvo i znanost. 8.. Izdanje. Cengage.
- Levin, R. 1988. Statistika za administratore. 2.. Izdanje. Dvorana Prentice.
- Sudman, S. 1982. Postavljanje pitanja: Praktični vodič za izradu upitnika. San Francisco. Jossey Bass.
- Walpole, R. 2007. Vjerojatnost i statistika za inženjering i znanosti. Pearson.
- Wonnacott, TH i RJ Wonnacott. 1990. Uvodna statistika. 5. izd. Wiley
- Wikipedia. Pogreška uzorkovanja. Oporavilo sa: en.wikipedia.com
- Wikipedia. Pogreška. Oporavilo sa: en.wikipedia.com
