POGREŠKA UZORKOVANJA: FORMULE I JEDNADŽBE, PRORAČUN, PRIMJERI - DUDÁS

Uzorkovanja pogreška ili uzorkovanje greška u statistici je razlika između srednje vrijednosti uzorka i srednje vrijednosti ukupnog stanovništva. Da bismo ilustrirali ideju, zamislimo da je ukupno stanovništvo grada milijun ljudi, od čega želite prosječnu veličinu cipela za koju se uzima slučajni uzorak od tisuću ljudi.

Prosječna veličina koja proizlazi iz uzorka neće se nužno podudarati s veličinom ukupne populacije, iako ako uzorak nije pristran, vrijednost mora biti blizu. Ova razlika između srednje vrijednosti uzorka i ukupne populacije predstavlja grešku uzorkovanja.

Slika 1. Budući da je uzorak podskupina ukupne populacije, prosjek uzorka ima granicu pogreške. Izvor: F. Zapata.

Srednja vrijednost ukupne populacije općenito je nepoznata, ali postoje tehnike za smanjenje ove pogreške i formule za procjenu margine pogreške uzorkovanja koja će se raspravljati u ovom članku.

Formule i jednadžbe

Recimo da želimo znati srednju vrijednost određene mjerljive karakteristike x u populaciji veličine N, ali budući da je N veliki broj, nije izvedivo istraživanje na ukupnoj populaciji, a zatim nastavljamo s slučajnim uzorkom veličina n <

Srednja vrijednost uzorka označena je sa a srednja vrijednost ukupnog stanovništva označena je grčkim slovom μ (čitaj mu ili miu).

Pretpostavimo da su uzeti m uzorci iz ukupne populacije N, svi jednake veličine n sa srednjim vrijednostima 1 ', 2 ', 3>,….m>.

Te srednje vrijednosti neće biti jednake jednakoj drugoj i sve će se kretati oko prosječne vrijednosti μ. Granica pogreške uzorkovanja E označava očekivano odvajanje srednjih vrijednosti u odnosu na srednju vrijednost populacije μ unutar određenog postotka naziva se razinom pouzdanosti γ (gama).

Standardna margina pogreške ε uzorka veličine n je:

ε = σ / √n

gdje je σ standardno odstupanje (kvadratni korijen varijance), koje se izračunava sljedećom formulom:

σ = √

Značenje standardne margine pogreške ε je sljedeće:

Srednja vrijednost dobivena uzorkom veličine n uključena je u interval ( - ε, + ε) s razinom pouzdanosti od 68,3%.

Kako izračunati grešku uzorkovanja

U prethodnom odlomku dana je formula za pronalaženje standardne granice pogreške na uzorku veličine n, gdje riječ standard označava da je riječ o granici pogreške s 68% pouzdanosti.

To ukazuje da će, ako je uzeto više uzoraka iste veličine n, 68% dati srednje vrijednosti u rasponu.

Postoji jednostavno pravilo, zvano pravilo 68-95-99.7, koje nam omogućava da lako pronađemo graničnu pogrešku uzorkovanja za razine pouzdanosti od 68%, 95% i 99.7%, budući da je ta granica 1⋅ ε, 2 ⋅ ε i 3⋅ ε.

Za razinu samopouzdanja

Ako razina pouzdanosti γ nije jedna od gore navedene, pogreška uzorkovanja je standardno odstupanje σ pomnoženo s faktorom Zγ, dobivenim sljedećim postupkom:

1.- Prvo, određuje se razina značajnosti α koja se izračunava iz razine pouzdanosti γ putem sljedećeg odnosa: α = 1 - γ

2.- Zatim moramo izračunati vrijednost 1 - α / 2 = (1 + γ) / 2, koja odgovara akumuliranoj normalnoj frekvenciji između -∞ i Zγ, u normalnoj ili Gaussovoj distribuciji tipiziranoj F (z), čija je definicija može se vidjeti na slici 2.

3. - Jednadžba F (Zγ) = 1 - α / 2 rješava se pomoću tablica normalne raspodjele (kumulativne) F, ili pomoću računalne aplikacije koja ima inverznu Gaussovu funkciju F ^-1.

U potonjem slučaju imamo:

Zγ = G ^-1 (1 - α / 2).

4.- Konačno, ova se formula primjenjuje za pogrešku uzorkovanja s razinom pouzdanosti γ:

E = Zγ ⋅ (σ / √n)

Slika 2. Tabela normalne raspodjele. Izvor: Wikimedia Commons.

Primjeri

- Primjer 1

Izračunajte standardnu granicu pogreške u srednjoj težini uzorka od 100 novorođenčadi. Izračun prosječne težine bio je= 3.100 kg sa standardnim odstupanjem σ = 1.500 kg.

Riješenje

Standardna dopuštena pogreška je ε = σ / √n = (1.500 kg) / √100 = 0.15 kg. To znači da se s ovim podacima može zaključiti da je težina 68% novorođenčadi između 2950 kg i 3,25 kg.

- Primjer 2

Odredite granicu uzorkovanja pogreške E i raspon mase 100 novorođenčadi s razinom pouzdanosti od 95% ako je srednja težina 3.100 kg sa standardnim odstupanjem σ = 1.500 kg.

Riješenje

Ako se primjenjuje pravilo 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, imamo:

E = 2⋅ε = 2⋅0,15 kg = 0,30 kg

Drugim riječima, 95% novorođenčadi imat će težinu između 2.800 kg i 3.400 kg.

- Primjer 3

U primjeru 1 odredite raspon težine novorođenčadi s pouzdanošću od 99,7%.

Riješenje

Pogreška uzorkovanja s pouzdanošću od 99,7% je 3 σ / √n, što je za naš primjer E = 3 * 0,15 kg = 0,45 kg. Odavde proizlazi da će 99,7% novorođenčadi imati težinu između 2.650 kg i 3.550 kg.

- Primjer 4

Odredite faktor Zγ za razinu pouzdanosti od 75%. Odredite marginu pogreške uzorkovanja s ovom razinom pouzdanosti za slučaj predstavljen u primjeru 1.

Riješenje

Razina pouzdanosti je γ = 75% = 0,75, što se odnosi na razinu značajnosti α kroz odnos γ = (1 - α), tako da je razina značajnosti α = 1 - 0,75 = 0, 25.

To znači da je kumulativna normalna vjerojatnost između -∞ i Zγ:

P (Z ≤ Zγ) = 1 - 0,125 = 0,875

Što odgovara vrijednosti Zγ od 1.1503, kao što je prikazano na slici 3.

Slika 3. Određivanje faktora Zγ koji odgovara nivou pouzdanosti od 75%. Izvor: F. Zapata kroz Geogebru.

Drugim riječima, pogreška uzorkovanja je E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).

Kada se primijeni na podatke iz primjera 1, daje pogrešku:

E = 1,15 * 0,15 kg = 0,17 kg

S razinom pouzdanosti od 75%.

- Vježba 5

Kolika je razina pouzdanosti ako je Z _{α / 2} = 2,4?

Riješenje

P (Z ≤ Z _{α / 2}) = 1 - α / 2

P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164

Razina značajnosti je:

α = 0,0164 = 1,64%

I na kraju, razina povjerenja ostaje:

1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%

Reference

Canavos, G. 1988. Vjerojatnost i statistika: Primjene i metode. McGraw Hill.
Devore, J. 2012. Vjerojatnost i statistika za inženjerstvo i znanost. 8.. Izdanje. Cengage.
Levin, R. 1988. Statistika za administratore. 2.. Izdanje. Dvorana Prentice.
Sudman, S. 1982. Postavljanje pitanja: Praktični vodič za izradu upitnika. San Francisco. Jossey Bass.
Walpole, R. 2007. Vjerojatnost i statistika za inženjering i znanosti. Pearson.
Wonnacott, TH i RJ Wonnacott. 1990. Uvodna statistika. 5. izd. Wiley
Wikipedia. Pogreška uzorkovanja. Oporavilo sa: en.wikipedia.com
Wikipedia. Pogreška. Oporavilo sa: en.wikipedia.com

POGREŠKA UZORKOVANJA: FORMULE I JEDNADŽBE, PRORAČUN, PRIMJERI - DUDÁS - 2026

Formule i jednadžbe

Kako izračunati grešku uzorkovanja

Za razinu samopouzdanja

Primjeri

- Primjer 1

Riješenje

- Primjer 2

Riješenje

- Primjer 3

Riješenje

- Primjer 4

Riješenje

- Vježba 5

Riješenje

Reference

Izbor urednika