- Prednosti i nedostatci
- Nedostaci raspona kao mjera disperzije
- Interkvartilni raspon, kvartili i primjer djela
- - Izračun kvartila
- Prvi kvartil
- Drugi kvartil ili medijan
- Treći kvartil
- Primjer rada
- Rješenje za
- Rješenje b
- Rješenje c
- Reference
Raspon, raspon ili amplituda u statistici, se razlika (oduzimanje) između maksimalne i minimalne vrijednosti skupa podataka iz uzorka ili populaciji. Ako je raspon predstavljen slovom R, a podaci predstavljeni s x, formula za raspon je jednostavno:
R = x max - x min
Gdje je x max maksimalna vrijednost podataka, a x min je minimalna.
Slika 1. Raspon podataka koji odgovara stanovništvu Cádiza u posljednja dva stoljeća. Izvor: Wikimedia Commons.
Koncept je vrlo koristan kao jednostavna mjera disperzije za brzu procjenu varijabilnosti podataka, jer ukazuje na produljenje ili duljinu intervala na kojem se nalaze.
Na primjer, pretpostavimo da se mjeri visina grupe od 25 muškaraca studenta prve godine studija na sveučilištu. Najviši učenik u skupini je 1,93 m, a najkraći 1,67 m. Ovo su ekstremne vrijednosti uzorka, pa je njihov put:
R = 1,93 - 1,67 m = 0,26 m ili 26 cm.
Visina učenika u ovoj grupi raspoređena je po tom rasponu.
Prednosti i nedostatci
Raspon je, kao što smo već rekli, mjerilo raširenosti podataka. Mali raspon ukazuje na to da su podaci više ili manje bliski, a rasprostranjenost mala. S druge strane, veći raspon ukazuje na to da se podaci više raspršuju.
Prednosti izračuna raspona su očite: vrlo je lako i brzo pronaći, jer je to jednostavna razlika.
Također ima iste jedinice kao i podaci s kojima radi, a koncept je vrlo lako protumačiti za bilo kojeg promatrača.
Na primjeru visine studenata strojarstva, ako je raspon bio 5 cm, rekli bismo da su svi studenti približno iste veličine. Ali s rasponom od 26 cm, odmah pretpostavljamo da u uzorku postoje studenti svih srednjih visina. Je li ta pretpostavka uvijek ispravna?
Nedostaci raspona kao mjera disperzije
Ako pažljivo pogledamo, može se dogoditi da u našem uzorku od 25 studenata strojarstva samo jedan mjeri 1,93, a preostala 24 visine blizu 1,67 m.
Pa ipak, domet ostaje isti, iako je potpuno moguće suprotno: visina većine je oko 1,90 m, a samo jedna 1,67 m.
U oba slučaja, distribucija podataka prilično je različita.
Nedostaci raspona kao mjere disperzije su zato što koristi samo ekstremne vrijednosti i zanemaruje sve ostale. Budući da je većina informacija izgubljena, nemate pojma kako se distribuiraju uzorci.
Druga važna karakteristika je da se raspon uzorka nikada ne smanjuje. Ako dodamo više informacija, tj. Razmotrimo više podataka, raspon se povećava ili ostaje isti.
I u svakom slučaju, koristan je samo pri radu s malim uzorcima, njegova jedina uporaba kao mjera disperzije u velikim uzorcima se ne preporučuje.
Ono što treba učiniti jest nadopuniti je s izračunavanjem drugih mjera disperzije koje uzimaju u obzir informacije koje daju ukupni podaci: interkvartilni raspon, varijanca, standardna devijacija i koeficijent varijacije.
Interkvartilni raspon, kvartili i primjer djela
Shvatili smo da je slabost raspona kao mjera disperzije ta što se koriste samo ekstremne vrijednosti raspodjele podataka, izostavljajući ostale.
Da biste izbjegli ovu neugodnost, koriste se kvartili: tri vrijednosti poznate kao mjere mjere.
Oni raspodjeljuju neugruficirane podatke u četiri dijela (ostale široko korištene mjere položaja su decilici i postotci). Ovo su njegove karakteristike:
-U prvi kvartil Q 1 je vrijednost podataka, tako da 25% svih njih je manje od Q 1.
-U drugi kvartil Q 2 je medijan distribucije, što znači da je pola (50%) spoja iz podataka manja od ove vrijednosti.
-Finally, treći kvartil Q 3 pokazuje da je 75% od podataka su manje od Q 3.
Zatim je interkvartilni raspon ili interkvartilni raspon se definira kao razlika između trećeg kvartilno Q 3 i prvog kvartilno Q 1 podataka:
Interkvartilni raspon = R Q = Q 3 - Q 1
Na taj način ekstremne vrijednosti ne utiču na vrijednost raspona R Q. Iz tog razloga, preporučljivo je koristiti ga kod iskrivljene distribucije, poput one opisane u visokim ili vrlo kratkim učenicima.
- Izračun kvartila
Postoji nekoliko načina kako ih izračunati, ovdje ćemo predložiti jedan, ali u svakom slučaju potrebno je znati broj narudžbe "N o ", što je mjesto koje pripadajući četverokut zauzima u distribuciji.
To jest, ako na primjer izraz koji odgovara Q 1 je drugi, treći ili četvrti i tako dalje distribucije.
Prvi kvartil
N ili (Q 1) = (N + 1) / 4
Drugi kvartil ili medijan
N ili (Q 2) = (N + 1) / 2
Treći kvartil
N ili (Q 3) = 3 (n + 1) / 4
Gdje je N broj podataka.
Medijana je vrijednost koja je tačno u sredini distribucije. Ako je broj podataka neparan, nema problema s njihovim pronalaženjem, ali ako je paran, dvije su središnje vrijednosti u prosjeku i postaju jedna.
Nakon izračuna broja, slijedi se jedno od ova tri pravila:
-Ako nema decimalnih brojeva, pretražuju se podaci navedeni u distribuciji i to će biti traženi kvartil.
-Kada je broj naloga na pola puta između dva, tada se podaci označeni cijelim dijelom uspoređuju sa sljedećim podacima, a rezultat je odgovarajući kvartil.
-U svakom drugom slučaju, zaokružuje se na najbliži cijeli broj i to će biti položaj kvartila.
Primjer rada
Na skali od 0 do 20, grupa od 16 studenata I matematike I osvojila je sljedeće ocjene na srednjoškolskom ispitu:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Pronaći:
a) Raspon ili raspon podataka.
b) Vrijednosti kvartila Q 1 i Q 3
c) Interkvartilni raspon.
Slika 2. Imaju li rezultati na ovom matematičkom testu toliku varijabilnost? Izvor: Pixabay.
Rješenje za
Prvo što trebate pronaći kako biste pronašli rutu je da se podaci naručuju u sve većem ili smanjenom redoslijedu. Na primjer, u povećanju redoslijeda imate:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Koristeći formulu navedenu na početku: R = x max - x min
R = 20 - 1 bod = 19 bodova.
Prema rezultatu, ove ocjene imaju veliku disperziju.
Rješenje b
N = 16
N ili (Q 1) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
To je broj s decimalama, čiji je cijeli broj 4., a zatim idemo na distribuciju, tražimo podatke koji zauzimaju četvrto mjesto i čija je vrijednost uspoređena s onom petog mjesta. Budući da su obojica 9, prosjek je također 9 i tako:
Q 1 = 9
Sada ponavljamo postupak za pronalaženje Q 3:
N ili (Q 3) = 3 (n + 1) / 4 = 3 (16 + 1) = 12.75 / 4
Opet je decimalna, ali s obzirom da nije na pola puta, zaokružen je na 13. Traženi kvart zauzima trinaestu poziciju i glasi:
Q 3 = 16
Rješenje c
R Q = Q 3 - Q 1 = 16 - 9 = 7 bodova.
Kao što vidimo, mnogo je manji od raspona podataka izračunatih u odjeljku a), jer je minimalna ocjena bila 1 bod, a vrijednost znatno dalje od ostatka.
Reference
- Berenson, M. 1985. Statistika za menadžment i ekonomiju. Interamericana SA
- Canavos, G. 1988. Vjerojatnost i statistika: Primjene i metode. McGraw Hill.
- Devore, J. 2012. Vjerojatnost i statistika za inženjerstvo i znanost. 8.. Izdanje. Cengage.
- Primjeri kvartila. Oporavak od: matematicas10.net.
- Levin, R. 1988. Statistika za administratore. 2.. Izdanje. Dvorana Prentice.
- Walpole, R. 2007. Vjerojatnost i statistika za inženjering i znanosti. Pearson.