Pravilo Sturges je kriterij za određivanje broja razrednih odjela ili skupine koje su potrebne za crtanje skup statističkih podataka. Ovo je pravilo izglasio njemački matematičar Herbert Sturges 1926. godine.
Sturges je predložio jednostavnu metodu koja se temelji na broju uzoraka x koja će nam omogućiti da pronađemo broj klasa i njihovu širinu raspona. Sturgesovo pravilo se široko koristi, posebno u području statistike, posebno za izradu frekvencijskih histograma.

Obrazloženje
Pravilo Sturgesa je empirijska metoda koja se široko koristi u opisnoj statistici za određivanje broja klasa koje moraju postojati u frekvencijskom histogramu kako bi se klasificirao skup podataka koji predstavljaju uzorak ili populaciju.
U osnovi, ovo pravilo određuje širinu grafičkih spremnika, frekvencijski histogram.
Da bi uspostavio svoje pravilo, Herbert Sturges smatrao je idealnim frekvencijskim dijagramom, koji se sastoji od K intervala, gdje i-ti interval sadrži određeni broj uzoraka (i = 0,… k - 1), predstavljenih kao:

Taj se broj uzoraka daje brojem načina na koji se može izdvojiti podskupina skupa; to jest binomnim koeficijentom, izraženim na sljedeći način:


Kako bi pojednostavio izraz, primijenio je svojstva logaritma na oba dijela jednadžbe:

Sturges je stoga ustanovio da je optimalni broj intervala k dat izrazom:

Može se izraziti i:

U ovom izrazu:
- k je broj nastave.
- N je ukupni broj opažanja u uzorku.
- Dnevnik je uobičajeni logaritam baze 10.
Na primjer, za izgradnju frekvencijskog histograma koji izražava slučajni uzorak od 142 djece visine, broj intervala ili klasa koje će distribucija imati:
k = 1 + 3.322 * zapis 10 (N)
k = 1 + 3,322 * zapisnik (142)
k = 1 + 3.322 * 2.1523
k = 8,14 ≈ 8
Dakle, raspodjela će biti u 8 intervala.
Broj intervala uvijek mora biti predstavljen cijelim brojevima. U slučajevima kada je vrijednost decimalna, potrebno je približiti najbližem cijelom broju.
Prijave
Pravilo Sturgesa primjenjuje se uglavnom u statistici, jer omogućuje raspodjelu frekvencije pomoću izračuna broja klasa (k), kao i duljine svakog od njih, poznatog i kao amplituda.
Amplituda je razlika između gornje i donje granice klase, podijeljeno s brojem klasa, a izražava se:

Postoje mnoga pravila koja omogućuju distribuciju frekvencije. Međutim, obično se koristi Sturgesovo pravilo jer približava broj razreda, koji se obično kreće od 5 do 15.
Stoga smatra vrijednost koja adekvatno predstavlja uzorak ili populaciju; to jest, aproksimacija ne predstavlja ekstremno grupiranje, niti djeluje s prekomjernim brojem klasa koji ne dopuštaju sažimanje uzorka.
Primjer
Prema datim podacima potrebno je izraditi frekvencijski histogram, koji odgovara dobima dobivenim istraživanjem muškaraca koji vježbaju u lokalnoj teretani.

Da biste odredili intervale, treba znati veličinu uzorka ili broj opažanja; u ovom slučaju je 30.
Tada vrijedi pravilo Sturgesa:
k = 1 + 3.322 * zapis 10 (N)
k = 1 + 3,322 * zapisnik (30)
k = 1 + 3.322 * 1.4771
k = 5,90 ≈ 6 intervala.
Iz broja intervala može se izračunati njihova amplituda; to jest, širina svake trake prikazana u frekvencijskom histogramu:

Donja granica smatra se najmanjom vrijednošću podataka, a gornja granica najvećom vrijednošću. Razlika između gornje i donje granice naziva se rasponom ili rasponom varijable (R).
Iz tablice imamo da gornja granica iznosi 46, a donja granica 13; na taj način će amplituda svakog razreda biti:

Intervali će se sastojati od gornje i donje granice. Da bismo odredili ove intervale, započinjemo odbrojavanjem od donje granice, dodajući tome amplitudu određenu pravilom (6), na sljedeći način:

Tada se izračunava apsolutna frekvencija kako bi se odredio broj muškaraca koji odgovara svakom intervalu; u ovom slučaju je:
- Interval 1: 13 - 18 = 9
- Interval 2: 19 - 24 = 9
- Interval 3: 25 - 30 = 5
- Interval 4: 31 - 36 = 2
- Interval 5: 37 - 42 = 2
- Interval 6: 43 - 48 = 3
Kada dodate apsolutnu učestalost svakog razreda, to mora biti jednako ukupnom broju uzorka; u ovom slučaju 30.
Nakon toga se izračunava relativna frekvencija svakog intervala, pri čemu se njegova apsolutna frekvencija dijeli s ukupnim brojem opažanja:

- Interval 1: fi = 9 ÷ 30 = 0.30
- Interval 2: fi = 9 ÷ 30 = 0.30
- Interval 3: fi = 5 ÷ 30 = 0,1666
- Interval 4: fi = 2 ÷ 30 = 0,0666
- Interval 5: fi = 2 ÷ 30 = 0,0666
- Interval 4: fi = 3 ÷ 30 = 0,10
Zatim možete napraviti tablicu koja odražava podatke, a također i dijagram s relativne frekvencije u odnosu na dobivene intervale, kao što se može vidjeti na sljedećim slikama:


Na taj način, pravilo Sturgesa omogućuje određivanje broja klasa ili intervala na koje se uzorak može podijeliti, kako bi se sažeo uzorak podataka razrađivanjem tablica i grafikona.
Reference
- Alfonso Urquía, MV (2013). Modeliranje i simulacija diskretnih događaja. UNED,.
- Altman Naomi, MK (2015). "Jednostavna linearna regresija." Metode prirode.
- Antúnez, RJ (2014). Statistika u obrazovanju. Digitalna jedinica.
- Fox, J. (1997.). Primijenjena regresijska analiza, linearni modeli i srodne metode. SAGE Publikacije.
- Humberto Llinás Solano, CR (2005). Opisna statistika i distribucije vjerojatnosti. Sjeverno sveučilište.
- Panteleeva, OV (2005). Osnove vjerojatnosti i statistika.
- O. Kuehl, MO (2001). Dizajn eksperimenata: Statistički principi dizajna i analize istraživanja. Thomson Editors.
