Oznaka klase, poznata i kao srednja točka, je vrijednost u središtu klase, koja predstavlja sve vrijednosti koje su u toj kategoriji. Oznaka klase se u osnovi koristi za izračunavanje određenih parametara, poput aritmetičke srednje vrijednosti ili standardnog odstupanja.
Dakle, oznaka klase je sredina bilo kojeg intervala. Ova je vrijednost također vrlo korisna za pronalaženje varijance skupa podataka koji su već grupirani u klase, što nam zauzvrat omogućava da shvatimo koliko su udaljeni od središta ti konkretni podaci.

Distribucija frekvencije
Da bismo shvatili što je oznaka klase, potreban je koncept distribucije frekvencija. S obzirom na skup podataka, raspodjela frekvencije je tablica koja dijeli podatke u više kategorija koje se nazivaju klasama.
Ova tablica prikazuje broj elemenata koji pripadaju svakoj klasi; potonji je poznat kao učestalost.
Ova tablica žrtvuje dio informacija koje dobivamo iz podataka, jer umjesto pojedinačne vrijednosti svakog elementa, samo znamo da pripada toj klasi.
S druge strane, dobivamo bolje razumijevanje skupa podataka, jer je na taj način lakše procijeniti utvrđene obrasce, što olakšava manipulaciju navedenim podacima.
Koliko sati uzeti u obzir?
Da bismo izvršili raspodjelu frekvencije, prvo moramo odrediti broj klasa koje želimo preuzeti i odabrati njihova ograničenja klase.
Izbor koliko klasa treba pohađati treba biti zgodan, uzimajući u obzir da mali broj klasa može sakriti podatke o podacima koje želimo proučavati, a vrlo velik može stvoriti previše detalja koji nisu nužno korisni.
Nekoliko je čimbenika koje moramo uzeti u obzir pri odabiru klase koje ćemo pohađati, no ističu se dva: prvi je uzeti u obzir koliko podataka moramo uzeti u obzir; drugo je znati koliko je velik raspon distribucije (to jest, razlika između najvećeg i najmanjeg promatranja).
Nakon što su klase već definirane, nastavljamo s brojenjem podataka u svakoj klasi. Taj se broj naziva učestalošću nastave i označava se fi.
Kao što smo prethodno rekli, raspodjelom frekvencije gubimo informacije koje dolaze pojedinačno iz svakog podatka ili opažanja. Iz tog razloga se traži vrijednost koja predstavlja cjelokupnu klasu kojoj pripada; ta vrijednost je oznaka klase.
Kako se dobiva?
Oznaka klase je osnovna vrijednost koju klasa predstavlja. Dobiva se dodavanjem granica intervala i dijeljenjem ove vrijednosti na dva. To možemo matematički izraziti na sljedeći način:
x i = (donja granica + gornja granica) / 2.
U ovom izrazu x i označavamo oznaku i klase.
Primjer
S obzirom na sljedeći skup podataka dajte reprezentativnu raspodjelu frekvencija i dobit ćete odgovarajuću oznaku klase.

Budući da su podaci s najvećom numeričkom vrijednošću 391, a najnižom 221, imamo da je raspon 391 -221 = 170.
Odabrat ćemo 5 razreda, sve iste veličine. Jedan od načina odabira nastave je sljedeći:

Imajte na umu da su svaki podaci u klasi, oni su razdvojeni i imaju istu vrijednost. Drugi način izbora klase je razmatranje podataka kao dijela kontinuirane varijable, koja bi mogla dostići bilo koju stvarnu vrijednost. U ovom slučaju možemo razmotriti klase obrasca:
205-245, 245-285, 285-325, 325-365, 365-405
Međutim, ovaj način grupiranja podataka može predstaviti neke nejasnoće s granicama. Na primjer, u slučaju 245, postavlja se pitanje: kojoj klasi pripada, prva ili druga?
Da biste izbjegli ovu zbrku, sastavlja se konvencija o krajnjoj točki. Na taj će način prvi razred biti interval (205,245], drugi (245,285] i tako dalje).

Nakon što su klase definirane, nastavljamo s izračunavanjem učestalosti i imamo sljedeću tablicu:

Nakon dobivanja frekvencijske raspodjele podataka nastavljamo s pronalaženjem klasnih oznaka svakog intervala. Zapravo, moramo:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
To možemo predstaviti na sljedećem grafikonu:

Čemu služi?
Kao što je prethodno spomenuto, oznaka klase je vrlo funkcionalna za pronalaženje aritmetičke srednje vrijednosti i varijancije skupine podataka koje su već grupirane u različite klase.
Aritmetičku sredinu možemo definirati kao zbroj dobivenih opažanja između veličine uzorka. S fizičkog stajališta, njegovo tumačenje je poput točke ravnoteže skupa podataka.
Identificiranje čitavog skupa podataka jednim brojem može biti rizično, tako da se mora uzeti u obzir i razlika između ove točke loma i stvarnih podataka. Te su vrijednosti poznate kao odstupanje od aritmetičke srednje vrijednosti, a s njima želimo utvrditi koliko varira aritmetička sredina podataka.
Najčešći način pronalaženja ove vrijednosti je varijanca, što je prosjek kvadrata odstupanja od aritmetičke srednje vrijednosti.
Da bismo izračunali aritmetičku sredinu i varijancu skupa podataka grupiranih u razredu, koristimo sljedeće formule:

U tim izrazima x i je oznaka i-te klase, f i predstavlja odgovarajuću frekvenciju i k broj klasa u koje su podaci grupirani.
Primjer
Koristeći se podacima iz prethodnog primjera, imamo da možemo malo više proširiti podatke tablice raspodjele frekvencija. Dobivate sljedeće:

Zatim, zamjenom podataka u formuli ostaje nam aritmetička sredina kao:

Njegova varijanca i standardno odstupanje su:

Iz ovoga možemo zaključiti da izvorni podaci imaju aritmetičku sredinu od 306,6, a standardno odstupanje 39,56.
Reference
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Deskriptivna statistika. Uredništvo Esic.
- Jhonson Richard A. Miller i Freund Vjerojatnost i državnici za inženjere. Pearson Education.
- Miller I i Freund J. Vjerojatnost i državnici za inženjere. Vrati.
- Sarabija A. Jose Maria, Pascual Marta. Osnovni statistički tečaj za tvrtke
- Llinás S. Humberto, Rojas A. Carlos Opisna statistika i distribucije vjerojatnosti, Universidad del Norte
