- Izjava o problemu u Mann-Whitney U testu
- Kvalitativne varijable nasuprot kvantitativnim varijablama
- Normalni slučaj
- Slučaj s normalnim trendom
- Upareni ili nespareni uzorci
- Karakteristike Mann Whitney U testa
- Mann - Whitney formula
- Koraci za primjenu testa
- Primjer praktične primjene
- - Korak 1
- - Korak 2
- Regija A
- Regija B
- 3. korak
- 4. korak
- Kriteriji za usporedbu
- Online kalkulatori za Mann - Whitney U test
- Reference
Mann - Whitney U testom se primjenjuje za usporedbu dviju neovisnih uzoraka kad imaju malo podataka ili ne slijede normalnu distribuciju. Na taj se način smatra neparametarskim testom, za razliku od njegovog kolega, Studentov t test, koji se koristi kada je uzorak dovoljno velik i prati normalnu raspodjelu.
Frank Wilcoxon prvi put ga je predložio 1945. godine, za uzorke identičnih veličina, ali dvije godine kasnije produžili su ga u slučaju uzoraka različitih veličina Henryja Manna i DR Whitney.

Slika 1. Mann-Whitney U test primjenjuje se za usporedbu neovisnih uzoraka. Izvor: Pixabay.
Test se često primjenjuje za provjeru postoji li veza između kvalitativne i kvantitativne varijable.
Ilustrativni primjer je uzimati skup hipertenzivnih osoba i izdvojiti dvije skupine od kojih se bilježe podaci o dnevnom krvnom tlaku u trajanju od mjesec dana.
Liječenje A primjenjuje se na jednu skupinu, a liječenje B. drugu. Ovdje je krvni tlak kvantitativna varijabla, a vrsta liječenja kvalitativna.
Želimo znati je li srednja, a ne srednja, izmjerenih vrijednosti statistički jednaka ili različita, kako bismo utvrdili postoji li razlika između oba tretmana. Da bi se dobio odgovor, primjenjuje se Wilcoxonova statistika ili Mann - Whitney U test.
Izjava o problemu u Mann-Whitney U testu
Drugi primjer u kojem se test može primijeniti je sljedeći:
Pretpostavimo da želite znati da li se konzumacija bezalkoholnih pića značajno razlikuje u dvije regije zemlje.
Jedan od njih naziva se regija A, a drugi regija B. Vodi se evidencija o litrama koje se konzumiraju tjedno u dva uzorka: jedan od 10 ljudi za regiju A i drugi od 5 ljudi za regiju B.
Podaci su sljedeći:
-Regija A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Regija B: 12,14, 11, 30, 10
Postavlja se sljedeće pitanje:
Kvalitativne varijable nasuprot kvantitativnim varijablama
-Kvalitativna varijabla X: Regija
-Kvalitativna varijabla Y: potrošnja bezalkoholnih pića
Ako je količina potrošenih litara jednaka u obje regije, zaključak će biti da ne postoji ovisnost između dvije varijable. Način da se to utvrdi je usporedba srednjeg ili srednjeg trenda za dvije regije.
Normalni slučaj
Ako podaci slijede normalnu distribuciju, predlažu se dvije hipoteze: nulta H0 i alternativna H1 usporedbom između sredstava:
- H0: nema razlike između srednje vrijednosti dviju regija.
- H1: sredstva u obje regije su različita.
Slučaj s normalnim trendom
Naprotiv, ako podaci ne slijede normalnu distribuciju ili je uzorak jednostavno premali da bi se mogli znati, umjesto da se usporedi srednja vrijednost, uspoređivali bi se medijani dviju regija.
- H0: nema razlike između medijala dviju regija.
- H1: medijani obje regije su različiti.
Ako se medijani podudaraju, tada je ispunjena nulta hipoteza: nema odnosa između konzumiranja bezalkoholnih pića i regije.
A ako se dogodi suprotno, alternativna hipoteza je istinita: postoji odnos između potrošnje i regije.
U tim je slučajevima naznačen Mann - Whitney U test.
Upareni ili nespareni uzorci
Sljedeće važno pitanje u odlučivanju da li ćemo primijeniti Mann Whitney U test je je li broj podataka u oba uzorka identičan, što znači da su u paru.
Ako su dva uzorka uparena, primijenila bi se originalna verzija Wilcoxona. Ali ako ne, kao što je slučaj u primjeru, tada se primjenjuje modificirani Wilcoxon test koji je upravo Mann Whitney U test.
Karakteristike Mann Whitney U testa
Mann - Whitney U test je neparametarski test, primjenjiv na uzorke koji ne slijede normalnu raspodjelu ili s malo podataka. Ima sljedeće karakteristike:
1.- Usporedite medijane
2.- Radi na naručenim rasponima
3. - Manje je moćna, što znači da je moć vjerojatnost odbacivanja nulte hipoteze kada je zapravo lažna.
Uzimajući u obzir ove karakteristike, Mann - Whitney U test primjenjuje se kada:
-Podaci su neovisni
-Ne slijede normalnu distribuciju
-Nutna hipoteza H0 prihvaćena je ako se medijani dvaju uzoraka podudaraju: Ma = Mb
- Alternativna hipoteza H1 prihvaćena je ako se medijani dvaju uzoraka razlikuju: Ma ≠ Mb
Mann - Whitney formula
Varijabla U je kontrastna statistika koja se koristi u Mann - Whitney testu i definira se kako slijedi:
To znači da je U najmanja od vrijednosti između Ua i Ub, primijenjenih na svaku skupinu. U našem primjeru to bi bilo za svaku regiju: A ili B.
Promjenjive vrijednosti Ua i Ub definiraju se i izračunavaju prema sljedećoj formuli:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Ovdje su vrijednosti Na i Nb veličine uzoraka koji odgovaraju regijama A i B, odnosno, sa svoje strane, Ra i Rb su zbrojevi ranga koje ćemo definirati u nastavku.
Koraci za primjenu testa
1.- Naručite vrijednosti dvaju uzoraka.
2.- Dodijelite rang naloga svakoj vrijednosti.
3. - Ispravite postojeće veze u podacima (ponovljene vrijednosti).
4.- Izračunajte Ra = zbroj redova uzorka A.
5.- Pronađite Rb = zbroj redova uzorka B.
6.- Odredite vrijednosti Ua i Ub, prema formulama danim u prethodnom odjeljku.
7.- Usporedite Ua i Ub, a manji od dva je dodijeljen eksperimentalnoj U statistici (to jest podataka) koji se uspoređuje s teoretskom ili normalnom U statistikom.
Primjer praktične primjene
Sada primjenjujemo gore spomenuto na prethodno spomenuti problem bezalkoholnih pića:
Regija A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Regija B: 12,14, 11, 30, 10
Ovisno o tome jesu li sredstva oba uzorka statistički ista ili različita, nulta hipoteza se prihvaća ili odbacuje: ne postoji odnos između varijabli Y i X, odnosno konzumiranje bezalkoholnih pića ne ovisi o regiji:
H0: Ma = Mb
H1: Ma ≠ Mb

Slika 2. Podaci o konzumiranju bezalkoholnih pića u regijama A i B. Izvor: F. Zapata.
- Korak 1
Postavljamo podatke zajedno za dva uzorka, poredajući vrijednosti od najnižih do najviših:

Primijetite da se vrijednost 11 pojavljuje 2 puta (jednom u svakom uzorku). Izvorno ima pozicije ili raspone 3 i 4, ali kako se ne bi precijenila ili podcijenila jedno ili drugo, prosječna vrijednost odabire se kao raspon, to jest 3,5.
Na sličan način nastavljamo s vrijednošću 12 koja se ponavlja tri puta s rasponima 5, 6 i 7.
Pa, vrijednosti 12 dodijeljen je prosječni raspon 6 = (5 + 6 + 7) / 3. I isto za vrijednost 14 koja ima ligaturu (pojavljuje se u oba uzorka) u pozicijama 8 i 9, dodijeljen je prosječni raspon 8,5 = (8 + 9) / 2.
- Korak 2
Zatim se podaci za Regije A i B ponovo razdvajaju, ali sada su njihovi odgovarajući rasponi dodijeljeni u drugom retku:
Regija A

Regija B

Rasponi Ra i Rb dobivaju se iz zbroja elemenata drugog reda za svaki slučaj ili regiju.
3. korak
Odgovarajuće vrijednosti Ua i Ub izračunavaju se:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Eksperimentalna vrijednost U = min (19, 31) = 19
4. korak
Pretpostavlja se da teorijski U slijedi normalnu raspodjelu N s parametrima danim isključivo veličinom uzoraka:
N ((na⋅nb) / 2, √)
Da bismo usporedili varijablu U dobivenu eksperimentalno, s teoretskom U potrebno je izvršiti promjenu varijable. Prelazimo s eksperimentalne varijable U na njezinu standardiziranu vrijednost, koja će se zvati Z, kako bismo mogli usporediti s standardiziranom normalnom raspodjelom.
Promjena varijable je sljedeća:
Z = (U - na.nb / 2) / √
Treba napomenuti da su za promjenu varijable korišteni parametri teorijske raspodjele za U. Tada je nova varijabla Z, koja je hibrid između teoretskog U i eksperimentalnog U, u kontrastu sa standardiziranom normalnom raspodjelom N (0,1).
Kriteriji za usporedbu
Ako je Z ≤ Zα ⇒, nulta hipoteza H0 je prihvaćena
Ako Z> Zα ⇒ odbacuje nultu hipotezu H0
Standardizirane Zα kritične vrijednosti ovise o potrebnoj razini pouzdanosti, na primjer, za razinu pouzdanosti α = 0,95 = 95%, što je najčešće, dobiva se kritična vrijednost Zα = 1,96.
Za ovdje prikazane podatke:
Z = (U - na nb / 2) / √ = -0,73
Koja je ispod kritične vrijednosti 1,96.
Dakle, konačni zaključak je da je nulta hipoteza H0 prihvaćena:
Online kalkulatori za Mann - Whitney U test
Postoje posebni programi za statističke proračune, uključujući SPSS i MINITAB, ali ti su programi plaćeni i njihova uporaba nije uvijek jednostavna. To je zbog činjenice da pružaju toliko mnogo mogućnosti da je njihova upotreba praktički rezervirana za stručnjake iz statistike.
Srećom, postoji niz vrlo točnih, besplatnih i jednostavnih internetskih programa koji vam omogućuju pokretanje Mann-Whitney U testa, među ostalim.
Ovi programi su:
-Socijalna znanstvena statistika (socscistatistics.com) koja u slučaju izbalansiranih ili uparenih uzoraka ima i Mann-Whitney U test i Wilcoxon test.
-AI terapijska statistika (ai-therapy.com) koja sadrži nekoliko uobičajenih testova opisne statistike.
-Statistički za upotrebu (physics.csbsju.edu/stats), jedan je od najstarijih, pa njegovo sučelje može izgledati datirano, iako je ipak vrlo učinkovit besplatni program.
Reference
- Dietrichson. Kvantitativne metode: rang test. Oporavilo sa: bookdown.org
- Marín J P. SPSS vodič: Analiza i postupci u neparametarskim testovima. Oporavak od: halweb.uc3m.es
- USAL MOOC. Neparametrijski testovi: Mann-Whitney U. Oporavilo od: youtube.com
- Wikipedia. Mann-Whitney U test. Oporavak od: es.wikipedia.com
- XLSTAT. Centar za pomoć. Mann - Whitney test tutorial u Excelu. Oporavilo od: help.xlsat.com
