ANOVA objašnjenje: analiza varijanse za početnike
# ANOVA objašnjenje: analiza varijanse za početnike
Imate četiri grupe ispitanika i želite da provjerite da li se razlikuju po nekom kriterijumu. Prva ideja koja pada na pamet je da uporedite svake dvije grupe t-testom. Četiri grupe, šest mogućih parova, šest t-testova. Zvuči jednostavno, ali je metodološki pogrešno. Upravo tu ANOVA postaje neophodna.
Zašto ne možete koristiti višestruke t-testove?
Svaki put kad izvedete statistički test sa pragom značajnosti od .05, postoji 5% šanse da ćete dobiti lažno pozitivan rezultat (greška Tipa I). Jedan test, 5% rizika. Ali šest testova? Vjerovatnoća da ćete bar jednom pogrešno zaključiti da razlika postoji raste na skoro 26%.
Formula za ukupnu grešku Tipa I:
α_ukupno = 1 - (1 - α)^k
Gdje je k broj testova. Za 6 testova sa α = .05:
1 - (1 - .05)^6 = 1 - .735 = .265
To znači da u više od četvrtine slučajeva možete „otkriti" razliku koja ne postoji. Ovaj problem se zove inflacija greške Tipa I, i ANOVA ga rješava tako što vrši jedan test za sve grupe odjednom.
Šta je ANOVA i kako funkcioniše?
ANOVA (Analysis of Variance, analiza varijanse) testira hipotezu da su aritmetičke sredine svih grupa jednake. Nulta hipoteza glasi:
H₀: μ₁ = μ₂ = μ₃ = ... = μₖ
Alternativna hipoteza kaže da se bar dvije sredine razlikuju (ne precizira koje).
ANOVA razdvaja ukupnu varijansu u podacima na dva dijela:
- Varijansa između grupa (between-groups): koliko se grupne sredine razlikuju jedna od druge
- Varijansa unutar grupa (within-groups): koliko se pojedinci razlikuju unutar svojih grupa
Ako su razlike između grupa mnogo veće od razlika unutar grupa, postoji statistički značajan efekat.
F-statistika: šta znači i kako se čita
Odnos ove dvije varijanse daje F-statistiku:
F = varijansa između grupa / varijansa unutar grupa
Ako su sve grupe zaista iste, varijansa između grupa biće mala, F će biti blizu 1, i rezultat neće biti značajan. Što je F veći, to su razlike između grupa izraženije u odnosu na individualne razlike unutar grupa.
F-statistika se uvijek prijavljuje sa dva stepena slobode: df₁ (broj grupa minus 1) i df₂ (ukupan broj ispitanika minus broj grupa). Na primjer, F(3, 196) = 4.52 znači 4 grupe (3 + 1) i 200 ispitanika ukupno (196 + 4).
Tipovi ANOVA
Postoji nekoliko varijanti, zavisno od dizajna istraživanja:
Jednosmjerna (one-way) ANOVA je najosnovnija. Imate jednu nezavisnu varijablu sa tri ili više nivoa i jednu zavisnu varijablu. Primjer: uticaj tipa fakulteta (4 fakulteta) na zadovoljstvo studiranjem.
Dvosmjerna (two-way/factorial) ANOVA uključuje dvije nezavisne varijable. Primjer: uticaj tipa fakulteta I godine studija na zadovoljstvo. Ova varijanta vam omogućava da testirate ne samo glavne efekte svake varijable, nego i interakciju između njih (da li se efekat fakulteta razlikuje zavisno od godine studija).
ANOVA sa ponovljenim mjerenjima (repeated measures) koristi se kada iste ispitanike mjerite u više navrata. Primjer: zadovoljstvo studenata na početku, sredinom i na kraju semestra. Ako vas zanima upoređivanje dva mjerenja, pogledajte tekst o t-testu za zavisne uzorke, jer je to poseban slučaj ponovljenih mjerenja sa samo dva vremenska momenta.
Post-hoc testovi: koji izabrati
Ako ANOVA pokaže značajan rezultat (p < .05), to znači da se bar dvije grupe razlikuju. Ali koje? Tu dolaze post-hoc testovi.
Tukey HSD (Honestly Significant Difference)
Najčešće korišten post-hoc test. Upoređuje svaki par grupa, kontrolišući ukupnu grešku Tipa I. Koristi se kada su grupe približno jednakih veličina i varijanse su homogene. U većini situacija, ovo je vaš prvi izbor.
Bonferroni korekcija
Dijeli prag značajnosti sa brojem poređenja. Ako imate 6 poređenja, novi prag je .05 / 6 = .0083. Konzervativniji je od Tukey testa, što znači da ima manju vjerovatnoću lažno pozitivnog rezultata, ali i manju statističku snagu. Dobar izbor kada imate mali broj unaprijed planiranih poređenja.
Scheffé test
Najkonzervativniji od tri navedena. Koristi se kada želite da testirate ne samo proste razlike između parova, nego i složene kontraste (npr. da li se prosjek prve i druge grupe razlikuje od prosjeka treće i četvrte). U praksi se rjeđe koristi jer je često „prestrog" za jednostavna poređenja parova.
Orijentir za izbor:
- •Jednake veličine grupa, standardna situacija → Tukey
- •Nejednake veličine grupa → Games-Howell (alternativa Tukey testu za heterogene varijanse)
- •Mali broj planiranih poređenja → Bonferroni
- •Složeni kontrasti → Scheffé
Eta-squared: veličina efekta za ANOVA
P-vrijednost vam govori da li razlika postoji, ali ne i koliko je ta razlika praktično značajna. Za to služi veličina efekta. Kod ANOVA najčešće se koristi eta-squared (η²):
η² = SS_između / SS_ukupno
Eta-squared pokazuje koji procenat ukupne varijanse zavisne varijable objašnjava nezavisna varijabla. Interpretacija po Cohenu:
| η² | Veličina efekta |
|---|---|
| .01 | Mali |
| .06 | Srednji |
| .14 | Veliki |
Ako η² = .065, vaša nezavisna varijabla objašnjava oko 6.5% varijanse zavisne varijable, što je srednja veličina efekta.
Napomena: parcijalni eta-squared (partial η²) se koristi u faktorskim i ponovljenim dizajnima. Računa udio varijanse koji objašnjava jedan faktor, kontrolišući ostale faktore. Većina statističkih softvera ga automatski prikazuje.
Pretpostavke ANOVA
Prije nego što interpretirate rezultate, provjerite tri ključne pretpostavke:
1. Normalnost distribucije. Zavisna varijabla treba da bude normalno distribuirana unutar svake grupe. Testira se Shapiro-Wilk testom ili vizuelno (Q-Q plot). ANOVA je relativno robusna na blaga odstupanja od normalnosti, posebno pri većim uzorcima (n > 30 po grupi).
2. Homogenost varijansi. Varijanse zavisne varijable treba da budu slične u svim grupama. Testira se Leveneovim testom. Ako je Leveneov test značajan (p < .05), varijanse nisu homogene i trebalo bi koristiti Welch ANOVA ili Games-Howell post-hoc test.
3. Nezavisnost opservacija. Svaki ispitanik pripada samo jednoj grupi, i odgovor jednog ispitanika ne utiče na odgovor drugog. Ovo je pretpostavka dizajna, ne može se testirati statistički.
Da biste unaprijed osigurali dovoljnu statističku snagu, vrijedi izračunati potrebnu veličinu uzorka pomoću analize statističke snage.
Praktičan primjer: zadovoljstvo studiranjem na četiri fakulteta
Istraživačko pitanje: da li se studenti Filozofskog, Pravnog, Medicinskog i Tehničkog fakulteta razlikuju u zadovoljstvu studiranjem?
Uzorak: 200 studenata (50 sa svakog fakulteta). Zadovoljstvo mjereno skalom od 1 do 5.
Deskriptivna statistika:
| Fakultet | M | SD | n |
|---|---|---|---|
| Filozofski | 3.72 | 0.81 | 50 |
| Pravni | 3.28 | 0.93 | 50 |
| Medicinski | 3.85 | 0.76 | 50 |
| Tehnički | 3.51 | 0.88 | 50 |
Provjera pretpostavki:
- •Shapiro-Wilk test: p > .05 za sve grupe (normalnost zadovoljena)
- •Leveneov test: F(3, 196) = 1.24, p = .297 (varijanse homogene)
Rezultat ANOVA:
F(3, 196) = 4.52, p = .004, η² = .065
P-vrijednost je manja od .05, što znači da postoji statistički značajna razlika između fakulteta. Eta-squared od .065 ukazuje na srednju veličinu efekta. Tip fakulteta objašnjava oko 6.5% varijanse u zadovoljstvu studiranjem.
Post-hoc (Tukey HSD):
| Poređenje | Razlika sredina | p |
|---|---|---|
| Filozofski - Pravni | 0.44 | .018 |
| Filozofski - Medicinski | -0.13 | .841 |
| Filozofski - Tehnički | 0.21 | .472 |
| Pravni - Medicinski | -0.57 | .002 |
| Pravni - Tehnički | -0.23 | .389 |
| Medicinski - Tehnički | 0.34 | .098 |
Post-hoc analiza pokazuje da se značajno razlikuju:
- •Filozofski i Pravni (p = .018): studenti Filozofskog su zadovoljniji
- •Pravni i Medicinski (p = .002): studenti Medicinskog su zadovoljniji
Ostale razlike nisu statistički značajne.
APA format za izvještavanje
U tekstu rada:
Jednosmjerna ANOVA pokazala je statistički značajnu razliku u zadovoljstvu studiranjem između fakulteta, F(3, 196) = 4.52, p = .004, η² = .065. Tukey post-hoc test ukazuje da su studenti Pravnog fakulteta (M = 3.28, SD = 0.93) bili značajno manje zadovoljni od studenata Filozofskog (M = 3.72, SD = 0.81, p = .018) i Medicinskog fakulteta (M = 3.85, SD = 0.76, p = .002).
Zapamtite: F je uvijek kurzivom, stepeni slobode u zagradama, p-vrijednost i veličina efekta obavezni.
Najčešća greška
Zaboravljanje post-hoc testa.
Iznenađujuće često u studentskim radovima i čak u publikovanim istraživanjima možete naći rečenicu poput: „ANOVA je pokazala značajnu razliku između grupa (p < .05)". I to je sve. Nema post-hoc analize, nema podatka koje grupe se zapravo razlikuju.
ANOVA vam kaže da razlika postoji negdje. Post-hoc test vam kaže gdje. Bez post-hoc testa, vaš nalaz je nepotpun. To je kao da kažete „neko od vas četvoro je pojeo posljednji kolač" bez da otkrijete ko.
Još jedna česta varijanta ove greške: istraživač uradi ANOVA, dobije značajan rezultat, pa onda umjesto post-hoc testa uradi seriju t-testova. Time se vraća na početni problem inflacije greške Tipa I, čime poništava svrhu ANOVA.
Uvijek koristite post-hoc test koji kontroliše ukupnu grešku Tipa I. U većini slučajeva, Tukey HSD je sasvim dovoljan.
Zaključak
ANOVA je nezaobilazan alat kada upoređujete tri ili više grupa. Ključne stvari za pamćenje: koristite je umjesto višestrukih t-testova, provjerite pretpostavke (posebno Leveneov test), obavezno uradite post-hoc analizu, prijavite veličinu efekta, i formatirajte rezultate po APA standardu.
Istražimo pokreće ANOVA sa automatskim post-hoc testovima i prikazuje rezultate u APA formatu. Uvezite podatke, odaberite varijable, i dobijete kompletnu analizu za nekoliko klikova. Probajte besplatno.
Isprobajte ovo u Istražimo platformi
Od kreiranja ankete do statističke analize, sve na jednom mjestu. Besplatno za studente i istraživače.
Započni besplatno →