Faktorska analiza: vodič za eksploratornu faktorsku analizu (EFA)
# Faktorska analiza: vodič za eksploratornu faktorsku analizu (EFA)
Imate upitnik sa 30 stavki i pitate se: da li ovih 30 stavki zapravo mjere tri ili četiri različite stvari? Da li se neke stavke grupišu zajedno? Možete li svesti 30 varijabli na manji broj smislenih dimenzija? Za to služi faktorska analiza.
Faktorska analiza je jedna od najmoćnijih psihometrijskih tehnika, ali i jedna od najčešće pogrešno primijenjenih. Razumijevanje njenih principa i preduvjeta razlika je između kvalitetnog rada i statističkog haosa.
Šta je faktorska analiza i čemu služi?
Faktorska analiza je statistička metoda koja identifikuje latentne (skrivene) konstrukte na osnovu korelacija između posmatranih varijabli. Drugim riječima, ona traži strukturu u vašim podacima.
Zamislite da imate upitnik o stavovima prema tehnologiji u obrazovanju sa 24 stavke. Ispitanici ocjenjuju svaku stavku na skali od 1 do 5. Kad pogledate korelacionu matricu, primijetićete da se neke stavke grupišu: stavke o korisnosti tehnologije koreliraju međusobno, stavke o strahu od tehnologije koreliraju međusobno, a stavke o lakoći korišćenja koreliraju međusobno.
Faktorska analiza formalno identifikuje ove grupe i kaže: „Vaših 24 stavki se svode na 3 faktora: percipirana korisnost, anksioznost prema tehnologiji i percipirana lakoća korišćenja."
Dva osnovna cilja:
- Redukcija varijabli (svedete 24 stavke na 3 faktorska skora)
- Identifikacija latentnih konstrukata (otkrijete šta vaš upitnik zapravo mjeri)
EFA vs CFA: kad koristiti koju?
Ovo su dva potpuno različita pristupa faktorskoj analizi, i važno je znati razliku.
Eksploratorna faktorska analiza (EFA) se koristi kad ne znate unaprijed koliko faktora postoji niti koje stavke pripadaju kojem faktoru. Vi puštate podatke da „govore" i na osnovu statističkih kriterijuma otkrivate strukturu.
Koristite EFA kad:
- •Razvijate novi upitnik i testirate njegovu strukturu
- •Prevodite upitnik na drugi jezik i želite provjeriti da li se struktura replicira
- •Nemate jasnu teorijsku osnovu za očekivanu strukturu
Konfirmatorna faktorska analiza (CFA) se koristi kad imate preciznu hipotezu o tome koliko faktora postoji i koje stavke pripadaju kojem faktoru. Vi testirate da li podaci odgovaraju vašem modelu.
Koristite CFA kad:
- •Validirate postojeći upitnik na novom uzorku
- •Testirate teorijski model
- •Poredite dva ili više alternativnih modela strukture
U praksi, dobra strategija je: EFA na jednom uzorku, pa CFA na drugom (ili podijelite uzorak na dva dijela).
Preduvjeti za faktorsku analizu
Prije nego što pokrenete EFA, morate provjeriti tri stvari.
1. Veličina uzorka
Postoji više pravila za minimalnu veličinu uzorka:
- •Pravilo 5:1 znači da vam treba minimalno 5 ispitanika po stavki. Za upitnik od 24 stavke, to je minimum 120 ispitanika.
- •Pravilo 10:1 je konzervativnija procjena i preporučljivo je kad imate slabije komunalitete.
- •Apsolutni minimum od 100 ispitanika, bez obzira na broj stavki.
Za detaljnije informacije o planiranju veličine uzorka, pogledajte članak o određivanju broja ispitanika.
2. KMO test (Kaiser-Meyer-Olkin)
KMO mjera adekvatnosti uzorka pokazuje koliko su varijable pogodne za faktorsku analizu. KMO se kreće od 0 do 1.
| KMO vrijednost | Interpretacija |
|---|---|
| < 0.50 | Neprihvatljivo |
| 0.50 - 0.59 | Loše |
| 0.60 - 0.69 | Osrednje |
| 0.70 - 0.79 | Dobro |
| 0.80 - 0.89 | Vrlo dobro |
| ≥ 0.90 | Odlično |
Minimum za faktorsku analizu: KMO > 0.60. Ako je KMO ispod toga, vaše varijable nemaju dovoljno zajedničke varijanse i faktorska analiza nije opravdana.
3. Bartlettov test sferičnosti
Ovaj test provjerava da li je korelaciona matrica dovoljno različita od matrice identiteta (matrice u kojoj su sve korelacije nula). Ako Bartlettov test nije značajan (p > .05), to znači da vaše varijable nisu dovoljno korelirane za faktorsku analizu.
Uslov: p < .05. U praksi, ovaj test je gotovo uvijek značajan kad imate razumnu veličinu uzorka, pa se KMO smatra informativnijim.
Metoda ekstrakcije: PCA vs PAF
Ovdje počinje zabuna koja muči studente i istraživače godinama.
Analiza glavnih komponenti (PCA)
PCA je tehnika redukcije podataka. Ona transformiše varijable u linearne kombinacije (komponente) koje objašnjavaju maksimalnu varijansu. PCA ne pretpostavlja latentne konstrukte i ne razlikuje zajedničku od jedinstvene varijanse.
Faktorska analiza glavnih osa (PAF / Principal Axis Factoring)
PAF je prava faktorska analiza. Ona pretpostavlja da posmatrane varijable su indikatori latentnih konstrukata i pokušava da identifikuje zajedničku varijansu među varijablama.
Ključna razlika: PCA analizira ukupnu varijansu (uključujući grešku mjerenja), dok PAF analizira samo zajedničku varijansu.
Koju metodu izabrati?
- •Ako vas zanima redukcija podataka bez teorijskih pretpostavki: PCA
- •Ako tražite latentne konstrukte i razvijate teoriju: PAF
- •Za psihometrijske svrhe (razvoj upitnika): PAF je bolji izbor
Rotacija: Varimax vs Oblimin
Nakon ekstrakcije, faktori se rotiraju da bi bili lakše interpretabilni. Postoje dvije kategorije rotacija.
Ortogonalna rotacija (Varimax)
Varimax pretpostavlja da su faktori nezavisni (nekorelirani). Nakon rotacije, svaka varijabla ima visoko opterećenje na jednom faktoru i nisko na ostalima.
Koristite Varimax kad:
- •Teorijski očekujete da su konstrukti nezavisni
- •Želite jednostavniju strukturu za interpretaciju
- •Radite eksploratornu analizu bez jasnih hipoteza
Kosa rotacija (Oblimin)
Oblimin dozvoljava faktorima da budu korelirani. Ovo je realniji pristup jer se u psihologiji i društvenim naukama konstrukti rijetko potpuno nezavisni (npr. anksioznost i depresija su korelirane).
Koristite Oblimin kad:
- •Očekujete da su faktori korelirani
- •Radite sa psihološkim konstruktima koji se prirodno preklapaju
- •Želite realniju sliku strukture podataka
Praktičan savjet: Pokrenite obje rotacije. Ako Oblimin pokaže korelacije između faktora manje od .32, rezultati će biti gotovo identični Varimax-u, pa možete koristiti jednostavniju Varimax soluciju.
Kako odrediti broj faktora?
Ovo je jedna od najvažnijih odluka u faktorskoj analizi, a nažalost, nema jednog tačnog odgovora. Koriste se tri kriterijuma.
1. Kaiserov kriterijum (eigenvalue > 1)
Zadržavaju se samo faktori čija je eigenvalue (svojstvena vrijednost) veća od 1. Ovo je najčešće korišten kriterijum, ali i najkritikovaniji jer ima tendenciju da precijeni broj faktora.
2. Scree plot (Cattellov dijagram prevoja)
Na grafikonu se nacrtaju eigenvalues i traži se „lakat" (tačka presjeka gdje kriva naglo mijenja nagib). Faktori iznad lakta se zadržavaju. Problem je što je određivanje lakta subjektivno.
3. Paralelna analiza (Horn)
Ovo je najobjektivniji kriterijum. Generiše se veliki broj random matrica iste dimenzije kao vaši podaci, izračunavaju se eigenvalues za svaku, i zadržavaju se samo faktori čije eigenvalues prelaze prosječne eigenvalues random matrica.
Preporuka: Koristite sva tri kriterijuma i tražite konvergenciju. Ako Kaiser kaže 4, scree plot kaže 3 ili 4, a paralelna analiza kaže 3, vjerovatno imate 3 faktora.
Kako interpretirati faktorska opterećenja?
Faktorsko opterećenje (factor loading) je korelacija između stavke i faktora. Što je opterećenje veće, stavka je bolji indikator tog faktora.
Pravila:
- •> 0.70 = odlično opterećenje
- •0.55 - 0.70 = dobro opterećenje
- •0.40 - 0.55 = prihvatljivo opterećenje
- •< 0.40 = stavka ne pripada faktoru (razmotriti brisanje)
Cross-loadings: Ako stavka ima opterećenje > 0.40 na dva ili više faktora, to je problematično. Takva stavka je „dvosmislena" i obično se uklanja iz upitnika.
Praktičan primjer: stavovi prema tehnologiji u obrazovanju
Recimo da razvijate upitnik o stavovima prema upotrebi tehnologije u obrazovanju. Počeli ste sa 24 stavke i prikupili podatke od 250 studenata.
Korak 1: Preduvjeti
- •KMO = 0.87 (vrlo dobro)
- •Bartlettov test: χ²(276) = 2341.5, p < .001 (značajan)
- •Uzorak 250 studenata za 24 stavke = odnos 10.4:1 (odlično)
Korak 2: Ekstrakcija (PAF) i određivanje broja faktora
- •Kaiser: 4 faktora sa eigenvalue > 1
- •Scree plot: lakat na 3 ili 4 faktora
- •Paralelna analiza: 3 faktora
- •Odluka: 3 faktora
Korak 3: Rotacija (Oblimin)
| Stavka | F1: Korisnost | F2: Anksioznost | F3: Lakoća |
|---|---|---|---|
| Tehnologija poboljšava kvalitet nastave | .78 | .05 | .12 |
| Studenti uče bolje uz digitalne alate | .73 | -.08 | .15 |
| Osjećam se nervozno kad koristim nove aplikacije | .02 | .81 | -.10 |
| Plašim se da ću napraviti grešku na računaru | -.05 | .76 | -.14 |
| Lako savladavam nove tehnologije | .11 | -.12 | .72 |
| Intuitivno razumijem kako softver funkcioniše | .08 | -.06 | .69 |
Korak 4: Interpretacija
- •Faktor 1 (Percipirana korisnost): stavke o tome koliko je tehnologija korisna za učenje
- •Faktor 2 (Tehnološka anksioznost): stavke o strahu i nelagodnosti pri korišćenju tehnologije
- •Faktor 3 (Percipirana lakoća korišćenja): stavke o tome koliko je lako koristiti tehnologiju
Tri faktora zajedno objašnjavaju 58.3% ukupne varijanse, što je prihvatljivo za društvene nauke (50-60% se smatra dobrim).
Nakon što utvrdite faktorsku strukturu, sljedeći korak je provjera pouzdanosti svake subskale. Za to pogledajte vodič o Cronbachovom alfa koeficijentu koji je standardna mjera interne konzistentnosti.
Najčešća greška
Korišćenje PCA i nazivanje toga „faktorska analiza".
Ovo je toliko rasprostranjeno da mnogi istraživači ne znaju da prave grešku. PCA (analiza glavnih komponenti) i FA (faktorska analiza) su matematički različite procedure sa različitim pretpostavkama.
PCA traži linearne kombinacije varijabli koje objašnjavaju maksimalnu ukupnu varijansu. FA traži latentne konstrukte koji objašnjavaju zajedničku varijansu.
Zašto je ovo bitno? Ako u radu napišete „sprovedena je faktorska analiza" a zapravo ste koristili PCA, recenzent koji zna razliku će vam to zamjeriti. Još važnije, PCA obično daje veće faktorske opterećenja i može stvoriti lažni utisak o kvalitetu stavki.
Kako izbjeći ovu grešku:
- U SPSS-u: kad birate ekstrakciju, eksplicitno izaberite „Principal Axis Factoring" umjesto „Principal Components"
- U radu: jasno navedite metodu ekstrakcije, rotaciju i kriterijum za broj faktora
- Ako koristite PCA, budite iskreni i napišite „analiza glavnih komponenti" a ne „faktorska analiza"
Izvještavanje u APA formatu
Kad izvještavate o faktorskoj analizi, obavezno navedite:
- Metodu ekstrakcije (PAF, PCA, ML...)
- Tip rotacije (Varimax, Oblimin...)
- Kriterijum za broj faktora
- KMO i Bartlettov test
- Procenat objašnjene varijanse
- Tabelu faktorskih opterećenja (sa cross-loadingima)
- Korelacije između faktora (ako koristite kosu rotaciju)
Primjer: „Sprovedena je eksploratorna faktorska analiza metodom glavnih osa (PAF) sa Oblimin rotacijom. KMO mjera adekvatnosti uzorka iznosila je .87, a Bartlettov test sferičnosti bio je statistički značajan (χ²(276) = 2341.5, p < .001). Na osnovu paralelne analize i scree plota, ekstrahovana su tri faktora koja zajedno objašnjavaju 58.3% varijanse."
Isprobajte Istražimo platformu
Istražimo platforma uključuje eksploratornu faktorsku analizu sa KMO testom, scree plotom, i automatskim određivanjem broja faktora. Umjesto ručnog konfigurisanja u SPSS-u ili R-u, možete pokrenuti kompletnu EFA analizu u nekoliko klikova, sa preglednom tabelom opterećenja i vizuelizacijom scree plota koju možete direktno eksportovati za rad.
Isprobajte ovo u Istražimo platformi
Od kreiranja ankete do statističke analize, sve na jednom mjestu. Besplatno za studente i istraživače.
Započni besplatno →