Kako ukloniti outliere u SPSS-u
Izdaci u statističkim analizama su ekstremne vrijednosti koje se ne uklapaju u većinu skupa podataka. Ako se ne uklone, te ekstremne vrijednosti mogu imati veliki učinak na sve zaključke koji bi se mogli izvući iz dotičnih podataka, jer mogu iskriviti korelacijske koeficijente i linije najboljeg uklapanja u krivom smjeru. SPSS je jedan od brojnih softverskih programa za statističku analizu koji se mogu koristiti za tumačenje skupa podataka i prepoznavanje i uklanjanje izvanrednih vrijednosti.
Istraživačka analiza podataka
1. korak
Kliknite na "Analiziraj". Odaberite "Opisna statistika", a zatim "Istraži."
2. korak
Povucite i ispustite stupce koji sadrže podatke o zavisnim varijablama u okvir s oznakom "Popis zavisnih." Kliknite "U redu."
3. korak
Uklonite sve izvanredne vrijednosti koje SPSS identificira u dijagramima stabljike i lišća ili kutijastim dijagramima brisanjem pojedinačnih podatkovnih točaka. Alternativno, možete postaviti filtar za izuzimanje ovih podatkovnih točaka.
4. korak
Odaberite "Podaci", a zatim "Odaberi slučajeve" i kliknite na uvjet koji ima izvanredne vrijednosti koje želite izuzeti. Odredite vrijednost za ovaj uvjet koja isključuje samo ekstremne vrijednosti i nijednu podatkovnu točku koja se ne razlikuje.
Korak 5
Odaberite "Ako je uvjet zadovoljen" u okviru "Odaberi", a zatim kliknite gumb "Ako" ispod njega. U okvir u gornjem desnom dijelu unesite pravilo za izuzimanje odstupanja koje ste odredili u prethodnom koraku. Na primjer, ako iz uvjeta "visina" izuzimate mjere iznad 74,5 inča, unijeli biste "visina <=74,5". Pritisnite "Nastavi" i "U redu" za aktivaciju filtra.
Regresijska analiza
1. korak
U izborniku "Analiza" odaberite "Regresija", a zatim "Linearno". Odaberite zavisne i nezavisne varijable koje želite analizirati.
2. korak
Kliknite "Spremi", a zatim odaberite "Kuharova udaljenost". Vrijednosti izračunate za Cookovu udaljenost bit će spremljene u vašoj podatkovnoj datoteci kao varijable s oznakom "COO-1."
3. korak
Pokrenite okvirni prikaz odabirom "Grafikoni", a zatim "Boxplot". Kliknite na "Jednostavno" i odaberite "Sažeci zasebnih varijabli." Unesite "COO-1" u okvir s oznakom "Boxes Represent", a zatim unesite ID ili naziv po kojem ćete identificirati slučajeve u okvir "Label Cases By".
4. korak
Povećajte okvir u izlaznoj datoteci dvostrukim klikom na njega. Zabilježite slučajeve koji se nalaze iza crnih linija - to su vaši ekstremi. Možete izabrati da uklonite sve ekstremne vrijednosti ili samo ekstremne ekstremne vrijednosti, koje su označene zvjezdicom (*).
Korak 5
Vratite se u podatkovnu datoteku i pronađite slučajeve koje treba izbrisati. Radeći odozdo prema gore, označite broj krajnje lijevo, u sivom stupcu, tako da cijeli red bude odabran. Kliknite na "Uredi" i odaberite "Izbriši". Ponovite ovaj korak za svaki outlier koji ste identificirali iz dijagrama.
Upozorenje
Kada brišete slučajeve u odjeljku 2, korak 5, uvijek radite od dna podatkovne datoteke prema gore jer se ID brojevi mijenjaju kada izbrišete slučaj. Ako radite odozgo prema dolje, završit ćete brisanjem pogrešnih velikih i malih slova.