Analisi
regresi merupakan alat analisis yang paling sering digunakan oleh mahasiswa
atau mahasiswi untuk menyelesaikan skripsi atau bahkan tesis dan penelitian
sejenis. Hal ini tentu saja di dorong oleh perkembangan software komputer yang
semakin mempermudah proses kalkulasi yang dulunya sangat sulit dikerjakan
secara manual. Analisis regresi adalah alat analisis yang termasuk dalam
statistik parametrik. Dengan demikian, untuk mempergunakan regresi, seorang
peneliti harus melakukan pengujian asumsi terlebih dahulu. Asumsi yang harus
diuji adalah, normalitas sebaran, linieritas (jika kita hendak mempergunakan
regresi linier), heteroskedastisitas, multikolinearitas serta autokorelasi.
Pada postingan kali ini saya hendak mencontohkan bagaimana kita melakukan
pengujian terhadap asumsi-asumsi statistika parametrik jika kita hendak
menggunakan analisis regresi. Karena keterbatasan tempat, saya hanya akan
memperlihat pengujian terhadap asumsi normalitas sebaran data, homokedastisitas
serta multikolinearitas.
Saya akan menggunakan data dari buku Applied Statistics for the Behavioral
Sciences karangan Hinkle dkk. Kita hendak menguji apakah skor yang diperoleh
siswa pada mata pelajaran matematika (X) dapat mempengaruhi skor siswa pada
mata pelajaran science (Y). pertama kita masukkan data ke dalam program SPSS
seperti berikut ini:
Setelah
itu klik analyze > Regression > Linear sehingga muncul kotak dialog linier
regression.
Masukkan
variabel science pada kotak Dependent dan variabel math pada kotak Independent(s).
kemudian klik statistics sehingga muncul tampilan seperti berikut ini:
Tandai
Durbin-Watson pada Residuals untuk melihat nilai autokorelasi, collinearity
diagnostics untuk melihat asumsi multikolinearitas. Klik continue untuk
melanjutkan. Setelah itu klik kotak Plots dan tandai histogram dan normal
probability plot pada standardized residual plot. Kemudian masukkan variabel
SRESID ke dalam kotak Y dan ZPRED ke dalam kotak X untuk melihat asumsi
heteroskedastisitas. Tekan continue.
Abaikan yang
lain dan klik OK untuk melihat hasil analisis yang telah dilakukan oleh SPSS.
Sekarang akan terbuka window baru yang berisi output SPSS. Nah, sekarang kita
lihat hasil pengujian asumsi-asumsi tersebut.
1. Asumsi normalitas sebaran
Asumsi normalitas dapat diketahui dengan berbagai cara. Baik melalui pengujian
statistik seperti Chi Square, Kolmogorov-Smirnov maupun Shapiro Wilk, berikut
ini, pengujian normalitas dilakukan dengan histogram dan Plot Normal.
Berdasarkan
output histogram di atas, terlihat bahwa sebaran data yang ada menyebar merata
ke semua daerah kurva normal. Dengan demikian dapat disimpulkan bahwa data yang
kita miliki mempunyai distribusi normal. Demikian juga dengan normal P-P Plot
memperlihatkan hasil yang sama.
2. Asumsi homokedastisitas
Pengujian homokedastisitas juga sering disebut uji homogenitas. Dalam postingan
ini, pengujian homogenitas dilakukan dengan menggunakan Scatter Plot nilai
residual variabel dependen. Pengambilan kesimpulan dilakukan dengan
memperhatikan sebaran plot data
Berdasarkan
plot data di atas, dapat kita tarik kesimpulan bahwa tidak terjadi persoalan
heterokedastisitas. Artinya bahwa data yang kita kita miliki adalah data yang
homogen. Jika terjadi persoalan heterokedastisitas, maka dapat dilakukan
transformasi log natural (LN)
3. Asumsi multikolinearitas
Pengujian multikolinearitas juga sering disebut uji independensi. Pengujian ini
akan melihat apakah antara sesama prediktor memiliki hubungan yang besar atau
tidak. Jika hubungan antara sesama prediktor kuat maka antara prediktor
tersebut tidak independen. Dalam contoh kita ini, hanya memiliki satu prediktor
yaitu sekor matematika sehingga dapat dikatakan terbebas dari persoalan
multikolinearitas. Akan tetapi, jika kita memiliki satu predikto dan hendak
menguji asumsi ini, kita bisa melihat pada output SPSS berikut ini.
Pengujian
multikolinearitas diketahui dari nilai VIF setiap prediktor. Jika nilai VIF
prediktor tidak melebihi 10, maka dapat kita katakan bahwa data kita terbebas
dari persoalan multikolinearitas. Pada contoh di atas, nilai VIF tidak melebihi
10 sehingga dapat disimpulkan bahwa model tidak terkena persoalan
multikolinearitas.