Senin, 02 Juli 2012

Belajar Statistik SPSS Yuk !! Analisis Regresi


Analisi regresi merupakan alat analisis yang paling sering digunakan oleh mahasiswa atau mahasiswi untuk menyelesaikan skripsi atau bahkan tesis dan penelitian sejenis. Hal ini tentu saja di dorong oleh perkembangan software komputer yang semakin mempermudah proses kalkulasi yang dulunya sangat sulit dikerjakan secara manual. Analisis regresi adalah alat analisis yang termasuk dalam statistik parametrik. Dengan demikian, untuk mempergunakan regresi, seorang peneliti harus melakukan pengujian asumsi terlebih dahulu. Asumsi yang harus diuji adalah, normalitas sebaran, linieritas (jika kita hendak mempergunakan regresi linier), heteroskedastisitas, multikolinearitas serta autokorelasi.

Pada postingan kali ini saya hendak mencontohkan bagaimana kita melakukan pengujian terhadap asumsi-asumsi statistika parametrik jika kita hendak menggunakan analisis regresi. Karena keterbatasan tempat, saya hanya akan memperlihat pengujian terhadap asumsi normalitas sebaran data, homokedastisitas serta multikolinearitas.

Saya akan menggunakan data dari buku Applied Statistics for the Behavioral Sciences karangan Hinkle dkk. Kita hendak menguji apakah skor yang diperoleh siswa pada mata pelajaran matematika (X) dapat mempengaruhi skor siswa pada mata pelajaran science (Y). pertama kita masukkan data ke dalam program SPSS seperti berikut ini:



Setelah itu klik analyze > Regression > Linear sehingga muncul kotak dialog linier regression.  


Masukkan variabel science pada kotak Dependent dan variabel math pada kotak Independent(s). kemudian klik statistics sehingga muncul tampilan seperti berikut ini:





Tandai Durbin-Watson pada Residuals untuk melihat nilai autokorelasi, collinearity diagnostics untuk melihat asumsi multikolinearitas. Klik continue untuk melanjutkan. Setelah itu klik kotak Plots dan tandai histogram dan normal probability plot pada standardized residual plot. Kemudian masukkan variabel SRESID ke dalam kotak Y dan ZPRED ke dalam kotak X untuk melihat asumsi heteroskedastisitas. Tekan continue.


Abaikan yang lain dan klik OK untuk melihat hasil analisis yang telah dilakukan oleh SPSS. Sekarang akan terbuka window baru yang berisi output SPSS. Nah, sekarang kita lihat hasil pengujian asumsi-asumsi tersebut.


1. Asumsi normalitas sebaran

Asumsi normalitas dapat diketahui dengan berbagai cara. Baik melalui pengujian statistik seperti Chi Square, Kolmogorov-Smirnov maupun Shapiro Wilk, berikut ini, pengujian normalitas dilakukan dengan histogram dan Plot Normal.

 

Berdasarkan output histogram di atas, terlihat bahwa sebaran data yang ada menyebar merata ke semua daerah kurva normal. Dengan demikian dapat disimpulkan bahwa data yang kita miliki mempunyai distribusi normal. Demikian juga dengan normal P-P Plot memperlihatkan hasil yang sama.


2. Asumsi homokedastisitas

Pengujian homokedastisitas juga sering disebut uji homogenitas. Dalam postingan ini, pengujian homogenitas dilakukan dengan menggunakan Scatter Plot nilai residual variabel dependen. Pengambilan kesimpulan dilakukan dengan memperhatikan sebaran plot data




Berdasarkan plot data di atas, dapat kita tarik kesimpulan bahwa tidak terjadi persoalan heterokedastisitas. Artinya bahwa data yang kita kita miliki adalah data yang homogen. Jika terjadi persoalan heterokedastisitas, maka dapat dilakukan transformasi log natural (LN)


3. Asumsi multikolinearitas

Pengujian multikolinearitas juga sering disebut uji independensi. Pengujian ini akan melihat apakah antara sesama prediktor memiliki hubungan yang besar atau tidak. Jika hubungan antara sesama prediktor kuat maka antara prediktor tersebut tidak independen. Dalam contoh kita ini, hanya memiliki satu prediktor yaitu sekor matematika sehingga dapat dikatakan terbebas dari persoalan multikolinearitas. Akan tetapi, jika kita memiliki satu predikto dan hendak menguji asumsi ini, kita bisa melihat pada output SPSS berikut ini.

Pengujian multikolinearitas diketahui dari nilai VIF setiap prediktor. Jika nilai VIF prediktor tidak melebihi 10, maka dapat kita katakan bahwa data kita terbebas dari persoalan multikolinearitas. Pada contoh di atas, nilai VIF tidak melebihi 10 sehingga dapat disimpulkan bahwa model tidak terkena persoalan multikolinearitas.

Tidak ada komentar:

Posting Komentar