Di dalam kehidupan sehari-hari, kita
tentu sering melihat bahwa sesuatu terjadi karena adanya pengaruh dari kejadian
lain.
Contoh yang sederhana dapat kita
lihat saat terjadinya kenaikan BBM. Saat harga BBM naik, harga-harga barang
kebutuhan pokok lain juga ikut naik. Secara tidak langsung dapat kita katakana
bahwa kenaikan harga kebutuhan pokok dipengaruhi oleh kenaikan harga BBM.
Mungkin banyak yang bertanya, seberapa besar sih kenaikan BBM akan berpengaruh
terhadap kenaikan harga kebutuhan pokok? Bagaimana cara mengetahuinya?
Perkembangan ilmu pengetahuan terus
berusaha mencari cara untuk mengukur pengaruh suatu kejadian terhadap kejadian
lain. Ilmu statistik menawarkan suatu cara untuk mengukur hal ini. Pengaruh
satu (atau beberapa) kejadian terhadap suatu kejadian dalam ilmu statistik
diukur dengan menggunakan Analisis Regresi Sederhana (satu penyebab
mempengaruhi suatu kejadian) atau Analisis Regresi Berganda (beberapa penyebab
mempengaruhi suatu kejadian).
Sebagai suatu metode statistik, ada
beberapa syarat yang harus dipenuhi sebelum kita menggunakan Analisis Regresi
Linier Sederhana/Analisis Regresi Linier Berganda (RLS/RLB). Syarat yang harus
dipenuhi antara lain bahwa variabel yang dipengaruhi/variabel terikat/variabel
dependent harus berupa angka atau sesuatu yang bisa diukur dengan menggunakan
bilangan. Bagi yang sudah tak asing dengan istilah statistik, data yang
digunakan minimal berada pada level data interval. Hal ini harus dipenuhi
karena RLS/RLB termasuk ke dalam golongan statistik parametric yang mewajibkan
pengukuran dalam level minimal interval. Jika syarat ini tak terpenuhi, RLS/RLB
tidak bisa dipergunakan. Alternatif analisis yang dapat digunakan adalah
Analisis Regresi Logistik.
Syarat lain yang harus dipenuhi agar
RLS/RLB dapat dipergunakan secara optimal adalah jumlah data minimal 30 data.
Kenapa 30? Hal ini terkait dengan asumsi kenormalan yang digunakan dalam
RLB/RLS. Data sejumlah itu dirasa cukup (menurut penelitian ahli) untuk
memenuhi asumsi tersebut. Jumlah 30 data digolongkan cukup besar untuk sebuah
sampel, sehingga pendekatan kenormalan dapat dipergunakan dengan CLT.
Selain syarat tersebut, agar dapat
digunakan menganalisis dengan baik, model yang dibentuk dengan menggunakan
RLS/RLB harus memenuhi beberapa asumsi. Asumsi-asumsi ini dikenal dengan nama
ASUMSI KLASIK. Asumsi klasik ini terdiri dari normalitas, homoskedastisitas,
nonmultikolinieritas, dan non autokorelasi.
Mengapa normalitas diperlukan?
Hayoo…kenapa? Ada 2 hal utama kenapa normalitas diperlukan, dilihat dari sisi
kehidupan sehari-hari dan dari sisi statistik. Dari sisi kehidupan sehari-hari,
sampel yang kita ambil harus berdistribusi normal agar dapat mewakili seluruh
data yang ada di populasi. Secara awam dapat kita katakan bahwa kita berharap
data-data yang kita ambil adalah data mainstream bukan data yang non
mainstream agar dapat mewakili sebagian besar/seluruh populasi. Secara
statistik, kita menggunakan asumsi normalitas karena uji-uji yang kita gunakan
dalam RLS/RLB yaitu uji F dan uji T merupakan turunan dari distribusi normal
sehingga untuk menggunakannya, maka asumsi normalitas harus dipenuhi.
Selanjutnya, mengapa
homoskedastisitas harus dipenuhi? Btw, apa sih homoskedastisitas?
Homoskedastisitas adalah varian error
data adalah nol. Atau jika kita lihat melalui plot, maka sebaran data akan
berada di sekitar garis nol. Kenapa hal ini perlu? Karena kita berharap bahwa
model kita bisa memprediksi dengan tepat atau model regresi yang kita hasilkan
bukan merupakan regresi spourious (palsu).
Jika varian error tidak nol, maka
akan berpengaruh terhadap interval kepercayaan dan kesalahan pada pengujian
hipotesis.
Nah, asumsi selanjutnya adalah non
Multikolinieritas. Multikolinieritas sendiri berarti adanya keterkaitan antara
variabel penyebab/variabel bebas/variabel independent. Dalam (Juanda, 2009)
disebutkan jika tujuan pemodelan hanya untuk peramalan nilai Y (peubah respon)
dan tidak mengkaji hubungan atau pengaruh antara peubah bebas (X) dengan peubah
respon (Y), maka masalah multikolinearitas bukan masalah yang serius. Masalah
multikolinearitas menjadi serius apabila digunakan unruk mengkaji hubungan
antara peubah bebas (X) dengan peubah respon (Y) karena simpangan baku
koefisiennya regresinya tidak siginifikan sehingga sulit memisahkan pengaruh
dari masing-masing peubah bebas. Asumsi ini tentu saja tidak diperlukan dalam
RLS karena RLS hanya mempunyai satu variabel bebas.
Asumsi terakhir adalah asumsi non
autokorelasi. Asumsi ini tidak perlu diuji jika kita menggunakan data tipe cross
section (data satu periode) karena autokorelasi berarti hubungan linier
antara error serangkaian observasi
yang diurutkan menurut waktu. Uji ini hanya kita lakukan jika data yang kita
gunakan adalah data tipe time series.
Model regresi linier berganda
melibatkan lebih dari satu variabel bebas.
Modelnya:

Dimana
Y = variabel terikat
Xi = variabel bebas ( i = 1, 2, 3, …, k)
b0 = intersep
bi = koefisien regresi ( i = 1, 2, 3, …, k)
Model penduganya adalah:


√ Yi (Variabel Tak Bebas/Dependent Variable) merupakan random variable/bersifat stochastic
√ Xki (Variabel bebas/Independent Variable) bersifat fixed/non stochastic (bukan merupakan random variable)
√ E(ei)= 0
√ E(ei,ej) = σ2 untuk i = j (Homoscedastic)
√ E(ei,ej) = 0 untuk i ≠ j (Non autocorrelation)
√ error mengikuti distribusi normal dengan rata-rata nol dan varians σ2.
√ Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.
Tidak ada komentar:
Posting Komentar