ANALISIS KORELASI


KORELASI adalah istilah statistik yang menyatakan derajat hubungan linier antara dua variabel atau lebih, yang ditemukan oleh Karl Pearson pada wal 1900, oleh sebab itu terkenal dengan sebutan korelasi Pearson Product Moment (PPM). korelasi adalah salah satu teknik analisis statistik yang paling banyak digunakan oleh para peneliti. karena para peneliti umumnya tertarik terhadap peristiwa-peristiwa yang terjadi dan mencoba untuk menghubungkannya. 


Misalnya kita ingin menghubngkan antara tinggi badan dengan berat badan, antara umur dengan tekanan darahnya, antara motivasi dengan prestasi belajar atau bekerja dan seterusnya. Hubungan antara dua variabel didalam teknik korelasi bukanlah dalam arti hubungan sebab akibat (timbal-balik), melainkan hanya merupakan hubungan searah saja. hubungan sebab akibat, misalnya : kemiskinan dengan kejahatan, kebersihan dengan kesehatan, kemiskinan dengan kebodohan.. dalam korelasi hanya mengenal hubungan searah saja (Bukan timbal balik) , misalnya tinggi badan menyebabkan berat badanya bertambah, tetapi berat badannya bertambah belum tentu menyebabkan tinggi badannya bertambah. akibatnya dalam korelasi dikenal penyebab dan akibatnya. dan data akibat atau yang dipengaruhi disebut variabel terikat. istilah bebas disebut juga dengan independen yang biasaya dilambangkan dengan huruf X atau X1. sedangkan istialh terikat disebut dependen yang biasanya dilambangkan dengan huruf Y. bagaimanakah menentukan bahwa variabel itu bebas atau terikat? jawaban ialah tergantung dari landasan teori yang kita pakai.

Korelasi merupakan teknik analisis yang  termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (measures of association). Pengukuran asosiasi   merupakan istilah umum yang mengacu pada sekelompok teknik dalam statistik bivariat yang digunakan untuk mengukur kekuatan hubungan antara dua variabel. Diantara sekian banyak teknik-teknik pengukuran asosiasi, terdapat dua teknik korelasi yang sangat populer sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi Rank Spearman. Selain kedua teknik tersebut, terdapat pula teknik-teknik korelasi lain, seperti Kendal, Chi-Square, Phi Coefficient, Goodman-Kruskal, Somer, dan Wilson.

Pengukuran asosiasi mengenakan nilai numerik untuk mengetahui tingkatan asosiasi atau kekuatan hubungan antara variabel. Dua variabel dikatakan berasosiasi jika perilaku variabel yang satu mempengaruhi variabel yang lain. Jika tidak terjadi pengaruh, maka kedua variabel tersebut disebut independen.

Korelasi bermanfaat untuk mengukur kekuatan hubungan antara dua variabel (kadang lebih dari dua variabel) dengan skala-skala tertentu, misalnya Pearson data harus berskala interval atau rasio; Spearman dan Kendal menggunakan skala ordinal; Chi Square menggunakan data nominal. Kuat lemah hubungan diukur diantara jarak (range) 0 sampai dengan 1. Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two tailed). Korelasi searah jika nilai koefesien korelasi diketemukan positif; sebaliknya jika nilai koefesien korelasi negatif, korelasi  disebut tidak searah. Yang dimaksud dengan koefesien korelasi ialah suatu pengukuran statistik kovariasi atau asosiasi antara dua variabel. Jika koefesien korelasi diketemukan tidak sama dengan nol (0), maka terdapat ketergantungan antara dua variabel tersebut. Jika  koefesien korelasi diketemukan +1. maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) positif.

Jika  koefesien korelasi diketemukan -1. maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) negatif.
Dalam korelasi sempurna tidak diperlukan lagi pengujian hipotesis, karena kedua variabel mempunyai hubungan linear yang sempurna. Artinya variabel X mempengaruhi variabel Y secara sempurna. Jika korelasi sama dengan nol (0), maka tidak terdapat hubungan antara kedua variabel tersebut.
                                         
Dalam korelasi sebenarnya tidak dikenal istilah variabel bebas dan variabel tergantung. Biasanya dalam penghitungan digunakan simbol X untuk variabel pertama dan Y untuk variabel kedua. Dalam contoh hubungan antara variabel remunerasi dengan kepuasan kerja, maka variabel remunerasi merupakan variabel X dan kepuasan kerja merupakan variabel Y.

 Variabel yang akan kita hubngkan terdiri atas berbagai tingkatan data. tingkatan data meliputi data nominal, interval, dan rasio. tingkatan data tersebutt menentukan alaisis korelasi mana yang paling tepat digunakan. oleh sebab itu, sebelum mempelajari analisis korelasi, maka macam-macam tingkatan data tersebut hasrus sudah dipahami sepenuhnya.

Kegunaan
Pengukuran asosiasi berguna untuk mengukur kekuatan (strength) hubungan antar dua variabel atau lebih. Contoh: mengukur hubungan antara variabel:
  • Motivasi kerja dengan produktivitas
  • Kualitas layanan dengan kepuasan pelanggan
  • Tingkat inflasi dengan IHSG
Pengukuran ini hubungan antara dua variabel untuk masing-masing kasus akan menghasilkan keputusan, diantaranya:
  • Hubungan kedua variabel tidak ada
  • Hubungan kedua variabel lemah
  •  Hubungan kedua variabel cukup kuat
  •  Hubungan kedua variabel kuat
  •  Hubungan kedua variabel sangat kuat
Penentuan tersebut didasarkan pada kriteria yang menyebutkan jika hubungan mendekati 1, maka hubungan semakin kuat; sebaliknya jika hubungan mendekati 0, maka hubungan semakin lemah.

Teori Korelasi

Korelasi dan Kausalitas
Ada perbedaan mendasar antara korelasi dan kausalitas. Jika kedua variabel dikatakan berkorelasi, maka kita tergoda untuk mengatakan bahwa variabel yang satu mempengaruhi variabel yang lain atau dengan kata lain terdapat hubungan kausalitas. Kenyataannya belum tentu. Hubungan kausalitas terjadi jika variabel X mempengaruhi Y. Jika kedua variabel diperlakukan secara simetris (nilai pengukuran tetap sama seandainya peranan variabel-variabel tersebut ditukar)  maka meski kedua variabel berkorelasi tidak dapat dikatakan mempunyai hubungan kausalitas. Dengan demikian, jika terdapat dua variabel yang berkorelasi, tidak harus terdapat hubungan kausalitas.

 Terdapat dictum yang mengatakan “correlation does not imply causation”. Artinya korelasi tidak dapat digunakan secara valid untuk melihat  adanya hubungan kausalitas dalam variabel-variabel. Dalam korelasi aspek-aspek yang melandasi terdapatnya hubungan antar variabel mungkin tidak diketahui atau tidak langsung. Oleh karena itu dengan menetapkan korelasi dalam hubungannya dengan variabel-variabel yang diteliti tidak akan memberikan persyaratan yang memadai untuk menetapkan hubungan kausalitas kedalam variabel-variabel  tersebut. Sekalipun demikian bukan berarti bahwa korelasi tidak dapat digunakan sebagai indikasi adanya hubungan kausalitas antar variabel. Korelasi dapat digunakan sebagai salah satu bukti adanya kemungkinan terdapatnya hubungan kausalitas tetapi tidak dapat memberikan indikasi hubungan kausalitas seperti apa jika memang itu terjadi dalam variabel-variabel yang diteliti, misalnya model recursive, dimana X mempengaruhi Y atau non-recursive, misalnya X mempengaruhi Y dan Y mempengaruhi X.

Dengan untuk mengidentifikasi hubungan kausalitas tidak dapat begitu saja dilihat dengan kaca mata korelasi tetapi sebaiknya menggunakan model-model yang lebih tepat, misalnya regresi, analisis jalur atau structural equation model
           
Korelasi dan Linieritas
Terdapat hubungan erat antara pengertian korelasi dan linieritas. Korelasi Pearson, misalnya, menunjukkan adanya kekuatan hubungan linier dalam dua variabel. Sekalipun demikian jika asumsi normalitas salah maka nilai korelasi tidak akan memadai untuk membuktikan adanya hubungan linieritas. Linieritas artinya asumsi adanya hubungan dalam bentuk garis lurus antara variabel. Linearitas antara dua variabel dapat dinilai melalui observasi scatterplots bivariat. Jika kedua variabel berdistribusi normal dan behubungan secara linier, maka  scatterplot berbentuk oval; jika tidak berdistribusi normal scatterplot tidak berbentuk oval. 

Asumsi
            Asumsi dasar korelasi diantaranya seperti tertera di bawah ini:
  • Kedua variabel bersifat independen satu dengan lainnya, artinya masing-masing variabel berdiri sendiri dan tidak tergantung satu dengan lainnya. Tidak ada istilah variabel bebas dan variabel tergantung.
  • Data untuk kedua variabel berdistribusi normal. Data yang mempunyai distribusi normal artinya data yang distribusinya  simetris sempurna. Jika digunakan bahasa umum disebut berbentuk kurva bel. Menurut Johnston (2004) ciri-ciri data yang mempunyai distribusi normal ialah sebagai berikut:
  1. Kurva frekuensi normal menunjukkan frekuensi tertinggi berada di tengah-tengah, yaitu berada pada rata-rata (mean) nilai distribusi dengan kurva sejajar dan tepat sama pada bagian sisi kiri dan kanannya. Kesimpulannya, nilai yang paling sering muncul dalam distribusi normal ialah rata-rata (average), dengan setengahnya berada dibawah rata-rata dan setengahnya yang lain berada di atas rata-rata.
  2. Kurva normal, sering juga disebut sebagai kurva bel, berbentuk simetris sempurna.
  3. Karena  dua bagian sisi dari tengah-tengah benar-benar simetris, maka frekuensi nilai-nilai diatas rata-rata (mean) akan benar-benar cocok dengan frekuensi nilai-nilai di bawah rata-rata.
  4. Frekuensi total semua nilai dalam populasi akan berada dalam  area dibawah kurva.  Perlu diketahui bahwa area total dibawah kurva mewakili kemungkinan munculnya karakteristik tersebut.  
  5. Kurva normal dapat mempunyai bentuk yang berbeda-beda. Yang menentukan bentuk-bentuk tersebut adalah nilai rata-rata dan simpangan baku (standard deviation) populasi.Koefesien Korelasi
Koefesien korelasi ialah pengukuran statistik kovarian atau asosiasi antara dua variabel. Besarnya koefesien korelasi berkisar antara +1 s/d -1. Koefesien korelasi menunjukkan kekuatan (strength) hubungan linear dan arah hubungan dua variabel acak. Jika koefesien korelasi positif, maka kedua variabel mempunyai hubungan searah. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan tinggi pula. Sebaliknya, jika koefesien korelasi negatif, maka kedua variabel mempunyai hubungan terbalik. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan menjadi rendah (dan sebaliknya). Untuk memudahkan melakukan interpretasi mengenai kekuatan hubungan antara dua variabel penulis memberikan kriteria sebagai berikut (Sarwono:2006):
  • 0 : Tidak ada korelasi antara dua variabel
  • >0 – 0,25: Korelasi sangat lemah
  • >0,25 – 0,5: Korelasi cukup
  • >0,5 – 0,75: Korelasi  kuat
  • >0,75 – 0,99: Korelasi  sangat kuat
  • 1: Korelasi sempurna
Signifikansi
Apa sebenarnya signifikansi itu? Dalam bahasa Inggris umum, kata, "significant" mempunyai makna penting; sedang dalam pengertian statistik kata tersebut mempunyai makna “benar” tidak didasarkan secara kebetulan. Hasil riset dapat benar tapi tidak penting. Signifikansi / probabilitas / α memberikan gambaran mengenai bagaimana hasil riset itu mempunyai kesempatan untuk benar. Jika kita memilih signifikansi sebesar 0,01, maka artinya kita menentukan hasil riset nanti mempunyai kesempatan untuk benar sebesar 99% dan untuk salah sebesar 1%.
  
Secara umum kita menggunakan angka signifikansi sebesar 0,01; 0,05 dan 0,1. Pertimbangan penggunaan angka tersebut didasarkan pada tingkat kepercayaan (confidence interval) yang diinginkan oleh peneliti. Angka signifikansi sebesar 0,01 mempunyai pengertian bahwa tingkat kepercayaan atau bahasa umumnya keinginan kita untuk memperoleh kebenaran dalam riset kita adalah sebesar 99%. Jika angka signifikansi sebesar 0,05, maka tingkat kepercayaan adalah sebesar 95%. Jika angka signifikansi sebesar 0,1, maka tingkat kepercayaan adalah sebesar 90%.

Pertimbangan lain ialah menyangkut jumlah data (sample) yang akan digunakan dalam riset. Semakin kecil angka signifikansi, maka ukuran sample akan semakin besar. Sebaliknya semakin besar angka signifikansi, maka ukuran sample akan semakin kecil. Unutuk memperoleh angka signifikansi yang baik, biasanya diperlukan ukuran sample yang besar. Sebaliknya jika ukuran sample semakin kecil, maka kemungkinan munculnya kesalahan semakin ada.

Untuk pengujian dalam SPSS digunakan kriteria sebagai berikut:
  • Jika angka signifikansi hasil riset < 0,05, maka hubungan kedua variabel signifikan.
  • Jika angka signifikansi hasil riset > 0,05, maka hubungan kedua variabel tidak signifikan
Interpretasi Korelasi
Ada tiga penafsiran hasil analisis korelasi, meliputi: pertama, melihat kekuatan hubungan dua variabel; kedua, melihat signifikansi hubungan; dan ketiga, melihat arah hubungan.
Untuk melakukan interpretasi kekuatan hubungan antara dua variabel dilakukan dengan melihat angka koefesien korelasi hasil perhitungan dengan menggunakan kriteria sbb:
  • Jika angka koefesien korelasi menunjukkan 0, maka kedua variabel tidak mempunyai hubungan
  • Jika  angka koefesien korelasi mendekati 1, maka kedua variabel mempunyai hubungan semakin kuat
  • Jika  angka koefesien korelasi mendekati 0, maka kedua variabel mempunyai hubungan semakin lemah
  • Jika angka koefesien korelasi sama dengan 1, maka kedua variabel mempunyai hubungan linier sempurna positif.
  • Jika angka koefesien korelasi sama dengan -1, maka kedua variabel mempunyai hubungan linier sempurna negatif.
Interpretasi berikutnya melihat signifikansi hubungan dua variabel dengan didasarkan pada angka signifikansi yang dihasilkan dari penghitungan dengan ketentuan sebagaimana sudah dibahas di bagian 2.7. di atas. Interpretasi ini akan membuktikan apakah hubungan kedua variabel tersebut signifikan atau tidak.

Interpretasi ketiga melihat arah korelasi. Dalam korelasi ada dua arah korelasi, yaitu searah dan tidak searah. Pada SPSS hal ini ditandai dengan pesan two tailed.  Arah korelasi dilihat dari angka koefesien korelasi. Jika koefesien korelasi positif, maka hubungan kedua variabel searah. Searah artinya jika variabel X nilainya tinggi, maka variabel Y juga tinggi. Jika koefesien korelasi negatif, maka hubungan kedua variabel tidak searah. Tidak searah artinya jika variabel X nilainya tinggi, maka variabel Y akan rendah.
Dalam kasus, misalnya hubungan antara kepuasan kerja dan komitmen terhadap organisasi sebesar 0,86 dengan angka signifikansi sebesar 0 akan mempunyai makna bahwa hubungan antara  variabel kepuasan kerja dan komitmen terhadap organisasi sangat kuat, signifikan dan searah. Sebaliknya dalam kasus hubungan antara variabel mangkir kerja dengan produktivitas sebesar -0,86, dengan angka signifikansi sebesar 0;  maka hubungan kedua variabel sangat kuat, signifikan dan tidak searah.
Contoh: Hubungan antara kepuasan kerja dengan loyalitas pegawai

Hipotesis berbunyi sbb:
  • H0: Tidak ada hubungan antara kepuasan kerja dengan loyalitas pegawai
  • H1: Ada hubungan antara kepuasan kerja dengan loyalitas pegawai
Hasil t hitung sebesar 3,6
T table dengan ketentuan α= 0,05 Degree of freedom: n-2, dan n = 30 diketemukan sebesar: 2,048. Didasarkan ketentuan di atas, maka t hitung 3,6 > t table 2,048. Dengan demikian H0 ditolak dan H1 diterima. Artinya  ada hubungan antara kepuasan kerja dengan loyalitas pegawai

Disamping menggunakan cara diatas, cara kedua ialah menggunakan angka signifikansi. Caranya sebagai berikut:

Hipotesis berbunyi sbb:
  • H0: Tidak ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai
  • H1: Ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai
Angka signifikansi hasil perhitungan sebesar 0,03. Bandingkan dengan angka signifikansi sebesar 0,05. Keputusan menggunakan kriteria sbb:

    • Jika angka signifikansi hasil riset < 0,05, maka H0 ditolak.
    • Jika angka signifikansi hasil riset > 0,05, maka H0 diterima

Didasarkan ketentuan diatas maka signifikansi hitung sebesar 0,03 < 0,05, maka H0 ditolak dan H1 diterima. Artinya  Ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai.

Dalam SPSS pengujian dilakukan dengan menggunakan angka signifikansi. Oleh karena itu dalam contoh analisis pada bab berikutnya akan hanya menggunakan angka signifikansi.

 Koefesien Determinasi
Koefesien diterminasi dengan simbol r2 merupakan proporsi variabilitas dalam suatu data yang dihitung didasarkan pada model statistik. Definisi berikutnya menyebutkan bahwa r2 merupakan rasio variabilitas nilai-nilai yang dibuat model dengan variabilitas nilai data asli. Secara umum r2 digunakan sebagai informasi mengenai kecocokan  suatu model.  Dalam regresi r2 ini dijadikan sebagai pengukuran seberapa baik garis regresi mendekati nilai data asli yang dibuat model. Jika r2 sama dengan 1, maka angka tersebut menunjukkan garis regresi cocok dengan data secara sempurna.

Interpretasi lain ialah bahwa r2 diartikan sebagai proporsi variasi tanggapan yang diterangkan oleh regresor (variabel bebas / X) dalam model. Dengan demikian, jika r2 = 1 akan mempunyai arti bahwa model yang sesuai menerangkan semua variabilitas dalam variabel Y. jika r2 = 0 akan mempunyai arti bahwa tidak ada hubungan antara regresor (X) dengan variabel Y. Dalam kasus misalnya jika r2 = 0,8 mempunyai arti bahwa sebesar 80% variasi dari variabel Y (variabel tergantung / response) dapat diterangkan dengan variabel X (variabel bebas / explanatory); sedang sisanya 0,2 dipengaruhi oleh variabel-variabel yang tidak diketahui atau variabilitas yang inheren. (Rumus untuk menghitung koefesien determinasi (KD) adalah KD = r2 x 100%) Variabilitas mempunyai makna penyebaran / distribusi seperangkat nilai-nilai  tertentu. Dengan menggunakan bahasa umum, pengaruh variabel X terhadap Y adalah sebesar 80%; sedang sisanya 20% dipengaruhi oleh faktor lain.

Dalam hubungannya dengan korelasi, maka  r2  merupakan kuadrat dari koefesien korelasi yang berkaitan dengan variabel bebas (X) dan variabel Y (tergantung). Secara umum dikatakan bahwa r2  merupakan kuadrat korelasi antara variabel yang digunakan sebagai predictor (X) dan variabel yang memberikan response (Y). Dengan menggunakan bahasa sederhana r2  merupakan koefesien korelasi yang dikuadratkan. Oleh karena itu, penggunaan koefesien determinasi dalam korelasi tidak harus diinterpretasikan sebagai besarnya pengaruh variabel X terhadap Y mengingat bahwa korelasi tidak sama dengan kausalitas. Secara bebas dikatakan dua variabel mempunyai hubungan belum tentu variabel satu mempengaruhi variabel lainnya. Lebih lanjut dalam konteks korelasi antara dua variabel maka pengaruh variabel X terhadap Y tidak nampak. Kemungkinannya hanya korelasi merupakan penanda awal bahwa variabel X mungkin berpengaruh terhadap Y. Sedang bagaimana pengaruh itu terjadi dan ada atau tidak kita akan mengalami kesulitan untuk membuktikannya. Hanya menggunakan angka r2 kita tidak akan dapat membuktikan bahwa variabel X mempengaruhi Y.

Dengan demikian jika kita menggunakan korelasi sebaiknya jangan menggunakan koefesien determinasi untuk melihat pengaruh X terhadap Y karena korelasi hanya menunjukkan adanya hubungan antara variabel X dan Y. Jika tujuan riset hanya untuk mengukur hubungan maka sebaiknya berhenti saja di angka koefisien korelasi. Sedang jika kita ingin mengukur besarnya pengaruh variabel X terhadap Y sebaiknya menggunakan rumus lain, seperti regresi atau analisis jalur.

Bentuk korelasi

Salah satu jenis korelasi yang paling populer adalah koefisien korelasi momen-produk Pearson, yang diperoleh dengan membagi kovarians kedua variabel dengan perkalian simpangan bakunya. Meski memiliki nama Pearson, metode ini pertama kali diperkenalkan oleh Francis Galton.

Koefisien korelasi momen-produk Pearson

Sifat-sifat matematis


Korelasi linier antara 1000 pasang pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh korelasi = +1).
Korelasi ρX, Y antara dua peubah acak X dan Y dengan nilai yang diharapkan μX dan μY dan simpangan baku σX dan σY didefinisikan sebagai:
\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y}.
Karena μX = E(X), σX2 = E(X2) − E2(X) dan demikian pula untuk Y, maka dapat pula ditulis


\rho_{X,Y}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E(X^2)-E^2(X)}~\sqrt{E(Y^2)-E^2(Y)}}
Korelasi dapat dihitung bila simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktian ketidaksamaan Cauchy-Schwarz, koefisien korelasi tak akan melebihi dari 1 dalam nilai absolut. Korelasi bernilai 1 jika terdapat hubungan linier yang positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1 dan +1 yang menunjukkan tingkat dependensi linier antara dua variabel. Semakin dekat dengan -1 atau +1, semakin kuat korelasi antara kedua variabel tersebut.
Jika variabel-variabel tersebut saling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ketergantungan linier antara kedua variabel. Misalnya, peubah acak X berdistribusi uniform pada interval antara -1 dan +1, dan Y = X2. Dengan demikian nilai Y ditentukan sepenuhnya oleh X, sehingga

Koefisien korelasi non-parametrik

Koefisien korelasi Pearson merupakan statistik parametrik, dan ia kurang begitu menggambarkan korelasi bila asumsi dasar normalitas suatu data dilanggar. Metode korelasi non-parametrik seperti ρ Spearman and τ Kendall berguna ketika distribusi tidak normal. Koefisien korelasi non-parametrik masih kurang kuat bila dibandingkan dengan metode parametrik jika asumsi normalitas data terpenuhi, namun cenderung memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.

Metode pengukuran yang lain untuk mengetahui dependensi antara dua peubah acak

 Untuk mendapatkan suatu pengukuran mengenai dependensi data (juga nonlinier), dapat digunakan rasio korelasi, yang mampu mendeteksi hampir segala dependensi fungsional

Kopula dan korelasi

Banyak orang yang keliru menganggap bahwa informasi yang diberikan dari sebuh koefisien korelasi sudah cukup mendefinisikan struktur ketergantungan (dependensi) antara peubah acak. Namun untuk mengetahui adanya ketergantungan antara peubah acak harus dipertimbangkan pula kopula antara keduanya. Koefisien korelasi dapat didefinisikan sebagai struktur ketergantungan hanya pada beberapa kasus, misalnya dalam fungsi distribusi kumulatif pada distribusi normal multivariat.

Matriks korelasi

Matriks korelasi n peubah acak X1, ..., Xn adalah n  ×  n matrik dimana i,j adalah corr(XiXj). Jika ukuran korelasi yang digunakan adalah koefisien momen-produk, matriks korelasi akan sama dengan matriks kovarians peubah acak yang telah distandarkan Xi /SD(Xi) untuk i = 1, ..., n. Sehingga, matriks korelasi merupakan matriks definit tak-negatif.
Matriks korelasi selalu simetris, yakni korelasi antara Xi dan Xj adalah sama dengan korelasi antara Xj and Xi).

"Korelasi tak selalu berarti sebab-akibat"

Diktum konvensi bahwa "korelasi tak selalu berarti sebab-akibat" dibahas dalam artikel hubungan artifisial (spurious relationship). Lihat pula korelasi mengarah ke hubungan sebab-akibat (kekeliruan logis). Bagaimanapun, korelasi tak diasumsukan selalu akausal, meski penyebab tersebut bisa pula tidak diketahui.

Menghitung korelasi secara akurat dengan metode numerik

Berikut adalah algoritma (dalam pseudocode) yang akan mengestimasi korelasi dengan menggunakan metode mumerik
sum_sq_x = 0
sum_sq_y = 0
sum_coproduct = 0
mean_x = x[1]
mean_y = y[1]
last_x = x[1]
last_y = y[1]
for i in 2 to N:
sweep = (i - 1.0) / i
delta_x = x[i] - mean_x
delta_y = y[i] - mean_y
sum_sq_x += delta_x * delta_x * sweep
sum_sq_y += delta_y * delta_y * sweep
sum_coproduct += delta_x * delta_y * sweep
mean_x += delta_x / i
mean_y += delta_y / i
pop_sd_x = sqrt( sum_sq_x / N )
pop_sd_y = sqrt( sum_sq_y / N )
cov_x_y = sum_coproduct / N
correlation = cov_x_y / (pop_sd_x * pop_sd_y)


 Sumber :

 Usman, Husaini, Prof.Dr, et.al, Pengantar statistik, Bumi Aksara, Jakarta, 2009

http://id.wikipedia.org/wiki/Korelasi

.


Tag:

Bagikan Ini

Baca Juga

Tidak ada komentar:

Posting Komentar