PENDAHULUAN
Latar Belakang
Statistika adalah ilmu yang
mempelajari bagaimana merencanakan, mengumpulkan, menganalisis dan
mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenan dengan
data. Statistika dibagi menjadi dua, yaitu Statistika Deskriptif dan Statistika
Inferensial. Statistika deskriptif berkenaan dengan deskripsi data, misalnya
dari menghitung rata-rata dan varians dari data mentah; mendeksripsikan
menggunakan tabel-tabel atau grafik sehingga data mentah lebih mudah “dibaca”
dan lebih bermakna. Sedangkan statistika inferensial lebih dari itu, misalnya
melakukan pengujian
hipotesis,
melakukan prediksi observasi masa depan, atau
membuat model regresi. Untuk saat ini, kami akan membahas
tentang ilmu Statistika Deskriptif.
Statistika dalam arti sempit berarti
kumpulan data berupa angka, penyajian data dalam table dan grafik, bilangan
yang menunjukan karakteristik dari kumpulan data. Statistika dalam arti luas
yaitu metode yang digunakan dalam pengumpulan dan analisis data yang berupa
angka-angka sehingga dapat diperoleh informasi yang berguna. Statistika adalah
suatu metode yang menjelaskan tata cara pengumpulan, penyusunan, penyajian,
penganalisaan, dan penginterprestasian data menjadi informasi yang lebih
berguna. (wikipedia).
Menurut Sudjana (1996:7), Statistika
Deskriptif adalah fase statistika dimana hanya berusaha melukiskan atau
menganalisa kelompok yang diberikan tanpa membuat atau menarik kesimpulan
tentang populasi atau kelompok yang lebih besar dinamakan Statistika
Deskriptif.
Dalam
materi Statistika Deskriptif, terdapat Regresi dan Korelasi. Regresi dan
korelasi digunakan untuk mempelajari pola dan mengukur hubungan statistik
antara dua atau lebih variabel.
Sepanjang
sejarah umat manusia,orang melakukan penelitian tentang ada tidaknya hubungan
antara dua hal,fenomena,kejadian atau lainnya. Dan ada tidaknya pengaruh antara
satu kejadian dengan kejadian yang lainnya. Karena itu untuk mempermudah dalam
melakukan penghitungan suatu kejadian maka digunakan korelasi dan regresi dalam
ilmu statistika.
Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (Measures of association). Teknik ini berguna untuk mengukur kekuatan hubungan antara dua variabel (kadang lebih dari dua variabel) dengan skala-skala tertentu.
Regresi merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh suatu variabel terhadap variabel lain .Dalam analisis regresi ,variabel yang mempengaruhi disebut independent variabel (variable bebas) dan variabel yang dipengaruhi disebut dependent variabel (variabel terikat).
Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (Measures of association). Teknik ini berguna untuk mengukur kekuatan hubungan antara dua variabel (kadang lebih dari dua variabel) dengan skala-skala tertentu.
Regresi merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh suatu variabel terhadap variabel lain .Dalam analisis regresi ,variabel yang mempengaruhi disebut independent variabel (variable bebas) dan variabel yang dipengaruhi disebut dependent variabel (variabel terikat).
Maka dari itu, kami membuat makalah
ini dengan judul “Analisa Korelasi dan Regresi”.
Rumusan Masalah
Berdasarkan latar belakang di atas, dapat di rumuskan sebuah
permasalahan sebagai berikut:
1.
Apa
pengertian Regresi dan Korelasi?
2.
Apa
kegunaan Regresi dan Korelasi?
3.
Apa
macam-macam Regresi dan Korelasi?
Tujuan Penulisan
Berikut ini adalah beberapa tujuan penulisan makalah :
1.
Untuk
memenuhi persyaratan dalam memperoleh nilai UAS Statistika Deskriptif semester
III.
2.
Untuk
mengetahui pengertian dan perhitungan Regrasi dan Korelasi.
3.
Untuk
mengetahui cara perhitungan Ukuran Gejala Pusat Data yang belum di kelompokkan.
4.
Membuat
para mahasiswa lebih mengetahui dan memahami materi ini melalui analisa data,
penarikan kesimpulan dan pembuat keputusan.
Metode Penulisan
Dalam penulisan makalah ini kami
menggunakan metode study kepustakaan yaitu proses pencarian dan pengumpulan
data dari buku-buku dan situs-situs yang berhubungan dengan judul makalah yang
kami buat.
BAB II
KAJIAN TEORI
Pengertian Regresi
Istilah regresi pertama kali
diperkenalkan oleh Sir Francis Galton pada tahun 1886. Galton menemukan adanya
tendensi bahwa orang tua yang memiliki tubuh tinggi memiliki anak-anak yang
tinggi, orang tua yang pendek memiliki anak-anak yang pendek pula. Kendati
demikian. Ia mengamati bahwa ada kecenderungan tinggi anak cenderung bergerak
menuju rata-rata tinggi populasi secara keseluruhan. Dengan kata lain,
ketinggian anak yang amat tinggi atau orang tua yang amat pendek cenderung
bergerak kearah rata-rata tinggi populasi. Inilah yang disebut hukum Golton
mengenai regresi universal. Dalam bahasa galton, ia menyebutkan sebagai regresi
menuju mediokritas.
Hukum regresi semesta (law
of universal regression) dari Galton diperkuat oleh temannya Karl
Pearson, yang mengumpulkan lebih dari seribu catatan tinggi anggota kelompok
keluarga. Ia menemukan bahwa rata-rata tinggi anak laki-laki kelompok ayah
(yang) pendek lebih besar dari pada tinggi ayah mereka, jadi “mundurnya” (“regressing”) anak
laki-laki yang tinggi maupun yang pendek serupa kea rah rata-rata tinggi semua
laki-laki. Dengan kata lain Galton, ini adalah “kemunduran kearah sedang”.
Secara umum, analisis regresi pada
dasarnya adalah studi mengenai ketergantungan satu variabel dependen (terikat)
dengan satu atau lebih variabel independent (variabel penjelas/bebas), dengan
tujuan untuk mengestimasi dan/ atau memprediksi rata-rata populasi atau niiai
rata-rata variabel dependen berdasarkan nilai variabe! independen yang
diketahui. Pusat perhatian adalah pada upaya menjelaskan dan mengevalusi
hubungan antara suatu variabel dengan satu atau lebih variabel independen.
Hasil analisis regresi adalah berupa
koefisien regresi untuk masing-masing variable independent. Koefisien ini
diperoleh dengan cara memprediksi nilai variable dependen dengan suatu
persamaan.
Analisis regresi merupakan alat
analisis staistik yang memanfaatkan hubungan antara dua variabel atau lebih.
Tujuannya adalah untuk membuat perkiraan (prediksi) yang dapat dipercaya untuk
nilai suatu variabel (biasa disebut variabel terikat atau variabel dependent
atau variabel respons), jika nilai variabel lain yang berhubungan dengannya
diketahui (biasa disebut variabel bebas atau variabel independent atau variabel
prediktor).
Analisis regresi pertama kali
dikenalkan sebagai metode analisis statistik pada tahun 1877 oleh Sir Francis
Galton (1822-1911) yang meneliti tentang hubungan antara tinggi badan orang tua
(ayah) dengan anaknya. Beliau mengungkapkan bahwa terdapat kecenderungan orang
tua yang tinggi badannya akan memiliki anak yang tinggi pula atau sebaliknya
orang tua yang pendek badannya akan memiliki anak yang pendek pula, tetapi
distribusi (penyebaran) rata-rata tinggi badan dari generasi kegenerasi adalah
tetap.
Selanjutnya hasil analisis Galton
disempurnakan oleh Karl Pearson dengan mengambil sampel lebih dari
1000 pengamatan. Pearson menemukan bahwa untuk kelompok anak yang tinggi dan
kelompok orang tua yang tinggi, ternyata tinggi badan anak lebih pendek dari
ayahnya. Sedangkan dari kelompok ayah dan anak yang lebih pendek, ternyata
tinggi badan anaknya lebih tinggi dari ayahnya. Peristiwa yang berbalikan
inilah disebut merosot (to regres).
Tujuan Analisis Regresi :
1.
Untuk
memperoleh suatu persamaan garis yang menunjukkan persamaan hubungan antara dua
variabel. Persamaan garis yang diperoleh disebut persamaan regresi.
2.
Untuk
mengetahui besarnya pengaruh perubahan tiap unit variabel bebas terhadap
perubahan variabel terikatnya. Pengaruh perubahan tiap unit variabel bebas
ditunjukkan oleh nilai koefisien regresinya.
3.
Untuk
menaksir nilai variabel terikat (Y) berdasarkan variabel bebas (X) yang
nilainya telah diketahui. Penaksiran disini bersifat deterministik (pasti) atau
non-stokastik, maksudnya penaksiran atau pendugaan yang dilakukan mengabaikan
faktor ketidakpastian.
- Bentuk Umum Regresi Linier
Sederhana
y
= a + bx
y :
peubah takbebas
x :
peubah bebas
a :
konstanta
b :
kemiringan
Pengertian Korelasi
Korelasi merupakan teknik analisis
yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (measures
of association). Pengukuran asosiasi merupakan istilah umum
yang mengacu pada sekelompok teknik dalam statistik bivariat yang digunakan
untuk mengukur kekuatan hubungan antara dua variabel.
Analisis korelasi sederhana (Bivariate
Correlation) digunakan untuk mengetahui keeratan hubungan antara dua variabel
dan untuk mengetahui arah hubungan yang terjadi. Koefisien korelasi sederhana
menunjukkan seberapa besar hubungan yang terjadi antara dua variabel. Dalam
SPSS ada tiga metode korelasi sederhana (bivariate correlation)
diantaranya Pearson Correlation, Kendall’s tau-b, dan Spearman
Correlation. Pearson Correlation digunakan untuk data
berskala interval atau rasio, sedangkan Kendall’s tau-b, dan Spearman
Correlation lebih cocok untuk data berskala ordinal.
Dalam korelasi sempurna tidak
diperlukan lagi pengujian hipotesis, karena kedua variabel mempunyai hubungan
linear yang sempurna. Artinya variabel X mempengaruhi variabel Y secara
sempurna. Jika korelasi sama dengan nol (0), maka tidak terdapat hubungan
antara kedua variabel tersebut. Dalam korelasi sebenarnya tidak dikenal istilah
variabel bebas dan variabel tergantung. Biasanya dalam penghitungan digunakan
simbol X untuk variabel pertama dan Y untuk variabel kedua. Dalam contoh
hubungan antara variabel remunerasi dengan kepuasan kerja, maka variabel remunerasi
merupakan variabel X dan kepuasan kerja merupakan variabel Y.
Analisis korelasi sederhana (Bivariate
Correlation) digunakan untuk mengetahui keeratan hubungan antara dua
variabel dan untuk mengetahui arah hubungan yang terjadi. Koefisien korelasi
sederhana menunjukkan seberapa besar hubungan yang terjadi antara dua variabel.
Analisis korelasi adalah alat
statistik yang digunakan untuk mengetahui derajat hubungan linear antara
variable yang satu dengan yang lainnya.
Terdapat perbedaan dan hubungan yang
mendasar antara analisis korelasi dan regresi dari segi kegunaan, analisis
korelasi digunakan untuk mencaari arah dan kuatnya hubungan antara dua
variabel, sedangkan analisis regresi digunakan untuk memprediksikan seberapa
jauh perubahan nilai variabel dependen bila nilai variabel
independen diketahui. Perbedaan lainnya adalah analisis korelasi posisinya
antar variabel setara, sedangkan analisis regresi (linear sederhana) posisi
antar variabel tidak setara (yang satu merupakan variabel dependen dan lainnya
variabel indpenden).
Dalam penerapannya terdapat beberapa
ukuran korelasi, tiga di antaranya yang paling sering digunakan adalah
koefisien korelasi product moment Pearson (digunakan dalam statistik parametik,
biasa digunakan untuk data interval dan rasio), korelasi tingkat Spearman, dan
korelasi tou kendall (digunakan dalam statistic nonparametik, biasa digunakan
untuk data nominal dan ordinal).
BAB III
PEMBAHASAN
Sejarah Statistika
Gottfried
Achenwall (1749)
menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai
nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai
“ilmu tentang negara (state)”. Pada awal abad ke-19 telah terjadi pergeseran arti
menjadi “ilmu mengenai pengumpulan dan klasifikasi data”. Sir John Sinclair
memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa
Inggris. Jadi,
statistika secara prinsip mula-mula hanya mengurus data yang dipakai
lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus
berlanjut, khususnya melalui sensus yang dilakukan secara teratur
untuk memberi informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20
statistika mulai banyak menggunakan bidang-bidang dalam matematika, terutama peluang. Cabang statistika yang pada saat
ini sangat luas digunakan untuk mendukung metode ilmiah, statistika
inferensi,
dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald
Fisher (peletak
dasar statistika inferensi), Karl Pearson (metode regresi
linear), dan William
Sealey Gosset (meneliti
problem sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan
telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang-cabang terapannya,
serta psikologi banyak dipengaruhi oleh
statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu
gabungan seperti ekonometrika, biometrika (atau biostatistika),
dan psikometrika.
Meskipun ada pihak yang menganggap
statistika sebagai cabang dari matematika, tetapi sebagian pihak lainnya
menganggap statistika sebagai bidang yang banyak terkait dengan matematika
melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian
besar masuk dalam fakultas matematika dan ilmu
pengetahuan alam,
baik di dalam departemen tersendiri maupun tergabung dengan matematika.
Analisis Regresi
Jika dalam analisis korelasi
peneliti hanya tertarik pada derajat asosiasi atau kecenderungan umum dua buah
peubah atau lebih, maka dalam analisis regresi peneliti ingin memperoleh
hubungan fungsional antara dua peubah yang dinyatakan dalam bentuk , Y a bX = +
yang merupakan penduga dari fungsi yang ada pada populasi yang biasa
dinotasikan dengan 0 1 , atau = , Y X Y X α βββ = ++ atau untuk peubah bebas
lebih dari satu dinyatakan sebagai = ,… Y X X β ββ ++ Melalui analisis regresi
peneliti ingin menghitung nilai penduga untuk j β yang sesuai dengan data.
Selain melakukan penghitungan nilai penduga untuk j β juga sekaligus melakukan
uji apakah nilainya signifikan atau dapat diabaikan (tidak signifikan). Regresi
mengukur seberapa besar suatu variabel mempengaruhi variabel yang lain,
sehingga dapat digunakan untuk melakukan peramalan nilai suatu variabel
berdasarkan variabel lain. Analisa regresi ada dua : Analisa Regresi Sederhana
dan Analisis Regresi Berganda.
Analisis regresi linier berganda
adalah hubungan secara linear antara dua atau lebih variabel independen (X1, X2,….Xn) dengan variabel dependen (Y). Analisis ini untuk
mengetahui arah hubungan antara variabel independen dengan variabel dependen
apakah masing-masing variabel independen berhubungan positif atau negatif dan
untuk memprediksi nilai dari variabel dependen apabila nilai variabel
independen mengalami kenaikan atau penurunan. Data yang digunakan biasanya
berskala interval atau rasio.
Analisis regresi sederhana hanya
terdiri atas satu peubah bebas (peubah penjelas/eksplanatori) X dan satu peubah
terikat (respon) Y dengan hubungan linier. Kedua peubah ini merupakan peubah
kuantitatif, khusus untuk Y harus dengan skala interval atau rasio. Dengan
visualisasi secara geometris dapat ditafsirkan bahwa dengan analisis regresi
kita ingin menduga garis populasi yang sesungguhnya tidak pernah diketahui
(garis lurus putus-putus) berdasarkan sampel pasangan data pada sampel.
Persoalanvini merupakan persoalan estimasi uji inferensi daam regresi. Garis
regresi penduga ini dapat dipergunakan untuk meramal (prediksi) rentang
rata-rata nilai Y pada saat nilai X diketahui, demikian juga rentang
nilai-nilai Y pada saat nilai tertentu dari X .
Berikut ini adalah contoh rumus :
Keterangan :
Y = nilai yang diukur/dihitung pada variabel tidak bebas
x = nilai tertentu dari variabel bebas
a = intersep/perpotongan garis regresi dengan sumbu y
b = koefisien regresi /kemiringan dari garis regresi/untuk
mengukur kenaikan atau penurunan y untuk setiap perubahan satu-satuan x /untuk
mengukur besarnya pengaruh x terhadap y kalau x naik satu unit.
Analisa Korelasi
Analisa Korelasi digunakan untuk mengukur kekuatan
keeratan hubungan antara dua variabel melalui sebuah bilangan yang disebut
koefisien korelasi. Dalam analisis korelasi, kita menghitung derajat asosiasi
antara satu peubah peubah lain (misalnya antara berat badan dan tinggi badan,
antara berat dengan kolesterol, antara nilai IQ dengan perolehan nilai ujian
mata matematika dan sebagainya). Ada dua jenis ukuran korelasi yang banyak
yaitu:
1.
Korelasi
produk momen Pearson untuk mengukur derajat asosiasi beberapa peubah dengan
skala interval atau rasio.
2.
Korelasi
Spearman untuk mengukur derajat asosiasi antara beberapa dengan skala ordinal
(rank).
· Koefisien korelasi linier ( r
) adalah ukuran hubungan linier antara
dua variabel/peubah acak X dan Y untuk mengukur sejauh mana titik-titik
menggerombol sekitar sebuah garis lurus regresi. Berikut ini adalah rumus dari
Korelasi :
Koefisien korelasi atau derajat asosiasi
dua peubah (dinotasikan dengan r). Besarnya r berkisar antara -1<.r<1.
Ilustrasi grafik sebaran data dengan berbagai nilai korelasi dapat disajikan
dalam bentuk diagram pencar.
Kegunaan diagram pencar :
1.
Membantu
menunjukkan apakah terdapat hubungan yang bermanfaat antara dua variabel.
2.
Membantu
menetapkan tipe persamaan yang menunjukkan hubungan antara kedua variabel
tersebut.
3.
Menentukan
persamaan garis regresi atau mencari nilai-nilai konstan.
· Koefisien Determinasi ( r2 )
1.
nilainya
antara 0 dan 1
2.
untuk
menyatakan proporsi keragaman total nilai-nilai peubah Y yang dapat dijelaskan
oleh nilai-nilai peubah X melalui hubungan linier tersebut.
3.
Contoh
: r = 0,6 artinya 0,36 atau 36 % diantara keragaman total nilai-nilai Y dapat
dijelaskan oleh hubungan liniernya dengan nilai-nilai X. atau Besarnya
sumbangan X terhadap naik turunnya Y adalah 36 % sedangkan 64 % disebabkan oleh
faktor lain.
Contoh Regresi dan Korelasi
Berikut adalah data biaya promosi dan volume penjualan PT.
Sukasukaku perusahaan minyak goreng.
Tahun
|
X
Biaya
Promosi
(Juta
Rupiah)
|
Y
Volume
penjualan
(Ratusan
juta rupiah per liter)
|
xy
|
X2
|
Y2
|
1992
|
2
|
5
|
10
|
4
|
25
|
1993
|
4
|
6
|
24
|
16
|
36
|
1994
|
5
|
8
|
40
|
25
|
64
|
1995
|
7
|
10
|
70
|
49
|
100
|
1996
|
8
|
11
|
88
|
64
|
121
|
∑
|
∑x=26
|
∑y=40
|
∑xy=232
|
∑x2=158
|
∑y2=346
|
Bentuk umum persamaan regresi linier sederhana: Y=a+bx
a=5
Peramalan dengan persamaan Regresi
Contoh:
Diketahui hubungan biaya promosi (x dalam juta rupiah) dan Y
(volume penjualan dalam ratusan juta liter) dapat dinyatakan dalam persamaan
regresi linier berikut:
Y=2.530+1.053X
Perkiraan volume penjualan jika dikeluarkan biaya promosi
Rp. 10 juta adalah?
Jawab:
Y=2.530+1.053X
X=10=y=2.53+1.053(10)=2.53+10.53=13.06 (ratusan juta liter)
Volume penjualan = 13.06 x 100.000.000 liter
Korelasi
Jika nilai r mendekati +1 atau r mendekati -1 maka X dan Y
memiliki korelasi linier yang tinggi.
Jika nilai r = +1 atau r = -1 maka X dan Y memiliki korelasi
linier sempurna
Jika nilai r = 0 maka X dan Y tidak memiliki hubungan linier
Lihat contoh diatas, setelah mendapatkan persamaan regresi
Y=2.530+1.053X, hitung koefisien korelasi (r) dan koefisien determinasi (R).
Gunakan data berikut (lihat contoh diatas)
Nilai r = 0.9857 menunjukkan bahwa peubah X (biaya promosi)
dan Y (volume penjualan) berkorelasi linier yang positif dan tinggi.
R= r2 =
098572..=0.97165…=97%
Nilai R=97% menunjukkan bahwa 97% proporsi kergaman nilai
peubah Y (volume penjualan) dapat dijelaskan oleh nilai peubah X (biaya
promosi) melalui hubungan linier. Sisanya, yaitu 3% dijelaskan oleh hal-hal
lain.
Analisis Korelasi dan Regresi dengan
Excel
1.
Untuk
dapat menggunakan perintah data analisis:
· Aktifkan program Microsoft Excel
hingga terdapat worksheet kosong.
· Klik File, Klik Menu Options,
· Sebuah kotak dialog Excel Options
ditampilkan, dan klik menu add-ins,
· Dibagian bawah terdapat kotak
Manage: Excel Add-ins. Klik icon Go.
· Check list Anaylsis Tool Pak dan
klik Go
2.
Analisis
Regresi
Analisis regresi bertujuan untuk melihat pengaruh satu
variabel terhadap variabel lainnya.
Langkah-langkah membuat Regresi dengan menggunakan excel:
1.
Ketik
data X pada kolom B dan data Y pada kolom C
2.
Pilih Data pada
menu utama
3.
Pilih Data
Analysis
4.
Pilih Regression
5.
Klik OK Setelah
muncul kotak dialog
üPada input Y range , sorot
pada range C3:C7
üPada input X range,
sorot pada range B3:B7
üPada output range, ketik
A9
üKlik OK
Maka hasil yang akan dikeluarkan adalah sebagai berikut:
3.
Analisis
Korelasi
· Analisis korelasi juga dapat
digunakan dalam Excel.
· Korelasi menunjukkan keeratan
hubungan antar variabel
· Keeratan tersebut dicerminkan dari
nilai korelasi yang semakin tinggi.
· Nilai korelasi berada di antara 0
hingga 1
· Tanda nya dapat positip dan negatif
· Positip menunjukkan hubungan dua
variabel searah sedang negatif menunjukkan hubungan kedua variabel berlawanan.
Langkah-langkahnya membuat korelasi dengan menggunakan
excel:
1.
Pilih Data pada
menu utama
2.
Pilih Data
analysis
3.
Pilih Correlation
4.
Klik OK Setelah
muncul kotak dialog
ü Pada Input
Range, sorot pada range A2:B11
ü Pada Output
Range, ketik D23
ü Klik OK
4.
Membuat
grafik regresi linier
5.
Pilih
menu Insert – Scatter, pilih type scatter only mark
6.
Pada
Chart Layout dimenu bar, pilih Layout ke 3. Maka hasil yang akan keluar adalah
sebagai berikut.
Perbedaan Regresi dan Korelasi
Pernyataan yang sering kita dengan
adalah bahwa regresi dimengerti dengan kata kunci pengaruh, dan korelasi
dimengerti dengan kata kunci hubungan. Pengertian sederhana itu tidaklah salah,
akan tetapi, tidak ada salahnya juga kita memahami secara lebih lanjut tentang
regresi dan korelasi.
Analisis korelasi berkaitan erat
dengan regresi, tetapi secara konsep berbeda dengan analisis regresi. Analisis
korelasi adalah mengukur suatu tingkat atau kekuatan hubungan linear antara dua
variabel. Koefisien korelasi adalah mengukur kekuatan hubungan linear. Sebagai contoh,
kita tertarik untuk menemukan korelasi antara merokok dengan penyakit kanker,
berdasarkan penjelasan statistik dan matematika, pada anak sekolah dan
mahasiswa (dst). Dalam analisis regresi, kita tidak menggunakan pengukuran
tersebut. Analisis regresi mencoba untuk mengestimasi atau memprediksikan nilai
rata-rata suatu variabel yang sudah diketahui nilainya, berdasarkan suatu
variabel lain yang juga sudah diketahui nilainya. Misalnya, kita ingin
mengetahui apakah kita dapat memprediksikan nilai rata-rata ujian statistik
berdasarkan nilai hasil ujian matematika.
Regresi mempelajari
bentuk hubungan antar variabel mealui suatu persamaan. Persamaan yang digunakan
untuk melihat hubungan antar variabel adalah Regresi Linear Sederhana (RLS),
Regresi Linear Berganda (RLB), dan Regresi non Linear.
Regresi bisa berupa hubungan sebab akibat.
Regresi mengukur seberapa besar
suatu variabel mempengaruhi variabel yang lain, sehingga dapat digunakan untuk
melakukan peramalan nilai suatu variabel berdasarkan variabel lain.
Korelasi juga mempelajari hubungan antar variabel, tetapi
digunakan untuk melihat seberapa erat hubungan antar dua variabel kuantitatif
dilihat dari besarnya angka dan bukan dari tandanya.
Dengan menggunakan korelasi, kita
dapat mengetahui arah hubungan yang terjadi dalam dua variabel. Jika korelasi
bertanda positif artinya berbanding lurus dan jika bertanda negatif maka
berbanding terbalik.
Korelasi tidak bisa menyatakan
hubungan sebab akibat meskipun angka korelasinya tinggi. Misal ada dua
pernyataan:
1.
tanaman
mati kekeringan di musim kemarau
2.
pupuk
kompos diberikan saat musim kemarau
Dari kedua pernyataan di atas, kita
tidak dapat mengatakan bahwa pupuk kompos menyebabkan tanaman mati meskipun
korelasinya tinggi.
Manfaat Korelasi dan Regresi
Kegunaan
Analisis Korelasi dan Regresi. Dalam kebanyakan fenomena alam, menaksir rerata
populasi, atau menguji perbedaan dua rerata dengan teknik uji statistika, baik
yang memerlukan asumsi sebaran khusus (parametrik) mau pun yang tidak ketat
asumsi sebarannya (nonparametrik) menjadi tidak efisien dan tidak efektif lagi.
Hal ini disebabkan oleh banyaknya peubah yang berhubungan dan saling
menjelaskan antara yang satu dengan yang lainnya. Misalnya, kita akan
memperkirakan nilai jual sebuah rumah di suatu daerah tertentu. Kita dapat
mengambil sampel acak dari ratusan rumah yang ada dalam daerah tersebut,
kemudian kita menghitung rerata harga jualnya. Tetapi, menggunakan metode ini,
kita mengabaikan informasi yang mudah diamati, misalnya luas lantai, banyaknya
kamar tidur, banyaknya kamar mandi, dan umur rumah tersebut. Informasi ini akan
lebih bermanfaat kalau digunakan menaksir nilai jual rumah yang bersangkutan.
Dari latar belakang yang kita
perhatikan di atas, metode atau analisis korelasi dan regresi merupakan topik
penting untuk dibicarakan. Metode korelasi dapat mengukur kuatnya hubungan
antara dua peubah yang sifat hubungannya simetris atau timbal balik Seperti
metode korelasi; metode regresi sudah menjadi bagian integral dari setiap
analisis data yang memperhatikan hubungan antara satu peubah tanggapan
(response variable) dengan satu atau lebih peubah penjelas (explanatory
variables). Istilah peubah tanggapan kadang-kadang juga disebut peubah terikat
atau terikat (dependent variable), dan peubah penjelas disebut peubah penaksir
(predictor variable) atau peubah bebas (independent variable). Penggunaan
istilah ini biasanya disesuaikan dengan situasi peubah-peubah yang dipelajari
hubungannya, dan juga selera penggunanya.
Pertama-tama kita akan membicarakan
masalah yang berkaitan dengan nilai rerata suatu peubah terikat Y (katakanlah
harga jual rumah) terhadap suatu peubah bebas X (misalnya luas lantai rumah)
dengan menggunakan hubungan linear. Model ini disebut model linear karena semua
peubah yang muncul dalam model itu berpangkat satu. Kalau dilihat dari
banyaknya peubah bebas dalam model, maka model itu disebut model linear
sederhana, karena hanya mempunyai satu peubah bebas.
Dalam hal mempelajari hubungan
antarpeubah, regresi linear bukan satu-satunya model yang harus digunakan, kita
juga dapat menggunakan model nonlinear, seperti model kuadratik, kubik,
eksponen, logaritma, dan lain-lain. Penentuan model tergantung pada sifat
peubah atau Pemilihan Peubah dalam Model populasi tempat data diambil. Sebelum
menentukan model pilihan, kita perlu mengadakan suatu diagnosis terhadap data
yang diperoleh. Diagram pencar adalah salah satu alat diagnosis untuk mendapatkan
gambaran tentang hubungan antara peubah bebas dan peubah terikat. Dari diagram
pencar itu, kita dapat memperkirakan bahwa model yang relevan adalah linear
atau nonlinear.
Selanjutnya, kalau kita memasukkan
lebih dari satu peubah bebas dalam model, maka diperoleh model regresi ganda
(multiple regression model). Seperti model sederhana, model regresi ganda dapat
juga dibedakan atas model regresi linear ganda dan model regresi nonlinear
ganda. Dalam hal ini, kita dapat membangun model satu peubah tanggapan Y
(katakanlah nilai jual rumah) sebagai fungsi dari peubah-peubah kuantitatif
(seperti luas lantai, umur rumah, luas pekarangan, dan banyaknya kamar), atau
sebagai fungsi dari peubah-peubah kualitatif (seperti jenis konstruksi, dan
lokasi).
Penggunaan Paket Komputer dalam
Statistika tersedianya paket statistika
sebagai perangkat lunak komputer memudahkan banyak peneliti dalam penggunaan
analisis statistik terhadap data yang diperoleh. Ketersediaan fasilitas ini
memudahkan dan sangat menguntungkan karena beberapa faktor.
1.
Proses
analisis, terutama perhitungan dapat dilakukan dengan cepat sekali tanpa ada
kesalahan hitung.
2.
Peneliti
dapat menghindari pekerjaan hitung yang memerlukan waktu lama apabila
dikerjakan dengan cara manual, yang akibatnya bisa melelahkan dan terjadinya
kesalahan.
3.
Peneliti
sudah dapat memiliki waktu yang cukup memadai untuk berpikir dan mengembangkan
masalah penelitiannya, menafsirkan hasil analisis data yang diperolehnya, dan
mengimplementasikan serta menindaklanjuti rekomendasi dari temuan-temuannya.
Di samping kemudahan dan sejumlah
keuntungan lain yang diberikan oleh fasilitas komputer yang tersedia, ada
peringatan keras agar peneliti memilih paket statistika dengan lebih hati-hati.
Paling sedikit tiga situasi yang memerlukan kehati-hatian dengan penggunaan
paket statistika dalam komputer, yaitu:
1.
Ketika
menganalisis data dan tidak memiliki pengetahuan statistika yang cukup untuk
mengerti secara lengkap hasil (out put) komputer yang diperoleh;
2.
ketika
mengajarkan penggunaan paket statistika dalam suatu pelatihan yang terpisah
dari pengajaran statistika;
3.
ketika
menggunakan paket statistika dalam pengajaran bidang tertentu tanpa memerlukan
metode statistika yang menunjang paket tersebut.
Determinasi
Koefesien diterminasi dengan Variabel r2 merupakan
proporsi variabilitas dalam suatu data yang dihitung didasarkan pada
model variable. Definisi berikutnya menyebutkan bahwa r2merupakan
rasio variabilitas nilai-nilai yang dibuat model dengan variabilitas nilai data
asli. Secara umum r2 digunakan sebagai informasi mengenai
kecocokan suatu model. Dalam regresi r2 ini
dijadikan sebagai pengukuran seberapa baik garis regresi mendekati nilai data
asli yang dibuat model. Jika r2 sama dengan 1, maka angka
tersebut menunjukkan garis regresi cocok dengan data secara sempurna.
Interpretasi lain ialah bahwa r2 diartikan
sebagai proporsi variasi tanggapan yang diterangkan oleh regresor (ariable
bebas / X) dalam model. Dengan demikian, jika r2 = 1 akan
mempunyai arti bahwa model yang sesuai menerangkan semua variabilitas
dalam variable Y. jika r2 = 0 akan mempunyai arti bahwa
tidak ada hubungan antara regresor (X) dengan ariable Y. Dalam kasus misalnya
jika r2 = 0,8 mempunyai arti bahwa sebesar 80% variasi dari
ariable Y (ariable tergantung / response) dapat diterangkan dengan ariable X
(ariable bebas / explanatory); sedang sisanya 0,2 dipengaruhi oleh
ariable-variabel yang tidak diketahui atau variabilitas yang inheren. (Rumus
untuk menghitung koefesien determinasi (KD) adalah KD = r2x 100%)
Variabilitas mempunyai makna penyebaran / distribusi seperangkat
nilai-nilai tertentu. Dengan menggunakan bahasa umum, pengaruh ariable X
terhadap Y adalah sebesar 80%; sedang sisanya 20% dipengaruhi oleh ariab lain.
Dalam hubungannya dengan korelasi,
maka r2 merupakan kuadrat dari koefesien korelasi
yang berkaitan dengan ariable bebas (X) dan ariable Y (tergantung). Secara umum
dikatakan bahwa r2 merupakan kuadrat korelasi antara
ariable yang digunakan sebagai predictor (X) dan ariable yang memberikan
response (Y). Dengan menggunakan bahasa sederhana r2 merupakan
koefesien korelasi yang dikuadratkan. Oleh karena itu, penggunaan koefesien
determinasi dalam korelasi tidak harus diinterpretasikan sebagai besarnya
pengaruh ariable X terhadap Y mengingat bahwa korelasi tidak sama dengan
kausalitas. Secara bebas dikatakan dua ariable mempunyai hubungan belum tentu
ariable satu mempengaruhi ariable lainnya. Lebih lanjut dalam konteks korelasi
antara dua ariable maka pengaruh variable X terhadap Y tidak ariab.
Kemungkinannya hanya korelasi merupakan penanda awal bahwa variable X
mungkin berpengaruh terhadap Y.
Scatter Diagram (Diagram Pencar)
Digram scatter adalah salah satu
alat dari QC seven tools ( 7 alat pengendalian kualitas ) yang berfungsi untuk melakukan
pengujian seberapa kuatnya hubungan dua variabel serta menentukan dari dua
variabel tersebut apakah hubungan positip ataupun tidak ada hubungan sama
sekali. jenis hubungan Scatter diagram sangat berguna untuk mendeteksi korelasi
(hubungan) antara dua variable (faktor), sekaligus juga memperlihatkan tingkat
hubungantersebut (kuat atau lemah). Diagram scatter juga menjadi dasar
pembuatan chart yang sering digunakan dalam peramalan. Pada pemanfaatannya,
scatter diagram membutuhkan data berpasangan sebagai bahan baku analisisnya,
yaitu sekumpulan nilai x sebagai faktor yangindependen berpasangan dengan
sekumpulan nilai y sebagai faktor dependen.Artinya, bahwa setiap nilai x yang
didapatkan memberi dampak pada nilai y.Contohnya : Diperoleh data bahwa ada
hubungan antara banyaknya komplain(x)
dengan jumlah retur barang (y) : x = 5 y = 50 eks.x
= 10 y = 120 eks.x = 12 y = 150 eks.
dst.Melalui penggambaran data tersebut dalam scatter diagram, akan dapat
dilakukan analisa lebih lanjut, sejauh mana antara faktor x dan y memiliki
korelasi, yang dalam hal ini direpresentasikan sebagai nilai r (rho), yaitu
nilai yang menunjukkan tingkat keeratan hubungan antar faktor tersebut.
Dikatakan kedua faktor itu berhubungan
sangat erat bila nilai rho mendekati angka + 1.Di samping itu, juga akan
dapat disimpulkan kecenderungan arah korelasitersebut (positif atau negatif).
Korelasi memiliki kecenderungan positif bila setiap pertambahanfaktor x
menyebab-kan pertambahan faktor y, sebaliknya kecenderungan negatif bila setiap
pertambahan menyebabkan pengurangan faktor y.
Tujuan
Penggunasn Scatter Diagram
a. Menguji
bagaimana kuatnya hubungan antara dua variabel
b. Menentukan
jenis hubungan dari dua variabel itu, apakah positif, negatif dantidak ada hubungan.
Fungsi Diagram Pencar
Scatter
diagram merupakan alat interpretasi data yang akan digunakan untuk :
a. Menguji
seberapa kuat hubungan antara dua variable (misalnya, hubungan antara biaya
iklan dengan penjualan, lama pengalaman dengan kinerja karyawan, dll.)
b. Memastikan
firasat akan hubungan sebab-akibat langsung antara jenis-jenis variabel.
c. Menentukan jenis hubungan (positif, negatif,
dll.)
Analisa (Pembuatan / Kasus)
X
|
Y
|
Xy
|
x²
|
y²
|
108
|
600
|
64.800
|
11.664
|
360.000
|
74
|
900
|
66.600
|
5.476
|
810.000
|
55
|
1.200
|
66.000
|
3.025
|
1.440.000
|
105
|
1.560
|
163.800
|
11.025
|
2.433.600
|
113
|
0
|
0
|
12.769
|
0
|
91
|
0
|
0
|
8.281
|
0
|
171
|
1.500
|
256.500
|
29.241
|
2.250.000
|
182
|
150
|
27.300
|
33.124
|
22.500
|
167
|
1.200
|
200.400
|
27.889
|
1.440.000
|
240
|
1.350
|
324.000
|
57.600
|
1.822.500
|
231
|
2.400
|
554.400
|
53.361
|
5.760.000
|
150
|
1.800
|
270.000
|
22.500
|
3.240.000
|
1.687
|
12.660
|
1.993.800
|
275.955
|
19.578.600
|
Dalam Ratusan
X
|
Y
|
Xy
|
x²
|
y²
|
1.08
|
6
|
6.48
|
11.664
|
36
|
0.74
|
9
|
6.66
|
0.5476
|
81
|
0.55
|
12
|
6.6
|
0.3025
|
144
|
1.05
|
15.6
|
16.38
|
1.1025
|
243.36
|
1.13
|
0
|
0
|
1.2769
|
0
|
0.91
|
0
|
0
|
0.8281
|
0
|
1.71
|
15
|
25.65
|
2.9241
|
225
|
1.82
|
1.5
|
2.73
|
3.3124
|
2.25
|
1.67
|
12
|
20.04
|
2.7889
|
144
|
2.4
|
13.5
|
32.4
|
5.7600
|
182.25
|
2.31
|
24
|
55.44
|
5.3361
|
576
|
1.5
|
18
|
27
|
2.2500
|
324
|
16.78
|
126.6
|
199.38
|
27.5955
|
1957.86
|
BAB IV
PENUTUP
Kesimpulan
Korelasi merupakan hubungan antara
dua kejadian dimana kejadian yang satu dapat mempengaruhi eksistensi kejadian
yang lain, Misalnya kejadian X mempengerahui kejadian Y. Apabila dua variable X
dan Y mempunyai hubungan, maka nilai variable X yang sudah diketahui dapat
dipergunakan untuk memperkirakan/menaksir atau meramalkan Y. Ramalan pada
dasarnya merupakan perkiraan/taksiran mengenai terjadinya suatu kejadian(nilai
suatu variabel) untuk waktu yang akan datang. Variable yang nilainya akan diramalkan
disebut variable tidak bebas (dependent variable), sedangkan variabel C yang
nilainya dipergunakan untuk meramalkan nilai Y disebut variable bebas
(independent variable) atau variable peramal (predictor) atau seringkali
disebut variable yang menerangkan (explanatory).
Jadi jelas analisis korelasi ini
memungkinkan kita untuk mengetahui suatu di luar hasil penyelidikan, Salah satu
cara untuk melakukan peramalan adalah dengan menggunakan garis regresi. Untuk
menghitung parameter yang akan dijadikan dalam penentuan hubungan
antara dua variabel, terdapat beberapa cara, yaitu: koefisien detreminasi,
koefisien korelasi.
Saran
Makalah ini kami susun agar
memberikan manfaat yang besar bagi para pembaca. Kami berharap makalah ini
dapat dijadikan sebagai bahan kajian sehingga dapat memberikan lebih
kejelasan bagi para pembaca tentang sub bab yang telah kami bahas. Kemudian
menurut hemat kami, makalah ini masih jauh dari kesempurnaan. Untuk itu kami
berharap kesedian bagi para pembaca untuk memberikan kritik dan
saran yang bersifat membangun, penulis harapkan semoga menjadi hasil yang
terbaik dan lebih sempurna di kemudian hari.
No comments:
Post a Comment