menggunakan statistika sebagai alat bantu dalam penyusunan laporan
penelitian, (3) menggunakan ... bab serta dilengkapi dengan soal-soal untuk
latihan.
BAHAN AJAR
STATISTIKA
Oleh: Dr. Samsudi, M.Pd
JURUSAN TEKNIK MESIN - FAKULTAS TEKNIK UNIVERSITAS NEGERI SEMARANG 2008
Samsudi - STATISTIKA
1
KATA PENGANTAR Puji dan syukur penulis panjatkan kehadirat Alloh SWT , yang telah melimpahkan petunjuk, bimbingan dan kekuatan lahir-batin sehingga dapat menyusun bahan ajar ini. Sasaran yang akan dicapai dengan buku Statistika ini adalah: (1) memberikan dasardasar pemahanan dan pengertian beberapa istilah statistika serta mafaatnya, (2) menggunakan statistika sebagai alat bantu dalam penyusunan laporan penelitian, (3) menggunakan rumus-rumus dan teknik analisis Statistika dan (4) memiliki sikap teliti dan cermat dalam menerima dan menggunakan sesuatu. Bahan ini terdiri atas 9 (sembilan) bab, yaitu: (1) Konsep dan Pengertian Statistika, (2) Distribusi Frekuensi, (3) Ukuran Statistika, (4) Deviasi Rata-rata dan Standar Deviasi, (5) Uji Hipotesis, (6) Teknik Analisis Korelasional, (7) Teknik Analisis Komparasional, (8) Teknik Analisis Variansi, (9) Analisis Regresi. Setiap bab terdiri atas beberapa sub bab serta dilengkapi dengan soal-soal untuk latihan. Penulis menyampaikan terima kasih sebanyak- banyaknya kepada fihak-fihak yang telah membantu penyusunan buku ini. Kritik dan saran yang bersifat konstruktif sangat penulis harapkan untuk kesempurnaan buku ini. Semarang, Oktober 2008 Dr. Samsudi, M.Pd
Samsudi - STATISTIKA
2
DAFTAR ISI KATA PENGANTAR ………………………………………………… DAFTAR ISI ……………………………………………………………
ii iii
BAB I
KONSEP DAN PENGERTIAN STATISTIKA …………. 1.1. Pengertian Statistika ................................................... 1.2. Statistika dalam Pelelitian ............................................ BAB II DISTRIBUSI FREKUENSI ................................................ 2.1. Distribusi Frekuensi .................................................... 2.2. Grafik dan Tabel Distribusi Frekuensi ........................ BAB III UKURAN STATISTIKA ................................................... 3.1. Pengukuran Tendensi Sentral ..................................... 3.2. Mean .......................................................................... 3.3. Median ……………………………………………… 3.4. Mode ……………………………………………….. BAB IV DEVIASI RATA-RATA DAN STANDAR DEVIASI ...... 4.1. Pengukuran Variabilitas ............................................. 4.2. Deviasi Rata-rata (Mean Deviation) ........................... 4.3. Standard Deviasi …………………………………… BAB V UJI HIPOTESIS .................................................................. 5.1. Pengertian Hipotesis ………………………………… 5.2. Menyatakan Hipotesis ……………………………….. 5.3. Menguji Hipotesis-Perbedaan Antara Dua Mean …… 5.4. Standar Kesalahan Perbedaan Mean ……………….. BAB VI TEKNIK ANALISIS KORELASIONAL ………………… 6.1. Arah Hubungan …………………………………….. 6.2. Koefisien Korelasi ....................................................... 6.3. Korelasi setujuduct Moment dan Cara Menghitungnya 6.4. Uji Taraf Signifikansi ………………………………. BAB VII TEKNIK ANALISIS KOMPARASIONAL .......................... 7.1. Chi Kuadrad ............................................................... 7.2. t-Score ........................................................................ BAB VIII ANALISIS VARIANSI ....................................................... 8.1. Konsep Mean Kuadrat .................................................. 8.2. F – Ratio …………………………………………….. 8.3. Anava pada Distribusi Tunggal …………………….. 8.4. Analisis Variansi (ANAVA) Klasifikasi Ganda ......... BAB IX ANALISIS REGRESI ………………………………….. 9.1 Analisis Regresi Linear Satu Prediktor ……………… 9.2. Analisis Varians Garis Regresi …………………….. 9.3. Analisis Regresi: Dua Prediktor ……………………. 9.4. Analisis Regresi : m – Prediktor …………………… DAFTAR PUSTAKA .............................................................................
Samsudi - STATISTIKA
1 2 2 3 4 7 11 12 12 13 14 18 19 19 20 25 26 26 26 27 30 31 31 31 34 37 37 41 48 49 50 57 61 67 69 76 79 86 88
3
BAB I KONSEP DAN PENGERTIAN STATISTIKA Tujuan Mahasiswa memiliki pemahaman tentang konsep statistika dalam konteks penelitian, pengolahan data dan penarikan kesimpulan, serta memahami statistika dalam kaitannya dengan kegiatan penelitian
Samsudi - STATISTIKA
4
1.1. Pengertian Statistika Istilah STATISTIKA memiliki pengertian berbeda dengan STATISTIK. Statistik merupakan kumpulan data, bilangan atau non bilangan yang disusun/disajikan sedemikian rupa (biasanya dalam bentuk tabel atau grafik) yang menggambarkan suatu persoalan atau keadaan. Sedangkan Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan, penyajian, pengolahan dan analisis data, serta teknikteknik analisis data. Statistika digunakan sebagai cara-cara ilmiah untuk mengumpulkan, menyusun, meringkas dan menyajikan data penelitian. Lebih lanjut statistika merupakan cara untuk mengolah data tersebut dan menarik kesimpulan-kesimpulan yang teliti dan keputusankeputusan yang logik dari pengolahan data tersebut. Sedangkan statistik lebih banyak digunakan untuk menggambarkan keadaan atau permasalahan seperti pencataan banyaknya penduduk, penarikan pajak, dan semacamnya. 1.2. Statistika dalam Pelelitian Dalam rangka kegiatan penelitian, seperti yang telah disinggung di depan, fungsi dan peranan statistika dijelaskan sebagai berikut: 1. Statistika memungkinkan pencatatan secara eksak data penelitian. 2. Statistika memandu peneliti menganut tata fikir dan tata kerja yang definit dan eksak. 3. Statistika menyediakan cara-cara meringkas data ke dalam bentuk yang lebih banyak artinya dan lebih gampang mengerjakannya. 4. Statistika memberi dasar-dasar untuk menarik kongklusi-kongklusi melalui prosesproses yang mengikuti tata cara yang dapat diterima oleh ilmu pengetahuan. 5. Statistika memberi landasan untuk meramalkan secara ilmiah tentang sebagaimana sesuatu gelaja akan terjadi dalam kondisi-kondisi yang telah di ketahui. 6. Statistika memungkinkan peneliti menganalisis, menguraikan sebab-akibat yang kompleks dan rumit, yang tanpa statistika akan merupakan peristiwa yang membingungkan, kejadian yang tak teruraikan. Soal Latihan 1. 2. 3. 4. 5.
Berikan definisi pengertian Statistika. Bagaimanakah pengertian tersebut dapat dibagi? Manfaat apakah yang dapat dipetik mahasiswa selaku calon sarjana, dengan mempelajari Statistika Pendidikan? Jelaskan jawaban saudara! Syarat apakah yang harus dipenuhi sekumpulan angka atau bilangan, sehingga ia dapat disebut data Statistika? Sebutkan tiga prinsip yang harus dipegang dalam rangka pengumpulan data Statistika! Jelaskan mengenai cara yang akan ditempuh dan alat yang dapat dipergunakan, dalam rangka menghimpun data Statistik!
Samsudi - STATISTIKA
5
BAB II DISTRIBUSI FREKUENSI Tujuan Mahasiswa memiliki pemahaman tentang distribusi frekuensi dan tabel/grafik distribusi frekuensi
Samsudi - STATISTIKA
6
2.1. Distribusi Frekuensi 2.1.1. Variabel Penelitian Seorang peneliti akan mengadakan penelitian tentang kecerdasan murid-murid dalam berhitung; seorang ahli beton mengadakan penelitian tentang campurancampuran beton, seorang ahli pertanian meneliti benih-benih baru. Kecerdasan, berhitung, campuran beton dan benih-benih baru, itu semuanya merupakan obyek penelitian. Obyek yang diteliti itu disebut variabel penelitian. 2.1.3. Variabel Kontinu dan Diskrit Kalau seorang guru menyelenggarakan penelitian tentang angka rata-rata muridmuridnya dalam berhitung, maka guru tersebut melihat nilai-nilai ujian mereka atau nilai-nilai dalam buku nilai. Nilai dalam berhitung itu disebut nilai variabel. Ada dua macam nilai variabel, yaitu nilai yang bersambung atau kontinu dan nilai yang terpisah atau diskrit. Nilai tinggi orang misalnya, adalah nilai yang kontinu, sebab jika kita sebutkan tinggi si A 165 cm, pada hakekatnya tinggi si A itu tidak mutlak tepat 165 cm, melainkan misalnya 165, 30 cm pada umumnya angka 165 cm, itu ditetapkan untuk mewakili tinggi orang dari 164,50 cm, sampai 165,49 cm. Mereka yang tingginya 165,50 cm sampai dengan 165,49 cm, dicatat 166 cm. Dengan kata lain, angka 0,50 ke atas dibulatkan atas, sedang angka di bawah 0,50 dihilangkan. 2.1.4. Distribusi Frekuensi Tunggal Dalam suatu penelitian tentang kecakapan berhitung, pada Mata Pelajaran Matematikan, siswa kelas 4, 5 dan 6 suatu sekolah yang berjumlah 70 orang, diperoleh nilai rapor sebagai berikut: 7 6 7 5
6 6 7 6
6 6 5 5
6 6 6 6
5 6 7 7
7 5 7 6
6 6 7 7
5 6 7 8
Nilai-nilai 4 6 7 6 7 7 6 6 6 5 6 5
7 5 6 7
6 7 5 5
7 7 5 6
5 8 7 7
6 5 7 8
6 6 5 8
5 6
Melihat angka-angka di atas kita belum dapat memperoleh gambaran apa-apa. Untuk mendapatkan gambaran dan kesimpulan, kita perlu mengatur angka-angka itu menjadi suatu tabel sebagai berikut :
NILAI 8 7 6 5 4
TABEL 2.1 TABEL NILAI-NILAI BERHITUNG 70 ORANG SISWA Jari-jari Frekuensi 4 //// 21 //// //// //// //// / 28 //// //// //// //// //// /// 16 //// //// //// / 1 / + N = 70
Samsudi - STATISTIKA
7
+ N adalah singkatan dari kata Number, yang berarti jumlah frekuensi variabel
Tabel di atas disebut Tabel Distribusi Frekuensi Tunggal. Istilah “Distribusi” digunakan dalam statistika untuk menunjuk adanya (seolah-olah) “Penyebaran” nilai-nilai dengan jumlah orang yang mendapat nilai itu, sedang istilah ”Tunggal” menunjukkan tidak adanya pengelompokan nilai-nilai variabel dalam kolom pertama. 2.1.5. Distribusi Frekuensi Bergolong Hasil-hasil Psikotest dari sebagian calon-calon mahasiswa suatu Fakultas adalah sebagai berikut : 18 21 10 21 12 17 21 20
13 22 11 12 12 16 8
16 20 10 10 16 16 19
4 7 10 17 20 14 19
10 (23) 6 7 14 14 19
10 10 11 12 15 15 13
15 18 23 5 14 19 13
17 (3) 19 9 15 13 19
16 10 19 12 16 15 14
16 8 20 15 15 14 13
Nilai yang tertinggi dari hasil ujian masuk itu adalah 23, sedang nilai terendah adalah tiga. Jika susun tabel distribusi tunggal, maka kita harus membuatnya sepanjang 21 baris (dari 23-3 plus 1). Dengan demikian kita akan menjumpai tabel sebagai berikut : TABEL 2.2 TABEL HASIL PSIKOTEST DARI CALON-CALON MAHASISWA Kelompok Frekuensi Nilai (f) 6 21-23 13 18-20 17 15-17 16 12-14 11 9-11 5 6-8 3 3-5 Jumlah 71
2.1.6. Beberapa Istilah dalam Distribusi Bergolong Interval Kelas. Tiap-tiap kelompok nilai variabel disebut interval kelas. Dalam Tabel 3.2 di atas kita jumpai ada tujuh interval kelas dengan masing-masing berisi tiga nilai variabel. Interval Kelas biasa disingkat dengan sebutan kelas atau interval saja. Batas Kelas. Batas kelas adalah nilai-nilai yang membatasi kelas yang satu dari kelas yang lain. Nilai-nilai 21 dan 23 pada kelas yang teratas dari Tabel 3.2 itu adalah nilai-nilai yang membatasi kelas itu dari kelas lainnya yang berdekatan. Batas Atas dan Batas Bawah dan batas atas. Kita lihat dalam kolom nilai variabel dalam Tabel 3.2 itu ada dua deret angka-angka batas kelas, deret sebelah kiri dan deret sebelah kanan. Angka-angka batas di deret sebelah kiri ialah angka-angka Samsudi - STATISTIKA
8
21,18,15,21,9,6 dan 3. Angka-angka itu semuanya menjadi batas bawah dari masingmasing kelasnya. Sebab itu angka-angka itu di sebut “Batas bawah” (Lower Limits). Angka-angka dideret sebelah kanan ialah angka-angka 23, 20, 17, 14, 11, 8 dan 5. Angka-angka ini masing-masing menjadi batas kelas, deret sebelah kiri dan deret sebelah kanan. Angka-angka batas di deret sebelah kiri ialah angka-angka 21, 18, 15, 12, 9, 6 dan 3. Angka-angka itu disebut “Batas Atas” (Upper Limits). Batas Semu dan Batas Nyata. Kalau kita letakkan pada garis mendatar kelaskelas dalam Tabel 3.2 itu akan kelihatan sebagai berikut : 5 6 20 21 3 8 9 11 12 23 15 14 17 18 Nampak kepada kita dari pemeriksaan lukisan di atas bahwa angka 5 dan angka 6 misalnya, bukanlah batas yang nyata antara kelas yang terendah dengan kelas di atasnya. Demikian juga angka-angka 20 dan 21. Lebar Kelas. Kita periksa kembali tabel 3.2 Interval kelas yang tertinggi di tandai dengan angka 21 dan 23. Kedua angka itu sebenarnya hanyalah batas kelas saja (batas semu). Antara keduanya masih ada satu angka lagi, yaitu angka 22. Demikian juga kelas yang keempat dari atas, sebenarnya mengandung angka-angka 3,4, dan 5. Jadi tiap-tiap kelas itu sebenarnya mengandung atau terdiri atas tiga angka. Inilah yang disebut lebar kelas dapat didefinisikan sebagai batas lebar atas nyata dikurangi batas bawah nyata dari kelas-kelas yang bersangkutan. Lebar kelas biasa diberi simbul “i”. Jika orang mengatakan “i” sama dengan tiga, ini berarti bahwa distribusi frekuensi disusun dalam tabel atau grafik yang menggunakan interval kelas dengan isi tiga angka atau nilai dalam tiap-tiap intervalnya. Titik Tengah. Yang dimaksud dengan “Titik Tengah” adalah angka atau nilai variabel yang terdapat ditengah-tengah interval kelas. Jika interval kelas memuat angkaangka 13, 14 dan 15, yang menjadi titik tengahnya adalah angka 14. Jika luas kelasnya genap, seperti 20, 21, 22 dan 23 titik tengahnya adalah separo dari jumlah angka-angka tengah, yaitu 21,5 (dari ½ x ( 21 ditmbah 22). Jumlah Interval . Yang disebut jumlah interval ialah banyaknya interval yang digunakan dalam penyusunan distribusi. Dalam tabel 3.2 diatas jumlah intervalnya ada tujuh. Jarak Pengukuran. Kalau kita mengukur tinggi sejumlah orang, dan kita menjumpai angka pengukuran yang tertinggi 180 cm. Dan angka pengukuran yang terendah, 145 cm, kita mempunyai jarak pengukuran 35 cm. (dari 180 cm, dikurangi 145 cm). 2.1.7. Menetapkan Jumlah Interval Salah satu masalah yang kita hadapi bila kita hendak menyusun tabel dengan interval-interval adalah menetapkan jumlah interval. Penetapan ini dipengaruhi oleh beberapa faktor, antara lain adalah faktor-faktor jumlah frekuwensi (N), jarak pengukuran (R), lebar interval yang hendak digunakan (i), dan tujuan penyusunan distribusi itu. Pada prinsipnya jumlah interval kelas janganlah terlalu sedikit, sehingga pola-pola kelompok menjadi kabur. Akan tetapi jumlah interval itu juga jangan terlalu besar, sehingga kita tidak dapat mendapat gambaran tentang pola kelompok. Petunjuk yang mutlak tidak ada dalam hal ini. Tetapi dalam psikologi dan pendidikan dapat kita anut kebiasaan Samsudi - STATISTIKA
9
mennggunakan 5 sampai 15 interval. Kalau R besar sekali, biasanya orang menggunakan 10 smapai 20 interval. Akan tetapi hal ini tidak boleh diikuti secara membabi buta. 2.1.8. Menentukan Lebar Interval Jika R sudah diketahui dan jumlah interval kelas sudah ditentukan, pada dasarnya i sudah diketemukan. Rumus dari i adalah sebagai berikut :
i=
JarakPengukuran( R ) JumlahInterval
Jadi kalau misalnya hasil pengukuran kita tentang tinggi orang yang tertinggi adalah 180 cm dan yang terendah adalah 145 cm, dan kita telah menetapkan jumlah intervalnya sebanyak 9 buah, maka
i=
180,50 − 144,50 36 = =4 9 9
2.1.9. Pengertian Distribusi Frekuensi Distribusi Frekuensi adalah penyusunan bahan-bahan atas dasar nilai variabel dan frekuensi tiap-tiap nilai variabel itu. Tabel untuk distribusi frekuensi, disebut tabel distribusi frekuensi atau tabel frekuensi saja. Distribusi tunggal adalah distribusi yang tidak menggunakan penggolongan-golongan. Distribusi Bergolong menggunakan interval-interval kelas dalam penyusunannya. 2.2. Grafik dan Tabel Distribusi Frekuensi Terdapat beberapa macam grafik dan tabel distribusi frekuensi. Namun dalam sub ini akan dibicarakan tiga macam yang pokok, yakni Histogram, Frekuensi Poligon, dan Ogive. 2.2.1. Histogram Grafik histogram biasa disebut juga Bar Diagram, yaitu suatu grafik yang berbentuk segi empat.
Nilai 8 7 6 5 4
TABEL 2.3 NILAI-NILAI BERHITUNG 72 ORANG MURID Frekuensi Batas Nyata + 8,5 4 7,5 23 6,5 28 5,5 16 4,5 1 3,5
Samsudi - STATISTIKA
10
Jumlah :
--
72
Grafik 2.1. Histogram
2.2.2. Poligon
Dengan grafik polygon kita dengan mudah dapat membandingkan keadaan distribusi, jika kedua distribusi itu dilukiskan dalam satu grafik. Hal ini dapat kita lihat dengan jelas pada keadaan sebagai berikut:
Grafik 3.2. Poligon
Samsudi - STATISTIKA
11
2.2.3. Ogive Ogive dapat dibuat baik dari distribusi tunggal maupun dari distribusi tergolong. Di bawah ini diberikan contoh untuk membuat grafik ogive dari distribusi bergolong.
TABEL 2.4 TABEL DISTRIBUSI UNTUK CONTOH MEMBUAT GRAFIK OGIVE Interval Batas Frekuensi Frekuensi Meningkat Nilai Nyata ( f _) (ef) 38,5 2 35,5 100 36-38 3 98 32,5 33-35 2 95 29,5 30-32 6 26,5 93 27-29 5 87 23,5 24-26 5 82 20,5 21-23 5 17,5 77 18-20 14 72 14,5 15-17 10 58 11,5 12-14 17 8,5 48 9-11 15 31 5,5 6-8 14 2,5 16 3-5 2 2 0,5 0-2 Jumlah
N = 100
--
Grafik 2.3. Ogive
Samsudi - STATISTIKA
12
Soal Latihan
1 . Jelaskan perbedaan diantara data kontinyu dan data diskrit. 2. Jelaskan pula tentang perbedaan antara data interval dan data ordinal. 3. Berikan contoh demikian rupa sehingga menjadi cukup jelas apa yang dimaksud dengan data primer dan data sekunder. 4. a. Interval 40 – 49; tentukan Midpointnya! b. Interval 37 – 40; berapakah Nilai Relatifnya? c. Interval 59 – 78; berapakah Nilai nyatanya? d. Interval 35 – 40; berapakah lower limitnya? e. Interval 71 – 75; berapakah upper limitnya? 5. Jelaskan apa yang dimaksud frekuensi! 6. Jelaskan langkah yang sebaiknya ditempuh dalam membuat Tabel Distribusi Frekuensi Data Tunggal! 7. Data di bawah ini: Nilai hasil ulangan harian dari sejumlah 60 orang siswa SMP dalam bidang studi Bahasa Indonesia adalah sebagai berikut: 7 4 3 9 7 10
5 6 4 7 6 8
8 8 6 5 3 7
3 6 5 8 9 6
6 8 5 6 5 6
4 5 4 4 7 5
6 7 8 6 6 7
7 5 6 7 3 7
5 9 5 8 8 6
9 7 6 10 7 6
Soal : Aturlah (susunlah) dan kemudian sajikanlah data tersebut diatas dalam bentuk: a. Tabel Distribusi Frekuensi, dengan mengindahkan persyaratan tertentu sehingga dapat disebut Tabel distribusi frekuensi yang baik. b. Tabel Persentase c. Tabel Presentase Kumulatif 8. Lukislah data pada soal nomor 7 diatas dalam bentuk Histrogram Frekuensi!
Samsudi - STATISTIKA
13
BAB III UKURAN STATISTIKA Tujuan
Mahasiswa memiliki pemahaman tentang ukuran statistika yang meliputi tendensi sentral, rerata, dan sebaran data.
Samsudi - STATISTIKA
14
3.1. Pengukuran Tendensi Sentral
Jika dilakukan penelitian terhadap motivasi, pada umumnya dapat diketahui bahwa sebagian besar dari orang yang diteliti mempunyai motivasi yang “normal”. Kemudian jika diambil angka 100 sebagai indeks (ukuran) normalitas, maka sebagian besar orang yang kita selidiki akan mempunyai angka motivasi di sekitar 100. Hanya sebagian kecil saja dari mereka yang angka motivasinya menyimpang jauh dari indeks normalitas itu. Salah satu tugas dari statistika adalah mencari suatu angka di sekitar mana nilainilai dalam suatu distribusi memusat. Angka yang menjadi pusat suatu distribusi disebut “tendensi sentral”. Ada tiga macam tendensi sentral yang sangat penting untuk dibahas, yakni: Mean, Median, dan Mode. Ketiganya mempunyai cara-cara menghitung yang berbeda-beda, dan mempunyai arti yang berbeda pula sebagai alat untuk mengadakan deskripsi sesuatu distribusi. 3.2. Mean Mean berarti “angka rata-rata”. Dari segi aritmetik Mean adalah “jumlah nilainilai dibagi dengan jumlah individu”. Sebagai contoh, ada tiga orang berpenghasilan 10, 15 dan 20 rupiah tiap harinya. Rata-rata penghasilan mereka adalah 15 rupiah tiap harinya. Ini dicari dengan cara sebagai berikut : 10 + 15 + 20 45 Penghasilan rata-rata = = = 15 3 3 Dari pernyataan itu dapat dikemukakan rumus Mean sebagai berikut : X + X 2 + X 3 .... X n −1 + X n Mean = 1 N Rumus itu disingkat sebagai berikut : ∑X M = N Simbul Σ adalah huruf Yunani yang disebut “Sigma” dan mempunyai arti jumlah.
a. Mean yang Ditimbang Jika ada empat orang yang berpenghasilan 10 rupiah, seorang yang berpenghasilan 15 rupiah, dan seorang yang berpenghasilan 20 rupiah seharinya, maka Mean dari penghasilan mereka tidak lagi 15 rupiah, melainkan 12,50 rupiah. Hal ini dapat dicari dengan tabel sebagai berikut : TABEL 3.1 TABEL CONTOH MENCARI MEAN YANG DITIMBANG Penghasilan Frekuensi fX (X) (f)
Samsudi - STATISTIKA
15
20 15 10
1 1 4
20 15 40
N = 6
Σ fX = 75
Rumus Mean yang ditimbang adalah sebagai berikut : M =
∑
fX
N
Diisi dengan bahan-bahan dari Tabel 12 75 M = = 12,50 6 b. Menghitung Mean dari Distribusi Bergolong Sekali lagi perlu diingatkan disini bahwa X adalah mewakili “titik tengah” dari interval kelas dalam distribusi. TABEL 3.2 TABEL CONTOH MENCARI MEAN DARI DISTRIBUSI BERGOLONG Penghasilan (X) 145-149 140-144 135-139 130-134 125-129 120-124 115-119 110-114 105-109 100-104 95-99 90-94 85-89 80-84
Titik Tengah (X) 147 142 137 132 127 122 117 112 107 102 97 92 87 82
f
fX
1 3 5 8 11 17 21 22 24 20 15 12 6 2
147 426 685 1056 1397 2074 2457 2464 2568 2040 1455 1104 522 164
Jumlah
--
N = 167
ΣfX =18559
M =
∑
fX
N
=
18559 = 111 ,13 167
3.3. Median Median dapat dibatasi sebagai “suatu nilai yang membatasi 50 persen frekuensi distribusi bagian bawah dengan 50 per sen frekuensi distribusi bagian atas.” Kita misalkan ada distribusi penghasilan dari tujuh orang seperti tersebut dalam tabel dibawah ini. TABEL 3.3 TABEL CONTOH DISTRIBUSI PENGHASILAN UNTUK MENCARI MEDIAN Individu Samsudi - STATISTIKA
Penghasilan (Rp)
16
1 2 3 4 5 6 7
10 12 13 14 16 16 20
a. Median pada Distribusi dengan Frekuensi Genap Jika suatu distribusi mempunyai frekuensi genap, maka median dihitung secara kom setujumi, yaitu dengan membagi dua nilai-nilai variabel yang ada ditengah-tengah distribusi. Misalkan ada empat orang yang masing-masing mempunyai tinggi badan 162, 162, 164 dan 166 cm, ditambah 164 cm, kemudian dibagi dua. Pemecahan semacam ini sama sekali tidak bertentangan dengan definisi median, sebab angka 163 cm, itu sebagai batas antara tinggi 162 dan 164 cm, membatasi 50 persen frekuensi variabel di bagian atas, yaitu dua orang, dan 50 per sen frekuensi variabel di bagian bawah distribusi, yaitu dua orang. b. Mencari Median dari Distribusi Bergolong
Rumus untuk mencari median dari distribusi bergolong adalah sebagai berikut : ⎡1 / 2 N − cfb ⎤ Median = Bb + ⎢ (7) ⎥i fd ⎣ ⎦ Dalam mana : Bb Adalah batas bawah (nyata) dari interval yang mengandung median Cfb Frekuensi kumulatif (frekuensi meningkat) di bawah interval yang mengandung median, fd Frekuensi dalam interval yang mengandung median i Lebar interval, dan N Jumlah frekuensi dalam distribusi Penggunaan rumus itu dapat kita lihat dari pekerjaan di bawah ini : TABEL 3.4 TABEL CONTOH MENGHITUNG MEDIAN DARI DISTRIBUSI BERGOLONG Interval Nilai f cf 55 1 100-104 54 3 95-99 51 5 90-94 fd 46 9 85-89 37 (13) 80-84 (24) 10 75-79 14 6 70-74 8 4 65-69 4 3 60-64 1 1 55-59 55 Jumlah -Samsudi - STATISTIKA
17
Dalam contoh diatas, jumlah frekuensinya (atau N ) ada 55. Kalau ini kita bagi dua hasilnya sama dengan 27,5 itu. Setelah ½ N ini kita ketemukan maka langkah selanjutnya adalah menemukan interval kelas yang mengandung frekuensi kumulatif 27,5 itu, interval kelas yang kita maksudkan adalah 80-84, sebab cf 27,5 terkandung dalam cf 37. Batas bawah (nyata) atau Bb dari interval yang mengandung median itu adalah 79,50. Separo dari jumlah frekuensinya, atau ½ N adalah 55/2, sama dengan 27,50. Frekuensi kumulatif di bawah interval yang mengandung median adalah 24 (24 adalah cf di bawah 37, sedang cf 37 adalah cf yang mengandung median). Frekuensi dalam interval adalah 13, sedang lebar interval atau i-nya ada lima. Diisikan dalam rumus kita jumpai perhitungan sebagai berikut : ⎡1 / 2 N − cfb ⎤ ⎡ 27,50 − 24 ⎤ Mdn = Bb + ⎢ ⎥i = 79,50 + ⎢ ⎥5 13 fd ⎣ ⎦ ⎣ ⎦ ⎡ 3,50 × 5 ⎤ = 79,50 + ⎢ ⎥ = 79,50 + 1,346 = 80,846 ⎣ 13 ⎦
atau 80,85 Jadi, median dari distribusi tersebut 80,5.
3.4. Mode
a) Dalam Distribusi Tunggal : Nilai variabel yang mempunyai frekuensi tertingi dalam distribusi; : Titik tengah interval kelas yang b) Dalam Distribusi Bergolong mempunyai frekuensi tertinggi dalam distribusi a. Mode dalam Distribusi Tunggal Jika ada serangkaian nilai-nilai 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, nilai yang timbul paling banyak adalah 8. Nilai 8 itu disebut Mode dari distribusi nilai-nilai itu. Kalau suatu distribusi sudah disusun dalam tabel, maka untuk mencari Mode-nya kita melihat pertama kolom frekuensi. TABEL 3.5 MENGHITUNG MEDIAN DARI DISTRIBUSI BERGOLONG Nilai Frekuensi 1 10 0 9 15 8 18 7 4 6 3 5 1 4 1 3 Samsudi - STATISTIKA
18
Frekuensi yang tertinggi dari distribusi tersebut adalah 18. Nilai yang mempunyai frekuensi tertinggi itu adalah nilai 7. Jadi yang menjadi modenya adalah nilai 7.
b. Tempat Kedudukan Mean, Median, dan Mode dalam Distribusi
Tempat kedudukan Mean, Median dan Mode dalam satu distribusi sangat tergantung kepada bentuk distribusinya. Kita ingat kembali ada distribusi yang simetri dan ada yang juling. Jika dari suatu distribusi simetri normal kita hitung mean, median, dan modenya, maka akan kita jumpai sifat yang khas, yaitu bahwa ketiga tendensi sentral itu bersekutu satu sama lain. Hal ini mudak kita mengerti, sebab pada distribusi normal, mean membagi dua sama banyak frekuensi variabel di atas dan dibawahnya. Dengan demikian mean ini mempunyai fungsi seperti median. Karena yang menjadi mode dalam distribusi normal adalah nilai yang ada pada mean, maka dengan sendirinya mode itu bersekutu dengan mean. Jadi pada distribusi normal mean, median, dan mode ketiga-tiganya berimpit. Untuk ilustrasi periksalah grafik 4.1.
frekuensi
N i l a i Median Mode Grafik 3.1 Ilustrasi mean, median dan mode Mean
Soal Latihan
1. Jelaskan tentang segi segi kebaikan dan kelemahan yang dimiliki oleh: a. Mean; b. Median; c. Modus. 2. Dalam kedaan yang bagaimana seharusnya kita mencari (menghitung); a. Mean; b. Median; c. Modus. 3. Jelaskan adanya saling hubungan antara Mean, Median dan Modus dengan mengemukakan contohnya! 4. Jelaskan bahwa Percentile sangat berguna untuk dipergunakan sebagai alat atau ukuran untuk: a. Mengubah raw score menjadi Nilai Standart Sebelas (Stanel). b. Menetapkan Nilai Batas Lulus dalam suatu tes atau seleksi. Samsudi - STATISTIKA
19
5. Dari sejumlah 266 orang lulusan SMK yang mengikuti Tes Seleksi Penerimaan Calon Mahasiswa Baru pada sebuah Perguruan Tinggi, berhasil dicatat sekor hasil ujian mereka dalam mata ujian Fisika sebagai berikut:
Sekor: 90-94 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24
frekuensi 4 10 14 19 30 33 40 32 25 21 18 10 6 3 1 266=N
Soal: a. Berapakah Nilai Rata –rata hitung yang berhasil dicapai oleh 266 orang calon yang mengikuti Tes Seleksi tersebut (dengan catatan bahwa perhitungan Nilai Rata-rata Hitung itu hendaknya dilakukan dengan menggunakan Metode Panjang dan Metode Singkat)? b. Ubahlah hasil tes tersebut menjadi STANEL (Nilai Standart Sekala Sebelas), dengan menggunakn ukuran Percentile! c. Sekor berapa yang merupakan modus dari data tersebut diatas? d. Jika dari jumlah 266 orang calon itu yang akan diluluskan (dinyatakan diterima sebagai mahasiswa baru) hanya 45 orang, tetapkan Niali Batas Lulusnya dengan menggunakan ukuran Percentile! 6. Dari kegiatan eksperimen yang dilakukan 6 kali, diperoleh sekor sebagai berikut: Esperimen ke: 1 2 3 4 5 6 Samsudi - STATISTIKA
Sekor: 26 13 20 18 10 15 20
Carilah Nilai Rata-rata Ukur dari sekor hasil eksperimen tersebut di atas tanpa menggunakn daftar logarithma.
BAB IV DEVIASI RATA-RATA DAN STANDAR DEVIASI Tujuan
Mahasiswa memiliki pemahaman tentang deviasi rata-rata dan standar deviasi
Samsudi - STATISTIKA
21
4.1. Pengukuran Variabilitas Ada dua orang atlet loncat tinggi yang sedang dilatih untuk menghadapi kompetisi nasional atletik. Ahmad menunjukkan loncatan yang tidak dipastikan: kadang-kadang dia meloncat setinggi 195, tetapi kadang-kadang dia hanya dapat meloncat setinggi 165 cm. Mahmud, sebaliknya menunjukkan loncatan yang lebih mantap sungguhpun dia tidak pernah meloncat setinggi 195 cm, tetapi dia juga tidak pernah meloncat serendah 165 cm. Paling rendah loncatannya adalah 171 cm, sedang paling tinggi 189 cm. Persoalannya adalah siapa yang akan dimajukan dalam perlombaan kejuaran nasional itu apabila hanya seorang peloncat saja yang diperkenankan untuk dimajukan. Loncatan Ahmad agak jauh dari mean loncatannya, dibandingkan dengan loncatan Mahmud. Dengan istilah statistika dikatakan bahwa loncatan Ahmad mempunyai variabilitas yang lebih besar dari pada loncatan Mahmud. Yang dimaksud dengan variabilitas adalah derajat penyebarannilai-nilai variabel dari suatu tendensi dalam suatu distribusi. Jika dua distribusi, katakana distribusi A dan distribusi B dibandingkan, dan distribusi A menunjukkan penyebaran nilai-nilai variabelnya yang lebih besar dari pada distribusi B, maka dikatakan bahwa distribusi A mempunyai variabilitas yang lebih besar dari distribusi B. Variabilitas ini juga disebut dispersi. Untuk memutuskan apakah Ahmad ataukah Mahmud yang harus dimajukan dalam perlombaan kejuaraan Nasional loncat tinggi, maka pelatih membutuhkan pengukuran variabilitas loncatan kedua orang itu. Ada beberapa macam cara untuk mencari variabilitas. Di sini yang akan dibicarakan hanyalah yang pokok-pokok saja, yaitu Mean Deviation, dan Standard Deviation. 4.2. Deviasi Rata-rata (Mean Deviation)
Mean Deviation atau Average Deviation atau Deviasi Rata-rata adalah rata-rata dari deviasi nilai-nilai dari Mean dalam suatu distribusi, diambil nilainya yang absolute. Yang dimaksud dengan deviasi absolute adalah nilai-nilai yang negatif. Secara aritmatika mean deviasi dapat didefinisikan sebagai mean dari harga mutlak dari deviasi nilai-nilai individual. Yang pertama dilakukan alada menghitung Mean, kemudian ditentukan berapa besarnya penyimpangan tiap-tiap nilai dari mean itu. Misalnya, jika seorang mempunyai IQ 110, sedang mean IQ dari grupnya = 100, maka deviasi IQ orang tesebut adalah 110 – 100 = +10. Jika orang lain dalam grup itu mempunyai IQ 85, maka deviasi orang itu adalah 85 – 100 = - 15. Deviasi yang bertanda plus menunjukkan deviasi di atas mean, sedang yang bertanda minus menunjukkan deviasi di bawah mean. Akan tetapi dalam perhitungan mean deviasi tanda minus ditiadakan. Dalam statistika, deviasi diberi simbul dengan huruf-huruf kecil seperti x, y, d, dan sebagainya. Rumusnya adalah x = X – M atau y = Y – M. d = D – M, dan sebagainya. Samsudi - STATISTIKA
22
Adapun rumus dari Mean deviasi adalah :
MD
=
Di mana :
∑
x
N
MD
∑x
= Mean Deviasi = Jumlah deviasi dalam harga mutlaknya
N
= Jumlah Individu / Kasus
Bagaimana menerapkan rumus itu untuk memperhitungkan mean deviasi dari suatu distribusi dapat dilihat dari contoh sederhana di halaman berikut : TABEL 4.1 TABEL CONTOH MENCARI MEAN DEVIATION Deviasi dari Mean Nilai Variabel Dengan nilainya absolut 5 19 4 18 3 17 2 16 1 15 0 14 1 13 2 12 3 11 4 10 5 9
∑
-Dengan N = 11 dan
MD
=
∑
x = 30
x = 30 maka
30 = 2 , 73 11
4.3. Standard Deviasi
Secara matematik Standard Deviasi dibatasi sebagai “Akar dari Jumlah deviasi kuadrad dibagi banyaknya individu” dalam distribusi. Untuk mencari standard deviasi pertama-tama kita harus mencari mean ini dapat dicari dengan rumus yang sudah kita ketahui : ∑x M = N Dengan mengetahui mean ini kita dapat mencari deviasi nilai individual dari mean. Ini dicantumkan dalam kolom kedua. Jumlah deviasi dari mean ini, yaitu Σ, x1 . harus sama dengan NOL. Samsudi - STATISTIKA
23
TABEL 4.2 TABEL CONTOH MENCARI STANDARD DEVIASI Nilai Deviasi dari Deviasi dari Variabel Mean Mean Kuadrat (X) (X) (X2) 25 +5 19 16 +4 18 9 +3 17 4 +2 16 1 +1 15 0 0 14 1 -1 13 44 -2 12 9 -3 11 16 -4 10 25 -5 9 Total
7
80
Rumus stanadar deviasi sebagai berikut :
SD
∑
=
X
2
N
Dalam mana : SD = Standard Deviasi 2 ∑x = Jumlah deviasi Kuadrat, dan N = Jumlah individu / kejadian dalam distribusi SD kadang-kadang diberi simbul ζ, disebut sigma (dari salah satu huruf Yunani), yang diartikan Standart Devasi 4.3.1. Cara Lain Untuk Menghitung SD Rumus untuk menghitung SD seperti yang telah dibicarakan dimuka adalah rumus yang paling sederhana. Frekuensi dari tiap-tiap nilai tidak akan satu. Melainkan berbeda-beda, bergerak dari bilangan 0 ke bilangan yang tak terhingga. Rumus untuk menghitung SD dari distribusi yang tidak sama frekuensi tiap-tiap nilai variabelnya adalah sebagai berikut : SD =
Samsudi - STATISTIKA
∑
fx
2
N
24
Kedua rumus yang telah kita ketahui itu disebut rumus deviasi. Distribusi demikian karena rumus itu menggunakan deviasi dari mean sebagai salah satu komponennya. Di halaman berikut contoh mencari SD dengan rumus itu.
TABEL 4.3 TABEL UNTUK MENGHITUNG SD DENGAN RUMUS DEVIASI X f fx x fx fx2 38,88 10,80 +3,60 30 3 10 60,84 23,40 +2,60 81 9 9 33,28 20,80 +1,60 104 13 8 8,28 13,80 +0,60 161 23 7 3,84 9,60 -0,40 144 24 6 25,48 18,20 -1,40 65 13 5 57,60 24,00 -2,40 40 10 4 57,80 17,00 -3,40 15 5 3 ∑f2 = 286,00
N = 100 ∑ fx = 640
M =
∑ fx
SD =
N
=
640 = 100 = 6,40
∑ fx
2
N 268,00 100
= 2,86 = 1,69
4.3.2. Rumus Angka Kasar Rumusnya adalah sebagai berikut :
SD
=
∑
f 2 N
⎡ − ⎢ ⎣
∑
fx ⎤ ⎥ N ⎦
2
Contoh menggunakan rumus tersebut: TABEL 4.4 CONTOH MENGGUNAKAN RUMUS ANGKA KASAR UNTUK MENCARI SD X f fx fx2 38,88 30 3 10 60,84 81 9 9 33,28 104 13 8 8,28 161 23 7 3,84 144 24 6 25,48 65 13 5 57,60 40 10 4 Samsudi - STATISTIKA
25
3
5
N = 100
∑fX = 640
∑
f
2
⎡ − ⎢ ⎣
∑
⎤ ⎥ ⎦
fX
SD
=
SD
=
4382 100
=
43 , 82 − 40 , 96
=
2 , 86
N
15
N
⎡ 640 − ⎢ ⎣ 100
⎤ ⎥ ⎦
57,80
∑fx2 = 4382 2
2
= 1 , 69
4.3.3. Standar Kesalahan Mean Rumus standard kesalahan mean sangatlah sederhana. Rumus itu berbunyi sebagai berikut : SD
M
=
SD N −1
Jadi, apa yang harus kita kerjakan untuk memperoleh SDM adalah: pertama, mencari SD dari angka kasar dari sampel kita; kedua, membagi SD itu dengan akar dari jumlah subyek dalam sampel dikurangi satu. TABEL 4.5 TABEL CONTOH MENCARI SDM frekuensi fx (f) 8,00 1 0,00 0 77,00 11 136,50 21 144,00 24 49,50 9 25,00 5 4,50 1 72 444,50 N ∑fx
Nilai (X) 8,0 7,5 7,0 6,5 6,0 5,5 5,0 4,5 Total : Simbul :
M = SD
fx2 64,00 00,00 539,00 887,25 864,00 272,25 125,00 20,25 2771,75 ∑ fx2
∑ fx = 444,50 = 6,17 72
N
=
∑
fx N
2
− M
Samsudi - STATISTIKA
2
26
=
2771,75 − 6,17 2 72
= 38,4965 − 38,0689
= 0,4276 = 0,654 0,654 0,654 SD = = = 0,078 SDM = N −1 72 − 1 8,426 Soal Latihan
1. Berikan sebuah contoh sehingga menjadi cukup jelas, apa yang dimaksud dengan deviasi! 2. Jelaskan hubungan antara deviasi Rata-rata (Average Deviation) dan deviasi Standart (Standart deviation)! 3. Semakin kecil Deviasi Standart dari sekelompok data, maka data tersebut semakin besifat homogen. Betulkah penyataan itu? Jelaskan denagn menggunakan sebuah contoh! 4. Tunjukkan bahwa antara Deviasi Rata-rata dan Deviasi Standart terdapat saling hubungan! Berikan contohnya! 5. Kemukakan beberapa keunggulan Deviasi Rata-rata dan Deviasi Standart. 6. Mean dan deviasi standart dapat dipergunakan sebagai alat bantu dalam rangka Evaluasi Hasil Belajar Anak Didik. Jelaskan pernyataan tersebut! 7. Data yang tertera pada table berikut: x 31 30 29 28 27 26 25 24 23 Total
f 4 4 5 7 12 8 5 3 2 50=N
fx 124 120 145 196 324 208 125 72 46 1360=ΣfX
x
x2
fx2
Soal: a. Buatlah table distribusi frekuensinya; b. Carilah Nilai Rata-rata Hitungnya; c. Carilah Deviasi Rata-ratanya; d. Carilah deviasi Standartnya dengan menggunakan cara mencari Deviasi Standart untuk data tunggal yang sebagian atau seluruh sekornya berfrekuensi lebih dari satu. Samsudi - STATISTIKA
27
BAB V
uji hipotesisi perbedaan mean Tujuan
Samsudi - STATISTIKA
28
Mahasiswa memiliki pemahaman tentang hipotesis, pengujian hipotesis perbedaan antara dua mean dan standar kesalahan perbedaan dua mean
Beberapa ahli statistika menyarankan agar diadakan pembedaan antara statistika inferensial yang bertugas mengadakan estimasi dengan statistik inferensial yang bertugas mengadakan pengujian hipotesis. Statistik inferensial untuk estimasi terutama mencurahkan perhatian pada kegiatan mengadakan estimasi tentang parameter dari penelitian terhadap sampel yang baik. Dengan sampel yang baik dimaksudkan (a) sampel yang diambil secara random; dan (b) sampel yang setujuposional jika populasi terdiri dari sub-sub golongan. 5.1. Pengertian Hipotesis Istilah hipotesis sebenarnya adalah kata majemuk, terdiri dari kata-kata hipo dan tesis. Hipo berasal dari kata Junani hupo, yang berarti dibawah, kurang atau lemah. Tesis berasal dari kata Junani thesis, yang berarti teori atau setujuporsi yang disajikan sebagai bukti. Hipotesis adalah pernyataan yang masih lemah kebenarannya dan masih perlu diuji kenyataannya. Jika suatu hipotesis telah diuji kebenarannya, namanya bukan lagi hipotesis, melainkan suatu tesis. Suatu hipotesis akan diterima kalau data-data dan bahan-bahan penelitian membenarkan pernyataan itu. Dan akan ditolak jika kenyataan menyangkalnya. Pada gilirannya suatu tesis dapat dipandang sebagai hipotesis kalau oleh suatu alasan suatu penelitian masih menginginkan mengujinya kembali. 5.2. Menyatakan Hipotesis Apabila akan diadakan penelitian komparatif tentang kecerdasan (atau variabelvariabel lainnya) wanita dan pria, kita dapat menyatakan hipotesis dalam bentuk yang bermacam-macam: (1) Pria lebih cerdas dari pada wanita. (2) Wanita lebih cerdas dari pada peria. (3) Wanita dan pria sama cerdasnya. (4) Tidak ada perbedaan kecerdasan antara pria dan wanita. (5) Wanita lebih cerdas dalam bidang A, tetapi pria lebih cerdas dalam bidang B. (6) Wanita dan pria sama cerdasnya dalam bidang A, tetapi wanita lebih cerdas dalam bidang B. Tiap-tiap hipotesis selalu dinyatakan dalam bentuk statemen atau pernyataan, bukan dalam bentuk pertanyaan. Hipotesis yang paling sederhana, setidak-tidaknya dari teoritik, adalah apa yang disebut hipotesis nihil atau null hypothesis. Istilah nihil di sini Samsudi - STATISTIKA
29
menunjuk kepada tidak adanya perbedaan antara sampel yang satu dengan sampel lainya dalam sesuatu hal yang diteliti. 5.3. Menguji Hipotesis-Perbedaan Antara Dua Mean Tujuan suatu eksperimen adalah mencari pengaruh dari perlakuan yang dibedakan. Jadi misalnya kalau kita mengadakan eksperimen tentang akibat kepemimpinan yang demokratik dan kepemimpinan yang otokratik, kita memperlakukan suatu kelompok dengan pemimpin yang demokratik dan kelompok lain dengan pemimpin yang otokratik. Kemudian kita cari ada tidaknya perbedaan antara tingkah laku kedua kelompok itu. Tiap-tiap eksperimen akhirnya harus membandingkan sedikitnya dua kelompok dalam segi-segi yang dieksperimenkan. 5.4. Standar Kesalahan Perbedaan Mean Apabila kita ambil sepasang sampel yang masing-masing terdiri dari anak-anak laki-laki dan perempuan dan kita hitung mean-meannya, kita memperoleh perbedaan mean antara kedua sampel dari kedua jenis kelamin itu. Demikian seterusnya, kita dapat mengambil pasangan-pasangan sampel lain dari kedua jenis kelamin itu, kita akan memperoleh distribusi perbedaan mean. Distribusi ini disebut distribusi sampling distribution of the mean differences, atau distribusi sampling daripada perbedaan mean. Statistik untuk ini disebut standard kesalahan perbedaan, yang tidak lain dan tidak bukan adalah SD dari pada perbedaan-perbedaan. Standard kesalahan perbedaan mean diberi simbul SD (M1 – M2) atau disingkat saja SDbM. Rumus standard kesalahan perbedaan mean:
SD
bM
=
SD
2 M
+ SD 1
2 M
2
Keterangan: = Standard Kesalahan Perbedaan Mean. SDbM
SD
2 M1
= KUADRAT Standard kesalahan mean dari sampel I, Disebut juga
varians mean sampel I. SD
2 M2
= KUADRAT Standard kesalahan mean dari sampel II, Disebut juga
varians mean sampel II. Untuk mencari standard kesalahan mean rumusnya adalah: − SD atau jika dikuadradkan menjadi SD M = N −1 SD 2 2 SD M = N − 1 Contoh: TABEL 5.1 TABEL DISTRIBUSI HASIL UJIAN SEMESTER SISWA LAKI-LAKI DAN PEREMPUAN Samsudi - STATISTIKA
30
Interval
x 52 47 42 37 32 27 22 17 12 7 -
50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 Total :
LAKI-LAKI f fx 0 0 235 5 294 7 407 11 128 4 351 13 286 13 204 12 192 16 0 0 81 2.097
fx
2
y 52 47 42 37 32 27 22 17 12 7 -
0 11.045 12.348 15.059 4.096 9.477 6.292 3.468 2.304 0 64.089
PEREMPUAN f fy fy2 2.704 52 1 2.209 47 1 15.876 378 9 6.845 185 5 7.168 224 7 8.748 324 12 3.388 154 7 4.624 272 16 2.880 240 20 147 21 3 81 1.897 54.589
Dengan kode x untuk laki-laki dan y untuk perempuan, maka statistiknya adalah sebagai berikut :
∑
Mx =
SD
fx
N
=
2 M
=
∑
2 .007 = 25 ,89 81 fx − M M2
N M 84 .089 = − 25,89 81 = 791, 22 − −670 , 29
= 120 ,93 2 Mx
SD
SDM2 120,93 120,93 = = = = 1,51 N X − 1 81 − 1 80
My =
SDy2 =
∑ fy = 1.897 = 23,42 81
Ny
∑
fy
2
Ny
− M Y2
SD M2 = =
SD Y2
N
−1 = y
125 , 44 81 − 1
125 , 44 = 1, 57 80
54.589 − 23,422 81 = 673,94 − 548,50 =
= 125,44
SDbM = SDM2 X + SDM2 y
=
1 , 51 + 1 , 57
=
3 , 08
= 1 , 75499
Samsudi - STATISTIKA
31
Soal Laihan 1. Data tes kecerdasan siswa yang masuk pagi dan masuk siang: Interval 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 Total :
x 50 42 41 37 32 25 22 17 12 7 -
Masuk pagi fx 0 5 7 11 4 13 13 12 16 0 81 f
fx2
y 52 47 42 35 32 25 22 17 12 7 -
f
Masuk siang fy
fy2
1 1 9 5 7 12 7 16 20 3 81
Hitunglah: a. Mean masing-masing variabel b. Standar deviasi c. Standar deviasi perbedaan mean dari dua variabel
Samsudi - STATISTIKA
32
BAB VI TEKNIK ANALISIS KORELASIONAL
Tujuan
Mahasiswa memiliki pemahaman tentang teknik-teknik korelasi dalam analisis statistika yang meliputi: arah hubungan, koefisien korelasi, korelasi product, moment dan uji taraf signifikansi Samsudi - STATISTIKA
33
Salah satu teknik statistika yang sering digunakan untuk mencari hubungan antara dua variabel adalah teknik korelasi. Dua variabel yang hendak diteliti hubungannya itu biasa diberi kode varaibel X dan variabel Y. Jadi misalnya, kita ingin menetapkan apakah ada hubungan atau tidak antara tinggi badan dan kecerdasan, variabel tinggi badan kita beri kode X, sedang variabel kecerdasan kita sebut Y, atau sebaliknya. 6.1. Arah Hubungan Jika kenaikan nilai variabel X selalu disertai kenaikan nilai variabel Y, dan sebaliknya turunnya nilai variabel x selalu diikuti oleh turunnya nilai varaibel y, maka hubungan semacam itu disebut hubungan yang positif. Namun sebaliknya jika kenaikan nilai variabel X yang tinggi selalu disertai oleh turunnya nilai variabel Y, atau jika turunnya nilai variabel X selalu diikuti oleh naiknya nilai varaibel Y, hubungan antara kedua variabel tersebut disebut bersifat negatif. Perlu diketahui, ada juga kemungkinannya bahwa kedua variabel itu tidak mempunyai hubungan, atau dalam istilah teknis statistika dikatakan mempunyai hubungan yang nihil, jika kenaikan variabel yang satu kadang-kadang disertai turunnya nilai variabel lainnya, dan kadang-kadang juga diikuti oleh kenaikan nilai variabel yang lain tersebut. 6.2. Koefisien Korelasi Pada umumnya besar-kecilnya hubungan dinyatakan dalam bilangan. Bilangan yang menyatakan besar-kecilnya hubungan itu disebut koefisien hubungan atau koefisien korelasi. Koefisien korelasi itu bergerak diantara 0,000 sampel +1,000 atau di antara 0,000 sampai -1,000, tergantung kepada arah korelasi, nihil, positif, dan negatif. Salah Satu sarat yang perlu diperhatikan dalam penggunaan teknik korelasi adalah bahwa hubungan antara x dan y adalah hubungan yang linier. Artinya jika kita buat scatter diagram (diagram pencaran) dari nilai-nilai variabel x dan nilai-nilai varaibel y, maka dapat kita tarik garis lurus pada pencaran titik-titik kedua nilai variabel itu. 6.3. Korelasi setujuduct Moment dan Cara Menghitungnya Sebenarnya ada berbagai macam teknik statistik yang digunakan untuk mencari korelasi. Tetapi satu diantaranya yang dikembangkan oleh KARL PEARSON dan Samsudi - STATISTIKA
34
disebut teknik korelasi prouduct moment dari PEARSON. Rumus koefisien korelasi product moment adalah:
rxy =
Di mana : rxy xy SDx SDy N
∑ xy N.SDx SDy
= Koefisien korelasi antara x dan y = setujuduct dari x kali y = Standard deviasi dari varaibel x = Standard deviasi dari variabel y. = Jumlah subyek yang diselidiki
Contoh menghitung korelasi product moment: TABEL 6.1 KOEFISIEN KORELASI ANTARA VARAIBEL KEMAMPUAN BERBAHASA (X) DAN MATEMATIK (Y) Subyek Kemamp. Matematik Subyek Kemamp. Matematik No. Berbahasa (Y) No. Berbahasa (Y) (X) (X) 1. 130 20 16. 178 35 2. 132 24 17. 172 30 3. 152 28 18. 165 28 4. 142 23 19. 160 27 5. 184 37 20. 148 25 6. 190 32 21. 180 24 7. 150 25 22. 149 25 8. 170 23 23. 188 36 9. 181 29 24. 167 29 10. 164 35 25. 162 27 11. 175 32 26. 145 23 12. 135 22 27. 150 29 13. 147 24 28. 160 30 14. 162 26 29. 172 31 15. 136 21 30. 154 30
Langkah-langkah menghitung koefisien korelasi dengan rumus di atas adalah : 1. Cari mean dari kedua variabel yang bersangkutan sebut kedua mean itu Mx dan My. 2. Cari SD dari kedua varaibel itu. Sebut kedua SD itu SDx dan SDy. 3. Cari deviasi-deviasi tiap-tiap nilai kedua variabel itu. Sebut –x untuk deviasi variabel x dan y untuk variabel Y. Jangan lupa mengecek:
∑x=0
dan
∑
y = 0
4. Kalikan tiap-tiap x dengan tiap-tiap y yang sebaris, dan masukkan dalam kolom xy, dan Samsudi - STATISTIKA
35
5. Jumlahkan kolom xy untuk memperoleh
Subyek (1) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. Total :
∑ xy .
TABEL 6.2 TABEL UNTUK MENGHITUNG KOEFISIEN KORELASI PRODUCT MOMENT, BAHAN DIAMBIL DARI TABEL 6.1 y y2 x y x x2 (2) (3) (4) (5) (6) (7) 130 20 -30 900 -8 64 132 24 -28 784 -4 16 152 28 -8 64 0 0 142 23 -18 324 -5 25 184 37 +24 576 +9 81 190 32 +30 900 +4 16 150 25 -10 100 -3 9 170 23 +10 100 -5 25 181 29 +21 441 +1 1 184 35 +4 16 +7 49 175 32 +15 225 +4 16 135 22 -25 625 -6 36 147 24 -13 169 -4 16 162 26 +2 4 -2 4 136 21 -24 576 -7 49 178 172 165 160 148 180 149 188 167 162 145 150 160 172 154 4.800
Samsudi - STATISTIKA
35 30 28 27 25 34 25 36 29 27 23 29 30 31 30 840
+18 +12 +5 0 -12 +20 -11 +28 +7 +2 -15 -10 0 +12 -6 0
324 144 25 0 144 400 121 784 49 4 225 100 0 144 36 8.304
+7 +2 0 -1 -3 +6 -3 +8 +1 -1 -5 +1 +2 +3 +2 0
49 4 0 1 9 36 9 64 1 1 25 1 4 9 4 624
xy (8) +240 +112 0 +90 +216 +120 +30 -50 +21 +28 +60 +150 +52 -4 +168 +126 +24 0 0 +36 +120 +33 +224 +7 -2 +75 -10 0 +36 -12 +1890
36
Dengan tabel di atas dapat kita peroleh data sebagai berikut: Variabel Kemampuan Berbahasa Variabel Matematik 1. N = 30 ∑x ∑Y 2. M x = 2. M Y = N N 4.800 840 = = 160 = = 28 30 30 3. SDx = =
∑x
2
3. SDy =
N 8.304 = 16,64 30
=
4.
∑ xy = 1.890
∑y
2
N 624 = 4,56 30
Besarnya koefisien korelasi: 1.890 ∑ xy = = 0,830 rxy = N .SDx SDy (30)(16,64)(4,56) 6.4. Uji Taraf Signifikansi Tabel korelasi itu mencantumkan batas-batas nilai r yang signifikan (berarti) pada taraf-taraf signifikansi tertentu. Jika nilai r yang kita peroleh sama dengan atau lebih besar dari pada nilai r dalam tabel r itu, maka nilai r yang kita peroleh itu signifikan. Dengan nilai r yang signifikan kita akan menolak hipotesis yang mengatakan bahwa korelasi antara x dan y dalam populasi adalah nul, atas dasar taraf signifikansi yang kita gunakan (yaitu 5% atau 1%). Nilai yang kita peroleh adalah 0,830. Dengan nilai f itu kita hendak menguji apakah nilai itu signifikan ataukah tidak atas dasar taraf signifikan 5%. Jumlah subyek atau N yang diselidiki ada 30. dengan melihat N = 30 dalam kolom N dan membacanya kekanan dalam kolom taraf signifikansi 5% dakan tabel r maka kita ketemukan bilangan 0,361. Bilangan ini menunjukkan bilangan batas signifikansi. Oleh karena nilai r yang kita peroleh, yaitu 0, 830 berada jauh di atas batas signifikansinya, yaitu 0,361, maka nilai r yang kita peroleh itu kita katakan signifikan. Dengan demikian kita menolak hipotesis nihil yang mengatakan bahwa nihil r dalam populasi adalah nul (tidak ada korelasi antara x dan y, atau tegasnya tidak ada korelasi antara pengetahuan umum dan matematik). Soal Latihan
1. Berikan pengertian tentang kolerasi! 2. Apa yang dimaksud dengan kolersi positif dan kolerasi negatif! Samsudi - STATISTIKA
37
3. Jelaskan difinisi tentang angka Indeks kolerasi! 4. Jelaskan tentang pengertian dan penggunaan dari teknik Kolerasi Product Moment dan Pearson! 5. Data: Subyek: Sekor pada Variabel: X Y A 8 5 B 4 5 C 6 7 D 5 6 E 7 6 F 4 5 G 9 6 H 6 7 I 5 6 J 6 7 Soal: Selidikilah dengan secara seksama, apakah memang terdapat korelasi positif yang signifikan antara sekor variabel X dan sekor variabel Y, dengan cara: a. Merumuskan hipotesis alternatifnya b. Merumuskan hipotesa Nihilnya c. Melakukan perhitungan untuk memperoleh angka Indeks Korelasi rxy, dengan mencari SD-nya lebih dulu! d. Memberikan interpretasi sederhana (secara kasar) terhadap rxy. e. Memberikan interpretasi terhadap rxy dengan cara berkonsultasi pada Tabel Nilai “r” Product moment. f. Kesimpulan apa yang dapat saudara kemukakan? 6. Data: Sekor Variabel X: 67 72 66 70 73 72 70 73 74 66 72 73 70 72 70 68 79 66 68 71 73 71 73 69 68 66 72 71 71 60 68 67 69 70 71 Sekor Variabel Y (Urutan sama dengan variabel Y): 59 64 58 62 65 64 62 65 66 58 64 65 62 64 62 60 60 58 60 63 65 63 65 61 60 58 64 63 65 60 62 60 59 64 66
69 73 67 70 72
71 71 69 69 69
69 72 72 68 72
61 65 59 62 63
63 63 61 61 59
61 64 64 60 60
Soal: Coba selidiki dengan cara seksama, apa memang terdapat kolerasi positif yang menyakinkan (signifikan) antara sekor variabel X dan sekor variabel Y, dengan cara: Samsudi - STATISTIKA
38
a. Merumuskan Hipotesis alternative b. Merumuskan Hipotesa Nihilnya! c. Melakukan perhitungan untuk memperoleh Angka Indeks Kolerasi “r” Product Moment, dengan Tabel Nilai “r”! d. Memberikan interpretasi terhadap rxy denagn menggunakan Tabel nilai “r”! e. Menarik Kesimpulan.
7. Dalam suatu kegiatan penelitian, diperoleh data sebagaimana tertera dalam table berikut: Sekolah Asal dan Prestasi Tes SIPENMARU dari 1760 Calon Prestasi Tes Sekolah Asal: Jumlah SIPENMARU: SLTA Negeri SLTA Swasta Lulus 270 470 740 Tidak Lulus 180 840 1020 Jumlah 450 1310 1760 Soal: a. Rumuskan hipotesis alternatif dan hipotesis nihilnya! b. Cari / Hitunglah Angka Indeks Korelasinya, dengan menggunakan Teknik Korelasi Koefisien Phi. c. Berikan interpretasi terhadap Phi dan kemukakan kesimpulannya
Samsudi - STATISTIKA
39
BAB VII TEKNIK ANALISIS KOMPARASIONAL Tujuan
Mahasiswa mampu menerapkan teknik Chi-Kuadrat dan t-score sebagai alat uji hipotesis dalam teknik analisis komparasional.
Samsudi - STATISTIKA
40
7.1. Chi Kuadrad Teknik analisis Chi-Kuadrat digunakan jika peneliti lebih berminat meneliti frekuensi individu-individu yang termasuk dalam sesuatu kategori sifat atau ciri gejala dengan jalan penghitungan atau counting. Chi-Kuadrat (baca Kai Kuadrat) adalah suatu teknik statistika yang memungkinkan peneliti menilai perbedaan frekuensi yang nyata diobservasi, dengan frekuensi yang diharapkan dalam kategori-kategori tertentu sebagai akibat dari kesalahan sampling. Sebagai bagian dari statistika inferensial chi kuadrad dapat digunakan untuk mengadakan estimasi maupun untuk pengetesan hipotesis. Di bawah ini secara berturut-turut akan dibicarakan lebih dahulu Chi Kuadrat untuk estimasi, kemudian disambung dengan Chi Kuadrat untuk pengetesan hipotesis. 7.1.1. Chi-Kuadrat Sebagai Alat untuk Estimasi
Jika kita ingin mengetahui sikap rakyat terhadap koedukasi (sekolah campuran murid-murid puteri dan putersa). Untuk ini kita mengambil suatu sampel yang terdiri dari 200 orang dan mengajukan pertanyaan kepada mereka untuk memperoleh pendapat mereka. Kita misalkan jawaban mereka adalah 115 orang mengatakan setuju dan 85 orang mengatakan tidak setuju. Dalam contoh di atas, kalau tidak ada sumber-sumber lain yang memberi ketentuan, kita mengajukan hipotesis bahasan dalam populasi frekuensi dari mereka yang setuju dan tidak setuju koedukasi terbagi rata (50% lawan 50%). Kita menanyakan, mengapa kita peroleh perbandingan 115 dengan 85 antara mereka yang setuju dan yang tidak setuju dari suatu sampel yang kita ambil secara random? Apakah perbedaan itu hanya semata-mata disebabkan oleh kesalahan sampling, ataukah memang dalam populasi terdapat perbedaan semacam itu? Kalau kita mengharapkan frekuensi dari mereka yang setuju dan yang tidak setuju terbagi rata, maka frekuensi yang diharapkan adalah yang setuju 100 orang dan yang tidak setuju 100 orang, dalam sampel yang jumlahnya 200 orang itu. Frekuensi yang diperoleh (disingkat fo) dan frekuensi yang diharapkan (disingkat fh) dari mereka yang setuju dan yang tidak setuju dapat ditunjukkan dalam tabel sebagai berikut: TABEL 7.1 Samsudi - STATISTIKA
41
FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN frekuensi frekuensi Sikap terhadap Yang diperoleh Yang diharapkan Ke-edukasi (fo) (fh) Setuju 115 100 Tidak setuju 85 100 Total : 200 200 Syarat yang perlu dipenuhi adalah jumlah fo harus sama dengan fh. Dalam tabel di atas ketentuan ini telah kita indahkan, yaitu masing-masing fo = 200 dan fh = 200.
7.1.2. Rumus untuk Menghitung Chi-Kuadrat Rumus umum Chi Kuadrat adalah sebagai berikut :
χ
2
=
∑
( fo
− fh ) fh
2
Dimana : χ2 fo fh
= Chi Kuadrat = frekuensi yang diperoleh (diobservasu dalam)sampel = frekuensi yang diharapkan dalam sampel sebagai pencerminan dari frekuensi yang diharapkan dalam populasi. Tabel kerja persiapan perhitungan Chi Kuadrat sebagai berikut: TABEL 7.2 TABEL KERJA PERHITUNGAN CHI KUADRAT
Sikap Pro tidak setuju Total :
fo
fh
115 85
100 100
200
200
fo-fh
(fo-fh)
+15 -15
225 225
0
-
2
(f
− fh ) fh
2
o
2,25 2,25 4,50
Dari angka-angka dalam table di atas, didapat nilai Chi Kuadrat: ( f o − f h )2 = 4 , 50 χ 2 = ∑ fh 7.1.3. Derajat Kebebasan untuk Chi-Kuadrat Derajat kebebasan atau d.b untuk nilai-nilai χ2 tidak tergantung kepada jumlah individu dalam sampel. Derajad kebebasan itu diperoleh dari kenyataan berapa banyaknya kebebasan yang kita miliki dalam menetapkan isi petak-petak yang diharapkan dalam tabel kita. Untuk memahami hal ini dapat dilihat tabel berikut: Samsudi - STATISTIKA
42
Kategori
fO
fh
I II Jumlah :
a
b
c (a+b)
d (m+n)
Derajad kebebasan untuk bentuk tabel di atas adalah 1. Dengan d.b = 1 maka untuk taraf signifikansi 5%, berlaku ketentuan jika χ O2 ≥ χ B2 5%, nilai Chi Kuadrat yang kita peroleh, atau χ2 itu kita katakan signifikan; dan sebagai konsekuensinya hipotesis (nihil) akan kita tolak. Sebaliknya jika χ o2 < χ b2 5% nilai χ2 itu kita katakan nonsignifikan, dan berbagai konsekwensinya hipotesis (nihil) akan kita terima. Nilai χ 02 = 4,50 sedang taraf signifiknsi 5% dengan d.b. = 1, nilai χ h2 = 3,841 . Dengan demikian χ 02 itu signifikansi, karena ia sudah melebihi χ h2 yang kita pandang sebagai bilangan χ2 maksimal sebagai akibat dari kesalahan sampling atas dasar taraf signifikansi 5%. Konsekwensinya, jika kita yakin bahwa sarat sampel random telah kita penuhi, maka kita tolak hipotesis nihil yang mengatakan bahwa separo dari populasi setuju koedukasi dan separo lagi tidak setuju.
7.1.4. Chi-Kuadrat Sebagai Alat untuk Pengujian Hipotesis Chi-Kuadrat juga dapat digunakan untuk menguji hipotesis, yakni untuk menguji apakah perbedaan frekuensi yang diperoleh dari dua sampel (atau lebih) merupakan perbedaan frekuensi yang hanya disebabkan oleh kesalahan sampling, ataukah merupakan perbedaan yang signifikan. Di bawah ini diberikan contoh-contoh tentang bagaimana menguji hipotesis perbedaan frekuensi yang signifikan atau tidak. Contoh Suatu penelitian dilakukan dengan tujuan untuk mengetahui apakah ada hubungan atau tidak antara kualifikasi pendidikan (S1 dan SLTA) dengan cara mengikuti berita-berita di media masa. Untuk ini diberikan daftar pertanyaan atau angket kepada dua sampel, yaitu sampel tamatan sekolah tinggi dan sampel tamatan sekolah menengah. Kepada mereka ditanyakan, apakah mereka mengikuti berita-berita dengan perantaraan radio ataukah surat kabar. Dari 200 orang tamatan sekolah tinggi yang ditanyai, 130 orang menjawab melalui “radio” sedang dari 100 orang tamatan SMA ada 55 orang yang menjawab melalui “radio”. Data tersebut dapat dihimpun dalam tabel kerja sebagai berikut:
TABEL 7.3 TABEL FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN Sampel Samsudi - STATISTIKA
Radio
Sumber berita Surat Kabar
Total
43
Tamatan S1 Tamatan SLTA Total
130 55 185
70 45 115
200 100 300
Hipotesis nihil untuk masalah di atas adalah: “tidak ada perbedaan yang signifikan antara frekuensi sampel I (tamatan S1) dengan frekuensi sampel II (tamatan SLTA) dalam memilih sumber-sumber berita. Kita lihat dalam tabel itu bahwa ada 185 orang dari 300 orang yang memilih radio sebagai sumber berita (atau dinyatakan dalam per se n ada 61,67 %), dan ada 115 orang dari 300 orang yang memilih surat kabar (atau dinyatakan dalam per se nada 38,33%). Persentase-persentase itulah yang kita gunakan sebagai dasar menetapkan frekuensi yang kita harapkan bagi sampel tamatan sekolah menengah atas ada 61,67% dari 100 orang, ada 61,67 orang. Atas dasar data tersebut dibuat table kerja sebagai berikut: TABEL 7.4 TABEL KERJA UNTUK MENGETES PERBEDAAN FREKUENSI Sampel Sekolah Tinggi Sekolah Menengah Atas Total :
Sumber Berita Radio Surat Kabar Radio Surat Kabar
2
fo
fh
fo-fh
(fo-fh)
130 70 55 45
123,33 76,67 61,67 38,33
+6,67 -6,67 -6,67 +6,67
44,49 44,49 44,49 44,49
300
300,00
0,00
-
(f
− fh ) fh 0,36 0,58 0,72 1,16
2
o
2,82
Jadi nilai Chi Kuadrat yang kita peroleh adalah :
χ = 2
∑
( fO
− fh ) = 2 ,82 fh 2
Dari Tabel di atas 2x2 (dengan 2 baris dan 2 kolom semacam itu derajad kebebasan diperoleh dari rumus d.b. = (b-1) (k-1) dalam mana d.b. = derajad kebebasan, b = baris, dan k = kolom. Atau riilnya, untuk tiap-tiap tabel 2x2 d.b. nya = satu, diperoleh dari (2-1) (2-1). Berdasarkan hasil Chi Kuadrat = 2,82 menunjukkan bahwa baik atas dasar taraf signifikansi 5% maupun 1% perbedaan frekuensi yang diperoleh itu tidaklah signifikan. Konsekwensinya adalah hipotesis nihil yang diajukan, yaitu bahwa tidak ada perbedaan yang signifikan dalam frekuensi pilihan sumber-sumber berita dari tamatan S1 dan tamatan SLTA diterima.
7.2. t-Score
Pada dasarnya t-score tidak lain adalah z-score hanya saja di sini kita tidak lagi menghadapi distribusi angka kasar, melainkan distribusi perbedaan. Inilah sebabnya Samsudi - STATISTIKA
44
mengapa yang dijadikan x bukan sesuatu angka kasar, tetapi angka perbedaan mean, kedua sampel yang diteliti. Lengkapnya t-score itu adalah sebagai berikut :
t = Dimana : Mx My Mh SDbM
Mx −M
y
−Mh
SD bM
= Mean dari sampel x = Mean dari sampel y = Mean hipotetik dari distribusi perbedaan mean = Standard kesalahan perbedaan mean
Oleh karena Mh = 0, maka rumusnya mejadi:
t =
M
x
− M
y
SD bM
Sebagai contoh, data pada tabel 6.1, mean-mean yang kita peroleh adalah 25,89 dan 23,42 dengan SDbM = 1,75499. Jika kita mengisikan bilangan-bilangan itu ke dalam rumus t- score, akan kita peroleh: t=
M
x
− M
SD bM
y
=
25 ,89 − 23 , 42 2 , 47 = = 1, 407 1, 75499 1, 75499
Jika kita menggunakan taraf kepercayaan atau taraf penerimaan 95% (lebih sering disebut taraf signifikansi 5%), maka kita tidak mempunyai bukti-bukti untuk menolak hipotesis “bahwa tidak ada perbedaan antara kecerdasan murid-murid putera dan murid-murid puteri yang kita teliti”. Atau dengan perkataan lain boleh dinyatakan bahwa berdasarkan bukti-bukti yang dikumpulkan ternyata bahwa antara kedua jenis kelamin itu dengan taraf kepercayaan 95% tidak terdapat perbedaan dalam hal kecerdasan sebagaimana ditunjukkan oleh hasil test kecerdasan.
7.2.1. t-Test Untuk Sampel-Sampel yang Berkorelasi t-Test sering juga digunakan dalam eksperimen-eksperimen yang menggunakan sampel-sampel yang berkorelasi (correlated samples). Yang dimaksud dengan sampelsampel berkorelasi adalah sampel-sampel yang sudah disamakan (di-matched) salah satu variabel (mungkin juga dua tiga variabelnya atau lebih). Misalnya saja, koefisien kecerdasan atau IQ lebih diketahui mempunyai pengaruh terhadap prestasi belajar. Dalam eksperimen-eksperimen yang menyangkut prestasi belajar, misalnya tentang Samsudi - STATISTIKA
45
pengaruh metode belajar, misalnya tentang pengaruh metode terhadap prestasi sesuatu mata pelajaran, maka IQ anak-anak yang ditugaskan dalam kelompok eksperimen dan kelompok kontrol disamakan (dianggap) lebih dahulu. Maksudnya agar jika ada perbedaan-perbedaan prestasi belajar dari eksperimen itu, dapat disimpulkan bahwa perbedaan-perbedaan tersebut semata-mata ditimbulkan oleh perbedaan metode-metode yang dieksperimenkan, bukan perbedaan yang diakibatkan oleh perbedaan IQ dari anakanak yang ditugaskan dalam kelompok eksperimen dan kelompok kontrol. Ada dua rumus yang dipersiapkan untuk meneliti signifikansi perbedaan mean dari sampel-sampel yang berkorelasi. Kedua rumus ini akan memberikan hasil yang sama. Cuma saja rumus yang satu, disebut rumus panjang atau Long method, melalui jalan yang melingkar-lingkar, sedang rumus yang satunya lagi, dibuat rumus pendek atau short method, melalui jalan yang langsung dan singkat. Kedua rumus itu berbunyi : RUMUS PANJANG :
t=
Mk − Me
(SD
2 Mk
+ SD
2 Me
) − 2r (SD )(SD ) ke
Mk
Me
Di mana : SDM2 k =
SDk2 Nk − 1
SDM2 e =
SDe2 Ne − 1
rke =
k = Kelompok Kontrol
∑ ke (∑ k )(∑ e ) 2
e = Kelompok eksperimen
2
RUMUS PENDEK : t=
Mk − Me
∑b
2
N ( N − 1)
Untuk segera dapat diketahui penggunaan dari kedua rumus itu akan diberikan contoh-contohnya. Sekedar catatan perlu diberikan lebih dahulu. 1. Rumus panjang, diperuntukan bagi penelitian eksperimental yang menggunakan method subjects designs, yaitu eksperimen yang menggunakan kelompok eksperimen dan kelompok control yang sudah disamakan subyek demi subyek sebelum eksperimen dijalankan. Yang disamakan adalah satu variabel (atau lebih) yang telah diketahui mempunyai pengaruh terhadap hasil eksperimen, yaitu variabel diluar variabel atau faktor yang dieksperimenkan. Samsudi - STATISTIKA
46
2. Rumus pendek, adalah rumus yang serba guna dan efisien. Rumus ini dipersiapkan untuk menyelesaikan penelitian eksperimen yang menggunakan matched subjects designs. Seperti yang disebutkan dalam angka (1) diatas dengan cara yang lebih singkat dan efisien. Kecuali itu rumus ini juga disediakan untuk menganalisa eksperimen yang menggunakan designs treatments by subjecte. Ini adalah eksperimen yang menggunakan hanya satu kelompok (one group experiment) yang sekaligus menjadi kelompok eksperimen dan kelompok kontrol pada periode-periode eksperimen yang berlainan.
Contoh Penggunaan Rumus Pendek TABEL 7.5 TABEL PERSIAPAN UNTUK T-TEST SAMPEL-SAMPEL YANG BERKORELASI DENGAN RUMUS PENDEK Pasangan Subyek K-E (1) 1 – 12 2 – 14 3 – 15 4 – 17 5 – 15 6 – 16 7 – 13 8 – 20 9 – 19 10 - 18 Total
MB =
∑B
N − 4,0 = 10 = −0,4 Harus dicek : ∑B = ∑K − ∑E
K
E
K2
E2
KE
(2) 5,0 5,8 5,8 6,3 6,3 6,5 6,9 7,2 7,4 7,8 65,0
(3) 5,2 6,5 4,9 7,8 6,6 7,5 6,1 8,3 8,1 8,0 69,0
(4) -0,2 -0,7 +0,9 -1,5 -0,3 -1,0 +0,8 -1,1 -0,7 -0,2 -4,0
(5) +0,2 -0,3 +1,3 -1,1 +0,1 -0,6 +1,2 -0,7 -0,3 +0,2 0,0
- (6) 0,04 0,09 1,69 1,21 0,01 0,36 1,44 0,49 0,09 0,04 5,46
b = B - MB
Dan ∑ b = 0,0
Samsudi - STATISTIKA
47
Dimasukkan ke dalam rumus: t=
Mk − Me
∑b
2
N ( N − 1)
=
6,5 − 6,9 = 5,46 10
6,4 0,4 = = 1,624 0,0606 0,246
Selanjutnya pekerjaan-pekerjaan perhitungan lainnya sama sepenuhnya dengan contoh yang diberikan sebelumnya, demikian juga interpretasi dari hasilnya.
Soal Latihan
1. Jelaskan pengertian yang tekandung dalam istikah “Teknik Analisa Komparasional”! 2. Apa yang dimaksud dengan “Teknik Analisa Komparasional Bivarian” dan “Taknik Analisa Komparasional Multivarian”? Kemukkakan contohnya! 3. Jelaskan perbedaan pokok antara Tes “t” dan tes Kai Kuadrat sebagai Taknik analisa Komparasional Bivariat! 4. Barilah penjelasan tentang prosedur yang perlu kita tempuh dalam rangka memberikan interpretasi terhadap Kai kuadrat. 5. Dalam keadaan bagaimana sebuah Ho yang menyatakan tidak adanya perbedan yang signifikan antara fo dan ft disetujui? 6. Buatlah sebuah ikhtisar tentang berbagai kegunaan Tes Kai Kuadrat dalam Praktek kehidupan sehari hari, terutama dalam kegiatan penelitian di bidang pendidikan. 7. Data: Diketahui: N =25; MD = 0,45; S DD = 0,83; Soal : a. Carilah “t” b. Berikan interpretasi terhadap “to” dengan berkonsultasi Tabel Harga Kritik “t”, pada taraf signifikansi 5%. 8. Data: N2= 82; Diketahui : N1 = 65; M1= 76,44; M2= 75,14; SD1= 10,66; SD2= 12,59; Soal: a. Hitunglah “t” b. Berikan interpretasi terhadap “to” denagn berkonsultasi pada table Harga Kritik “t”, pada taraf signifikansi 5%. 9. Data: N2 = 20 Diketahui : N1 = 20 ΣX22= 160 ΣX12= 180 Σx1 = 24 Σx2 = 22 Samsudi - STATISTIKA
48
Soal: a. Carilah “t” dengan menggunakan rumus dari fisher! b. Berikan interpretasi terhadap “to” denagn berkonsultasi terhadap table Harga Kritik “t” pada taraf signifikansi 5%. 10. Sekor Hasil Tes Matematika dari 40 orang siswa SMK sebelum diajar dengan metode baru adalah sebagai berkut: 68 50 58 40 62 54 66 70 46 56 60 64 42 52 48 44 76 72 43 74 51 65 57 51 55 49 62 59 64 59 53 54 45 55 60 75 70 50 40 53 Sedangkan sekor sasil tes Matematika dari 40 orang siswa yang sama di atas, setelah diajar dengan metode baru adalah sebagai berikut: 87 75 50 70
55 81 83 60
72 48 69 55
45 51 77 59
71 57 65 69
66 54 58 79
84 99 77 70
90 93 72 59
54 58 64 48
69 96 59 65
Soal: Selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan Mean hasil tes Matematika dikalangan 40 siswa SMK tersebut, antara sesudah dan sebelum diajar dengan metode baru dengan cara: a. Menemukan Ha dan Ho –nya lebih dahulu b. Menguji kebenaran / kepalsuan hipotesa tersebut dengan membandingkan besarnya to dan ttabel pada taraf signifikan 5% c. Apa kesimpulan yang diperoleh? 11. Dalam suatu kegiatan yang dilaksanakan dengan tujuan untuk mengetahui bagaimana pendapat para penonton televisi mengenai acara Dakwah yang dituangkan dalam bentuk ceramah dan Sandiwara televisi, dalam penelitian mana telah disiapkan 800 orang penonton televisi sebagai sempel penelitian, telah berhasil dihimpun data jawaban yang mereka berikan kepada tim peneliti, sebagai berikut: Pendapat: f A. Siaran Dakwah melalui sandiwara televise lebih baik daripada 243 ceramah B. Siaran Dakwah melalui ceramah lebih baik daripada sandiwara 235 televisi C. Siaran Dakwah melalui Ceramah dan sandiwara televise sama 232 baiknya D. Saya tidak dapat menemukakan pendapat 90 Soal: Berdasarkan perimbangan bahwa pendapat para penonton televisi mengenai Siaran Dakwah itu merupakan faktor determinan (faktor yang menentukan) yang perlu dipertimbangkan dalam penyusunan program Siaran Dakwah lewat televisi itu, cobalah Samsudi - STATISTIKA
49
selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan frekuansi yang diibservasi dan frekuensi toritiknya, dengan cara: a. Terlebih dahulu menyusun hipitesa alternative dan hipotera Nolnya. b. Mengetes perbedan frekuensinya dengan menggunakan Teknik Analisis Kai kuadrat. c. Memberikan interpretasi terhadap kai kuadrat, dengan menggunakan signifikan 5%. d. Kemukakan kesimpulannya 12. Sejumlah 300 oarang mahasiswa pada sebuah perguruan tinggi ditetapkan sebagai sempel dalam rangka kegiatan penelitian yang berjudul “Komparasi Prestasi Studi Mahasiswa Dalam hubungannya Dengan kegiatan Para Mahasiswa dalam Organisasi-organisasi kemahasiswaan”. Mereka itu dibagi dalam kedua kelompok, yaitu: 60 orang mahasiswa yang duduk dalam kepengurusan organisasi-organisasi kemahasiswaan, dan 240 orang lainnya adalah mahasiswa yang tidak duduk dalam kepengurusan organisasi kemahasiswaan. Dari kedua kelompok mahasiswa tersebut berhasil dicatat hasil belajar mereka dalam ujian semester difakultas mereka masing masing sebagai berikut: Dari sejumlah 60 orang mahasiswa yang menjadi pengurus organisasi kemahasiswaan, 20 orang diantaranya lulus pada ujian utama; 25 diantaranya dinyatakan lulus dalm ujian ulangan, sedangkan sisanya yaitu 15 orang dinyatakan gagal. Selanjutnya dari sejumlah 240 orang mahasiswa yang tiadak menjadi pengurus organisasi kemahasiswaan, 80 orang diantaranya dinyatakan lulus ujian utama, 120 orang lulus pada ujian utama dan 40 orang selebihnya dinyatakan gagal dalam ujian tersebut. Soal: a. Rumuskan Hipotesis alternatifnya dan Hipotesis Nihilnya! b. Ujilah Hipotesis tersebut dengan menggunakan Teknik analisis kai kadrat! c. Berikan interpretasi terhadap Kai Kuadrat dengan menggunakan signifikan 5%. d, Apa kesimpulan yang dapat dikemukakan? 13. Data: Jenis Sekolah / sikap Baik Cukup Kurang Total: keagamaan Sekolah Umum 100 140 60 300 Sekolah Teknik 40 90 50 180 Sekolah Guru 63 40 17 120 Total 203 270 127 600=N Soal: Dengan menggunakan Teknik Analisa Kai Kuadrat, Ujilah hipotesis nol yang menyatakan bahwa diantara 600 orang siswa SLTA yang berbeda jenis sekolahnya itu tidak dapat berbeda sikap keagamaan yang signifikan!
Samsudi - STATISTIKA
50
BAB VIII ANALISIS VARIANSI Tujuan
Mahasiswa memiliki pemahaman tentang teknik analisis variansi sebagai alat analisis data dan uji hipotesis yang meliputi mean kuadrat, asumsi-asumsi dalam Anava, Anava Klasifikasi Tunggal dan Anava Klasifikasi Ganda dan dapat menggunakan Anava untuk menganalisis data penelitian.
Samsudi - STATISTIKA
51
8.1. Konsep Mean Kuadrat
Perlu diingat kembali apa yang disebut varian dalam pembicaraan tentang SD (standar deviasi). Varians adalah SD kuadrad, yang diperoleh dengan rumus:
SD
2
=
∑
x2
N
Hanya saja dalam hubungan dengan pembicaraan kita sekarang ini kwalitas itu tidak disebut varians, melainkan Mean KUADRAT, disingkat dari mean dari jumlah KUADRAT, dan diberi simbul MK, dan diperoleh dengan rumus:
MK =
DK d b
DK = jumlah KUADRAT, d b = derajad kebebasan. Dalam teknik Anava ini yang menjadi alat pengukuran variabilitas antar kelompok adalah mean KUADRAT atar kelompok (disingkat dengan MKant), sedang yang menjadi alat pengukuran variabilitas dalam kelompok adalah mean KUADRAT dalam kelompok (disingkat dengan MK dal). Hasil bagi dari kedua komponen ini, yaitu MKant dan MKdal, akan memjadi petunjuk seberapa jauh jarak penyimpangan mean-mean kelompok kita itu dari mean hipotetis (yaitu bahwa tidak ada perbedaan antara mean-mena variabel yang diselidiki) sebagai akibat dari kesalahan sampling. Jadi sebenarnya yang kita cari adalah menemukan MKant yang mewakili variabilitas dalam kelompok. Jika kedua MKdal yang mewakili variabilitas dalam kelompok. Jika kedua MK itu sudah kita ketemukan, maka perbandingan antara keduanya akan dapat digunakan sebagai dasar menarik kesimpulan statistik tentang obyek yang sedang kita teliti. Rumus umum untuk mencari MK, yaitu : Samsudi - STATISTIKA
52
MK ant =
DK an t db ant
MK dal =
DK dal dbdal
dbdal = derajad kebebasan dalam kelompok, diperoleh dari dbtot dikurangi dengan dbant sedang dbtot = N-1 dbant = derajad kebebasan antar kelompok, diperoleh dari jumlah kelompok dikurangi satu, atau (m-1) Sebagai contoh diperoleh data sebagai berikut: dbant = 5 – 1 =4 N = 50 DKant = 19,72 dbdal = 50 – 1 – 4 = 45 m=5 DKdal = 254,30 Dengan mengisikan bilangan-bilangan itu ke dalam rumus MK dapat diperoleh:
MK ant =
DK ant 19,72 = dbant 4
MKdal =
= 4 , 93
DKdal 254,30 = dbdal 45
= 5 , 56
8.2. F – Ratio
Adapun yang dimaksud dengan F-ratio adalah angka-angka perbandingan antara MKant dengan MKdal dan didefinisikan dengan persamaan sebagai berikut :
F =
MK MK
ant da l
Besarnya nilai-nilai F yang terjadi hanya 5% dan 1% dari seluruh kejadian dari samplesampel yang diambil secara random, sekiranya memang hipotesis nilai adalah benar. Jika MKant adalah sedemikian besarnya, jauh melebihi MKdal sehingga perbandingan kedua MK itu menunjukkan nilai yang menyamai atau melebihi nilai F dalam tabel pada dasar taraf signifikansi 5 % dan 1%, maka kita menyimpulkan bahwa tidak mungkin nilai F sebesar itu terjadi kalau hipotesis nihil dan mengatakan bahwa F yang kita peroleh menunjukkan nilai yang signifikan atas dasar taraf signifikansi 5 % dan 1 %. Misalkan hipotesis nihil yang kita ajukan dalam penelitian kita itu adalah: “tidak ada perbedaan yang signifikan antara kelima kelompok pelajar-pelajar SMA dari berbagai daerah dalam soal kecakapan atau pengetahuan kebudayaan” . MKant yang kita peroleh adalah 4.93, dan MKdal-nya 5,56. Jika harga-harga MK tersebut kita isikan ke dalam rumus F, maka:
Samsudi - STATISTIKA
53
MK ant 4 , 93 = MK da l 5 , 56 = 0 , 873
F =
Mengkonsultasikan dengan Tabel F Dari perhitungan di atas, dapatemukan bahwa:
F db
ant
; db dal =
MK MK
ant
F 4; 45 = 0,873
dal
Untuk mengkosultasikan harga F diatas, dapat ditempuh dua cara. MK yang lebih kecil adalah MKant = 4,93 Derajad kebebasan dari MK ini = 4. kita cari db = 4 dalam kolom sebelah kiri, kit abaca kekanan sampai menyilang kolom db = 45 sebagai db dari MK kita yang lebih besar. Karena ternyata tidak ada kolom db = 45, maka kita ambil saja suatu bilangan diantara db = 40 dan db = 50, yaitu bilanganbilangan 5,71 dan 5,70, jika kita gunakan taraf signifikansi 5 %, sedang bilanganbilangan diantara 5,71 dan 5,70 adalah 5,705, taraf signifikansi 5%, sedang bilanganbilangan pada baris bawah adalah bilangan-bilangan batas F pada taraf signifikansi 1%. Karena itu jika kita gunakan taraf signifikansi 1%, bilangan batas yang kita cari adalah bilangan diantara 13,74 dan 13,69, yaitu bilangan 13,715. Dari pemeriksaan pada tabel itu ternyata bahwa F yang kita peroleh sebesar 0,873 berada jauh di bawah batas signifikansi 5%, apalagi sebagai konsekuensinya hipotesis nihil yang kita ajukan sebelum penelitian kita terima. Kesimpulan kita akan berbunyi kira-kira sebagai berikut: “Bahwa menurut bahan-bahan yang dikumpulkan dalam penelitian itu diperoleh buktibukti antara pelajar-pelajar SMA dari berbagai daerah itu tidak terdapat perbedaan yang signifikan mengenai pengetahuan kebudayaan”. Tabel Ringkasan ANAVA Hasil-hasil perhitungan analisis varians yang telah kita kerjakan berikutnya dimasukkan ke dalam tabel berikut:
Tabel 8.1 Tabel Ringkasan Anava Sumber Variasi SV Kelompok Pelajar SMA Dalam Kelompok Total
Mean Jumlah Derajad F empiris Kebebasan KUADRAT KUADRAT FO MK DK db 4
19,72
4,93
45
254,30
5,65
49
274,02
-
Samsudi - STATISTIKA
F teoritis (hipotetis) Ft 5% 1%
0,873
5,705
13,715
-
-
54
Kesimpulan : Karena FO = 0,873 < Ft5% = 5,705 maka HO diterima.
Adapun ringkasan rumus-rumus dalam table Anava: Tabel 8.2 Tabel Ringkasan Anava dari bahan-bahan dalam tabel Sumber Variasi SV Kelompok apa ? ( antar)
db C–1
JK
∑
(∑ X )
2
nk
Dalam Kelompok (dalam)
N–C
∑X
Total
N-1
∑
(∑ X )
2
−
k
RJK DK ant C −1
tot
N
(∑ X ) −
2
2
MK MK
DK dal N −C
k
tot
FO
nk
(∑ X )
Ft
ant
5%
1%
?
?
-
-
dal
2
X 2 tot −
-
tot
N
-
F O ≥ F t ? % , maka HO ditolak (2) Jika F O ≤ F t ? % , maka HO diterima
Pengujian
: (1) Jika
Kesimpulan
: (1) Ada perbedaan apa antara kelompok apa (2) Tidak ada perbedaan apa antara kelompok apa Dengan tabel ringkasan Anava yang tersedia itu, marilah kita kerjakan contoh lain dibawah ini. Tabel 8.3ini memuat bahan hipotetis tentang sikap terhadap persoalan “KLM” yang diperoleh dengan jalan angket. NIlai yang lebih besar menunjukkan sikap yang lebih positip. Tabel 8.3 Tabel distribusi sikap untuk contoh Anava Kelompok I Kelompok II Kelompok III Total X1 68 63 58
2
X 1
4624 3969 3364
Samsudi - STATISTIKA
X2 78 69 58
2
X 2
6084 4761 3364
X3 94 82 73
2
X
X
X2
3
8836 6724 5329
240 214 189
19544 15454 12057 55
∑ (1)
DKtot =
∑X
2
∑ n1 = 10
X1
X 1
∑
2
∑X
2
X 2
n2 = 10
∑X
tot
−
(∑ X )
∑
3
n3 = 10
2
2
4489 4356 3844 3600 2916 2500 1024 43618
67 66 62 60 54 50 32 640
3249 2809 2704 2304 2116 1764 729 29884
57 53 52 48 46 42 27 530
2601 1681 1600 1156 729 400 324 20488
51 41 40 34 27 20 18 420
2
X 3
175 160 154 142 127 112 77 1590
∑
X tot
10339 8846 8148 7060 5761 4664 2077 993950
∑
X
2
tot
N = 30
(1 .590 )
2
= 93 .950 −
tot
N
30
2528100 30 = 93.950− 84270 = 93.950− = 9.680.
(∑ X )
2
(2)
DKan t =
1
n1
(∑ X ) +
2
2
n2
(∑ X ) +
2
3
n3
(∑ X ) −
2
tot
N
2 2 2 2 ( 420) (530) (640) (1.590) = + + +
10 10 = 86.690 − 84270
10
30
= 2.420 (3)
DKdal = DK tot − DK ant = 9.680 − 2.420 = 7.260
(4)
MKant = = 1.210
(5)
DK ant 2.420 = m −1 3 −1
MKdal =
MK dal 7.260 = N − m 30 − 3
= 268,90 (6)
Fm – 1; N – m = Samsudi - STATISTIKA
MK ant 1.210 = MK dal 268,9
56
= 4 , 50 Hasil-hasil perhitungan itu kemudian disusun dalam tabel ringkasan Anava sebagai berikut :
Tabel 8.4 Tabel Ringkasan Anava dari bahan tabel Sumber Variasi SV Kelompok “K” Dalam Kelompok Total
db
DK
MK
2
2.420
1.210
27
7.260
268,9
29
9.680
-
FO
4,50 -
Ft t.s.5% 3,35 t.s.1% 5,49 -
Signifikansi Nonsignifi Sig Nonsig -
Jadi, dengan taraf signifikansi 5% kita akan menolak hipotesis nihilnya yang mengatakan bahwa tidak ada perbedaan sikap antara ketiga kelompok yang diselidiki. Kita menolaknya disebabkan karena kita meragukan bahwa variabilitas antar kelompok sebesar 4,50 itu semata-mata disebabkan karena kesalahan sampling. Bagaimana halnya jika kita gunakan taraf sigibifikansi 1%?. Bilangan batas signifikansi atau batas penolakan hipotesis nihil dengan taraf signifikansi 1% adalah 5,49. Dengan demikian hipotesis nihil itu kita terima. Karena batas penolaknnya masih belum dilewati. F yang kita peroleh = 4,50 dan ini masih di bawah Ft = 5,49 sebagai batas signifikansinya. Kita menerima hipotesis nihilnya karena jikalau kita menggunakan dasar taraf signifikansi 1%, kita memandang deviasi-deviasi yang besarnya terjadi 5 kali dalam 100 atau 4 kali dalam 100 kemungkinan, atau malahan 2 kali dalam 100 kemungkinan masih disebabkan karena kesalahan sampling. Hanya deviasi-deviasi yang terjadi 1 kali diantara 100 kejadian yang kita pandang tidak disebabkan oleh kesalahan sampling. Asumsi-asumsi Dalam Analisis Variansi Pengujian dengan F test ini juga menggunakan asumsi-asumsi atau landasanlandasan teori tertentu. Ada tiga macam asumsi yang perlu diindahkan dalam penggunaan teknik Anava, yaitu (1) Bahwa subyek-subyek atau individu-individu yang ditugaskan dalam sampelsampel penelitian harus diambil secara random secara terpisah satu sama lain dari masing-masing populasinya. Samsudi - STATISTIKA
57
(2) Bahwa distribusi gejala yang diselidiki dalam masing-masing populasi itu adalah normal. (3) Bahwa varians-varians atau SD2 dari masing-masinng populasi tidak menunjukkan perbedaan yang signifikan satu sama lain. Bagaimana memenuhi sarat-sarat yang ditentukan itu dapat dituturkan secara singkat sebagai berikut : (1) Random samples : dapat kita penuhi dengan cara yang sudah dibicarakan dalam permulaan bab VII. Gunakan tabel bilangan random untuk mengambil random clusters, random areas, atau random subjectsnya. (2) Normal distributions: dapat kita penuhi melalui dua jalan. Pertama, atau kita mengadakan pengetesan normalitas (test of normality) dengan rumus-rumus yang sudah kita ketahui. Ini kita lakukan jika kita belum mempunyai bukti-bukti bahwa gejala yang kita selidiki mengikuti cirri-ciri distribusi normal. Kedua, atau jika kita telah mempunyai bukti-bukti bahwa varaibel yang kita selidiki telah mengikuti distribusi normal, baik bukti ini kita peroleh dari penelitian-penelitian pendahuluan maupun dari penelitian-penelitian orang lain yang mendahului, kita dapat menggunakan bukti-bukti sebagai landasan untuk memenuhi sarat atau tuntutan normalitas ini. (3) Correlated variances : dapat kita penuhi dengan mengadakan pengetesan terhadap varians-varians (test of variance) yang kita peroleh dari distribusi-distribusi yang kita peroleh dari distribusi-distribusi yang kita selidiki. Rumus untuk ini adalah : 2
SD F db Vb ; dbVk =
bs 2
SD kt
Dalam mana db Vb = derajad kebebasan dari Varians yang lebih besar, db Vk = derajad 2
2
bs
kt
kebebasan dari varians yang lebih kecil, dan SD dan SD masing-masing adalah varians yang lebih besar dan varians yang lebih kecil. Kongkritnya, dari bahan tabel 67 hal. 375 kita dapat mengetest variansnya seperti berikut : Kelompok I n = 10 ∑ x = 135. ∑x2 = 1881 1881 1352 18825 SD 2 = − 2 = 188,1 − 10 10 100 = 188,10 − 182,25 = 5,85 Kelompok II n = 10 ∑ x = 153. ∑x2 = 2385 2385 1532 23409 2 SD = − 2 = 238,5 − 10 10 100
Samsudi - STATISTIKA
58
= 238,5 − 234,09 = 4,41 Dari perhitungan itu kita ketahui itu kita ketahui bahwa SD2 atau varians yang lebih besar adalah varians dari kelompok I. Varians yang lebih besar ini kemudian kita jadikan pembilang dalam test of variance kita.
5,85 = 1,33 4,41
F 9;9 =
Karena itu
Dengan melihat tabel pada derajad kebebasan 9 lawan 9 akan kita ketemukan bahwa FO = 1,33 ini lebih kecil daripada F15% = 3,18. karena itu kita menyimpulkan bahwa varians dari kelompok I dan kelompok II itu tidak berbeda secara signifikan, hal mana berarti bahwa varians dari kedua kelompok itu dalam populasinya masing-masing adalah tidak berbeda. Analisa varians ternyata dapat digunakan untuk meneliti bahan-bahan yang telah disusun ke dalam bermacam-macam distribusi. Di bawah ini diberikan contohcontoh penggunaan Anava pada (1) distribusi tunggal; (2) distribusi bergolong dan (3) distribusi deskriptip. Penerapan itu akan dibaca secara berturut-turut. 8.3. Anava pada Distribusi Tunggal Tabel di bawah ini menunjukkan distribusi tunggal dari hasil test psikologis terhadap mahasiswa-mahasiswa yang baru ulai belajar mata pelajaran itu. Untuk tidak menimbulkan kebingungan, perlu kiranya segera diberi keterangan tentang rumusrumus DK untuk bahan yang sudah distribusikan yang kelihatannya sepintas lalu berbeda dengan rumus-rumus DK yang sudah kita pelajari. Pada dasarnya rumus-rumus baru ini tidak ada bedanya dengan rumus-rumus yang terdahulu. Komponen f dimasukkan ke dalam rumus-rumus baru ini disebabkan karena dalam distribusi komponen f itu selalu ada. Jadinya,
(1)
DKtot = ∑ fX2tot (2)
(∑ fX ) −
(3)
Nilai X
tot
N
(∑ fX ) − (∑ fX ) = 2
DKant
2
2
1
n1
tot
N
(∑ fX ) − (∑ fX ) + .........+ 2
2
m
nm
tot
N
DK dal = DK tot − DK ant Tabel 8.5 Distribusi hasil tes Potensi Akademik dari tiga kelompok mahasiswa Kelompok 1 Kelompok II Kelompok III Total 2 fX 1 f fX1 f fXt fX t2 f fX2 fX 22 f fX3 fX 32
Samsudi - STATISTIKA
59
4 22 242 2 11 121 1 11 121 1 11 5 10 100 1 20 200 2 20 200 2 10 10 27 243 3 36 324 4 27 243 3 9 19 56 448 7 56 448 7 40 320 5 8 25 35 245 5 77 539 11 63 441 9 7 20 48 288 8 30 180 5 42 252 7 6 15 25 125 5 20 100 4 30 150 6 5 11 80 20 5 64 16 4 32 8 2 4 10 27 9 3 27 9 3 36 12 4 3 6 12 6 3 8 4 2 4 2 1 2 5 1 1 1 1 1 1 3 3 3 1 3 0 0 2 0 0 0 0 0 1 0 Total 44 258 1802 44 280 2012 45 259 1811 133 Anava dari bahan tersebut dapat dikerjakan dengan cara-cara yang biasa : 797 2 635209 (1) DK tot = 5625 − = 5625 − = 5625 − 4776,01 133 133
44 454 50 500 90 810 152 1216 175 1225 120 720 75 375 44 176 90 30 24 12 5 5 0 0 797 5625
= 848 , 99
(2) DK ant =
2582 2802 2592 797 2 + + − 44 44 45 133
66564 78400 67081 635209 + + − 44 44 45 133 = 1512,82 + 1781,82 + 1490,69 − 4776,01 = 4785,33 − 4776,01 = 9,32 =
(3)
DKdal = 848,99 − 9,32 = 839,67
(4)
MKant =
9,32 = 4,66 2
(5)
MKdal =
839,67 = 6,46 130
(6) F 2;130 =
4,66 = 0,72 6, 46
db dari MK yang lebih besar adalah 130, sedang db dari MK yang lebih kecil adalah 2. jika kit abaca tabel F1 dengan db 130 lawan 2 maka akan kita ketahui bahwa batas penolakan hipotesis pada taraf signifikansi 5% adalah 19,49, dan pada taraf signifikansi 1% adalah 99,49. Ternyata nilai F yang kita peroleh itu berada sangat jauh di bawah batas signifikansi 1%. Dengan begitu maka hipotesis nihil yang kita ajukan, kita terima. Kesimpulan kita adalah bahwa atas dasar bahan-bahan yang kita kumpulkan sampai sekian jauh, antara kelompok signifikansi tentang pengetahuan psikologi mereka. Samsudi - STATISTIKA
60
Tabel Singkatan Anava dari pekerjaan analisa tersebut di atas dapat dilihat pada tabel 8.6 di bawah ini. Tabel 8.6 Tabel Ringkasan Anava dari bahan dalam table 8.5 Sumber Variasi Antar Kelompok Dalam Kelompok Total
db
DK
MK
2
9,32
4,66
13
839,67
6,46
132
848,99
-
Signifikansi
FO
Ft
0,72
t.s.5% =19,49
Nonsig
-
-
-
ANAVA PADA DISTRIBUSI BERGOLONG Distribusi bergolong yang tercantum dalam tabel 8.7 di bawah ini dipersiapkan untuk meneliti ada tidaknya perbedaan gaji guru-guru wanita dan pria. Interval gaji diambil dari gaji rata-rata tiap-tiap bulannya.
Interval gaji
Kode X
f
Rp.7000-7999 Rp.6000-6999 Rp.5000-5999 Rp.4000-4999 Rp.3000-3999 Rp.2000-2999 Rp.1000-1999 Total
6 5 4 3 2 1 0 -
4 8 12 15 8 3 1 51
Tabel 8.7 Tabel Distribusi Bergolong Peria Wanita 2 fX 1 fX 22 f fX2 fX1 24 40 48 45 16 3 0 176
144 200 192 135 32 3 0 706
1 5 10 12 18 7 3 56
6 25 40 36 36 7 0 150
36 125 160 108 72 7 0 508
Total f
fXt
fX t2
5 13 22 27 26 10 4 107
30 65 88 81 52 10 0 326
180 325 352 243 104 10 0 1214
Kode-kode digunakan dalam tabel itu disebabkan karena sungguhpun kita dapat melakukan analisa dengan metode yang lazim, yaitu dengan menggunakan titiktitik tengah atau tanda-tanda kelas Rp 7.500,-, Rp 6.000,- dan seterusnya, kita akan terlibat dalam mengKUADRATkan bilangan-bilangan besar. Dengan pengkodean itu kita dapat menghemat sangat banyak waktu dan fikiran. Dari interval yang terendah dimulai pengkodean dengan bilangan nol. Analisa variannya adalah : 106276 3262 = 1214 − = 1214 − 993,23 107 107 = 220 , 77
(1) DK tot = 1214 −
Samsudi - STATISTIKA
61
(2) DK ant =
1762 1502 3262 30976 22500 106276 + − = + − 51 56 107 51 56 107
= 607 ,37 + 401,79 − 993,23 = 1009 ,16 − 993,23 = 15,93 (3)
DKdal = 220,77 −15,93 = 204,84
(4)
MKant =
(5)
MKdal =
(6)
15,93 = 15,93 1
204,84 = 1,95 105
F1;105 =
15,93 = 8,17 1,95
Dimasukkan dalam tabel ringkasan Anava : Tabel 8.8 Ringkasan Anava dari bahan dalam tabel Sumber Variasi
db
DK
MK
Sekse
1
15,93
15,93
Dalam
105
204,84
1,95
Total
106
220,77
-
Signifikansi
FO
Ft
8,17
t.s.1%=6,90
Sig
-
-
-
db dari MK yang lebih besar = 1, dan db dari MK yang lebih kecil = 105. Pemeriksaan pada tabel F menunjukkan bahwa dengan taraf signifikansi 5% dan 1 % batas penolakan itu maka hipotesis nihilnya kita tolak. Kita menyimpulkan bahwa berdasarkan bahan-bahan yang masuk ada perbedaan besarnya gaji guru-guru wanita dna peria. Mean dari gaji peria = 176/51=3,45. sedang mean dari gaji wanita = 150/56 = 2,68. karena gaji peria ternyata lebih besar daripada wanita, dan perbedaan itu signifikan, maka akhirnya kita menyimpulkan bahwa gaji adalah fungsi daripada jenis kelamin, dan guru-guru peria mempunyai kecenderungan memperoleh gaji yang lebih tinggi.
8.4. Analisis Variansi (ANAVA) Klasifikasi Ganda Dalam bab VII kita telah membicarakan bagaimana mengetest hipotesis tentang sesuatu variabel dari dua kelompok. Dalam bab XI kita telah maju satu langkah, yaitu memperbincangkan cara mengetest hipotesis tentang sesuatu variabel dari tiga kelompok atau lebih. Dalam bab ini kita maju satu langkah lagi. Kita ingin mengetahui Samsudi - STATISTIKA
62
bagaimana mengetest hipotesis dari banyak kelompok yang tidak hanya menggunakan satu klasifikasi, tetapi banyak klasifikasi. Mengadakan klasifikasi ganda ini bukan saja mungkin dikerjakan dalam banyak penelitian, tetapi juga sangat berguna untuk mendapatkan informasi yang lebih banyak dan lebih teliti. Kebenaran pernyataan tersebut dapat dilihat dari contoh sebagai berikut : Seorang insinyur mobil ingin meneliti lima macam merk sepeda motor untuk menetapkan keadaan konsumsi bensin mereka. Dia mengambil dari tiap-tiap merk lima buah sepeda motor dari model empat tahun yang lalu sampai model tahun ini. Semua sepeda motor itu kemudian dijalankan dalam keadaan yang diawasi baik-baik dan dicatat konsumsi bensinya tiap-tiap kilometernya. Kita misalkan hasil daripada test ini adalah seperti berikut : Tabel 8.9 Konsumsi bensin per km dari lima macam merk sepeda motor M ERK MODEL TOTAL A B C D E 112 18 24 22 22 26 Tahun 2008 105 20 20 20 21 24 Tahun 2007 94 16 19 19 18 22 Tahun 2006 80 15 13 17 15 20 Tahun 2005 67 12 18 11 12 14 Tahun 2004 Total 106 88 89 91 81 458 Dengan menggunakan Anava yang biasa kita dapata mengetest hipotesis nihil : “Bahwa ada perbedaan konsumsi bensin antara kelima merk sepeda motor itu”. Dengan Anava klasifikasi tunggal akan kita peroleh hasil-hasil sebagai berikut : 4582 2 2 2 (1) DK tot = 26 + 24 + ... + 12 − = 393,44 25 1062 882 892 942 812 4582 (2) DK ant = + + + + − = 69,04 5 5 5 5 5 25
DKdal = 393,44− 69,04 = 324,40 69,04 = 17,26 (4) MK ant = 4 324,40 = 16,22 (5) MKdal = 20 (3)
(6) F 4;20 =
17 ,26 = 1,06 16,22
Hasil-hasil perhitungan itu kita masukkan ke dalam tabel ringkasan Anava sebagai berikut : Tabel 8.10 Samsudi - STATISTIKA
63
Ringkasan Anava dari bahan dalam tabel 9.5 Sumber Variasi
db
DK
MK
Merk
4
60,04
17,26
Dalam
20
324,40
16,22
Total
24
393,44
-
Signifikansi
FO
Ft
1,06
t.s.5%=2,87
Non
-
-
-
Nilai F dengan derajad kebebasan 4 lawan 20 adalah tidak signifikan. Konsekwensinya hipotesis nilai yang dikemukakan tidak dapat ditolak. Kelima merk sepeda motor itu tidak menunjukkan perbedaan konsumsi bensin yang menyakinkan. Data dalam tabel di atas dapat juga digunakan untuk menetapkan DK-DK dari merk maupun model. Analisa varians untuk ini pada prinsipnya adalah sama seperti yang telah kita pelajari. Beberapa dari pekerjaan kita di atas dapat kita ambil lagi untuk analisa ini. 2 Perlu dicatat bahwa suku 458 dalam perhitungan-perhitungan DKmerk dan 25
DKmodel di atas kita sebut suku koreksi. Jumlah pembilang pada tiap-tiap pecahan yang ditambahkan sebelum diKUADRATkan harus sama dengan pembilang dari suku koreksi. Demikian juga jumlah pembagi pada tiap-tiap pecahan yang ditambahkan sebelum diKUADRATkan dalam tiap-tiap menghitung DK haruslah sama dengan pembagi dari suku koreksi. Catatan ini perlu diperhatikan agar kita meneliti kembali jumlah-jumlah itu sebelum menghitung tiap-tiap DK. Hasil Anava dari data tersebut yang memasukkan dua jenis klasifikasi yaitu klasifikasi merk dan klasifikasi odel, ditunjukkan dalam tabel 8.11 di bawah ini. Dari dua klasifikasi ini dapat perbedaan yang signifikan antara kenihilan yang aseli, yaitu bahwa tidak ada perbedaan yang signifikan antara kelima macam merk dapat ditest kembali. Hipotesis yang kedua ialah hipotesis nihil tentang tidak adanya perbedaan yang signifikan antara kelima mode. Periksalah kembali test hipotesis pertama yang sudah dikerjakan di muka. Hipotesis nihil itu diterima atas dasar klasifikasi tunggal (periksa tabel 8.10). Persoalannya sekarang apakah kesimpulan itu masih dapat dipertahankan jadi faktor model turut diperhitungkan? Tabel 8.11 Tabel ringkasan Anava tentang konsumsi bensin sepeda motor ditinjau dari segu merk dan model Jumlah Mean Sumber setujubabilitas db FO Variasi KUADRAT KUADRAT Kejadian (p)x) 4,96 17,26 69,04 4 Merk p < 1 % xx) 19,32 67,19 286,76 4 Model p < 1% xx) 3,48 55,64 16 Dalam Samsudi - STATISTIKA
64
Total
(5) (6) (7) (8) (9)
24
393,44
-
-
-
X) Diartikan juga proporsi kesalahan dari tiap-tiap penolakan hipotesis nihil. XX) Lebih lazim ditulis dalam bentuk setujuporsi sebagai berikut P < 0,01 Baiklah pertanyaan ini kita jawab setelah kita menyelesaikan pekerjaan kita dalam mengisi tabel ringkasan di atas. 60,04 MK merk = = 17,26 4 288,76 MK mod el = = 67,19 4 55,64 MK dal = = 3,48 16 17,26 Untuk Merk : F4 ;16 = = 4,96 3,84 67,19 Untuk Model : F 4;16 = = 19,32 3,84 Pemeriksaan pada tabel F menunjukkan kepada kita bahwa dengan derajad kebebasan 4 lawan 16 batas penolakan hipotesis nihilnya adalah 3,01 untuk taraf signifikansi 5%, dan 4,77 untuk taraf signifikansi 1%. Dengan bukti-bukti itu dapatlah kita menjawab pertanyaan yang baru diajukan. Hipotesis nihil tentang perbedaan konsumsi bensin di berbagai merk itu jika model atau tahun pembuatannya telah turut diperhitungkan, tidak lagi dapat dipertahankan. Kita menyimpulkan bahwa kelima jenis merk sepeda motor yang diselidiki berbeda konsumsi bensinya. Jelaslah bahwa analisa varians dengan menggunakan kalsifikasi ganda merupakan alat pengetesan hipotesis yang lebih peka. Hal ini disebabkan karena MKdal yang digunakan untuk menjadi pembagi dalam mencari nilai F disini tidak lagi 16,22 seperti yang digunakan dalam tabel 78, melainkan hanya 3,48, sedang pembilangnya dalam F-Ratio untuk merk itu, yaitu MKmerk’ tetap konstan. Memang penambahhan klasifikasi biasanya menambah halusnya test hipotesis. Tambahan halusnya ini tentu saja tergantung sekali kepada tambahan arti daripada klasifikasi itu. Untuk menyelesaikan pengetesan hipotesis model ini cukup kiranya jika kita menggunakan Anava klasifikasi tunggal. ) DK tot = 393,44 (2) DK mod el = 286,76 (3)
DKdal = 393,44− 286,76 = 106,68
(4)
MKmodel = 67,19
324 , 4 = 16 , 22 20 67,19 = 12,66 (6) F 4;20 = 5,33
(5) MK
dal
=
Samsudi - STATISTIKA
65
P < 0,01. Dengan kenyataan itu kita tetap menolak hipotesis nihil dan menyimpulkan bahwa perbedaan konsumsi bensin menurut tahun-tahun pembuatan adalah sangat signifikan.
Soal Latihan
1.
Distribusi hasil tes Matematika terhadap tiga kelompok siswa disajikan sebagai berikut: Kelompok 1 Kelompok II Kelompok III Total Nilai Matematika f f f f 4 2 1 1 80 5 1 2 2 79 10 3 4 3 78 19 7 7 5 77 25 5 11 9 76 20 8 5 7 75 15 5 4 6 72 11 5 4 2 68 10 3 3 4 66 6 3 2 1 62 5 1 1 3 61 3 2 0 1 60 Total 44 44 45 133 Ujilah pada taraf signifikansi 5%, apakah ada perbedaan secara signifikan nilai matematika pada tiga kelompok tersebut. Buat/masukkan juga ke dalam tabel ringkasan Anava.
2.
Data di bawah ini menunjukan distribusi interval gaji kelompok guru sekolah (SMA, MA dan SMK).
Interval gaji (ribuan) Rp.700-699 Rp.600-699 Rp.500-599 Rp.400-499 Rp.300-399 Rp.200-299 Samsudi - STATISTIKA
Kode X 6 5 4 3 2 1
Guru SMA f 4 8 12 15 8 3
Guru MA f 1 5 10 12 18 7
Guru SMK f 3 7 9 14 15 6 66
Rp.100-199 Total
0 -
1 51
3 56
2 56
Ujilah apakah ada perbedaan secara signifikan distribusi gaji tiga kelompok guru tersebut, pada taraf signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan Anava.
3. Data rata-rata suhu mesin pada lima macam merek sepeda motor (A, B, C, D, dan E), masing-masing untuk tahun pembuatan/model yang berbeda (2004, 2005, 2006, 2007, dan 2008), disajikan sebagai berikut: MODEL
Tahun 2004 Tahun 2005 Tahun 2006 Tahun 2007 Tahun 2008 Total
M ERK A B 85 86 84 85 84 84 82 82 82 81
C 85 84 83 81 80
D 85 83 83 81 80
E 86 83 82 81 80
TOTAL
Ujilah apakah ada perbedaan secara signifikan rata-rata panas mesin pada lima merek motor yang berbeda dan model/tahun pembuatan yang berbeda, pada taraf signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan Anava.
Samsudi - STATISTIKA
67
BAB IX ANALISIS REGRESI Tujuan
Mahasiswa memiliki pemahaman tentang analisis regresi klasifikasi tunggal dan ganda dan mampu menggunakannya untuk menganalisis data penelitian.
Samsudi - STATISTIKA
68
Realitas tentang hubungan/keterkaitan antar ubahan dapat dikategorikan dalam konteks ubahan yang satu menjadi penyebab dari ubahan lainnya. Pola hubungan seperti ini disebut sebagai kausalitas, artinya ubahan yang satu merupakan predictor, sedangkan ubahan yang lain sebagai kriterium. Misalnya, apakah prestasi belajar anak dapat diprediksikan dari angka kecerdasan dan perbendaharaan bahasa (kosakata); apakah produktivitas kerja karyawan dapat diprediksikan dari hasil tes seleksi dan lamanya latihan dan sebagainya. Dalam contoh ini prestasi belajar dan produktivitas kerja merupakan ubahan kriterium, sedangkan angka kecerdasan, perbendaharaan bahasa, hasil tes seleksi, dan lamanya latihan merupakan ubahan predictor. Suatu ubahan dapat diramalkan dari ubahan lain apabila antara ubahan yang diramalkan, disebut terikat / dependend, dan ubahan yang digunakan untuk meramalkan, disebut bebas / Independend, terdapat korelasi yang signifikan. Misalnya, jika antara tinggi badan dan berat badan pada umur-umur tertentu terdapat korelasi yang signifikan, maka berat badan orang pada umur tersebut dapat diramalkan dari tinggi badannya. Korelasi antara ubahan kriterium dengan ubahan predictor dapat dilukiskan dalam suatu garis. Garis ini disebut garis regresi. Garis regresi mungkin merupakan garis lurus (linear), mungkin merupakan garis lengkung (parabolic, hiperbolik, dan sebagainya). Dalam kesempatan ini hanya akan kita bicarakan garis regresi yang linear. Suatu garis regresi dapat dinyatakan dalam persamaan matematik. Persamaan ini disebut persamaan regresi. Untuk garis regresi linear dnegan satu ubahan predictor persamaannya adalah :
Y = aX + K
dalam mana Y = kriterium; X = prediktor; a = bilangan koefisien prediktor ; dan K = bilangan konstan. Untuk garus regresi linear dengan dua ubahan predictor persamaan garisnya adalah :
Y = a1 X 1 + a2 X 2 + K dan untuk m ubahan prediktor persamaannya adalah :
Y = a1 X 1 + a2 X 2 + ....... + am X m + K dalam mana Y
= Kriterium
Samsudi - STATISTIKA
69
X1, X2, . . . . …, Xm = Prediktor 1, prediktor 2, prediktor ke- m a1, a2, . . . . . . .. ., am = Koefisien prediktor 1, koefisien prediktor 2,. . . . . . . . ., koefisien prediktor ke-m K = Bilangan konstan untuk menemukan persamaan guru regresi tersebut harga-harga koefisien prediktor dan bilangan konstantanya dapat dicari dari data yang diselidiki. Mengenai tugas kedua dari pembicaraan analisis regresi, yaitu memberi dasar untuk pembicaraan mengenai analisis kovariansi, akan kita bicarakan pada waktu kita membicarakan analisis kovariansi. 9.1 Analisis Regresi Linear Satu Prediktor
Tugas pokok analisis regresi adalah : 1. Mencari korelasi antara kriterium dengan prediktor, R 2. Menguji apakah korelasi itu signifikan ataukah tidak, → tabel 3. Mencari persamaan garis regresi, F 4. Menemukan sumbangan relatif antara sesama prediktor, jika prediktornya lebih dari satu. Jika kita melukis garis regresi untuk meramalkan kriterium dari prediktor, tujuan kita adalah ingin mendapatkan dasar ramalan yang menghasilkan kesalahan yang sekecil-kecilnya. Tujuan itu dapat tercapai, jika dari serangkaian ramalan jumlah kesalahan-kesalahan raalan itu sama dengan nol. Kesalahan ramalan ini disebut residu. Maksud pernyataan ini akan dapat kita fahami dari contoh-contoh yang akan diberikan nanti. Contoh : Misalkan suatu penelitian ingin memastikan apakah berat badan orang pada kelompok umur tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu dikumpulkan data tinggi badan dan berat badan sepuluh orang sebagai berikut : Subyek No. 1 2 3 4 5 6 7 8 9 10
Tinggi (dalam cm) X. 168 173 162 157 160 165 163 170 168 164
Berat (dalam kg) y 63 81 54 49 52 62 56 78 64 61
Korelasi antara prediktor X dengan kriterium Y dapat kita cari melalui teknik korelasi momen tangkar dari Pearson, dengan rumus umum : Samsudi - STATISTIKA
70
rxy =
∑ xy (∑ x )(∑ y ) 2
2
Telah kita ketahui bahwa :
( X )( Y ) ∑ xy = ∑ XY − ∑ N ∑ , ( X) , ∑ x = ∑ X − ∑N , dan ( Y) ∑ y = ∑ Y − ∑N 2
2
2
2
2
Jika tekah kita lakukan komputasi terhadap data contoh hasil penelitian tersebut (gunakan kalkulator yang ada fungsi statistiknya), akan kita temukan : N = 10 ∑X = 1.650 ∑Y = 620 ∑XY = 102.732 ∑X2 = 272.460 ∑Y2 = 39.432 Dari itu
∑ xy = 102.732 −
(1.650)(620) = 432
10 1.6502 2 272 . 460 x = − = 210 ∑ 10 6202 2 ∑ y = 39.432 − 10 = 992 432 rxy = = 0,946 (210)(992) Untuk menguji apakah harga rxy = 0,946 itu signifikan apa tidak, kita dapat berkonsultasi dengan tabel r – teoretik dengan dengan N = 10 atau derajat kebebasan db = 10 – 2 (Catatan: ada tabel r = teoretik yang menggunakan N, ada juga yang menggunakan db, Ambilah mana saja yang tersedia pada Anda). Dari tabel r – teoretik dengan N = 10 (atau db = 8) akan kita ketemukan harga r-teoretik pada taraf signifikansi 1% atau rt1% = 0,765. karena itu harga rxy sebesar 0,946 itu kita nyatakan sangat signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y, yaitu antara tinggi badan dan berat badan, sangat signifikan. Dengan harga korelasi antara tinggi badan dan berat badan yang sangat signifikan itu kita mempunyai landasan untuk meramalkan / mengestimasi berat badan dari tinggi badan (sebenarnya boleh juga sebaliknya, kita dapat meramalkan tinggi badan dari berat badan), dab karenanya kita dapat membuat garis regresi untuk prediksi dengan rumus garis regresi untuk prediksi dengan rumus garis regresi satu-prediktor yang sudah kita ketahui, yaitu : Y = αX + K → Y = αx + bx → α = Koefisien prediktor Samsudi - STATISTIKA
71
Untuk mengisi persamaan garis regresi itu harga koefisien prediktor (yaitu harga a) dan harga bilangan konstan K harus kita ketemukan lebih dahulu. Harga-harga a dan K itu dapat kita ketemukan melalui dua jalan : (a) dengan metode skor kasar, dan (b) dengan metode skor deviasi. Kedua metode ini akan menghasilkan harga-harga a dan K yang sama. Nanti kita akan memilih salah satu dari dua metode itu berdasarkan pertimbangan efisiensi. Dengan metode skor kasar harga-harga a dan K dapat dicari dari persamaan :
(1 ) Σ XY = a Σ X
2
+ KΣX
( 2 ) Σ Y = a Σ X + NK Jika data yang sudah kita ketahui kita masukkan ke dalam rumus-rumus itu (1) 102.732 = 272.460 a + 1.650 K (2) 620 = 1.650 a + 10 K dengan penyelesaian persamaan secara simultan akan kita ketemukan (dengan membagi persamaan I dengan 1.650 dan persamaan 2 dengan 10) : (3) 62, 26 = 165,13 a + K (4) 62 = 165 a + K Subtitusi (5) 0,26 = 0,13 a (6) 62 = (165) (2) + K K = - 268 Perlu dicatat bahwa dalam perhitungan terhadap data penelitian yang sesungguhnya, ketelitian perhitungan harus diusahakan semaksimal mungkin, dengan jumlah angka desimal yang lebih banyak, misalnya enam desimal atau delapan desimal. Dalam contoh perhitungan di atas hanya digunakan dua desimal. Maka jika dalam komputasi digunakan kalkulator, biarkanlah desimalnya mengambang (floating) sehingga perhitungan-perhitungannya dapat membawa terus jumlah desimal sesuai dengan kemampuan kalkulator tesebut. Misalnya, jika dalam perhitungan di atas digunakan desimal yang menggambang sampai enam angka, hasilnya adalah a = 2,057 143, dan K = - 277, 428 595. Tentu saja perhitungan dengan enam desimal hasilnya akan jauh lebih teliti daripada perhitungan dengan dua desimal. Dengan harga a = 2 dan K = - 268, persamaan garis regresinya adalah :
Y = aX + K Y = 2X − 268 → a = -268, b = 2 y = −268+ 2X
Dengan metode skor deviasi harga-harga a dan K dapat kita cari dari persamaan
y = ax
Dalam mana
y =Y −Y,
Samsudi - STATISTIKA
x = X − X,
dan
a=
Σ xy Σx 2 72
Jika data yang sudah diketemukan dimasukkan ke dalam rumus tersebut : Σ xy = 432 Σ x 2 = 210 432 a = = 2 , 05 210 y = 2 , 05 x Dari data yang dikumpulkan dapat dicari : ΣY 620 ΣX 1.650 = = 62 = = 165 Y = X = 10 10 N N Karena itu untuk persamaan garis regresi y = ax atau Y - Y = a ( X - X ) dapat kita selesaikan:
Y − 62 = (2,05)( X − 165)
Y = 2,05 X − 338 , 25 + 62 Y = 2,05 X − 276 , 25 Dengan etode skor kasar kita menemukan persamaan garis regresinya Y = 2X – 268, sedang dengan metode skor deviasi kita menemukan persamaan garis regresinya Y = 2,05 X – 276,25. Seharusnya dengan kedua metode itu kita tidak menemukan hasil perhitungan yang berbeda. Perbedaan hasil perhitungan garis regresi yang kita temukan itu semata-mata disebabkan karena ketelitian perhitungan saja. Dengan jumlah desimal yang mengambang sampai enam desimal, hasilnya adalah
Y = 2,057143 X − 277 ,428595
Baiklah kita coba dulu meramalkan berat badan dari persamaan garis regresi Y = 2X-268 seperti yang dihasilkan dengan perhitungan dengan metode skor kasar. Maka untuk tinggi badan atau X tertentu, berat badannya atau Y-nya akan Untuk X = 175 Y = 2(175)-268 = 82; Untuk X = 174 Y = 2(174)-268 = 80; Dan seterusnya . . . . Untuk X = 150 Y = 2(150) – 268 = 32 Jika dari perhitungan-perhitungan itu kita buat suatu tabel berikut. Tabel 9.1 TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2 X – 268 Tinggi (cm) Berat (kg) Tinggi (cm) Berat (kg) Tinggi (cm) Berat (kg) X Y X Y X Y 175 82 165 62 155 42 174 80 164 60 154 40 173 78 163 58 153 38 172 76 162 56 152 36 171 74 161 54 151 34 170 72 160 52 150 32 169 70 159 50 149 30 168 68 158 48 148 28 Samsudi - STATISTIKA
73
167 166
66 64
157 156
46 44
147 146
26 24
Bagaimana keadaannya jika kita menggunakan persamaan garis regresi Y = 2,05 X – 276,25 (seperti yang diperoleh dengan metode skor deviasi) dan persamaan garis regresi Y = 2,057 143 X – 277,428 595 (yang diperoleh dengan ketelitian enam desimal, baik dengan metode skor kasar ataupun skor deviasi)? Sambil mendemontrasikan pentingnya ketelitian dalam perhitungan akan kita coba menyusun tabel-tabel ramalan dengan persamaan garis regresi yang berbeda-beda itu.
X
Tabel. 9.2 TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,05 X – 276,25 Y X Y X Y
175 174 173 172 171
82,5 80,5 78,4 76,4 74,3
165 164 163 162 161
62,0 60,0 57,9 55,9 53,8
155 154 153 152 151
41,3 39,5 37,4 35,4 33,3
170 169 168 167 166
72,3 70,2 68,2 66,1 64,1
160 159 158 157 156
51,8 49,7 47,7 45,6 43,6
150 149 148 147 146
31,3 29,2 27,2 25,1 23,1
Tabel 9.3 TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,057 143X – 277,428 595 X
Y
X
Y
X
Y
175 174 173 172 171
82,6 80,5 78,5 76,4 74,3
165 164 163 162 161
62,0 59,9 57,9 55,8 53,8
155 154 153 152 151
41,4 39,4 37,3 35,3 33,2
170 169 168 167 166
72,3 70,2 68,2 66,1 64,1
160 159 158 157 156
51,7 49,7 47,6 45,5 43,5
150 149 148 147 146
31,1 29,1 27,0 25,0 22,9
Dari tiga tabel raalan yang telah kita susun itu tabel yang terakhir ini adalah yang paling teliti, sedang tabel yang pertama merupakan tabel yang paling kurang teliti. Ketelitian itu mungkin ada akibatnya dalam kesalahan ramalan atau residu. Ini dapat kita uji dari perbandingan seperti di bawah ini. Samsudi - STATISTIKA
74
9.2. Analisis Varians Garis Regresi Sebelum kita melanjutkan pembicaraan mengenai analisis regresi dengan dua prediktor atau lebih, ada baiknya kita membicarakan dulu apa yang sesungguhnya disebut analisis regresi. Jika suatu prediksi hanya menggunakan satu ubahan prediktor seperti contoh ditas, pekerjaan “analisis regresi” seperti yang sudah kita kerjakan boleh dikatakan selesai. Sebab besarnya korelasi antara prediktor dengan kriterium telah diketemukan, uji signifikansinya sudah dijalankan; dan garis regresinya telah dibuat. Akan tetapi, jika dalam prediksi digunakan beberapa prediktor, untuk menguji signifikansi garis regresinya perlu dilakukan analisis variansi terhadap garis regresi tersebut. Apa yang disebut analisis regresi sebenarnya adalah analisis variansi terhadap garis regresi, dengan maksud untuk menguji signifikansi garis regresi yang bersangkutan. Dari analisis regresi kita akan menghasilkan bilangan –F sebagaimana halnya jika kita mengadakan analisis variansi. Untuk analisis regresi bilangan – F diperoleh dari rumus :
F reg =
RK
reg
RK
res
Dalam mana Freg = Harga bilangan – F untuk garis regresi; RKreg = Rerata Kuadrat garis regresi; dan RKres = Rerata Kuadrat residu. Jadi bilangan –F regresi diperoleh dari membandingkan (nisbah) RK regresi dengan RK residu. Makin besar harga RK residu akan makin kecil harga F regresi. RK residu RK “error” memang mempunyai cirri semacam itu: dalam perhitungan nisbah – F harga bilangan –F akan sangat ditentukan oleh harga RK “error” nya. Maka, dalam analisis garis regresi, jika harga F - regresi sangat kecil dan tidak signifikan , maka garis regresinya tidak akan memberikan landasan untuk prediksi secara efisien. Walaupun analisis variansi garis regresi lebih efektif untuk menganalisis garis regresi dengan beberapa prediktor, namun sebagai dasar pemahaman marilah kita coba menganalisis data satu prediktor dalam contoh di depan. Metode Skor Kasar : Dari data yang telah dikomputasi kita ketahui : ∑Y = 620 N = 10 a =2 ∑Y2 = 39.432 ∑XY = 102.732 K = - 268 Dalam analisis variansi perhitungan yang paling banyak harus dilakukan adalah perhitungan mengenai jumlah Kuadrat JK (Jumlah Kuadrat). Jika hasil perhitungan JK kita masukkan dalam tabel ringkasan analisis varians, maka perhitungan rerata Kuadrat RK dan F-nya tidak akan banyak menghadapi kesulitan. Tata kerja itu akan kita tempuh juga dalam percobaan kita menerapkan rumus-rumus analisis variansi ini.
Samsudi - STATISTIKA
75
JKT = 39.432 −
6202 = 992 10
JKreg = 2(102.732) + (− 268)(620) −
6202 = 864 10
JKres = 992 − 864 = 128 dbT = 10 − 1 = 9 dbreg = 1 dbres = 9 − 1 = 8 Dengan Satu-Prediktor : (dengan skor kasar) Sumber Variasi Regresi (reg)
db
JK
RK
1
(Σxy )2
JK reg
Σx 2 Residu (res)
N–2
Total T
(Σxy )
2
Σy 2 −
N–1
Σx
2
ΣY 2
Freg =
KRreg KRres
;
dbreg
JK res dbres -
db = 1 lawan N-2
(dengan skor deviasi) Sumber Variasi Regresi (reg)
Residu (res) Total ( T )
db
JK
1
(Σxy )2 Σx 2
N–2
2 ( Σxy ) Σy 2 −
N–1
ΣY 2
Samsudi - STATISTIKA
Σx 2
RK JK reg dbreg
JK res dbres -
Freg
RK reg RK res -
76
(dari rxy) Sumber Variasi Regresi(reg)
Residu (res) Total ( T )
db
JK
RK
(r )(Σ y )
(r )(Σ y )
1
2
N–2 N–1
2
2
2
ΣY
2
(1 − r )(Σ y ) 2
(1 − r )(Σ y ) 2
2
N − 2 -
2
Freg
(r )(N − 2) 2
1− r2 -
TABEL RINGKASAN Sumber Variasi Regresi(reg) Residu (res) Total ( T )
db
JK
RK
1 8 9
864 128 992
864 10 -
Freg 54,00
p < 0,01
-
-
Metode skor deviasi Telah kita ketahui : ∑x2 = 210 ∑y2 = 992 JKT = 992 JK reg
JK reg
∑xy = 432 N = 10 dbT = 10 − 1 = 9
4322 = = 888,69 120 = 992 − 888,69 = 103,31
dbreg = 1 dbres = 9 − 1 = 8 TABEL RINGKASAN
Sumber Variasi Regresi(reg) Residu (res) Total ( T )
db
JK
RK
Freg
p
1 8 9
888,69 103,31 992
888,69 12,91 -
68,84 -
< 0,01 -
Melalui rxy : Telah kita ketemukan : r= 0,946 Samsudi - STATISTIKA
∑y2 = 992
N = 10 77
JKT = 992
dbT = 10 − 1 = 9 dbreg = 1
JK reg = (0,946) (992) = 887,76 2
JK
reg
= 992 − 887 , 26 = 1
dbres = 9 − 1 = 8
TABEL RINGKASAN Sumber Variasi Regresi(reg) Residu (res) Total ( T )
db
JK
RK
Freg
p
1 8 9
887,76 104,24 992
887,76 13,03 -
68,13 -
< 0,01 -
Dari tiga perhitungan tersebut kita memperoleh harga F regresi yang berbedabeda : yang pertama F = 54,00; yang kedua F= 68,84; dan yang ketiga F = 68,13. Dua harga F yabf terakhir boleh dikatakan sama, tetapi harga F dari perhitungan yang pertama ternyata sangat rendah. Seharusnya, dengan metode manapun hasilnya akan sama saja. Perbedaan itu disebabkan karena ketelitian perhitungan. 9.3. Analisis Regresi: Dua Prediktor Prinsip-prinsip untuk memprediksi kriterium dari satu prediktor berlaku juga untuk memprediksi kriterium dari dua prediktor atau lebih. Dengan sedikit memperluas perhitungannya , akan kita coba bagaimana menyelesaikan anlaisis regresi dengan dua prediktor lebih dahulu. Persamaan skor regresi dua prediktor adalah :
Y = a1 X1 + a2 X 2 + K Dalam skor deviasi persamaan itu dapat dituliskan
y = a1 x1 + a 2 x2 Oleh karena itu dengan kalkulator tangan metode skor deviasi jauh lebih efisien daripada metode skor kasar, maka dalam contoh analisis di bawah ini akan digunakan saja metode skor deviasi. Metode skor kasar dapat juga kita coba sebagian untuk mengetahui sekedar cara-cara menghitungnya. Untuk menyelesaikan perhitungan garis regresi y = a1 x1 + a 2 x 2 harga koefisisen prediktor a1 dan a2 dapat kita cari dari persamaan simultan : Contoh : Misalkan seorang peneliti ingin memastikan apakah nilai Statistik Dasar (Y) dapat diprediksikan dari nilai Pretes Aljabar (X1) dan nilai Indeks Prestasi SMA (X2), apa tidak. Untuk itu peneliti tersebut misalkan telah mengumpulkan data sebagai berikut:
Samsudi - STATISTIKA
78
Mhs. No. 1 2 3 4 5 6 7 8 9 10
X1
X2
Y
57 93 79 26 69
3,00 2,85 3,20 2,49 3,07
27 34 27 24 35
24 76 61 82 29
2,38 3,74 2,62 2,53 3,17
18 33 39 35 25
Dengan kalkulator kita akan menghasilkan perhitungan N = 10 ∑X 12 = 41.214 ∑X1 = 596 ∑X2 = 29,05 ∑X 22 = 85,9537 ∑Y = 297 ∑Y2 = 9.199 ∑X1X2 = 1.765,99 ∑X1Y = 18.787 ∑X2Y = 867,75 Jika hasil perhitungan itu kita ubah dalam skor deviasi maka akan kita peroleh :
( X) 596 ∑ = ∑ − ∑N = 41 .214 − 10 = 5 .692 , 4 ( X ) 29 , 05 ∑ = ∑ − ∑ N = 85 ,9537 − 10 = 1,56345 ( y) 297 ∑ y = ∑ y − ∑N = 9 ,199 − 10 = 378 ,1 ( X )( X ) (596)(29,05) = 34,61 ∑ X X = ∑ X X − ∑ ∑ = 1.765,99 − 2
2
2
1
1
2
2
2
2
2
1
2
2
2
2
2
1
1
2
1
2
2
∑X Y = ∑X Y − 1
2
2
1
N (∑ X 1 )(∑ Y )
10
=18.787 −
(596)(297 ) = 1.085,8
10 (29,05)(297 ) = 4,965 =867,75 − ∑ X 1Y = ∑ X 2Y − N 10 Persamaan simultan untuk menentukan a1 dan a2 adalah :
∑x (2). ∑ x
(1).
Samsudi - STATISTIKA
N (∑ X 2 )(∑ Y )
1
y = a 1 Σ x 12 + a 2 Σ x 1 x 2
2
y = a1Σ x1 x 2 + a 2 ∑ x 22
79
Diisikan dan dikerjakan (1). (2). (1) (2) (3)
1.085,8 = 53692,4 a1 + 34,61 a2 4,965 = 34,61 a1 + 1,563 45 a2 ; 34, 61 = 31,372 435 71 = 164, 472 695 7 a1+ a2 ; 1,56345 = 3,175 669 19 = 22, 136 940 74 a1+ a2 – (4) = 28,196 766 52 = 142, 335 755 a1 28,19676652 a1 = = 0,198100375 142,335755 (4) 3,17569919 = (22,13694074 )(0,198100375) + a2 = 4,385336261 + a2 a2 = 3,17566919 − 4,385336261 = −1,2095667071 Persamaan garis regresi dalam skor deviasi yang kita cari adalah : Y = a1 x1 + a2 x2
( Y = a (X
) ( − X ) + a (X
Y − Y = a1 X 1 − X 1 + a2 X 2 − X 2 1
1
1
2
2
− X2
) )+ Y
Dari pekerjaan di muka dapat diketemukan : 596 = 59,6 X1 = 10 29,05 = 2,905 X2 = 10 297 = 29,7 Y= 10 a1 = 0,198100375 a2 = −1,209667071 Jadi, Y = (0,198100375)( X 1 − 59,6 ) + (− 1,209667071)( X 2 − 2,905) + 29,7 = 0,198100375 X 1−11,80678235 − 1,209667071X 2 + 3,514082841 + 29,7 Y = 0,198100375 X 1 − 1,209667071X 2 + 21.40730049
Jika dibulatkan : Y = 0,2 X 1 − 1,2 X 2 + 21,4 → Y = a1 x1 − a2 x2 + K Catatan : Pembulatan ini hanya untuk menggampangkan pencatatan Untuk perhitungan-perhitungan (selanjutnya) masih baru Digunakan bilangan yang belum dibulatkan. Koefisien korelasi antara kriterium Y dengan prediktor X1 dan prediktor X2 dapat diperoleh dari rumus : Samsudi - STATISTIKA
80
a 1Σ x1 y + a 2 Σ x 2 y Σy 2
R y (1, 2 ) =
∑x1y ∑x2y ∑y2
RY(1,2) = Koefisien korelasi antara Y dengan X1 dan X2 a1 = Koefisien prediktor X1 a2 = Koefisien prediktor X2 = Jumlah setujuduk antara X1 dengan Y = Jumlah setujuduk antara X2 dengan Y = Jumlah Kuadrat kriterium Y Jika hasil-hasil perhitungan di muka diisikan ke dalam rumus di atas : (0,198100375 )(1 .085 ,8 ) + (− 1, 209667071 )(4,965 ) R y (1, 2 ) = 378 ,1 = 0,553005527 = 0,743643414
Jadi Ry(1,2) = 0,744 Dan R2y(1,2) = 0,553005527 Dalam perhitungan tersebut sekaligus dicari harga R2y(1,2) oleh karena dalam analisis regresi nanti yang kita pakai adalah harga R2y(1,2) Untuk menjawab pertanyaan, apakah harga Ry(1,2) = 0,744 itu signifikan apa tidak, analisis regresi tidak lain adalah analisis regresi. Seperti sudah kita kenal, analisis regresi tidak lain adalah analisis harga F si garis regresi. Dari analisis ini kita akan menemukan harga F garis regresi, yang kemudian dapat kita uji apakah harga F itu signifikan ataukah tidak. Rumus F yang paling efisien, jika koefisien korelasi antara kriterium dengan prediktor-prediktorny a telah diketemukan, adalah:
F reg
R 2 (N − m − 1) = m 1− R2
(
)
F reg = Harga F garis regresi N = Cacah kasus m = Cacah prediktor R = Koefisien korelasi antara kriterium dengan prediktor-prediktor. Derajat kebebasan atau db untuk menguji harga F itu adalah m lawan N – m – 1. Diisikan :
F reg =
(0 ,553055527 )(10 − 2 − 1) = 4,330 < 4,74 2 (1 − 0 ,553005527 )
Dengan db = m lawan N-m-1 atau 2 lawan 7 harga Ft5% = 4,74 jadi, jika demikian, harga Freg sebesar 4,330 itu tidak signifikan. Kita menyimpulkan, tidak ada korelasi antara Y dengan X1 dan X, atau antara nilai statistika Dasar dengan nilai Pretest Samsudi - STATISTIKA
81
Aljabar dan persen kita tidak berani menggunakan prediktor nilai Pretest Aljabar dan nilai Indeks Prestasi SMA untuk memprediksi nilai Statistik Dasar. Rumus F regresi yang baru disebutkan di atas diperoleh dari setujuses analisis variasi garis regresi yang agak panjang. Keseluruhan setujuse situ dapat dilihat dalam tabel rangkuman analisis regresi sebagai berikut : TABEL RINGKASAN ANALISIS REGRESI Sumber Variasi
db
JK R2
m
Regresi(reg) Residu (res) Total ( T )
(∑ y )
( )
(1− R2 )(Σy2 )
N-1
∑y2
)
R 2 Σy2 m = 1 − R 2 Σy2 N − m −1
(
)(
)
R 2 Σy 2 m 1 − R 2 Σy 2 N − m −1 --
2
N-m-1
(
Freg
RK
(
)( )
R 2 (N − m − 1 ) = m 1− R2
(
)
Jadi, jika seluruh proses analisis tersebut kita ikuti, maka :
(
)
JK reg = R 2 Σ Y 2 = (0 ,553005527
)(378 ,1) = 209 ,0913897
db reg = m = 2 JK
RK reg =
(
reg
db reg
=
)(
209 , 0913897 = 104 ,5456948 2
)
JK res = 1 − R 2 Σ Y 2 = (1 − 0,553005527 )(378 ,1) = 169 ,0086102 dbres = N − m − 1 = 10 − 2 − 1 = 7 RK res =
JK res 169 ,0086102 = = 24 ,14408717 7 dbres
JadiFreg =
RK reg RK res
=
104 ,5456948 = 4,330 24 ,14408717
Hasil analisis regresi tersebut kemudian dapat kita masukkan dalam tabel ringkasan analisis sebagai berikut :
Samsudi - STATISTIKA
82
TABEL RINGKASAN ANALISIS REGRESI Sumber Variasi
db
Regresi(reg)
2
Residu (res)
7
Total ( T )
9
JK
RK
209,091 389 7
104,545 694 8
169,008 610 2
24, 144 087 17
378,1
----------
F = 4,330 Jika diinginkan mencari harga F regresi dengan rumus skor kasar, rumusnya adalah : 2 ⎡ ⎤ ( N − m − 1 )⎢ a1Σ X 1Y + a 2 Σ X 2Y + K Σ Y − (Σ Y ) ⎥ N ⎦ ⎣ Freg = 2 m Σ Y − a1Σ x1 y − a 2 Σ X 2Y − K Σ Y
(
)
Untuk mengingat kembali data dan hasil-hasil perhitungan yang sudah kita ketemukan : N = 10 m=2 a1 = 0,198 100 375 a2 = 1,209 667 071 K = 21, 407 300 49 ∑X2Y = 867,75 ∑X1Y = 18.787 ∑Y = 297 ∑Y2 = 9.199 Dikerjakan N – m – 1 = 10 – 2 – 1 = 7 a1∑X1Y = (0,198 100 375) (18.787) = 3.721,711 745 a2∑X2Y = (-1,209 667 071) (867,75) = - 1.049,688 6 K∑Y = (21,407 300 49) (297) = 6.375, 968 245 2 2 (ΣY ) = 297 = 8.820,9 N 10 Diisikan :
7 (3.721,711745 + −1.049 ,6886 + 6.357 ,968245 − 8.820 ,9 ) 2(9.199 − 3.721,711745 − 1.049 ,6886 − 6.357 ,968245 ) 1.463,63973 = = 4,330 338,01722
Freg =
Rumus-rumus skor kasar untuk analisis regresi dapat dirangkum dalam tabel seperti di bawah ini : Samsudi - STATISTIKA
83
TABEL RINGKASAN ANALISIS REGRESI Sumber Variasi Regresi(reg)
db m
Residu (res)
N-m-1
Total ( T )
N-1
Jadi Freg
JK
RK
a1ΣX 1Y + a2 ΣX 2Y + KΣY −
(ΣY )2
JK reg
N
dbreg
ΣY 2 − a1Σx1 y − a2 ΣX 2Y − KΣY
ΣY
2
2 ( ΣY ) −
N
JK res dbres --
2 ⎡ ( ΣY ) ⎤ (N − m − 1)⎢a1ΣX 1Y + a2ΣX 2Y + KΣY − ⎥ N ⎦ ⎣ = m ΣY 2 − a1Σx1 y − a2ΣX 2Y − K ΣY
(
)
Dikerjakan berikutnya : JK reg = a1ΣX 1Y + a2ΣX 2Y + KΣY −
(ΣY )2
N = 3.721,711745 + −1.049,6886 + 6.357,968245 − 8.820,9 = 209,09139 dbreg = m = 2 RK reg =
JK reg dbreg
=
209,09138 = 104,545695 2
JK res = ΣY 2 − a1Σx1 y − a2ΣX 2Y − KΣY = 9.199 − 3.721,711745 − −1.049,6886 − 6.357,968245 = 169,00861 dbres = N − m − 1 = 10 − 2 − 1 = 7 RK reg 169,00861 RK res = = = 24,14408714 7 RK res RK reg 104,545695 = = 4,330 Jadi Freg = RK res 24,14408714
Sebagaimana biasa dari hasil analisis variansi garis regresi dibuatlah tabel ringkasan analisis. Maka jika kita buat tabel ringkasan analisis regresi, hasilnya akan nampak seperti tabel ringkasan analisis regresi seperti yang baru kita buat di muka. Telah dikemukakan, apabila dalam mengerjakan analisis regresi kita hanya mempunyai kalkulator tangan, cara yang paling efisien adalah menggunakan metode Samsudi - STATISTIKA
84
skor deviasi. Karena itu untuk analisis-analisis berikutnya akan kita gunakan saja metode skor deviasi, dan untuk metode skor kasar hanya akan dikemukakan rumusnya, saja. 9.4. Analisis Regresi : m – Prediktor
Prinsip-prinsip analisis regresi dua prediktor berlaku sepenuhnya untuk analisis regresi tiga prediktor, empat prediktor, lima prediktor dan seterusnya, jika dengan sedikit perluasan. Hal tersebut dengan mudah kita fahami jika bandingkan rumusrumusnya untuk garis regresi maupun untuk koefisien korelasinya. Periksalah rumusrumus dibawah ini. Persamaan Garis Regresi Dua Prediktor :
Y = a1 x1 + a 2 x2 + K
Tiga Prediktor : Y = a1 x1 + a2 x2 + a3 x3 + K Empat Prediktor : Y = a1x1 + a2 x2 + a3 x3 + a4 x4 + K m – Prediktor
: Y = a1 x1 + ......am xm + K Koefisien Korelasi
Dua Prediktor : R
y
(1 , 2 ) =
Tiga Prediktor : R
y
(1 , 2 ) =
Empat Prediktor : R y (1, 2 ) =
m – Prediktor
: R y (1 , 2 ) =
Samsudi - STATISTIKA
a1Σ x1 y + a 2 Σ x 2 y Σy2 a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y Σy 2
a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y + a 4 Σ x 4 y Σy 2
a 1 Σ x 1 y + ....... + a m Σ x m y Σy 2
85
Soal Latihan
1. Jika suatu penelitian ingin menguji apakah berat badan orang pada kelompok umur tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu dikumpulkan data tinggi badan dan berat badan sepuluh orang sebagai berikut : Subyek No. 1 2 3 4 5 6 7 8 9 10
Tinggi (dalam cm) X. 168 173 162 157 160 165 163 170 168 164
Berat (dalam kg) y 63 81 54 49 52 62 56 78 64 61
Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi. 2. Seorang peneliti akan menguji apakah nilai Praktik Kelistrikan Otomotif (X1) dan Praktik Chasis (X2) berpengaruh terhadap nilai Praktik Trouble Shoting (Y) mahasiswa Pendidikan Teknik Mesin. Untuk itu peneliti tersebut telah mengumpulkan data sebagai berikut : Mhs. No.
X1
X2
Y
1 60 67 78 2 72 66 82 3 79 65 80 4 68 87 81 5 69 75 83 6 78 77 85 7 76 67 78 8 61 65 86 9 82 66 78 10 68 62 77 11 70 63 75 12 71 70 76 13 72 73 73 14 69 68 72 15 82 81 71 Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi. Samsudi - STATISTIKA
86
DAFTAR PUSTAKA
Christensen, Larry B. 2001. Expeprimental Methodology. (Eighth Edition). Boston: Allyn and Bacon. Guilford, J.P; Fruchter, benjamin. 1985. Fundamental Statistics in Psychology and Education. (Sixth Edition). Bogota: McGraw-Hill Book Co. Hadi, Sutrisno. 1982. Statistik, Jilid 1, 2 dan 3. Yogyakarta: Fakultas Psikologi UGM Hadi, Sutrisno. 1991. Analisis Regresi. Yogyakarta: Andi Offset Mendenhall, William; Ott, Lyman; Larson, Ricahrd F. 1974. Statistics: a Tool for the Social Sciences. California: Duxbury Press. Sudijono, Anas. 1996. Pengantar Statitik Pendidikan. Jakarta: Rajawali Sudjana. 1991. Desain dan Analisis Eksperimen. Edisi III. Bandung: Tarsito. Sudjana. 1989. Statistika. Edisi ke 5. Bandung: Tarsito
Samsudi - STATISTIKA
87