Puji syukur
kehadirat Tuhan Yang Maha Esa atas karunia dan rahmat-Nya sehingga makalah ini
dapat terselesaikan dengan baik.
Makalah ini disusun berdasarkan tugas
yang telah diberikan kepada kami sebagai tugas kelompok yang di dalamnya memuat
latar belakang, pembahasan, dan kesimpulan pembahasan dari makalah ini.
Dengan selesainya
makalah ini, kami mengucapkan terima kasih kepada Ibu dan Bapak Dosen mata
kuliah Evaluasi Hasil Belajar yang telah membimbing dalam penyusunan makalah
ini, dan kepada orang tua yang telah memberi motivasi selama pembuatan makalah
sehingga makalah dapat terselesaikan.
Dalam penyusunan
makalah ini, kami sudah berusaha semaksimal mungkin. Mohon maaf apabila masih
terdapat kesalahan-kesalahan atau kekurangan. Semoga makalah ini dapat
bermanfaat bagi mahasiswa lainnya juga bagi para pembaca umumnya.
Medan,
September 2017
Penyusun,
Jenis-Jenis
Validitas Tes Secara Garis Besar
Cara
Mengetahui Validitas Alat Ukur
Faktor-Faktor
Yang Mempengaruhi Validitas Tes
Cara Mencari Besarnya Reliabilitas
Faktor-Faktor
Yang Mempengaruhi Reliabilitas
Evaluasi memiliki arti penting dalam kegiatan belajar
mengajar yang dilaksanakan oleh seorang guru. Diantara tujuan dari evaluasi
adalah untuk menilai ketercapaian tujuan pendidikan oleh anak didik, sarana
untuk mengetahui apa yang telah anak didik ketahui dalam kegiatan belajar
mengajar, dan memotivasi anak didik. Untuk mengevaluasi hasil belajar dan
proses belajar siswa, seorang guru menggunakan berbagai macam alat atau
instrumen evaluasi seperti tes tertulis, tes lisan, ceklis-observasi,
angket-wawancara, dan dokumentasi.
Keberhasilan mengungkap hasil dan proses belajar ini
sebagaimana adanya (objektivitas hasil penilaian) sangat bergantung pada
kualitas alat penilainya, di samping itu juga yang tidak kalah pentingnya
tergantung pada cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai
kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua hal, yaitu
validitas (ketepatan) dan reliabilitas (ketetapan atau keajegan) alat tes
terjamin kualitasnya. Alat tes yang bagaimana dan seperti apa yang dikatakan
memiliki validitas dan reliabilias ini, selanjutnya akan kita bahas dalam
makalah ini berjudul “Validitas Tas dan Reliabilitas Tes” ini.
Adapun rumusan masalah yang ada
didalam makalah ini yaitu:
1.
Apa dan bagaimana validitas tes ?
2.
Apa dan bagaimana Reliabilitas tes ?
Adapun tujuan dari makalah ini
yaitu:
1.
Untuk mengetahui apa dan bagaimana validitas tes.
2.
Untuk mengetahui apa dan bagaimana Reliabilitas tes.
Validitas berasal dari kata validity yang
mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya (Azwar, 1986). Suatu skala atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut
menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas
rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Validitas tes biasa juga disebut sebagai kesahihan suatu
tes adalah mengacu pada kemampuan suatu tes untuk mengukur karakteristik atau
dimensi yang dimaksudkan untuk diukur. Valid berarti cocok atau sesuai. Suatu tes dikatakan valid,
apabila tes tersebut benar-benar manyasar keapada apa yang dituju. Tes tersebut
benar-benar dapat memberikan keterangan atau gambaran tentang apa yang
diinginkan. Jika tes itu bahasa, maka tes tersebut harus diberikan gambaran
tentang kemampuan dan kacakapan anak dalam hal bahasa, dan bukan manunjukkan
gambaran kecakapan anak dalam hal ekonomi, ilmu bumi dan sebagainya. Guna
menjelaskan pengertian valid ini, dapat kita ambil contohnya jika kita ingin
mengetahui berat dari suatu benda, maka kita pergunakan alat pengukuran timbangan.
Jika ingin mengetahui panjang sesuatu, maka kita pergunakan alat pengukur
meteran. Dan jika kita ingin mengetahui suhu sesuatu, kita pergunakan alat
pengukur thermometer.
Sifat valid diperlihatkan oleh tingginya validitas hasil
ukur suatu tes. Suatu alat ukur yang tidak valid akan memberikan informasi yang
keliru mengenai keadaan subjek atau individu yang dikenai tes itu. Apabila
informasi yang keliru itu dengan sadar atau tidak dengan sadar digunakan
sebagai dasar pertimbangan dalam pengambilan suatu keputusan, maka keputusan
itu tentu bukan merupakan suatu keputusan yang tepat.
Jenis-Jenis Validitas Tes Secara Garis Besar
1. Validitas isi (Content Validity)
Validitas isi (Content Validity)
adalah ketepatan suatu alat ukur ditinjau dari isi alat ukur tersebut. Suatu
alat ukur dikatakan memiliki validitas isi apabila isi atau materi atau bahan alat ukur tersebut betul-betul merupakan
bahan yang representatif terhadap bahan pembelajaran yang diberikan.
Artinya, isi alat ukur diperkirakan sesuai dengan apa yang telah diajarkan
berdasarkan kurikulum.
Cara menyelidiki validitas isi alat
ukur Matematika dapat dilakukan dengan menggunakan pendapat suatu ‘panel’ yang
terdiri dari ahli-ahli dalam bidang matematika dan ahli-ahli dalam pengukuran.
Bila cara tersebut sulit untuk dilakukan, maka dapat dikerjakan dengan cara
membandingkan materi alat ukur tersebut dengan bahan-bahan dalam penyusunan
alat ukur, dengan analisis rasional. Apabila materi alat ukur cocok dengan
materi penyusunan alat ukur, berarti alat ukur tersebut memiliki validitas isi.
2. Validitas
Konstruksi (Construct Validity)
Sebuah
tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan
dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir soal
mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang
menjadi tujuan instruksional.
Sebagai
contoh jika rumusan Tujuan Instruksional Khusus (TIK). “Siswa dapat
membandingkan antara efek biologis dan efek psikologis”, maka butir soal pada
tes merupakan perintah agar siswa membedakan anatar dua efek tersebut.
“Konstruksi”
dalam pengertian ini bukanlah “susunan” seperti yang sering dijumpai dalam
teknik, tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh
para ahli ilmu jiwa yang dengan suatu cara tertentu “memerinci” isi jiwa atas
beberapa aspek seperti ingatan (pengetahuan), pemahaman, aplikasi dan seterusnya.
Dalam hal ini, mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi
sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan sementara
untuk mempermudah mempelajari. Seperti halnya validitas isi, validitas
konstruksi dapat diketahui dengan cara memerinci dan memasangkan setiap butir
soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan berdasarkan logika
bukan pengalaman.
Validitas
isi dan validitas konstruksi dapat dimasukkan kedalam logical validity, karena
dalam penyusunan soal tesnya mengacu kepada kriteria-kriteria yang secara teori
dan logis harus diperhatikan untuk mendapatkan tingkat validitas tinggi.
3. Validitas
Kesamaan (Concurent Validity)
Alat tes sebagai alat pengukur dapat
dikatakan telah memiliki validitas kesamaan apabila alat tes tersebut dalam
kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan
yang searah antara tes pertama dengan tes berikutnya.
Menurut Suharsimi, dalam hal ini alat tes dipasangkan dengan hasil pengalaman.
Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman
tersebut sekarang sudah ada.
4. Validitas
Prediksi/ Ramalan
Setiap
kali kita menyebutkan istilah “ramalan” maka didalamnya akan terkandung
pengertian mengenai “sesuatu yang bakal terjadi masa yang akan datang “ atau
sesuatu yang pada saat sekarang belum terjadi dan baru akan terjadi pada
waktu-waktu yang akan datang. Apabila istilah ramalan dikaitkan dengan
validitas alat tes maka yang dimaksud dengan validitas ramalan dari suatu alat tes
adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah alat tes dapat
secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi
pada masa yang akan datang.
5. Kesahihan
Tampang (Face Validity)
Kesahihan
tampang ini disebut juga dengan kesahihan semu, karena hasil yang ditunjukkan
hanyalah menyangkut “tampang” atau tampilan dari perangkat soal tes dikemas
dengan baik, seperti desain luar, format penulisan butir soal, jenis dan ukuran
kertas yang digunakan, dan sebagainya. Sedangkan criteria secara substansi isi
soal dengan kesesuaian perangkat soal tidak dibicarakan.
Sesahihan
tampang ini hanyalah untuk memberi kesan yang baik kepada peserta tes bahwa
pelaksanaan ujian dilakukan dengan serius, sehingga peserta tes juga akan berusaha
dengan sungguh-sungguh dalam mengerjakan soal.
Cara Mengetahui Validitas Alat Ukur
Sekali lagi
diulangi bahwa sebuah tes dikatakan memiliki validitas jika hasilnya sesuai
dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut
dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah
teknik korelasi product moment yang dikemukakan oleh Pearson dengan rumus:
Keterangan: |
n ∑X ∑Y ∑XY ∑X2 ∑Y2 |
: jumlah subyek atau siswa : jumlah skor X : jumlah skor Y : jumlah skor X dan Y : jumlah skor X
dikuadratkan : jumlah skor Y
dikuadratkan |
Koefisien
korelasi selalu terdapat - antara 1,00 sampai + 1,00. Namun kerena dalam
menghitung sering dilakukan pembulatan angka-angka, sangat mungkin diperoleh
koefisien lebih dari 1,00. Koefisien negative menunjukkan hubungan kebalikan
sedangkan koefisien positif menunjukkan adanya kesejajaran untuk mengadakan
interpretasi mengenai besarnya koefisien korelasi adalah sebagai berikut:
·
Antara 0,800
sampai dengan 1,00 : sangat tinggi
·
Antara 0,600
sampai dengan 0,800 : tinggi
·
Antara 0,400
sampai dengan 0,600 : cukup
·
Antara 0,200
sampai dengan 0,400 : rendah
·
Antara 0,00
sampai dengan 0,200 : sangat rendah
Penafsiran
harga koefisen korelasi ada dua cara yaitu:
1.
Dengan melihat
harga r dan diinterpretasikan misalnya korelasi tinggi, cukup dan sebagainya.
2.
Dengan
berkonsultasi ke table harga kritik r product moment sehingga dapat diketahui
signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga
kritik dalam table, maka korelasi tersebut tidak signifikan. Begitu juga arti
sebaliknya.
Faktor-Faktor Yang Mempengaruhi Validitas Tes
1. Pengaruh latar
belakang kebudayaan siswa; seperti keadaan
status ekonomi, perbedaan struktur social (status social tinggi/rendah)
perbedaan jenis kelamin tersebut akan mempengaruhi validitas tes. Sebagai
contoh tes inteligensi Binet simon, yang dipersiapkan untuk anak-anak Eropa,
akan tidak valid jika dikenakan terhadap anak Indonesia yang mempunyai latar
belakang kebudayaan/pengetahuan/kehidupan yang berbeda-beda. Demikian juga
apabila tes tersebut sama-sama dikenakan sama anak desa, barangkali akan
memberikan hasil rata-rata yang berbeda, apabila group/kelompok yang diatas
tersebut terdiri anak-anak yang mempunyai status social ekonomi rendah.
Perbedaan tersebut disebabkan antara lain disamping perbedaan-perbedaan latar
belakang social ekonomi akan berpengaruh terhadap pembentukan pola tingkah laku
anak, juga akan berpengaruh terhadap persepsi anak dan pola responnya dalam
menanggapi suatu masalah.
2. Keadaan tipe tes;
tiap-tiap tes akan berpengaruh terhadap validitas jawaban anak. Tes subjektif (Essay test) akan mempunyai validitas
yang berbeda dibandingkan dengan tes objektif. Tes subjektif akan mempunyai
validitas yang lebih rendah, karena dengan tes subjektif kurang dapat
mengungkapkan materi tes secara tuntas dibandingkan dengan tes objektif.
Demikian juga diantara macam-macam tipe tes objektif, tes yang terdiri dari 2
alternatif (benar-salah, setuju-tidak setuju) akan mempunyai validitas yang
lebih rendah dibandingkan dengan tes objektif tipe pilihan ganda. Hal itu
disebabkan karena tes benar salah mempunyai tendensi untuk menerka-nerka yang
lebih besar dibandingkan tes pilihan ganda.
3. Usaha menambah
butir soal dengan maksud ingin mempertinggi reliabilitas tes;
memang salah satu cara untuk mempertinggi reliabilitas tes adalah dengan
menambah butir-butir soal tes secara otomatis akan dapat mempertinggi
reliabilitas, salahnya justru akan dapat merendahkan validitas tes. Oleh karena
itu jika ingin meningkatkan reliabilitas tes dengan tidak akan merendahkan
validitas tes, hendaknya penambahan butir-butir soal tes tersebut dengan
menambahkan faktor-faktor baru dari materi tesnya, karena hal itu berarti
memperbanyak/memeprbesar sampel bahan tes.
4. Kurang jelasnya
petunjuk mengerjakan tes; adanya
petunjuk/pengarahan bagaimana cara mengerjakan tes dimaksudkan agar tidak
terjadi kesalahan-kesalahan interpretasi tentang bagaimana cara mengerjakan tes
tersebut. Jika petunjuknya kurang jelas, akan terjadi siswa yang memperoleh
skor rendah tersebut barangkali disebabkan karena mengalami kesulitan dalam
menginterpretasi petunjuknya, bukan karena tidak menguasai materinya.
Contoh 1:
Mengetahui Validitas Tes Perbutir soal
Tabel
Analisis Soal Untuk Perhitungan Validitas Tes
No |
Nama Siswa |
Butir Soal |
Skor Total |
|||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|||
1 |
Ain aydira |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
0 |
1 |
8 |
2 |
Bunga Rizki |
1 |
1 |
0 |
0 |
1 |
1 |
1 |
0 |
1 |
1 |
7 |
3 |
Bunga Rizka |
0 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
1 |
5 |
4 |
Heri Irmada Sri Windari Ginting |
1 |
0 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
0 |
7 |
5 |
M. Abdul Goffur |
1 |
0 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
1 |
8 |
6 |
Puja |
0 |
0 |
1 |
0 |
1 |
1 |
1 |
1 |
0 |
1 |
6 |
7 |
Pujianti |
1 |
1 |
1 |
1 |
0 |
1 |
0 |
1 |
1 |
1 |
8 |
8 |
Roslinda wati |
1 |
1 |
0 |
1 |
0 |
1 |
1 |
1 |
1 |
0 |
7 |
9 |
Sri Malemna Barus |
1 |
1 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
7 |
10 |
Susi Susanti |
0 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
0 |
0 |
6 |
Untuk
menghitung validitas soal terlebih dahulu membuat tabel persiapannya. Misalnya
menghitung validitas soal no.4, maka:
No |
Nama Siswa |
Soal No.3 |
Skor Total |
X2 |
Y2 |
XY |
(X) |
(Y) |
|||||
1 |
Ain aydira |
1 |
8 |
1 |
64 |
8 |
2 |
Bunga Rizki |
0 |
7 |
0 |
49 |
0 |
3 |
Bunga Rizka |
0 |
5 |
0 |
25 |
0 |
4 |
Heri Irmada Sri Windari Ginting |
1 |
7 |
1 |
49 |
7 |
5 |
M. Abdul Goffur |
1 |
8 |
1 |
64 |
8 |
6 |
Puja |
0 |
6 |
0 |
36 |
0 |
7 |
Pujianti |
1 |
8 |
1 |
64 |
8 |
8 |
Roslinda wati |
1 |
7 |
1 |
49 |
7 |
9 |
Sri Malemna Barus |
1 |
7 |
1 |
49 |
7 |
10 |
Susi Susanti |
1 |
6 |
1 |
36 |
6 |
n= 10 |
7 |
69 |
7 |
485 |
51 |
Koefesien
validitas soal no.4 yaitu 0,624. Validitas soal tersebut meyakinkan karena
berada pada validitas tinggi.
Contoh 2:
Mengetahui Validitas Tes Buatan Guru Dengan
Tes Yang Sudah Valid Dengan Mata Pelajaran Yang Sama
No |
Nama Siswa |
Skor Tes Buatan Guru (X) |
Skor Tes yang Dipandang Valid
(Y) |
X2 |
Y2 |
XY |
1 |
Ain aydira |
8 |
9 |
64 |
81 |
72 |
2 |
Bunga Rizki |
7 |
8 |
49 |
64 |
56 |
3 |
Bunga Rizka |
5 |
7 |
25 |
49 |
35 |
4 |
Heri Irmada Sri Windari Ginting |
7 |
8 |
49 |
64 |
56 |
5 |
M. Abdul Goffur |
8 |
8 |
64 |
64 |
64 |
6 |
Puja |
6 |
7 |
36 |
49 |
42 |
7 |
Pujianti |
8 |
8 |
64 |
64 |
64 |
8 |
Roslinda wati |
7 |
8 |
49 |
64 |
56 |
9 |
Sri Malemna Barus |
7 |
8 |
49 |
64 |
56 |
10 |
Susi Susanti |
6 |
7 |
36 |
49 |
42 |
n= 10 |
69 |
78 |
485 |
612 |
543 |
Indeks koefesien korelasi (r) = 0,8480 jika dikomfirmasi
dengan r tabel (rt) dengan N=10, pada tarif signifikansi 99%
diperoleh 0,7646 atau (re > rt). Ini berarti bahwa ada
korelasi yang signifikan antara hasil tes buatan guru dengan hasil tes yang
valid atau standar. Kesimpulannya ialan bahwa tes buatan guru yang dicari
validitasnya dapat dinyatakan valid.
Kata
reliabillitas dalam bahasa Indonesia di ambil dari reliability dalam bahasa
inggris, berasal dari kata, reliable yang artinya dapat dipercaya.
“reliabilitas” merupakan kata benda, sedangkan “reliable” merupakan kata sifat
atau keadaan.
Reliabilitas
merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan
ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai
pengukuran yang reliabel (reliable).Walaupun reliabilitas mempunyai berbagai
arti seperti kepercayaan, keterandalan, keajegan, kestabilan dan konsistensi,
namun ide pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana
hasil pengukuran dapat dipercaya.
Dari
beberapa pengertian di atas jadi reliabilitas tes marupakan suatu alat ukur
yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya
menunjukan keajegan.Seorang dikatakan dapat dipercaya apabila orang tersebut
berbicara ajeg, tidak berubah-ubah pembicaraannya dari waktu ke waktu.Dalam
sebuah tes pentingnya diamati keajegan dan kepastian tes tersebut dilihat dari
hasil tes yang didapat.
Dengan
demikian reliabilitas dalam evaluasi pembelajaran merupakan sifat yang ada pada
data atau skor yang dihasilkan oleh instrumen, namun untuk memudahkan,
reliabilitas dapat dikatakan merupakan sifat dari instrumen juga. Maksudnya
reliabilitas bukanlah bersifat dikotomis, tetapi merupakan rentangan yang
biasanya dinyatakan dalam bentuk angka 0 – 1.
Cara
Mencari Besarnya Reliabilitas
Beberapa
metode yang dapat digunakan untuk mencari besarnya reliabilitas antara lain:
1. Metode Test-Retest
Untuk menentukan reliabilitas tes
dengan menggunakan metode test-retest, satu
perangkat tes dilakukan dua kali terhadap kelompok siswa yang sama dalam waktu
yang berbeda. Kedua hasil tes dikorelasikan, koefisien korelasi yang diperoleh
menyatakan tingkat reliabilitas tes. Semakin tinggi koefisien korelasi yang
diperoleh, tes semakin stabil dengan demikian skor siswa pada kedua tes
tersebut cenderung tetap, atau konsisten. Interpretasi reliabilitas instrumen
untuk hal ini yaitu:
Besarnya Nilai r |
Interpretasi |
0,80 - 1,00 |
tinggi |
0,60 - 0,80 |
cukup |
0,20 - 0,60 |
agak rendah |
0,00 - 0,20 |
rendah |
Contoh perhitungan reliabilitas
tes-retest bentuk soal objektif tes
No Urut |
Perolehan skor
siswa |
XY |
X2 |
Y2 |
|
Siswa |
tes pertama (X) |
tes kedua (Y) |
|||
1 |
45 |
47 |
2115 |
2025 |
2209 |
2 |
22 |
25 |
550 |
484 |
625 |
3 |
42 |
38 |
1596 |
1764 |
1444 |
4 |
35 |
37 |
1295 |
1225 |
1369 |
5 |
36 |
38 |
1368 |
1296 |
1444 |
6 |
33 |
30 |
990 |
1089 |
900 |
7 |
23 |
26 |
598 |
529 |
676 |
8 |
38 |
33 |
1254 |
1444 |
1089 |
9 |
26 |
30 |
780 |
676 |
900 |
10 |
40 |
42 |
1680 |
1600 |
1764 |
11 |
29 |
28 |
812 |
841 |
784 |
12 |
33 |
33 |
1089 |
1089 |
1089 |
13 |
41 |
43 |
1763 |
1681 |
1849 |
14 |
37 |
39 |
1443 |
1369 |
1521 |
15 |
36 |
36 |
1296 |
1296 |
1296 |
16 |
32 |
26 |
832 |
1024 |
676 |
17 |
38 |
35 |
1330 |
1444 |
1225 |
18 |
33 |
36 |
1188 |
1089 |
1296 |
19 |
44 |
45 |
1980 |
1936 |
2025 |
20 |
34 |
36 |
1224 |
1156 |
1296 |
21 |
41 |
42 |
1722 |
1681 |
1764 |
22 |
38 |
36 |
1368 |
1444 |
1296 |
23 |
35 |
36 |
1260 |
1225 |
1296 |
24 |
43 |
45 |
1935 |
1849 |
2025 |
25 |
37 |
39 |
1443 |
1369 |
1521 |
26 |
33 |
35 |
1155 |
1089 |
1225 |
27 |
14 |
24 |
336 |
196 |
576 |
28 |
23 |
28 |
644 |
529 |
784 |
29 |
32 |
38 |
1216 |
1024 |
1444 |
30 |
44 |
46 |
2024 |
1936 |
2116 |
jumlah |
1037 |
1072 |
38286 |
37399 |
39524 |
n = 30 |
Formula yang digunakan adalah:
Penyelelesaian:
2. Metode
Belah Dua (Split-Half Method)
Dengan
menggunakan satu perangkat tes yang dilakukan satu kali tes dapat juga
ditentukan koefisien dengan cara membangi dua tes tersebut. Jadi satu perangkat
tes dibagi dua, kedua skor tes dianggap dua macam tes yang paralel. Pembagian
biasanya dilakukan dengan patokan nomor soal ganjil dan nomor soal genap. Hal
ini dilakukan karena biasanya perangkat tes disusun mulai butir soal yang mudah
menuju butir soal yang sukar. Jadi akan diperoleh satu set soal bernomor ganjil
dan satu set lainnya bernomor genap. Kedua skor tes ini dikorelasikan, dan
hasil korelasi menunjukkan koefisien reabilitas. Namun demikian perlu
diperhatikan bahwa reliabilitas dengan teknik ini sangat relative karena
reliabilitas sangat tergantung pada cara penomoran dan pengelompokkan
butir-butir soal yang disusun. Cara perhitungan reliabilitas dengan belah dua
sama seperti perhitungan metode tes-retest.
Contoh perhitungan
reliabilitas split half bentuk soal objektif tes
No Urut |
Ganjil (X) |
Total Skor |
||||
Siswa |
1 |
3 |
5 |
7 |
9 |
|
1 |
1 |
1 |
1 |
1 |
0 |
4 |
2 |
1 |
0 |
1 |
1 |
1 |
4 |
3 |
1 |
1 |
0 |
1 |
1 |
4 |
4 |
0 |
1 |
1 |
0 |
1 |
3 |
5 |
1 |
1 |
1 |
1 |
0 |
4 |
6 |
1 |
0 |
1 |
1 |
1 |
4 |
7 |
1 |
1 |
1 |
0 |
1 |
4 |
8 |
0 |
1 |
1 |
1 |
1 |
4 |
9 |
0 |
1 |
0 |
1 |
1 |
3 |
10 |
1 |
0 |
1 |
1 |
1 |
4 |
No Urut |
Genap (Y) |
Total Skor |
||||
Siswa |
2 |
4 |
6 |
8 |
10 |
|
1 |
1 |
1 |
0 |
1 |
1 |
4 |
2 |
1 |
1 |
1 |
1 |
1 |
5 |
3 |
1 |
1 |
0 |
1 |
0 |
3 |
4 |
1 |
1 |
1 |
1 |
1 |
5 |
5 |
0 |
0 |
1 |
0 |
1 |
2 |
6 |
1 |
1 |
1 |
1 |
1 |
5 |
7 |
1 |
1 |
1 |
1 |
1 |
5 |
8 |
1 |
1 |
1 |
1 |
1 |
5 |
9 |
1 |
1 |
0 |
1 |
1 |
4 |
10 |
1 |
1 |
1 |
1 |
1 |
5 |
No Urut |
Skor Soal |
XY |
X2 |
Y2 |
|
Siswa |
Ganjil (X) |
Genap (Y) |
|||
1 |
4 |
4 |
16 |
16 |
16 |
2 |
4 |
5 |
20 |
16 |
25 |
3 |
4 |
3 |
12 |
16 |
9 |
4 |
3 |
5 |
15 |
9 |
25 |
5 |
4 |
2 |
8 |
16 |
4 |
6 |
4 |
5 |
20 |
16 |
25 |
7 |
4 |
5 |
20 |
16 |
25 |
8 |
4 |
5 |
20 |
16 |
25 |
9 |
3 |
4 |
12 |
9 |
16 |
10 |
4 |
5 |
20 |
16 |
25 |
Jumlah |
38 |
43 |
163 |
146 |
195 |
3. Metode
Kuder-Richardson
Metode
Kuder-Richardson ini adalah pengembangan dari metode split-half, tetapi pada
metode ini tidak dibelah dua, melainkan didasarkan pada proporsi siswa yang
menjawab benar dan standar deviasi skor. Caranya adalah dengan mengkorelasikan
skor-skor setiap butir dengan skor total keseluruhan tes.
Rumus
yang dikemukanakan oleh Kuder-Richardson adalah sebagai berikut:
Keterangan : |
: koevisien
reliabilitas yang dicari |
|
: varians
skor total |
||
p |
: proporsi
siswa yang menjawab benar |
|
q |
: 1 – p |
|
pq |
: hasil
perkalian p dan q |
|
n |
: jumlah
butir soal |
Dengan mengacu pada soal
reliabilitas split half maka reliabilitas perangkat soal dapat diketahui
sebagai berikut:
No Urut |
Skor Soal |
X |
X2 |
|||||||||
Siswa |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
1 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
1 |
0 |
1 |
8 |
64 |
2 |
1 |
1 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
9 |
81 |
3 |
1 |
1 |
1 |
1 |
0 |
0 |
1 |
1 |
1 |
0 |
7 |
49 |
4 |
0 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
8 |
64 |
5 |
1 |
0 |
1 |
0 |
1 |
1 |
1 |
0 |
0 |
1 |
6 |
36 |
6 |
1 |
1 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
9 |
81 |
7 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
9 |
81 |
8 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
9 |
81 |
9 |
0 |
1 |
1 |
1 |
0 |
0 |
1 |
1 |
1 |
1 |
7 |
49 |
10 |
1 |
1 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
9 |
81 |
Jumlah |
7 |
9 |
7 |
9 |
8 |
7 |
8 |
9 |
8 |
9 |
81 |
667 |
P |
0,7 |
0,9 |
0,7 |
0,9 |
0,8 |
0,7 |
0,8 |
0,9 |
0,8 |
0,9 |
||
Q |
0,3 |
0,1 |
0,3 |
0,1 |
0,2 |
0,3 |
0,2 |
0,1 |
0,2 |
0,1 |
||
Pq |
0,21 |
0,09 |
0,21 |
0,1 |
0,2 |
0,21 |
0,2 |
0,09 |
0,2 |
0,09 |
1,47 |
·
Skor Rata-Rata Total
= 8,1
·
Varians Skor Total
·
Koevisien Reliabilitas
Koefisien korelasi berada antara 0 – 1. Suatu instrumen
penilaian dikatakan reliabel jika koefisien korelasinya ≥ 0,6, makin tinggi
koefisien korelasi makin reliabel instrumen tersebut, dan sebaliknya. Instrumen
penilaian yang di jadikan contoh termasuk kategori instrumen yang kurang baik
karena tidak reliabel. Untuk menjadikan instrumen tersebut reliabel maka
validitas butir yang tidak baik dibuang atau diganti. Instrumen yang valid
pasti reliabel, tetapi instrumen yang reliabel belum tentu valid.
4. Metode
Equivalent-form Atau Pararel
Metode
paralel dipilih apabila tidak diinginkan mengujikan dua kali. Metode paralel
dilakukan dengan cara menyusun dua instrumen yang hampir sama (equivalent),
kemudian di ujicobakan pada sekelompok responden yang sama (responden
mengerjakan dua kali) kemudian dari hasil ujicoba tersebut dikorelasikan dengan
teknik korelasi product moment. Metode ini umumnya untuk menguji
reliabilitas instrument bentuk tes (Eko Putro. Widoyoko. 2012 : 158).
Instrumen
paralel atau ekuivalen adalah dua buah instrumen yang mempunyai kesamaan
tujuan, tingkat kesulitan dan susunan, tetapi butir – butir pertayaan/peryataan
berbeda. Untuk menentukan apakah intrument tersebut reliabel atau tidak,
koefisien korelasi hasil perhitungan atau “r hitung”(rh)
dikonsultasi dengan “r tabel” (rt) dalam tabel korelasi product
moment. (rh ≥ rt) maka diartikan ada korelasi yang
signifikan dan intrument dianggap reliabel. Sebaliknya (rt < rh)
maka diartikan tidak ada korelasi yang signifikan, maka kesimpulan instrumen
dianggap tidak reliabel.
Faktor-Faktor Yang Mempengaruhi Reliabilitas
Reliabilitas
dapat dipengaruhi oleh waktu penyelenggaran tes-retes. Interval penyelengaraan
yang terlalu dekat atau jauh, akan mempengruhi koefisien reliabilitas.
Faktor-factor lain yang mempengaruhi di antaranya;
1. Panjang
test;
semakin panjang test evaluasi, semakin banyak jumlah item materi pembelajaran
diukur. Ini menunjukan dua kemungkinan yaitu test semakin mendekati
kebenaran, dan dalam memgikuti test, semakin kecil siswa menebak. Berarti
semakin tinggi koefisien reliabilitas.
2. Penyebaran
skor;
koefisien reliabiltas secara langsung dipengeruhioleh bentuk sebaranskor dalam
kelompok siswa yang diukur. Semakin tinggi sebaran semakin tingi estimasi
koefisien reliabilitas. Hal ini tejadi karena posisi skor siswa, secara
individual mempunyai kedudukan sama pada tes retest lain,sebagai acuan.
3. Kesulitan
test; test
normative yang terlalu mudah atau terlalu sulitskor untuk siswa cenderung
menghasilkan reliabilitas rendah. Fenomena tersebut, akan menghasilkan sebaran
skor yang cenderung terbatas pada salah satu sisi. Untuk test yang terlalu
mudah skor jawaban siswa akan mengumpul ada sisi atas, untuk tes terlalu sulit
skor jawaban siswa akan cenderung mengumpul pada ujung bawah. Dua kejadian
tersebut mempunyai kesamaan yaitu bahwa perbedaan di antara individu adalah
kecil dan cenderung tidak relevan.
4. Objektivitas; yang di maksud objekif yaitu
derajat dimana siswa dengan kompetensi sama mencapai hasil sama. Ketika
prosedur test evaluasi memiliki objektivitas tinggi, maka reliabilitas test
tidak dipengaruhi oleh prosedur teknik penskoran. Item test objektif yang
dihasilkan tidak dipengaruhi pertimbangan atau opini seorang evaluator.
Validitas tes biasa juga disebut sebagai kesahihan suatu
tes adalah mengacu pada kemampuan suatu tes untuk mengukur karakteristik atau
dimensi yang dimaksudkan untuk diukur. Valid berarti cocok atau sesuai. Suatu tes dikatakan valid,
apabila tes tersebut benar-benar manyasar keapada apa yang dituju. Jenis-jenis
validitas tes secara garis besar:
·
Validitas isi (Content Validity)
·
Validitas Konstruksi
(Construct Validity)
·
Validitas
Kesamaan (Concurent Validity)
·
Validitas
Prediksi/ Ramalan
·
Kesahihan
Tampang (Face Validity)
Faktor-Faktor Yang Mempengaruhi
Validitas Tes
·
Pengaruh latar belakang kebudayaan siswa
·
Keadaan tipe tes
·
Usaha menambah butir soal dengan maksud ingin mempertinggi
reliabilitas tes
·
Kurang jelasnya petunjuk mengerjakan tes
Reliabilitas
merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan ability.
Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang
reliabel (reliable).Walaupun reliabilitas mempunyai berbagai arti seperti
kepercayaan, keterandalan, keajegan, kestabilan dan konsistensi, namun ide
pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil
pengukuran dapat dipercaya.
Beberapa
metode yang dapat digunakan untuk mencari besarnya reliabilitas antara lain:
·
Metode Test-Retest
·
Metode Belah Dua
(Split-Half Method)
·
Metode
Kuder-Richardson
·
Metode
Equivalent-form Atau Pararel
Faktor-Faktor Yang Mempengaruhi Reliabilitas
·
Panjang test
·
Penyebaran skor
·
Kesulitan test
·
Objektivitas
Bahan
Pembelajaran Evaluasi Pembelajaran Oleh Tim Dosen KDBK
http://mmeri3328.blogspot.co.id/2016/01/reliabilitas-dan-validitas-tes.html
https://hamimnurham.wordpress.com/2013/05/02/pengertian-validitas-dan-jenis-jenis-validitas/
http://makalahpendidikanislamlengkap.blogspot.co.id/2015/06/pengujian-validitas-tes-assesmen.html
http://www.biologimu.com/2015/06/validitas-reliabilitas-tes-assesmen.html
http://dwimunawar.blogspot.co.id/2016/03/makalah-validitas-dan-realibilitas.html
http://ohmakalah.blogspot.co.id/2015/11/reliabilitas.html
http://cosmoseduart.blogspot.co.id/2013/07/analisis-reliabilitas-butir-soal-dengan.html