Mengenai Saya

Foto Saya
Aku ingin berusaha terus dan lebih. Aku ingin jadi orang yang berguna dan bermanfaat. Aku juga gak mau buang-buang waktu ato sia-siain hidup yang penuh berkah ini :-)
Hai! Selamat datang dan selamat menikmati sajian tulisan-tulisan yang semoga bermanfaat ini. Kotak saran dan kritik sangat terbuka, jadi jangan sungkan-sungkan untuk memberikan komentar. Jangan lupa menuliskan sumbernya ya jika mau merujuk tulisan-tulisan di blog ini. Have a nice surf :)

Minggu, 27 Januari 2013

KRITERIA TES VALIDITAS DAN RELIABILITAS


Oleh: Silka Yuanti Draditaswari
Mahasiswa Sastra Indonesia
Universitas Negeri Malang


          Penilaian adalah proses memberikan atau menentukan nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Penilaian berfungsi sebagai: (a) alat untuk mengetahui tercapai-tidaknya tujuan instruksional. Dengan fungsi ini maka penilaian harus mengacu kepada rumusan-rumusan tujuan instruksional. (b) umpan balik bagi perbaikan proses belajar mengajar. Perbaikan mungkin dilakukan dalam hal tujuan instruksional, kegiatan belajar siswa, strategi mengajar guru, dll. (c) dasar menyusun lapoan kemajuan belajar siswa kepada para orang tuanya. Dalam laporan tersebut dikemukakan kemampuan dan kecakapan/ belajar siswa dalam berbagai bidang studi dalam bentuk nilai-nilai preatasi yang dicapainya.
            Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adalanya (objektivitas hasil penilaian) sangat bergantung pada kualitas alat penilaiannya, selain pada cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua hal, yakni ketepatannya atau validitasnya dan ketetapan atau keajegannya atau reliabilitasnya. Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai. Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Validitas mencakup dua syarat penting, yaitu harus mengetahui objek yang akan diukur dan mengetahui satuan ukuran yang tepat untuk objek tersebut. Contohnya adalah aspek berbicara yaitu kemampuan menceritakan pengalaman liburan siswa, maka yang diukur adalah bahasa yang digunakan siswa untuk bercerita, keruntutan cerita siswa dalam bercerita, ukuran keras nyaringnya siswa dalam bercerita, kelancaran siswa dalam bercerita, dan ekspresi siswa dalam bercerita. Jika aspek berbicara itu yang dinilai adalah nilai kehidupan dari cerita yang diceritakan, maka penilaian itu tidak valid.
Ada empat jenis validitas yang sering digunakan, yakni validitas isi, validitas bangun pengertian, validitas ramalan, dan validitas kesamaan. Berikut akan dijelaskan satu persatu mengenai empat jenis validitas:
11.      Validitas isi
Validitas isi berkenaan dengan kesanggupan alat penilaian dalam mengukur isi seharusnya, artinya tes tersebut mampu mengungkapkan isi suatu konsep atau variabel yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun tes yang bersumber dari kurikulum bidang studi yang hendak diukur.
Penilaian ini dilakukan dengan cara mengambil sebagian materi dalam bentuk tes. Sampel harus dapat mencerminkan materi yang terkandung dalam seluruh materi bidang studi selama satu semester. Cara yang ditempuh dalam menetapkan sampel tes adalah memilih konsep-konsep materi yang esensial. Dari setiap konsep dikembangkan beberapa pertanyaan tes. Di sinilah pentingnya peranan kisi-kisi sebagai alat untuk memenuhi validitas isi. Dalam hal tertentu untuk tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi, dapat pula dimintakan bantuan ahli bidang studi untuk menelaah apakah konsep materi yang diajukan telah memadai atau tidak sebagai sampel tes. Dengan demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka-angka.
Contoh dari validitas isi adalah penulisan soal-soal untuk ujian akhir semester 1 Bahasa Indonesia pada kelas X. Penulisan soal-soal tersebut harus sesuai dengan konsep-konsep materi yang terdapat pada buku teks pelajaran yang digunakan dalam  kegiatan belajar mengajar tersebut. Cara menulis soal-soal tersebut dilakukan dengan mengambil sampel-sampel dari seluruh bab yang ada dalam buku teks pelajaran.
22.      Validitas konstruk
Validitas konstruk adalah kesanggupan alat penilaian untuk mengukur kemampuan siswa dalam menguasai materi yang diukurnya. Kemampuan siswa yang termasuk konsep kemampuan, minat, sikap dalam berbagai bidang kajian. Konsep-konsep tersebut masih abstrak sehingga memerlukan penjabaran yang lebih spesifik agar mudah diukur. Ini berarti setiap konsep harus dikembangkan indikator-
indikatornya. Menetapkan indikator suatu konsep dapat dilakukan dengan dua cara, yakni (a) menggunakan pemahaman atau logika berpikir atas dasar teori pengetahuan ilmiah dan (b) menggunakan pengalaman empiris, yakni apa yang terjadi dalam kehidupan nyata. Contoh: Konsep mengenai “wawancara” dilihat dari pengalamannya, indikator empirisnya adalah:
-          Menyiapkan alat-alat untuk wawancara (buku tulis dan alat tulis/ kaset rekaman/ video rekaman),
-          Memilih seseorang yang dapat diwawancarai,
-          Membuat pertanyaan-pertanyaan yang akan diberikan, dan
-          Melakukan wawancara tersebut.
Berikut adalah contoh lain dari konsep wawancara jika dilihat dari indikator yang teoritis:
-          Menentukan topik yang akan dijadikan bahan wawancara,
-          Menentukan narasumber yang akan diwawancarai,
-          Menyusun pertanyaan-pertanyaan yang akan diajukan secara runtut,
-          Menyiapkan alat wawancara,
-          Melakukan wawancara tersebut dengan narasumber,
-          Melaporkan hasil wawancara di selembar kertas dengan bahasa Indonesia yang baik dan benar secara runtut.
Apabila hasil tes menunjukkan indikator-indikator yang berhubungan secara positif satu sama lain, maka ukuran tersebut tidak memenuhi validitas konstruk.
            Contoh lain adalah ketika guru akan menilai aspek menyimak, maka konstruknya adalah soal-soal yang berhubungan dengan menyimak, seperti pertanyaan yang mendeskripsikan atau menjelaskan poin-poin yang disimak. Jika menggunakan soal-soal objektif, maka penilaian tersebut tidak valid karna aspek menyimak tidak bisa dinilai menggunakan soal objektif.
33.      Validitas ramalan
Dalam validitas ini yang diutamakan bukan isi tes, melainkan kriterianya, apakah alat penilaian tersebut dapat digunakan untuk meramalkan suatu ciri, perilaku tertentu, atau kriteria tertentu yang diinginkan. Misalnya alat penilaian motivasi belajar, apakah dapat digunakan untuk meramal prestasi belajar yang dicapai. Artinya, terdapat hubungan yang positif antara motivasi dengan prestasi. Motivasi dapat digunakan untuk meramal prestasi bila skor-skor yang diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi.
Validitas mengandung ciri adanya relevansi dan keajegan atau ketetapan. Validitas ramalan ini mengandung dua makna: validitas jangka pendek dan validitas jangka panjang. Validitas jangka pendek berarti daya ramal alat penilaian tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut berkorelasi pada waktu yang sama. Sedangkan validitas jangka pajang mengandung makna skor tersebut akan berkorelasi dalam waktu ke depan. Agar korelasi tersebut ada, maka perlu dijelaskan hubungan antara konsep dan variabel berdasarkan pengetahuan ilmiah. Selain itu, skor yang dikorelasikan harus memenuhi linieritas.
44.      Validitas kriteria
Validitas kriteria suatu tes artinya membuat tes yang memiliki kriteria yang sama dengan tes sejenis yang telah ada (standar tes). Kriteria tersebut mencakup objek yang diukur serta waktu yang dibutuhkan. Apabila hasil tes tersebut menunjukkan korelasi yang tinggi dengan standarnya, maka tes tersebut dapat dikatakan valid. Contohnya adalah soal-soal try out ujian akhir sekolah dibakukan sesuai dengan standar tes ujian akhir sekolah. Penulisan soalnya berdasarkan soal-soal ujian akhir sekolah tahun sebelumnya juga menambahkan beberapa soal baru yang diprediksi akan keluar. Melalui beberapa kali uji coba akan dianalisis tingkat kesuakaran dan daya pembedanya di samping diuji validitas dan reliabilitasnya. Berdasarkan uji coba tersebut, soal-soal akan diperbaiki dan disempurnakan sehingga menghasilkan tes yang mendekati standarnya.
Reliabilitas penilaian adalah ketetapan atau keajegan alat penilaian dalam menilai yang dinilai. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama. Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya terhadap siswa yang sama. Indeks reliabilitas alat penilaian dapat dicari dengan mengorelasikan skor-skor yang diperoleh dari hasil penilaian yang berulang-ulang pada waktu yang berbeda atau dengan kelompok pertanyaan yang sepadan. Berikut berbagai macam prosedur dalam melakukan reliabilitas penilaian:
11.      Reliabilitas remidial
Reliabilitas remidial (tes ulang/ retest) adalah penggunaan alat penilaian terhadap subjek yang sama, dilakukan dua kali dalam waktu yang berlainan. Jarak waktu antara tes pertama dengan tes kedua sebaiknya tidak terlalu dekat juga tidak terlalu jauh. Jika terlalu dekat, hasilnya banyak dipengaruhi oleh ingatan siswa tentang jawaban yang diberikan pada pengukuran yang pertama. Jika terlalu jauh, bisa terjadi adanya perubahan pengetahuan dan pengalaman siswa sehingga mempengaruhi reliabilitasnya.
Contohnya adalah penilaian membaca cepat artikel biografi Presiden Susilo Bambang Yudoyono selama 200 detik pada pertemuan minggu pertama. Penilaian ini menggunakan intrumen pertanyaan-pertanyaan berdasarkan poin-poin penting yang terdapat dalam artikel biografi tersebut. Pada pertemuan minggu kedua, guru dapat memberikan instrumen yang sama untuk menilai reliabilitas membaca cepat siswa. Jika hasilnya relatif sama, maka alat penilaian tersebut ajeg (reliabel). Jika tidak, maka terjadi kesalahan dalam alat penelitiannya.
22.      Reliabilitas pecahan setara
Mengukur bentuk pecahan setara tidak dilakukan dengan pengulangan kepada subjek yang sama, tetapi menggunakan hasil dari bentuk tes yang sebanding atau setara yang diberikan kepada subjek yang sama pada waktu yang sama pula. Dengan demikian, diperlukan dua perangkat tes yang disusun agar memiliki derajat yang setara baik dari segi isi, tingkat kesukaran, abilitas yang diukur, jumlah pertanyaan, bentuk pertanyaan, maupun segi teknis lainnya. Yang berbeda hanyalah pertanyaannya.
Contoh dari penilaian reliabilitas pecahan setara adalah penilaian dalam aspek menyimak, yaitu menyimak cerita rakyat dari Maluku dan Aceh. Pada sesi pertama, guru memberikan tugas pada siswa untuk menyimak cerita rakyat Maluku, kemudian guru memberikan instrumen pertanyaan yang mencakup unsur intrinsik dan eksrinsik cerita rakyat. Begitu pula pada sesi kedua dimana guru menugaskan siswa untuk menyimak cerita rakyat dari Aceh. Setelah menyimak, siswa menjawab pertanyaan-pertanyaan yang mencakup unsur intrinsik dan ekstrinsik cerita rakyat. Bila penyusunan kesetaraan tes dapat dicapai seoptimal mungkin, maka reliabilitasnya terpeunhi dengan baik.
33.      Reliabilitas belah dua
Reliabilitas belah dua ini mirip dengan reliabilitas pecahan setara, terutama dalam pelaksanannya. Dalam prosedur tes ini diberikan kepada kelompok subjek cukup sekali. Prosedur ini digunakan apabila tes mengandung atau terdiri dari banyak item yang realtif sukar, materi yang duji cukup komperehensif sehingga memungkinkan penyusunan dua soal untuk satu permasalahan yang sama.
Contoh dari penilaian reliabilias belah dua adalah penilaian dalam aspek menulis yaitu majas. Guru memberikan instrumen pertanyaan kepada siswa sebanyak 30 pertanyaan mengenai berbagai macam majas yang terdapat dalam Bahasa Indonesia. Setelah selesai dikerjakan, guru membagi pertanyaan-pertanyaan tersebut menjadi dua bagian yang sebanding. Pertanyaan-pertanyaan tersebut dapat dibagi dengn cara membedakan soal ganjil dan genap. Kemudian guru menilai pertanyaan-pertanyaan tersebut pada kelompok ganjil dan genap. Nilai/ skor tersebut dikorelasikan untuk dicari koefisien korelasinya. Jika ada korelasinya, maka intrumen tersebut dinilai reliabel.
44.      Reliabilitas persamaan rasional
Reliabilitas persamaan rasional ini dilakukan dengan cara menghubungkan setiap butir dalam satu tes dengan butir-butir lainnya. 

Tidak ada komentar:

Poskan Komentar