Oleh: Silka Yuanti Draditaswari
Mahasiswa Sastra Indonesia
Universitas Negeri Malang
Penilaian adalah proses memberikan atau menentukan nilai kepada objek
tertentu berdasarkan suatu kriteria tertentu. Penilaian berfungsi sebagai: (a)
alat untuk mengetahui tercapai-tidaknya tujuan instruksional. Dengan fungsi ini
maka penilaian harus mengacu kepada rumusan-rumusan tujuan instruksional. (b)
umpan balik bagi perbaikan proses belajar mengajar. Perbaikan mungkin dilakukan
dalam hal tujuan instruksional, kegiatan belajar siswa, strategi mengajar guru,
dll. (c) dasar menyusun lapoan kemajuan belajar siswa kepada para orang tuanya.
Dalam laporan tersebut dikemukakan kemampuan dan kecakapan/ belajar siswa dalam
berbagai bidang studi dalam bentuk nilai-nilai preatasi yang dicapainya.
Keberhasilan
mengungkapkan hasil dan proses belajar siswa sebagaimana adalanya (objektivitas
hasil penilaian) sangat bergantung pada kualitas alat penilaiannya, selain pada
cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang
baik apabila alat tersebut memiliki atau memenuhi dua hal, yakni ketepatannya
atau validitasnya dan ketetapan atau keajegannya atau reliabilitasnya. Validitas
berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga
betul-betul menilai apa yang seharusnya dinilai. Validitas tidak berlaku
universal sebab bergantung pada situasi dan tujuan penilaian. Validitas
mencakup dua syarat penting, yaitu harus mengetahui objek yang akan diukur dan
mengetahui satuan ukuran yang tepat untuk objek tersebut. Contohnya adalah aspek
berbicara yaitu kemampuan menceritakan pengalaman liburan siswa, maka yang
diukur adalah bahasa yang digunakan siswa untuk bercerita, keruntutan cerita
siswa dalam bercerita, ukuran keras nyaringnya siswa dalam bercerita, kelancaran
siswa dalam bercerita, dan ekspresi siswa dalam bercerita. Jika aspek berbicara
itu yang dinilai adalah nilai kehidupan dari cerita yang diceritakan, maka
penilaian itu tidak valid.
Ada empat jenis validitas yang sering digunakan, yakni
validitas isi, validitas bangun pengertian, validitas ramalan, dan validitas
kesamaan. Berikut akan dijelaskan satu persatu mengenai empat jenis validitas:
11.
Validitas isi
Validitas isi
berkenaan dengan kesanggupan alat penilaian dalam mengukur isi seharusnya, artinya
tes tersebut mampu mengungkapkan isi suatu konsep atau variabel yang hendak
diukur. Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan
isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun tes yang
bersumber dari kurikulum bidang studi yang hendak diukur.
Penilaian ini
dilakukan dengan cara mengambil sebagian materi dalam bentuk tes. Sampel harus
dapat mencerminkan materi yang terkandung dalam seluruh materi bidang studi
selama satu semester. Cara yang ditempuh dalam menetapkan sampel tes adalah
memilih konsep-konsep materi yang esensial. Dari setiap konsep dikembangkan
beberapa pertanyaan tes. Di sinilah pentingnya peranan kisi-kisi sebagai alat
untuk memenuhi validitas isi. Dalam hal tertentu untuk tes yang telah disusun
sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi,
dapat pula dimintakan bantuan ahli bidang studi untuk menelaah apakah konsep
materi yang diajukan telah memadai atau tidak sebagai sampel tes. Dengan
demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau
dinyatakan dalam bentuk angka-angka.
Contoh dari
validitas isi adalah penulisan soal-soal untuk ujian akhir semester 1 Bahasa
Indonesia pada kelas X. Penulisan soal-soal tersebut harus sesuai dengan konsep-konsep
materi yang terdapat pada buku teks pelajaran yang digunakan dalam kegiatan belajar mengajar tersebut. Cara
menulis soal-soal tersebut dilakukan dengan mengambil sampel-sampel dari
seluruh bab yang ada dalam buku teks pelajaran.
22.
Validitas konstruk
Validitas konstruk
adalah kesanggupan alat penilaian untuk mengukur kemampuan siswa dalam
menguasai materi yang diukurnya. Kemampuan siswa yang termasuk konsep
kemampuan, minat, sikap dalam berbagai bidang kajian. Konsep-konsep tersebut
masih abstrak sehingga memerlukan penjabaran yang lebih spesifik agar mudah
diukur. Ini berarti setiap konsep harus dikembangkan indikator-
indikatornya. Menetapkan
indikator suatu konsep dapat dilakukan dengan dua cara, yakni (a) menggunakan
pemahaman atau logika berpikir atas dasar teori pengetahuan ilmiah dan (b)
menggunakan pengalaman empiris, yakni apa yang terjadi dalam kehidupan nyata. Contoh:
Konsep mengenai “wawancara” dilihat dari pengalamannya, indikator empirisnya
adalah:
-
Menyiapkan alat-alat untuk wawancara (buku tulis dan alat tulis/ kaset
rekaman/ video rekaman),
-
Memilih seseorang yang dapat diwawancarai,
-
Membuat pertanyaan-pertanyaan yang akan diberikan, dan
-
Melakukan wawancara tersebut.
Berikut adalah contoh lain dari konsep wawancara jika
dilihat dari indikator yang teoritis:
-
Menentukan topik yang akan dijadikan bahan wawancara,
-
Menentukan narasumber yang akan diwawancarai,
-
Menyusun pertanyaan-pertanyaan yang akan diajukan secara runtut,
-
Menyiapkan alat wawancara,
-
Melakukan wawancara tersebut dengan narasumber,
-
Melaporkan hasil wawancara di selembar kertas dengan bahasa Indonesia
yang baik dan benar secara runtut.
Apabila hasil tes menunjukkan indikator-indikator yang
berhubungan secara positif satu sama lain, maka ukuran tersebut tidak memenuhi
validitas konstruk.
Contoh
lain adalah ketika guru akan menilai aspek menyimak, maka konstruknya adalah
soal-soal yang berhubungan dengan menyimak, seperti pertanyaan yang
mendeskripsikan atau menjelaskan poin-poin yang disimak. Jika menggunakan
soal-soal objektif, maka penilaian tersebut tidak valid karna aspek menyimak
tidak bisa dinilai menggunakan soal objektif.
33.
Validitas ramalan
Dalam validitas ini yang diutamakan bukan isi tes,
melainkan kriterianya, apakah alat penilaian tersebut dapat digunakan untuk
meramalkan suatu ciri, perilaku tertentu, atau kriteria tertentu yang
diinginkan. Misalnya alat penilaian motivasi belajar, apakah dapat digunakan
untuk meramal prestasi belajar yang dicapai. Artinya, terdapat hubungan yang
positif antara motivasi dengan prestasi. Motivasi dapat digunakan untuk meramal
prestasi bila skor-skor yang diperoleh dari ukuran motivasi berkorelasi positif
dengan skor prestasi.
Validitas mengandung ciri adanya relevansi dan
keajegan atau ketetapan. Validitas ramalan ini mengandung dua makna: validitas
jangka pendek dan validitas jangka panjang. Validitas jangka pendek berarti
daya ramal alat penilaian tersebut hanya untuk masa yang tidak lama. Artinya,
skor tersebut berkorelasi pada waktu yang sama. Sedangkan validitas jangka
pajang mengandung makna skor tersebut akan berkorelasi dalam waktu ke depan. Agar
korelasi tersebut ada, maka perlu dijelaskan hubungan antara konsep dan variabel
berdasarkan pengetahuan ilmiah. Selain itu, skor yang dikorelasikan harus
memenuhi linieritas.
44.
Validitas kriteria
Validitas kriteria suatu tes artinya membuat tes yang
memiliki kriteria yang sama dengan tes sejenis yang telah ada (standar tes). Kriteria
tersebut mencakup objek yang diukur serta waktu yang dibutuhkan. Apabila hasil
tes tersebut menunjukkan korelasi yang tinggi dengan standarnya, maka tes
tersebut dapat dikatakan valid. Contohnya adalah soal-soal try out ujian akhir
sekolah dibakukan sesuai dengan standar tes ujian akhir sekolah. Penulisan
soalnya berdasarkan soal-soal ujian akhir sekolah tahun sebelumnya juga
menambahkan beberapa soal baru yang diprediksi akan keluar. Melalui beberapa
kali uji coba akan dianalisis tingkat kesuakaran dan daya pembedanya di samping
diuji validitas dan reliabilitasnya. Berdasarkan uji coba tersebut, soal-soal
akan diperbaiki dan disempurnakan sehingga menghasilkan tes yang mendekati
standarnya.
Reliabilitas penilaian adalah ketetapan atau keajegan
alat penilaian dalam menilai yang dinilai. Artinya, kapanpun alat penilaian
tersebut digunakan akan memberikan hasil yang relatif sama. Tes hasil belajar
dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil
pada saat yang berlainan waktunya terhadap siswa yang sama. Indeks reliabilitas
alat penilaian dapat dicari dengan mengorelasikan skor-skor yang diperoleh dari
hasil penilaian yang berulang-ulang pada waktu yang berbeda atau dengan
kelompok pertanyaan yang sepadan. Berikut berbagai macam prosedur dalam
melakukan reliabilitas penilaian:
11.
Reliabilitas remidial
Reliabilitas
remidial (tes ulang/ retest) adalah penggunaan alat penilaian terhadap
subjek yang sama, dilakukan dua kali dalam waktu yang berlainan. Jarak waktu
antara tes pertama dengan tes kedua sebaiknya tidak terlalu dekat juga tidak
terlalu jauh. Jika terlalu dekat, hasilnya banyak dipengaruhi oleh ingatan
siswa tentang jawaban yang diberikan pada pengukuran yang pertama. Jika terlalu
jauh, bisa terjadi adanya perubahan pengetahuan dan pengalaman siswa sehingga
mempengaruhi reliabilitasnya.
Contohnya
adalah penilaian membaca cepat artikel biografi Presiden Susilo Bambang
Yudoyono selama 200 detik pada pertemuan minggu pertama. Penilaian ini
menggunakan intrumen pertanyaan-pertanyaan berdasarkan poin-poin penting yang
terdapat dalam artikel biografi tersebut. Pada pertemuan minggu kedua, guru
dapat memberikan instrumen yang sama untuk menilai reliabilitas membaca cepat
siswa. Jika hasilnya relatif sama, maka alat penilaian tersebut ajeg
(reliabel). Jika tidak, maka terjadi kesalahan dalam alat penelitiannya.
22.
Reliabilitas pecahan setara
Mengukur bentuk
pecahan setara tidak dilakukan dengan pengulangan kepada subjek yang sama,
tetapi menggunakan hasil dari bentuk tes yang sebanding atau setara yang
diberikan kepada subjek yang sama pada waktu yang sama pula. Dengan demikian,
diperlukan dua perangkat tes yang disusun agar memiliki derajat yang setara baik
dari segi isi, tingkat kesukaran, abilitas yang diukur, jumlah pertanyaan,
bentuk pertanyaan, maupun segi teknis lainnya. Yang berbeda hanyalah
pertanyaannya.
Contoh dari
penilaian reliabilitas pecahan setara adalah penilaian dalam aspek menyimak,
yaitu menyimak cerita rakyat dari Maluku dan Aceh. Pada sesi pertama, guru
memberikan tugas pada siswa untuk menyimak cerita rakyat Maluku, kemudian guru
memberikan instrumen pertanyaan yang mencakup unsur intrinsik dan eksrinsik
cerita rakyat. Begitu pula pada sesi kedua dimana guru menugaskan siswa untuk
menyimak cerita rakyat dari Aceh. Setelah menyimak, siswa menjawab
pertanyaan-pertanyaan yang mencakup unsur intrinsik dan ekstrinsik cerita
rakyat. Bila penyusunan kesetaraan tes dapat dicapai seoptimal mungkin, maka
reliabilitasnya terpeunhi dengan baik.
33.
Reliabilitas belah dua
Reliabilitas
belah dua ini mirip dengan reliabilitas pecahan setara, terutama dalam
pelaksanannya. Dalam prosedur tes ini diberikan kepada kelompok subjek cukup
sekali. Prosedur ini digunakan apabila tes mengandung atau terdiri dari banyak
item yang realtif sukar, materi yang duji cukup komperehensif sehingga
memungkinkan penyusunan dua soal untuk satu permasalahan yang sama.
Contoh dari
penilaian reliabilias belah dua adalah penilaian dalam aspek menulis yaitu
majas. Guru memberikan instrumen pertanyaan kepada siswa sebanyak 30 pertanyaan
mengenai berbagai macam majas yang terdapat dalam Bahasa Indonesia. Setelah
selesai dikerjakan, guru membagi pertanyaan-pertanyaan tersebut menjadi dua
bagian yang sebanding. Pertanyaan-pertanyaan tersebut dapat dibagi dengn cara
membedakan soal ganjil dan genap. Kemudian guru menilai pertanyaan-pertanyaan
tersebut pada kelompok ganjil dan genap. Nilai/ skor tersebut dikorelasikan
untuk dicari koefisien korelasinya. Jika ada korelasinya, maka intrumen
tersebut dinilai reliabel.
44.
Reliabilitas persamaan rasional
Reliabilitas persamaan rasional ini dilakukan dengan
cara menghubungkan setiap butir dalam satu tes dengan butir-butir lainnya.
Tidak ada komentar:
Posting Komentar