FORMAT PENELAAHAN BUTIR
SOAL BENTUK URAIAN, PILIHAN GANDA, INSTRUMEN PERBUATAN DAN INSTRUMEN NON-TES
A.
Analisis Butir Soal Secara Kualitatif
dan Kuantitatif
Menurut Kamus Besar
Bahasa Indonesia (2002) analisis adalah penguraian suatu pokok atas berbagai
bagiannya dan penelaahan bagian itu sendiri serta hubungan antar bagian untuk
memperoleh pengertian yang tepat dan pemahaman arti keseluruhan.Analisis butir
soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap
empirik. Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah
dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita peroleh.
Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat
kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang
dihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut.
Identifikasi terhadap
setiap butir item soal dilakukan dengan harapan akan menghasilkan berbagai
informasi berharga, yang pada dasarnya akan merupakan umpan balik (feed back)
guna melakukan perbaikan, pembenahan, dan penyempurnaan kembali terhadap
butir-butir soal, sehingga pada masa-masa yang akan yang akan dating tes hasil
belajar yang disusun atau dirancang oleh guru itu betul-betul dapat menjalankan
fungsinya sebagai alat pengukur hasil belajar yang memiliki kualitas yang
tinggi.
Aiken dalam Suprananto
(2012) berpendapat bahwa kegiatan analisis butir soal merupakan kegiatan
penting dalam penyusunan soal agar diperoleh butir soal yang bermutu. Tujuan
kegiatan ini adalah:
1. Mengkaji
dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum
digunakan,
2. meningkatkan
kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
3. mengetahui
informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah
diajarkan.
Soal yang bermutu
adalah soal yang dapat memberikan informasi setepat-tepatnya tentang siswa mana
yang telah menguasai materi dan siswa mana yang belum menguasai materi.
Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012),
analisis butir soal dapat dilakukan secara kualitatif (berkaitan dengan isi dan
bentuknya) dan kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis
kualitatif mencakup pertimbangan validitas isi dan konstruksi, sedangkan
analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir soal,
kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing
memiliki keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah
menggunakan atau memadukan keduanya.
Pada prinsipnya analisis
butir soal secara kualitatif dilaksanakan berdasarkan kaida penulisan
soal (tes tertulis, perbuatan, dan sikap). Penelaahan
ini biasanya dilakukan sebelum soal digunakan atau diujikan. Aspek yang
diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal
ditelaah dari segi materi, konstruksi, bahasa atau budaya, dan kunci jawaban
atau pedoman penskorannya. Dalam menganalisis butir soal, terdapat dua teknik.
Yaitu teknik kualitatifdan teknik kuantitatif.
1.Teknik Analisis Secara Kualitatif
Ada beberapa teknik yang dapat digunakan
untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik
moderator dan teknik panel.
a.
Teknik moderator
Teknik moderator merupakan
teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah.
Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama
dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi,
penyusun atau pengembangkurikulum, ahli penilaian, ahli bahasa, berlatar
belakang psikologi.Teknik ini sangat baik karena setiap butir soal dilihat
secara bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para
penelaah dipersilakan mengomentari berdasarkan kompetensinya masing-masing. Setiap
komentar atau masukan dari peserta diskusi dicatat. Setiap butir soa ldapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan
teknik ini memiliki kelemahan karena memerlukan waktu lama untuk rnendiskusikan
setiap satu butir soal.Teknik berikutnya adalah
b.
Teknik Panel
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir
soalnya ditelaah berdasarkan kaidah penulisan butir soal, yaitu
ditelaah dari segi materi, konstruksi, bahasa/budaya, kebenaran kunci
jawaban/pedoman penskorannya yang dilakukan oleh beberapa penelaah. Caranya adalah
beberapa penelaah diberikan: butir-butir soal
yang akan ditelaah, format penelaahan, dan pedoman
penilaian/ penelaahannya. Pada tahap awal para penelaah diberikan pengarahan,
kemudian tahap berikutnya
para penelaah berkerja sendiri-sendiri di tempat yang tidak sama. Penalaah dipersilakan memperbaiki langsung pada
teks soal dan memberikan nilai pada setiap butir soalnya yang kriterianya
adalah : baik, diperbaiki, atau di ganti. Secara ideal penelaah
butiran soal di samping memiliki latar belakang materi yang diujikan, beberapa
penelaah yang diminta untuk menelaah butir soal memiliki ketrampilan, seperti
guru yang mengajarkan materi itu, ahli materi, ahli pengembang kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli kebijakan pendidikan, atau lainnya.
2.
Analisis
Butir Soal Secara Kuantitatif
Penelaahan soal secara
kuantitatif adalah penelaahan butir soal didasarkan pada bukti empirik. Salah
satu tujuan utama pengujian butir-butir soal secara emperik adalah untuk
mengetahui sejauh mana masing-masing butir soal membedakan antara mereka yang
tinggi kemampuannya dalam hal yang didefinisikan oleh kriteria dari mereka yang
rendah kemampuannya.
Data empirik ini diperoleh dari soal
yang telah diujikan. Ada dua pendekatan dalam analisis secara kuantitatif yaitu
pendekatan secara klasik dan modern.
a. Analisis butir soal secara klasik
Analisa
butir soal secara klasik adalah proses penelaahan butir soal melalui informasi
dari jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan
dengan menggunakan teori tes klasik. Pada teori tes klasik, analisis item tes
dilakukan dengan memperhitungkan kedudukan item dalam suatu kelas atau
kelompok. Karakteristik atau kualitas item sangat tergantung pada kelompok
dimana diujicobakan sehingga kualitas item terikat pada sampel responden atau
peserta tes yang memberikan respons (sample bounded).
Ada beberapa kelebihan
analisis butir soal secara klasik adalah murah, sederhana, familiar, dapat
dilaksanakan sehari-hari dengan cepat menggunakan komputer dan dapat
menggunakan beberapa data dari peserta tes.
b. Analisis butir soal secara moderen
Analisa
butir soal secara moderen adalah penelaahan butir soal dengan menggunakan teori
respon butir atau item response theory. Teori ini merupakan suatu teori
yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab
benar suatu butir dengan kemampuan siswa.
Teori ini muncul karena adanya beberapa
keterbatasan pada analisis secara klasik, yaitu:
1)
Tingkat kemampuan dalam teori klasik
adalah true score. Artinya, jika suatu tes sulit maka tingkat
kemampuan peserta tes akan rendah. sebaliknya, jika suatu tes mudah maka
tingkat kemampuan peserta tes tinggi.
2)
Tingkat kesukaran butir soal
didefinisikan sebagai proporsi peserta tes yang menjawab benar. Mudah atau
sulitnya butir soal tergantung pada kemampuan peserta tes. Daya pembeda,
reliabilitas, dan validitas tes tergantung pada kondisi peserta tes.
A.
Analisis Butir Soal
Pedoman penskoran.
Caranya beberapa penelaah diberikan butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian atau penelaahan. Pada tahap
awal, semua orang yang terlibat dalam kegiatan penelaahan disamakan
persepsinya, kemudian mereka terlibat berkerja sendiri-sendiri
di tempat berbeda. Para penelaah dipersilakan memperbaiki langsung pada teks
soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soal
dengan kriteria: soal baik, perlu diperbaiki, atau diganti.Dalam menganalisis
butir soal secara kualitatif, penggunaan format penelaahan soal akan sangat membantu dan mempermudah
prosedur pelaksanaannya. Format penelaahan soal digunaka sebagai dasar untuk menganalisis setiap butir
soal. Format penelaahan soal yang dimaksud adalah format penelaahan butir soal:
uraian, pilihan ganda, tes perbuatan dan instrumen non-tes. Berikut disajikan
keempat format penelaahan butir soal.
a.
Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN SOAL BENTUK
URAIAN
Mata pelajaran :
Kelas/semester :
Penelaah :
No.
|
Aspek yang ditelaah
|
NomorSoal
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
...
|
A.
1
2
3
4
B
5
6
7
8
|
Materi
Soal sesuai
dengan indikator(menuntut tes tertulis untuk bentuk Uraian)
Batasan pertanyaandan jawaban yang diharapkan sudah sesuai
Materi yang
ditanyakan sesuai dengan kompetensi (urgensi,
relevasi, kontinyuitas, keterpakaian sehari-
hari tinggi)
Isi materi
yang ditanyakan sesuai dengan
jenjang jenis sekolah
atau tingkatkelas
Konstruksi
Menggunakan kata
tanya atau perintah yang
menuntut jawaban uraian
Ada petunjukyang jelas tentangcara mengerjakan soal
Ada pedoman penskorannya
Tabel, gambar, grafik, peta,atau yang sejenisnya disajikan dengan jelas dan terbaca
|
|
|
|
|
|
|
|
|
|
|
No.
|
Aspek yang ditelaah
|
NomorSoal
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
...
|
C.
9
10
11
12
13
|
Bahasa/Budaya
Rumusan
kalimat coal komunikatif
Butir soal
menggunakan bahasa
Indonesia
yang baku
Tidak
menggunakan kata/ungkapan yang
menimbulkan penafsiran ganda atau salah pengertian
Tidak
menggunakan bahasa yang berlaku setempat/tabu
Rumusan
soal tidak mengandung
|
|
|
|
|
|
|
|
|
|
|
Keterangan : Berilah tanda
(V)
bila tidak sesuai dengan aspek yang ditelaah !
b.
Format Penelaahan untuk Instrumen pilihan ganda
FORMAT PENELAAHAN SOAL BENTUK PILIHAN GANDA
Mata Pelajaran
:.................................
Kelas/semester:.................................
Penelaah:.................................
No.
|
Aspek yang ditelaah
|
Nomor Soal
|
1
|
2
|
3
|
4
|
5
|
...
|
A.
1
2.
3.
4.
B.
5.
6.
7.
8
9.
10.
11.
12.
13.
14.
|
Materi
Soal
sesuai dengan indikator (menuntuttes tertulis untuk bentuk
pilihan ganda
Materi
yang ditanyakan sesuai dengan kompetensi
(urgensi,relevasi,
kontinyuitas, keterpakaian sehari- hari tinggi)
Pilihan jawaban homogen dan logis
Hanya ada
satu kunci jawaban
Konstruksi
Pokok soal dirumuskan dengan singkat,jelas,dan tegas
Rumusan pokok
soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja
Pokok soal
tidak memberi petunjuk kunci jawaban
Pokok soal
bebas dan pernyataan yang
bersifat negatif ganda
Pilihan jawaban homogen dan logis ditinjau dari segi materi
Gambar, grafik, tabel, diagram, atau sejenisnya
jelas dan
berfungsi
Panjang pilihan
jawaban relatif sama
Pilihan jawaban tidak menggunakan pernyataan
"semua jawaban di atas salah/benar"dan
sejenisnya
Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan
urutan besar kecilnya angka atau kronologisnya
Butir soal
tidak bergantung pada jawaban soal sebelumnya
|
|
|
|
|
|
|
C.
15.
16.
17.
18.
|
Bahasa/Budaya
Menggunakan
bahasa yang sesuai dengankaidah
bahasa Indonesia
Menggunakan
bahasa yang komunikatif
Tidak menggunakan
bahasa yang
berlakusetempat/tabu
Pilihan jawaban tidak mengulang kata/kelompok kata yang sama,kecuali merupakan satu kesatuan pengertian
|
|
|
|
|
|
|
Keterangan:
Berilah tanda (V) bila
tidak
sesuai dengan
aspek
yang ditelaah!
c. Format Penelaahan untuk Instrumen Perbuatan
FORMAT PENELAAHAN SOAL TES PERBUATAN
Mata Pelajaran:.................................
Kelas/semester: .................................
Penelaah :.................................
No.
|
Aspek yang ditelaah
|
Nomor Soal
|
1
|
2
|
3
|
...
|
.
1.
2.
3.
4.
B.
5.
6.
7.
8.
C.
9.
10.
11.
12.
13.
|
Materi
Soal sudah sesuai
dengan indikator (menuntut tes perbuatan: kinerja, hasil karya, atau penugasan)
Pertanyaan dan
jawaban yang diharapkan
sudah sesuai
Materi sesuai dengan tuntutan kompetensi (urgensi, relevansi, kontinyuitas, keterpakaian sehari-hari tinggi) Isi materi yang ditanyakan sesuai
dengan jenjang jenis sekolah taua tingkat kelas
Konstruksi
Menggunakan kata tanya atau perintah yang menuntut jawaban perbuatan/praktik
Ada petunjuk yang
jelas tentang cara mengejakan soal
Ada pedoman penskorannya
Tabel, peta, gambar,
grafik, atau sejenisnya disajkian dengan jelas
dan terbaca
Bahasa/Budaya
Rumussan soal komunikatif
Butir soal
menggunakan bahasa Indonesia
yang baku Tidak menggunakan kata /ungkapan yang menimbulkan
penafsiran ganda atau salah pengertian
Tidak menggunakan bahasa yang berlaku
setempat/tabu
Rumusan soal tidak mengandung kata/ungkatpan yang dapat menyinggung perasaan siswa
|
|
|
|
|
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
d. Format Penelaahan untuk Instrumen Non-Tes
FORMAT PENELAAHAN SOAL NON-TES
Nama Tes :.................................
Kelas/semester: .................................
Penelaah :.................................
No.
|
Aspek yang ditelaah
|
Nomor Soal
|
1
|
2
|
3
|
...
|
A.
1.
2.
B.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
C.
13.
14.
15.
|
Materi
Pernyataan/soal sudah
sesuai dengan rumusan indikator dalam kisi-kisi.
Aspek yang
diukur pada setiap pernyataan sudah sesuai
dengan tuntutan dalam kisi-kisi (misal untuk tes sikap:
aspek koginisi,
afeksi, atau konasinya dan pernyataan positif
atau negatifnya).
Konstruksi
Pernyataan dirumuskan dengan
singkat (tidak melebihi 20 kata ) dan jelas.
Kalimatnya bebas dari pernyaatn yang tidak relevan objek yang dipersoalkan atau kalimatnya merupakan
pernyataan yang diperlukan
saja.
Kalimatnya bebas dari pernyataan yang bersifat negatif
ganda.
Kalimatnya bebas dari pernyataan yang
mengacu pada masa lalu.
Kalimatnya bebas dari pernyataan faktual atau dapat diinterpretasikan sebagai fakta.
Kalimatnya bebas dari pernyataan dapat
diinterpretasikan lebih
Kalimatnya bebas dari pernyataan yang mungkin disetujui atau dikosongkan
oleh hampir semua responden.
Setiap pernyataan
hanya berisi satu gagasan
secara lengkap.
Kalimatnya bebas dari pernyatan
yang tidak pasti pasti seperti semua,
selalu, kadang-kadang, tidak satupun, tidak pernah.
Jangan banyak menggunakan kata hanya, sekedar, semata-mata gunakan seperlunya.
Bahasa/Budaya
Bahsa soa harus komunikatif dan sesuai dengan jenjang pendidikan siswa atau responden.
Soal harus
menggunakan bahasa Indonesia baku. Soal tidak menggunakan
bahasa yang berlaku
setempat/tabu.
|
|
|
|
|
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
B.
Parameter
Item Tes yang Baik
Sebagaimana telah
disebut sebelumnya, bahwa item tes yang baik adalah item yang memenuhi syarat
sebagaimana kriteria atau karakteristik item tes yang baik. Karakteristik item
yang dimaksud adalah tingkat kesulitan atau kesukaran, daya pembeda, dan
efektivitas pengecoh.
1. Tingkat Kesulitan atau Kesukaran (Difficulty level)
Tingkat kesukaran soal
adalah peluang menjawab benar suatu soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks. Tingkat kesukaran dinyatakan dalam
indeks kesukaran (dificulty index), yaitu angka yang menunjukkan
proporsi siswa yang menjawab benar soal tersebut. Semakin besar indeks tingkat
kesukaran yang diperoleh dan hasil hitungan, berarti semakin mudah soal itu.
Dalam hal ini, item
yang baik adalah item yang tingkat kesukarannya dapat diketahui, tidak
terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item itu
memiliki korelasi dengan daya pembeda. Bilamana item memiliki tingkat kesukaran
yang maksimal, maka daya pembedanya akan rendah, demikian pula bila item itu
terlalu mudah maka tidak akan memiliki daya pembeda.
Oleh karena itu,
sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas yang mampu
memberikan daya pembeda. Namun, jika terdapat tujuan khusus dalam penyusunan
tes, maka tingkat kesukaran itu bisa dipertimbangkan. Misalnya, tingkat
kesukaran item untuk tes sumatif berbeda dengan tingkat kesukaran pada tes
diagnostik.
Untuk menghitung taraf kesukaran soal
dari suatu tes dipergunakan rumus sebagai berikut:
TK
= U + L
T
Keterangan:
U = jumlah siswa yang termasuk kelompok
pandai (upper group)yang menjawab benar untuk tiap soal.
L = jumlah siswa yang
termasuk kurang (lower group) yang menjawab benar untuk tiap soal.
T = jumlah siswa dari kelompok
pandai dan kelompok kurang(jumlah upper group dan lower group)
Misalkan suatu tes yang
terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil tes tersebut,
tiap-tiap soal dianalisis taraf kesukarannya. mula-mula hasil tes itu kita
susun kedalam peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa
kelompok pandai), dan 10 lembar jawaban siswa dari kelompok yang kurang pandai.
Kemudian kita tabulasikan. Misalkan dari tabulasi soal kita peroleh hasil
sebagai berikut: yang menjawab benar dari kelompok pandai ada 9 siswa, dan yang
menjawab benar dari kelompok kurang pandai ada 4 siswa.
Dengan menggunakan rumus diatas, maka
taraf kesukaran atau TK dari soal adalah:
TK
= U + L = 9 + 4 = 0,65 atau
65%
T
20
Jadi dapat disimpilkan bahwa nilai dari
TK atau tingkat kesukarannya adalah 65%.
Sedangkan dalam bukunya Drs. H.
Daryanto, rumus untuk mencari taraf kesukaran atau indeks kesukaran adalah:
P
= B
JS
Keterangan:
P =
indeks kesukaran.
B =
banyaknya siswa yang menjawab soal itu dengan benar.
JS
= jumlah seluruh siswa peserta tes.
Contoh:
Jumlah siswa peserta tes dalam suatu
kelas ada 40 siswa. Dari 40 siswa tersebut terdapat 12 siswa yang mampu
mengerjakan soal no. 1 dengan benar. Maka berapa indeks kesukarannya?
Jawab:
P
= B
JS
= 12
40
= 0,30
Menurut ketentuan yang sering diikuti,
indeks kesukaran sering diklasifikasikan sebagai berikut:
a. Soal
dengan P 0,00 sampai 0,30 adalah soal sukar.
b. Soal
dengan P 0,30 sampai 0,70 adalah soal sedang.
c. Soal
dengan P 0,70 sampai 1,00 adalah soal mudah.
2. Daya
Pembeda
Perhitungan daya
pembeda adalah pengukuran sejauh mana suatu butir soal mampu membedakan peserta
didik yang sudah menguasai kompetensi dengan peserta didik yang belum atau
kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi
koofisien daya pembeda suatu butir soal, semakin mampu butir soal tersebut
membedakan antara peerta didik yang menguasai kompetensi dengan pesertan didik
yang kurang menguasai kompetensi.
Angka yang menunjukkan besarnya daya
pembeda disebut indeks diskriminasi. Daya pembeda suatu soal tes dapat dihitung
dengan menggunakan rumus sebagai berikut:
DP
= U – L
½
T
Keterangan:
DP
= indeks DP atau daya
pembeda yang dicari.
U = jumlah
siswa yang termasuk dalam kelompok pandai yang mampu
menjawab
benar untuk tiap soal.
L
= jumlah siswa yang termasuk kurang yang
menjawab benar untuk tiap soal.
T
=
jumlah siswa keseluruhan.
Contoh:
Dari hasil tes lomba olimpiade IPS,
jumlah siswa yang dites adalah 40 siswa, sedangkan tes tersebut terdiri dari 20
soal. Setelah hasil tes tersebut diperiksa, kemudian disusun kedalam peringkat
untuk menentukan 25% siswa yang termasuk kelompok pandai (upper
group) dan 25% siswa yang termasuk kelompok kurang (lower group).
Kemudian hasil tes tersebut
ditabulasikan dengan menggunakan format tabulasi jawaban tes, kemudian hasil
tabulasi dari kedua kelompok tersebut dimasukkan kedalam format analisis soal
tes, sehingga kita dapat menghitung tingkat kesukaran dan daya pembeda tiap
soal yang kita analisis.
Misalkan dari tabulasi soal no. 1 kita
peroleh hasil sebagai berikut: yang menjawab benar dari kelompok pandai ada 10
siswa, dan yang menjawab benar dari kelompok kurang ada 9 siswa. Maka daya
pembedanya adalah:
DP
= U – L
½ T
= 10 – 9
½ x (20)
= 1
10
= 0,10
Jadi dapat disimpulkan bahwa indeks
pembedanya adalah 0,10.
Dalam bukunya Prof. Dr. Suharsimi
Arikunto, dijelaskan mengenai klasifikasi daya pembeda, yaitu:
D = 0,00 – 0,20
= jelek (poor).
D = 0,20 –
0,40 = cukup (satisfactory).
D = 0,40 –
0,70 = baik (good).
D = 0,70 –
1,00 = baik sekali (excellent).
3.
Analisis
pengecoh (Efektifitas Distraktor )
Instrumen evaluasi yang berbentuk tes
dan objektif, selain harus memenuhi syarat-syarat yang telah disebutkan
terdahulu, harus mempunyai distraktor yang efektif. Yang disebut dengan
distraktor atau pengecoh adalah opsi-opsi yang bukan merupakan kunci jawaban
(jawaban benar).
Butir soal yang baik pengecohnya akan
dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir
soal yang kurang baik, pengecohnya akan dipilih secara tidak merata. Pengecoh
dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau
mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus:
IP = P
x 100%
(N - B) (n - 1)
Keterangan:
IP =
indeks pengecoh
P
= jumlah peserta didik yang memilih pengecoh
N =
jumlah peserta didik yang ikut tes
B =
jumlah peserta didik yang menjawab benar pada setiap soal
n
= jumlah alternatif jawaban
1=
bilangan tetap
Catatan:
Jika semua peserta didik menjawab benar
pada butir soal tertentu (sesuai kunci jawaban), maka IP = 0 yang berarti soal
tersebut jelek. Dengan demikian pengecoh tidak berfungsi.
Contoh:
50 orang peserta didik dites dengan 10
soal bentuk pilihan ganda. Tiap soal memiliki alternatif jawaban (a, b, c, d,
e). Kunci jawaban (jawaban yang benar) no. 8 adalah c. Setelah soal no.8
diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta didik, 20
peserta didik menjawab benar dan 30 peserta didik menjawab salah. Idealnya,
pengecoh dipilih secara merata.
Berikut ini adalah contoh soal no.8.
Alternatif jawaban
|
A
|
B
|
C
|
D
|
E
|
Distribusi jawaban peserta didik
|
7
|
8
|
20
|
7
|
8
|
IP
|
93%
|
107%
|
**
|
93%
|
107%
|
Kualitas pengecoh
|
++
|
++
|
++
|
++
|
++
|
Keterangan:
** =
kunci jawaban
++ =
sangat baik
+
= baik
=
kurang baik
_
= jelek
_ _
= sangat jelek
Pada contoh diatas, IP butir a, b, c, d,
dan e adalah 93%, 107%, 93%, dan 107%. Semuanya dekat dengan angka 100%,
sehingga digolongkan sangat baik sebab semua pengecoh itu berfungsi. Jika
pilihan jawaban peserta didik menumpuk pada satu alternatif jawaban, misalnya
seperti berikut:
Alternatif jawaban
|
A
|
B
|
C
|
D
|
E
|
Distribusi jawaban peserta didik
|
20
|
2
|
20
|
8
|
0
|
IP
|
267%
|
27%
|
**
|
107%
|
0%
|
Kualitas pengecoh
|
_
|
-
|
**
|
++
|
_
|
Dengan demikian, dapat ditafsirkan
pengecoh (d) yang terbaik, pengecoh (e) dan (b) tidak berfungsi, pengecoh (a)
menyesatkan, maka pengecoh (a) dan (e) perlu diganti karena termasuk jelek,
danpengecoh (b) perlu direvisikarena kurang baik. adapun kualitas pengecoh
berdasar indeks pengecoh adalah:
1)
Sangat baik IP
= 76% - 125%
2)
Baik
IP = 51% - 75% atau 126% - 150%
3)
Kurang baik IP =
26% - 50% atau 151% - 175%
4)
Jelek
IP = 0% - 25% atau 176% - 200%
5)
Sangat jelek IP
= lebih dari 200%
D. Manfaat
Kegiatan Menganalisis Butir Soal
Berdasarkan pendapat yang diungkapkan
oleh Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal
memiliki banyak manfaat, diantaranya yakni:
1)
Membantu pengguna tes dalam mengevaluasi
kualitas tes yang digunakan.
2)
Relevan bagi penyusunan tes informal
seperti tes yang disiapkan guru untuk siswa dikelas.
3)
Mendukung penulisan butir soal yang
efektif.
4)
Secara materi dapat memperbaiki tes di
kelas.
5)
Meningkatkan validitas soal dan
reliabilitas.
Linn dan
Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa pelaksanaan
kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan
berikut:
1)
Apakah fungsi soal sudah tepat?
2)
Apakah soal telah memiliki tingkat
kesukaran yang tepat?
3)
Apakah soal bebas dari hal-hal yang
tidak relevan?
4)
Apakah pilihan jawabannya efektif?
Selain itu, data hasil analisis butir
soal juga sangat bermanfaat sebagai dasar untuk:
1)
Diskusi tentang efisien hasil tes,
2)
Kerja remedial
3)
Peningkatan secara umum pembelajaran di
kelas,
4)
Peningkatan keterampilan pada kontruksi
tes.
Berdasarkan uraian di atas menunjukkan
bahwa analisis butir soal memberikan manfaat:
1)
Menentukan soal-soal yang cacat atau
tidak berfungsi dengan baik,
2)
Meningkatkan butir soal melalui tiga
komponen analisis yaitu, tingkat kesukaran, daya pembeda dan pengecoh soal,
3)
Merevisi soal yang tidak relevan degan
materi yang diajarkan, ditandai dengan banyaknya anak yang tidak dapat menjawab
butir soal tertentu.
E.
Kriteria Kualitas Butir Soal
Berdasarkan uraian di
atas, menurut pandangan teori tes klasik secara empiris mutu butir soal
ditentukan oleh statistik butir soal yang meliputi : tingkat kesukaran, daya
beda dan efektifitas distraktor. Menurut statistik butir, kualitas butir soal
secara keseluruhan dapat dikategorikan
sebagai berikut :
Klasifikasi Kualitas Butir Soal
Kategori Kriteria Penilaian
Baik Apabila
(1). Tingkat kesukaran 0,25 ≤ p ≤ 0,75.
(2). Korelasi biserial butir soal ≥ 0,40
dan
(3). Korelasi biserial alternatif
jawaban (distraktor) bernialai negatif.
Revisi Apabila
(1). Tingkat kesukaran p < 0,25 atau p > 0,75
tetapi korelasi biserial butir ≥ 0,40 dan korelasi biserial distraktor bernilai
negatif.
(2). Tingkat kesukaran 0,25 ≤ p ≤ 0,75 dan korelasi
biserial butir soal ≥ 0,40 tetapi ada korelasi biserial pada distraktor yang
bernilai positif
(3). Tingkat
kesukaran 0,25 ≤ p ≤ 0,75 dan korelasi biserial butir soal antara 0,20 sampai 0,30
tetapi korelasi distraktor bernilai negatif selain kunci atau tidak ada yang
lebih besar nilainya dari kunci jawaban.
Tidak baik Apabila
(1). Tingkat kesukaran p < 0,25 atau p > 0,75
dan ada korelasi biserial pada distraktor bernilai positif
(2). Korelasi
biserial butir soal < 0,20, (3). Korelasi biserial butir soal < 0,30 dan
korelasi biserial distraktor bernilai positif.10
F
. Reliabilitas
Reliabilitas adalah suatu hal yang
sangat penting pada alat pengukuran standar. Reliabilitas dihubungkan dengan
pengertian adanya ketepatan tes dalam pengukurannya. Reliabilitas adalah
kestabilan skor yang diperoleh peserta tes yang sama ketika diuji ulang dengan
tes yang sama pada situasi yang berbeda atau dari suatu pengukuran ke
pengukuran lainnya. Dengan kata lain reliabilitas merupakan tingkat konsistensi
atau kemantapan hasil terhadap hasil dua pengukuran hal yang sama. Dapat juga
diartikan sebagai tingkat kepercayaan dari
suatu alat ukur (Depdikbud : 1997). Hasil
pengukuran diharapkan akan sama apabila pengukuran itu diulangi. Dengan
perangkat tes yang reliabel, apabila tes itu diberikan dua kali pada peserta
yang sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada perubahan
dalam kemampuan maka skor yang diperoleh akan konstan. Kriteria untuk menentukan
tinggi rendahnya reliabilitas sebuah perangkat tes, menurut (Suharsimi Arikunto
: 2001) dilihat pada rentangan koefesien
korelasi sebagai berikut :
Klasifikasi Tingkat Reliabilitas Tes
Kategori Reliabilitas Tes Nilai
Koefesien Korelasi
1)
Sangat Tinggi 0,800 –
1,000
2)
Tinggi 0,600 –
0,799
3)
Cukup 0,400 –
0,599
4)
Rendah 0,200 –
0,399
5)
Sangat Rendah 0,000 –
0,199
Comments
Post a Comment