ANALISIS
BUTIR TES
- PENDAHULUAN
Salah satu upaya dalam meningkatkan kualitas proses dan
hasil belajar sebagai bagian dari peningkatan kualitas pendidikan dapat
dilakukan melalui sistem penilaian. Dalam penilaian proses dan hasil belajar
siswa di sekolah, guru memberikan suatu evaluasi untuk mengetahui sejauh mana
penguasaan materi yang telah dikuasai oleh siswa selama proses belajar mengajar mengenai materi
yangdisampaikan.
Dalam melaksanakan kegiatan evaluasi, berhasil atau tidaknya
sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian. Untuk
melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya
adalah butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir
soal tertulis yang disediakan bagi setiap tes, atau sekurang-kurangnya pokok
pertanyaan yang sudah tertulis dan dipersiapkan sebelumnya. Bagi ujian praktek,
maka alatnya adalah lembar pengamatan yang berisi segi-segi yang diamati beserta
rentang skor masing-masing.
Idealnya sebelum suatu tes dipergunakan maka tes tersebut
harus memenuhi syarat-syarat sebagi tes yang baik, maka tes yang bersangkutan
perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut harus
memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini
dilakukan suatu analisis butir tes.
- Pembahasan
Salah satu untuk memperbaiki proses belajar-mengajar
yang paling efektif adalah dengan jalan
mengevaluasi tes hasil belajar yang diperoleh dari proses belajar-mengajar itu
sendiri. Dengan kata lain, hasil tes itu kita olah sedemikian rupa sehingga
hasil pengolahan itu dapat diketahui komponen-komponen yang manakah dari proses belajar-mengajar itu yang masih lemah.
Pengolahan
tes hasil belajar dalam rangka memperbaiki proses belajar mengajar dapat dilakukan dengan berbagi cara,
antara lain :
a. dengan
membuat analisis soal (item analysis)
b. dengan
menghitung validitas dan keadaan tes.
Menurut
Thorndike dan Hagen (1977), analisis terhadap soal-soal (items) tes yang telah
dijawan oleh murid-murid mempunyai dua tujuan penting. Pertama jawaban-jawaban
soal itu merupakan informasi diagnostic untuk meneliti pelajaran dari kelas itu
dan kegagalan-kegagalan belajarnya, sserta selanjutnya untuk membimbing ke arah
belajar yang lebih baik. Kedua, jawaban-jawaban terhadap soal-soal yang terpisah
dan perbaikan (review) soal-soal yang didasarkan atas jawaban-jawaban merupakan basis bagi penyiapan tes-tes yang
lebih baikutny utuk tahun berikutnya. Jadi tujuan khusus dari items analysis
ialah mencari soal tes mana yang baik dan mana yang tidak baik, dan mengapa
item atau soal itu dikatakan baik atau tidak baik. Dengan mengetahui soal-soal
yang tidak baik itu selanjutnya kita dapat mencari tiga hal penting yang dapat
dipereroleh dari tiap soal yaitu :
a. sampai
dimana tingkat atau taraf kesukaan soa itu( difficulty level of an item)
b. apakah
soal mempunyai daya pembeda (discriminating power) sehingga dapat membedakan
.kelompok siswa yang pandai dengan kelompok siswa yang bodoh.
c. apakah
semua alternative jawaban (options) menarik jawaban-jawaban, ataukah ada yang
demikian tidak menarik sehingga tidak perlu dimasukkan ke dalam dalam soal.
Alasan
perlunya analisis butir soal
a. Untuk
dapat mengetahui kekuatan dan kelemahan butir tes, sehingga dapat ditentukan
butir yang baik atau yang harus direvisi.
b. untuk
menyediakan informasi tentang spesifikasi butir soal secara lengkap, sehingga
akan lebih memudahkan bagi dosen dalam menyusun perangkat soal yang akan
memenuhi kebutuhan ujian dalam bidang lain dn tingkat tertentu.
c. untuk
segera diketahui masala yang terkandung dalam butir soal.
d. untuk
dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal
atau bank soal.
Analisis butir tes adalah pengkajian pertanyaan tes
agar diperoleh perangkat pertanyaan yang memiliki kualitas memadai. Analisis yang
dilakukan atas dasar uji coba dinamakan analisis empiris. Sedangkan analisis
berdasarkan karakteristik yang tampak pada tes tersebut tanpa uji coba
dinamakan analisis rasional, karena semata-mata dilakukan atas dasar
pertimbangan rasio.Untuk dapat membuat soal tes yang berkualitas dan memadai
maka berikut beberapa langkah yang dapat ditempuh sebagai berikut :
1. Menyusun
Kisi-kisi
a. Ruang lingkup dari pengetahuan yang akan
diukur sesuai dengan rencana pelajaran yang akan ditetapkan dalam kurikulum.
b. Proporsi jumlah item dari pada tiap-tiap sub
materi.
Proporsi jumlah
aitem untuk tiap-tiap sub materi hendaknya sesuai dengan proporsi dari pada
luas masing-masing sub materi. Misalnya
apabila apabila dalam suatu materi terdiri dari tiga sub dengan proporsi 25%:40
%:35% maka jumlah itemnya pun harus mengikuti proporsi 25%:40%:35 %.
c. Jenis pengetahuan atau aspek proses mental yang hendak diukur ada
beberapa klasifikasi yang dapat digunakan untuk mengolongkan jenis-jenis
pengetahuan. Salah satunya adalah pengetahuan dari Bloom yang membagi jenjang
pengetahuan menjadi enam tingkatan yaitu: Ingatan, pemahaman, Penerapan
sintesis dan evaluasi. Dalam mengadakan evaluasi hasil belajar sedapat mungkin
hendaknya diusahakan agar keenam jenjang pengetahuan tersebut kita ukur.
d. Bentuk yang akan digunakan
Bentuk tes yang digunakan
hendaknya lebih dari satu bentuk. Misalnya: pilihan ganda Dengan menjodohkan , atau essay dengan
melengkapi dan sebagainya.
2. Menulis Soal
Untuk menuliskan soal-soal/item tes
yang baik, maka kita harus berpedoman pada saran atau petunjuk penyusunan item
menurut taksonomi Bloom. Menurut Bloom ada tiga ranah dalam hasil belajar,
Yaitu Ranah Kognitif, Ranah Afektif dan Ranah Psikomotor.
3. Menata Soal
Setelah soal
yang diperlukan untuk suatu tindakan evaluasi mencukupi maka langkah
selanjudnaya adalah mengatur soal tersebut. Dalam pengaturan ini kita
kelompokan soal-soal itu menurut bentuknya bukan menurut jenis materinya dan
bukan pula menurut jenjang pengetahuan yang hendak diukur.
4. Menetapkan Skor
Setelah pengaturan soal uraian kita lakukan langkah selanjudnya adalah
menetapkan besaarnya skor yang diberikan
untuk setiap item. Beberapa skor yang akan diberikan untuk setiap
jawaban yang diberikan oleh peserta didik. Cara menskor yang banyak dilakukan
adalah memberikan skor satu ( 1 ) untuk setiap jawaban yang betul.
5. Reproduksi Tes
Setelah semua langkah tersebut diatas dilampaui, maka langkah terakhir
adalah memproduksi tes tersebut. Reproduksi ini dapat dalam bentuk ketikan
ataupun cetakan. Jumlah reproduksi kita sesuaikan dengan jumlah kebutuhan.
Ada dua jenis analisis butir soal, yakni
analisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas
dan reliabilitas.
1.
Analisis Taraf kesukaran
Asumsi
yang digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi
validitas dan realibilitas adalah adanya keseimbangan dari tingkat kesulitan
soal tersebut. Keseimbangna yang dimaksudkan adalah adanya soal yang termasuk
mudah, sedang dan sukar secara propesional. Tingkat kesukaran soal dipandang
dari kesangupan atau kemampuan siswa dalam menjawabnya. Persoalan yang penting
dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan
kriteria soal yang termasuk mudah, sedang dan sukar.
Ada
beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang, dan sukar.
Pertimbangan pertama adalah adanya
keseimbangan, yakni jumlah soal sama untuk ketiga kategori tersebut. Artinya
soal mudah, sedang dan sukar jumlahnya seimbang. Perbandingan antara soal
mudah-sedang-sukar dapat dibuat 3-4-3 artinya 30% soal kategori mudah, 40% soal
kategori sedang dan 30% lagi soal
kategori sukar misalnya, dari 60 pertanyaan pilihan ganda terdapat 18 soal
kategori mudah, 24 soal kategori sedang, dan 18 soal kategori sukar.
Persoalan
lain adalah menentukan kreteria soal, yaitu ukuran untuk menentukan apakah soal
tersebut termasuk mudah, sedang, atau sukar dalam menentukan kriteria ini
digunakan Judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu,
antara Lain :
a.
Abilitas yang
diukur dari pertanyaan tersebut. Misalnya untuk bidang kognitif aspek pengetahuan dan ingatan dan pemahaman
termasuk kategori mudah, aspek penerapan dan analisis termasuk kategori sedang,
dan aspek sintesis dan evaluasi termasuk kategori sukar.
b.
Sifat materi yang
diujikan atau ditanyakan misalnya ada fakta, konsep, prisip dan hukum, serta
generalisasi. Fakta termasuk kedalam kateori mudah , konsep dan prinsip
termasuk kedalam kategori sedang, dan generalisasi ( menarik kesimpulan )
termasuk kedalam kategori sukar.
c.
Bentuk soal misalnya dalam tes objektif, tipe soal
pilihan benar salah lebih mudah dari pada pilihan berganda obtion
tiga atau empat menjodohkan relatif lebih sulit dari pada pilihan berganda jika
terdapat lima atau lebih yang harus dipasangkan.
Setelah
judgment dilakukan oleh guru kemudian soal tersebut diujicobakan dan dianalisis apakah judgment tersebut sesuai atau tidak.
Cara melakukan analisis untuk menentukan tingkat kesukaran soal adalah dengan
mengunakan rumus sebagai berikut:
Tingkat kesulitan (difficulity index)atau kita singkat TK dapat didefinisikan sebagai
proporsi siswa peserta tes yang menjawab benar (crorcker dan
Algina,1986:311).definisi itu dapat dinyatakan dengan sebuah rumus dimana TK
adalah jumlah peserta yang menjawab benar dibagi dgn jumlah peserta.
P =
|
Np
|
N
|
Keterangan:
P
= tingkat kesukaran
Np= jumlah siswa yang menjawab benar
N
= jumlah siswa peserta tes
Misalnya: dari 10siswa yang mengikuti
uji coba ,pada butir1 terdapat 7orang dapat menjawab benar dan pada butir2
terdapat 2 orang dapat menjawab benar.berapakah tingkat kesukaran kedua butir
soal tersebut?
7
|
TK (1) = --- = 0,70.
|
10
|
2
|
TK (2) = --- = 0,20.
|
10
|
Nilai TK butir
merentang antara 0 sampai
1 TK sebuah
butir sama dengan nol terjadi bila semua peserta tidak ada yang menjawab
benar,sebaliknya Tk sebuah butir akan sama dengan 1(satu) apabila semua peserta
menjawab benar pada butir tersebut.Semakin tinggi indeks TK maka butir soal
semakin mudah.Dalam THB,TK butir-butir soal diusahakan sedang.Kalau butir soal
terlalu mudah atau terlalu sukar bagi dua atau lebih peserta maka sekor tidak
lagi dapat membedakan kemampuan para peserta sekiranya di antara mereka terdapat
perbedaan kemampuan.butir yang sangat sukar sehingga tidak ada siswa yang dapat
menjawab dengan benar menyebabkan butir tersebut kehilangan kemampuannya
membedakan siwa yang mempunyai kemampuan tinggi dan rendah.begitu pula dengan
butir yang sangat mudah sehiingga semua peserta dapat menjawab benar. Oleh
karenanya,butir sebaiknya mempunyai TK yang sedang. Kriteria untuk menentukan rentang untuk TK sedang sangat
tergantung jumlah kategori yang diinginkan. Misalnya kategori TK meliputi
sukar, sedang dan mudah maka kriteria sedang adalah antara 0,33 sampai 0,66
Berikut pembagian kategori TK ke dalam tiga kelompok:
Rentang TK
|
Kategori
|
0,00 – 0,32
|
Sukar
|
0,33 – 0,66
|
Sedang
|
0,67 – 1,00
|
Mudah
|
Namun, bila TK di klasifikasikan ke
dalam lima kelompok :sangat sukar ,sukar ,sedang ,mudah dan sangat mudah ,maka
butir soal di katakana mempunyai TK sedang bila indeks TK berada antara
0,40-0,59.secara keseluruhan pembagian rentang TK diatur sebagai berikut :
Rentang TK
|
Kategori
|
0,00 – 0,19
|
Sangat sukar
|
0,20 – 0,39
|
Sukar
|
0,40 – 0,59
|
Sedang
|
0,60 – 0,79
|
Mudah
|
0,80 – 1,00
|
Sangat mudah
|
Dalam beberapa situasi ,TK butir
soal tidak di usahakan sedang .Pada keadaan di mana diingin kan sebanyak
mungkin peserta tes dapat di nyatakan lulus maka butir di usahakan sangat mudah
,missal nya penerimaan siswa di mana diperkirakan jumlah daya tampung lebih
banyak daripada pelamar yang mendaftar .Sebalik nya,pada keadaan diinginkan
peserta tes sekecil mungkin dapat dinyatakan lulus ,maka butir soal di usahakan
sesukar mungkin.
2.
Daya beda
Daya beda (discriminating power) atau kita singkat DB adalah kemampuan butir
soal membedakan siswa yang mempunyai
kemampuan tinggi dan rendah . Daya beda berhubungan dengan derajat kemampuan
butir membedakan dengan baik perilaku pengambil tes dalam tes yang di
kembangkan (anstasi dan urbina ,1997:179). Daya beda harus di usahakan positif dan setinggi
mungkin, Butir soal yang mempunyai daya beda positif dan tinggi berarti butir tersebut dapat membedakan dengan
baik siswa kelompok atas dan bawah. Siswa kelompok atas adalah kelompok
siswa yang tergolong pandai atau mencapai skor total hasil belajar yang timggi
dan siswa kelompok bawah adalah kelompok ssiswa yang bodoh atau memperoleh
sekor total hasil belajar yang rendah .DB itu dapat di tentukan basarannya
dengan rumus sebagai
berikut:
DB = PT –
PR
Atau
DB =
|
Σ
T B Σ R B
|
Σ T
Σ R
|
Keterangan:
PT = proporsi siswa yang menjawab
benar pada kelompok siswa yang mempunyai kemampuan tinggi .
PR = proporsi siswa yang menjawab
benar pada kelompok siswa yang mempunyai kemampuan rendah.
STB = jumlah peserta yang menjawab
benar pada kelompok siswa yang mempunyai kemampuan tinggi.
ST = jumlah kelompok siswa yang
mempunyai kemampuan tinggi .
SRB = Jumlah peserta yang menjawab
benar pada kelompok siswa yang mempunyai kemampuan rendah .
SR = jumlah siswa yang mempunyai
kemampuan rendah
Atau menurut Anas Sudjono untuk
mengetahui besar kecilnya angka indek diskriminasi item yang dipergunakan
rumus:
D
= PA – PB
D
= Discriminatory power (angka indek diskriminasi item)
PA
– PH = Proposi testee kelompok atas yang dapat
menjawab dengan huruf butir item yang bersangkuatan (PH adalah
singkatan dari Probortion of the Higher Group) pA atau pH ini dapat diperoleh
dengan rumus :
PA
= 

Dimana
:
BA
= Banyaknya testee kelompok atas (the higher group) yang menjawab dengan betul
butir yang bersangkutan.
JA
= Jumlah testee yang termasuk dalam elompok atas
PB
atau PL = proporsi testee kelompok bawah yang dapat menjawab denga betul butir
item yang bersangkutan (pl adalah
singkatan dari prorpotion of the Lower Group)
PB
atau PL ini dapat diperoleh dengan rumus :
PB
= 

Dimana
:
BB = Banyak testee kelompok bawah
(the lower group) yang dapat dengan betul butir yang bersangkutan.
JB = Jumlah testee yang termasuk
dalam kelompok bawah.
Sebagai sebuah penjelasan di berikan
contoh sebagai berikut : Sebanyak 10 orang mengikuti uji coba THB
berbentuk objektif dengan hasil sebagai berikut:
Siswa
|
Butir soal
|
Jumlah
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
B
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
3
|
C
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
8
|
D
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
E
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
4
|
F
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
G
|
0
|
0
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
5
|
H
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
1
|
3
|
I
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
2
|
J
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
10
|
Perhitungan DB dapat di lakukan
dengan langkah-langkah sebagai berikut:
1. Menentukan siswa kelompok
atas dan bawah .Kelompok atas adalah setengah kelompok siswa (5 orang)yang
mamperoleh sekor terendah .penentuan kelompok atas dan kelompok bwah dapat di
sajikan dalam tabel berikut:
Kelompok atas
|
Kelompok bawah
|
||
Siswa
|
Skor
|
Siswa
|
Skor
|
A
|
10
|
B
|
3
|
C
|
8
|
E
|
4
|
D
|
9
|
G
|
5
|
F
|
9
|
H
|
3
|
J
|
10
|
I
|
2
|
2. Menghitung perolehan sekor
butir pada kelompok atas dan kelompok bawah.
Kelompok atas
|
||||||||||
Siswa
|
Butir soal
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
A
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
C
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
D
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
F
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
J
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
Jumlah
|
5
|
2
|
5
|
4
|
5
|
5
|
5
|
5
|
5
|
4
|
Kelompok bawah
|
||||||||||
Siswa
|
Butir soal
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
B
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
E
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
G
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
0
|
H
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
I
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
Jumlah
|
1
|
4
|
1
|
2
|
2
|
2
|
1
|
1
|
2
|
2
|
3. Menghitung DB
DB dihitung sebagai mana rumusnya
sebagai barikut:
a. Butir 1
DB (1) =
|
5
|
-
|
1
|
=
|
4
|
= 0,80
|
5
|
5
|
5
|
b. Butir 2
DB (2) =
|
2
|
-
|
4
|
=
|
2
|
= - 0,40
|
5
|
5
|
5
|
Sebuah butir soal yang baik adalah butir soal yang mempunyai
DB positif dan signifikan .Daya beda akan positif apabia jumlah siswa kelompok
atas yang dapat menjawab dengan benar lebih banyak dari pada jumlah siswa
kelompok bawah. Daya beda yang signifikan dimaksudkan sebagai mempunyai indexs
minimal+0,30 yang artinya pada butir yang baik jumlah siswa kelompok atas yang
dapat menjawab benar minimal30%lebih banyak dari pada jumlah siswa kelompok
bawah yang dapat menjawab benar.
Nilai DB akan merentang antara -1,00
hingga +1,00. Dengan mengambil contoh soal diatas,beberapa kondisi ekstrim
dapat di jelaskan sebagai berikut:
a. Bila semua siswa kelompok atas
dapat menjawab benar dan semua siswa kelompok bawah menjawab salah,makaDB
akan +1,00.
DB =
|
5
|
-
|
0
|
= + 1,00
|
5
|
5
|
b. Bila semua siswa kelompok atas
dapat menjawab salah dan semua siswa kelompok bawah menjawab benar,maka DB
-1,00.
DB =
|
0
|
-
|
5
|
= - 1,00
|
5
|
5
|
c. Bila baik siswa kelompok atas
maaupun kelompok bawah dpat menjawab dengan benar maka DB akan 0,00.
DB =
|
5
|
-
|
5
|
= 0,00
|
5
|
5
|
|||
|
d. Bila baik siswa kelompok atas
maupun kelompok bawah menjawab salah maka DB akan 0,00.
DB =
|
0
|
-
|
0
|
= 0,00
|
5
|
5
|
Berdasar nilai rentang DB diatas
dapat ditarik kesimpulan sebagai berikut:
a. Bila semua siswa baik
kelompok atas maupun kelompok bawah sama-sama menjawab benar atau sama-sama
menjawab salah maka butir soal tidak mempunyai kemampuan membedakan yang
ditunjukkan oleh DB=0,00.
b. Bila siwa kelompok atas
yang dapat menjawab benar lebih banyak dari pada kelompok bawah yang menjawab
benar maka DB akan positif.
c. Bila siwa kelompok atas
yang dapat menjawab benar lebih sedikit dari pada kelompok bawah yang menjawab
benar maka DB akan negative.
d. Butir soal mempunyai DB
tinggi apabila siswa kelompok atas yang dapat menjawab benar lebih banyak
dibandingkan siswa kelompok bwah yang dapat menjawab benar dengan perbandingan
tertentu hingga DB minimal +0,30.
Dalam menghitung DB terdapat
beberapa kejadian khusus yang harus diperhatikan:
a. Bila data di tengah sama maka
data yang sama di keluarkan dari analisis. Misalnya: data skor hasil belajar
enam orang siswa di urutkan dari tinggi ke rendah adalah sebagi berikut: 10, 9,
7, 7, 4 dan 2. Data skor yang sama adalah 7 dan di keluarkan dari analisis,
sehingga perhitungan DB melibatkan siswa yang memperoleh skor 10 dan 9 sebagai
kelompok atas dan siswa yang memperoleh skor 4 dan 2 sebagi kelompok bawah.
b. Dalam hal jumlah siswa uji coba
sangat banyak maka penentuan kelompok atas dan bawah adalah dengan mengambil
27% siswaa yang memperoleh skor tertinggi sebagai kelompok atas dan 27% siswa
yang memperoleh skor terendah sebagai kelompok bawah. Sebanyak 46% siswa di
tengah distribusi di keluarkan dan tidak di analisis. Perhitungan daya beda
butir di dasarkan pada “aturan 27%”. Menurut Kelly, pada kondisi normal, titik
optimum di mana dua kondisi seimbang di capai pada 27% kelompok atas dan bawah
(Anastasi dan Urbina, 1997: 182).
Perhitungan DB
butir juga dapat dilakukan dengan mengkorelasikan skor butir dengan skor total.
Korelasi butir dengan total menunjukkan kesejajaran nilai antara butir dengan
total. Bila skor butir bervariasi sejalan dengan variasi skor total maka butir
tersebut mampu membedakan dengan baik siswa yang mempunyai kemampuan tinggi dan
rendah. Butir di katakan mempunyai DB yang tinggi apabila korelasi butir itu
dengan total minimal +0,30. Adapun korelasi antara butir dengan total dapat di
lakukan menggunakan rumus product moment,
biserial, poin biserial. Phi atau tetrakorik (Crocker dan Algina, 1986:317:319).
3.
Teknik Analisis Fungsi Distraktor
(Pengecoh)
Pada tes tes obyektif bentuk
multiple choice item telah dikemukakkan bahwa pada tes objektif bentuk multiple
choice item tersebut untuk setiap butir yng dikeluarkan dalam tes hasil belajar
telah dilegkapi denga beberapa kemungkinan jawaban, atau yang sering di kenal
dengan istilah option atau alternative. Tujuan utama dari pemasangan ditraktor
pada setiap butir item itu adalah agar ari sekalian banyak testee yang
mengikuti trs hasil belajar ada yang tertarik atau bertanggung untuk
memilihnya, sebab merekab manenyangkabahwa distraktor yang mereka pilih itu
merupakan jawaban betul. Distraktor baru dapat dikatakan telah dapat
menjalankan fungsinya dengan baik, apabila distraktor tersebut telah memilki
daya rangsang atau daya tarik demikian rupa sehingga testee (khususnnya yang
termasuk dalam kategori kemampuannya rendah atau bodoh).
Menganalisis fungsi distraktor
sering dikenal dengan istilah lain yaitu menganalisis pola penyebaran jawaban
item. Adapun yang dimaksud dengan pola penyebaran jawaban item ialah suatu pola
yang dapat menggambarkan bagaimana testee menentuka pilihan jawaban terhadap
kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item.
Kriteria Untuk Menentukan Soal Yang Baik dan Tidak Baik
Untuk
menentukan apakah suatu soal dikatakan baik atau tidak baik sehingga perlu
direvisi, digunakan criteria sebagai berikut :
a. Untuk soal yang berbentuk
benar-salah (true-false)
·
Jika tingkat kesukarannya sama ayau lebih kecil dari 0,16
dikategorika soal yang sukar
·
jika tingkat kesukarannya sama atau lebih besar dari 0,84
dikategorikan soal yang mudah
b. Untuk soal pilihan ganda (multiple
choice)
·
Untuk pilihan ganda denga option 3, jika kesukarannya sama
atau lebih kecil dari 0,21 dikatergorikan soal sukar, sedangkan jika tingkat
kesukarannya sama atau lebih besar dari 0,79 dikategorikan soal yang mudah.
·
Untuk pilihan ganda denan optian 4, jika tingkat
kesukarannya sama atau lbih kecil dari 0,24 dikategorikan sola yang sukar,
sedangkan jika tingkat kesukarannya sama atau lebih besar dri 0,76
dikategorikan soal yang mudah
·
jika daya pembeda soal itu adlah 0 atau minus, maka soal itu
perlu direvisi/ diperbaiki.
·
Untuk menentukan daya pembeda suatu soal, di samping
kriteril pada c tersebut di atas dapat juga dicari dengan menggunakan tabel
koefesien biserial.
Analisis butir juga dilakukan dengan
memerhatikan pengecoh. Pengecoh (distractor)
yang juga dikenal dengan istilah penyesatatau penggoda adalah pilihan jawaban
yang bukan merupakan kunci jawaban .pengecoh bukan sekedar pelengkap pilihan, Pengecoh
diadakan untuk menyesatkan siswa agar idak mememilih kunci jawaban pengecoh
menggoda siswa yang kurang begitu memahami materi pelajaran untuk
memilihnya.Agar dapat melakukan fungsinya untuk mengecoh maka pengecoh harus
dibuat semirip mungkin dengan kunci jawaban.
Pengecoh dikatakan berfungsi efektif apabila paling tidak ada siwa yang terkecoh memilih.Pengecoh yang sama sekali tidak dipilih tidak dapat melakukan fungsinya sebagai pengecoh karena terlalu mencolok dan dimengerti oleh semua siswa sebagai penggecoh soal.Pengecoh yang berdasarkan hasil uji coba tidak efektif direkomendasikan untuk diganti dengan pengecoh yang lebih menarik.
Pengecoh dikatakan berfungsi efektif apabila paling tidak ada siwa yang terkecoh memilih.Pengecoh yang sama sekali tidak dipilih tidak dapat melakukan fungsinya sebagai pengecoh karena terlalu mencolok dan dimengerti oleh semua siswa sebagai penggecoh soal.Pengecoh yang berdasarkan hasil uji coba tidak efektif direkomendasikan untuk diganti dengan pengecoh yang lebih menarik.
Contoh pengujian karasteristik butir
Sehubungan dengan analisis butir
secara klasik dapatdiberikan contoh sebagai berikut: THB uji coba adlah 10
butir soal tes obyektif pilihan ganda dengan empat pilihan.jawaban 10 orang
siswa uji coba dilaporkan hasilnyya sebagai berikut:
Siswa
|
Butir soal
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
A
|
B
|
D
|
C
|
D
|
B
|
B
|
C
|
A
|
C
|
D
|
B
|
B
|
C
|
C
|
A
|
B
|
A
|
C
|
A
|
B
|
C
|
C
|
C
|
D
|
A
|
D
|
A
|
D
|
D
|
B
|
C
|
B
|
D
|
D
|
B
|
A
|
A
|
C
|
B
|
A
|
A
|
C
|
A
|
E
|
A
|
C
|
B
|
B
|
A
|
C
|
D
|
C
|
D
|
B
|
F
|
A
|
D
|
B
|
A
|
D
|
B
|
D
|
B
|
C
|
B
|
G
|
C
|
D
|
D
|
C
|
A
|
D
|
A
|
A
|
C
|
A
|
H
|
B
|
D
|
B
|
A
|
B
|
C
|
D
|
A
|
C
|
D
|
I
|
D
|
D
|
D
|
B
|
C
|
D
|
A
|
C
|
D
|
B
|
J
|
B
|
D
|
A
|
B
|
C
|
D
|
D
|
A
|
C
|
B
|
Kunci
|
B
|
D
|
C
|
A
|
A
|
B
|
D
|
A
|
C
|
B
|
Dari sebaran jawaban
tersebut,penghitungan skor uji coba dan analisis butir dapat diringkaskan dalam
tabel sebagai berikut:
Siswa
|
Butir soal
|
Jumlah
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
6
|
B
|
1
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
4
|
C
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
5
|
D
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
4
|
E
|
0
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
0
|
1
|
3
|
F
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
6
|
G
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
4
|
H
|
1
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
6
|
I
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
2
|
J
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
6
|
ΣB
|
4
|
7
|
2
|
4
|
3
|
3
|
5
|
6
|
7
|
5
|
|
TK
|
0,40
|
0,70
|
0,20
|
0,40
|
0,30
|
0,30
|
0,50
|
0,60
|
0,70
|
0,50
|
|
DB
|
0,40
|
0,60
|
0
|
0
|
-0,20
|
0,20
|
0,60
|
0
|
0,60
|
0,20
|
|
EP
|
E
|
TE
|
E
|
E
|
E
|
E
|
E
|
E
|
E
|
E
|
Ketrerangan:
SB = Jumlah siswa yang menjawab
benar pada butir ke-I
TK = Tingkat kesukaran
DB = Daya beda
EP = Efektivitas pengecoh
E = Efektif
TE = Tidak efektif
Bila ditetapkan kriteria untuk
memberikanpenelitian butir adalah sebagai berikut:
1. TK butir harus sedang yaitu
antara 0,33 sampai 0,66
2. DB harus tinggi yaitu
minimal +0,30
3. Pengecohh paling tidak
seorang siswa ada yang memilih.
Berdasarkan ringkasan analisis butir
pada tabel di atas dan kriteria penilaian butir yang baik maka dapat
ditarik kesimpulan:
1.Butir 3, 5 dan 6 terlalu sukar
2.Butir 3, 4, 5, 6, 8, dan 10 tidak mampu membedakan
kemampuan siswa kelompok atas dan bawah.
3.Pada butir 2 pengecoh A tidak
efektif.
Perhitungan
analisis butir itu selengkap nya dilakukan sebagai berikut:
1. Tingkat kesukaran
Misalnya TK butir 1 di hitung
sebagai berikut:
TK (1) =
|
4
|
= 0,40
|
10
|
2. Daya beda
Perhitungan DB dilakukan dengan
langkah sebagai berikut:
a.Menentukan siswa kelompok atas dan
bawah.
Kelompok atas
|
Kelompok bawah
|
||
Siswa
|
Skor
|
Siswa
|
Skor
|
A
|
6
|
B
|
4
|
C
|
5
|
D
|
4
|
F
|
6
|
E
|
3
|
H
|
6
|
G
|
4
|
J
|
6
|
I
|
2
|
b.
Menghituung
perolehan skor tiap-tiap butir pada siswa kelompok atas dan bawah.
Kelompok atas
|
||||||||||
Siswa
|
Butir soal
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
A
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
0
|
C
|
0
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
F
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
H
|
1
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
J
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
Jumlah
|
3
|
5
|
1
|
2
|
1
|
2
|
4
|
3
|
5
|
3
|
Kelompok bawah
|
||||||||||
Siswa
|
Butir soal
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
B
|
1
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
D
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
E
|
0
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
0
|
1
|
G
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
1
|
0
|
I
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
Jumlah
|
1
|
2
|
1
|
2
|
2
|
1
|
1
|
3
|
2
|
2
|
c. Menghitung DB butir.
Misalnya DB untuk butir 1 dapat dihitung
sebagai berikut:
DB (1) =
|
3
|
-
|
1
|
=
|
2
|
= 0,40
|
5
|
5
|
5
|
3. Efektivitas pengecoh
Efektivitas
pengecoh dapat dianalisis sebagaimana ditabulasikan dan sebagai contoh
dianalisis tiga butir soal sebagai berikut:
Butir
|
Kunci
|
Pemilih
|
Pengecoh
|
Pemilih
|
Efektifitas pengecoh
|
1
|
B
|
4
|
A
C
D
|
2
2
2
|
Efektif
Efektif
Efektif
|
2
|
D
|
7
|
A
B
C
|
0
1
2
|
Tidak efektif
Efektif
Efektif
|
3
|
C
|
2
|
A
B
D
|
3
3
2
|
Efektif
Efektif
Efektif
|
Dan seterusnya
|
|||||
Butir
soal yang tidak memiliki daya pembeda diduga terlalu mudah dan terlalu sukar sehingga
perlu diperbaiki atau diganti dengan pertanyaan lain Suatu alat pengukur dapat dikatakan
alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang
hendak diukur secara tepat. Penganalisaan terhadap tes hasil belajar sebagai suatu
totalitas dapat dilakukan dengan dua cara:
1.
Pengujian Validitas Tes Secara Rasional
Tes hasil belajar yang setelah
dilakukan penganalisaan secara rasional ternyata memiliki daya ketepatan
mengukur, disebut tes hasil belajar yang telah memiliki validitas logika
(logical validity).
Validitas rasional adalah: validitas yang diperoleh atas dasar
hasil pemikiran,
validitas yang diperoleh dengan berpikir secara logis.
Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas rasional ataukah belum, dapat dilakukan penelusuran dari dua segi yaitu:
Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas rasional ataukah belum, dapat dilakukan penelusuran dari dua segi yaitu:
a.
Validitas Isi (
Content Validity )
Sebuah tes dikatakan memiliki
validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isi pelajaran yang diberikan. Validitas isi ini sering juga disebut
validitas kurikuler.
Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam forum diskusi tersebut, para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi hasil belajar tersebut. Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan.
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk mene¬laah apakah konsep materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka-angka.
Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam forum diskusi tersebut, para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi hasil belajar tersebut. Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan.
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk mene¬laah apakah konsep materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka-angka.
b.
Validitas Konstruksi
( Construksi Validity )
Secara
etimologis, kata “konstruksi” mengandung arti susunan, kerangka atau rekaan.
Dengan demikian, Validitas konstruksi dapat diartikan sebagai validitas yang
ditilik dari segi susunan, kerangka atau rekaanya.
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus.
Tes hasil belajar dapat dinyatakan sebagai tes yang teh memiliki validitas konstruksi apabila tes hasil belajar tersebut (ditilik dari segi susunan, kerangka atau rekaannya) telah dapat dengan seclaara tepat mencerminkan suatu konstruksi dalam teori psikologis. Tes hasil belajar baru dapat dikatakan telah memiliki validitas susunan apabila butir-butir soal atau item yang membangun tes tersebut benar-benar telah dapat dengan secara tepat mengukur aspek-aspek berpikir (seperti: aspek kognitif, aspek efektif, aspek pdikomotorik dan sebagainya) sebagaimana telah ditentukan dalam tujuan instruksional khusus. Penganalisaan validitas konstruksi juga dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan.
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus.
Tes hasil belajar dapat dinyatakan sebagai tes yang teh memiliki validitas konstruksi apabila tes hasil belajar tersebut (ditilik dari segi susunan, kerangka atau rekaannya) telah dapat dengan seclaara tepat mencerminkan suatu konstruksi dalam teori psikologis. Tes hasil belajar baru dapat dikatakan telah memiliki validitas susunan apabila butir-butir soal atau item yang membangun tes tersebut benar-benar telah dapat dengan secara tepat mengukur aspek-aspek berpikir (seperti: aspek kognitif, aspek efektif, aspek pdikomotorik dan sebagainya) sebagaimana telah ditentukan dalam tujuan instruksional khusus. Penganalisaan validitas konstruksi juga dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan.
Contoh :
Konsep mengenai “hubungan social”, konsep sikap dapat dilihat dari indikatornya secara teoretis (deduksi teori) : dilihat dari pengalaman:
- kesediaan menerima stimulus-(bisa bergaul dengan orang lain)
- kemauan reaksi stimulus-(disenangibanyak temannya)
- menilai stimulus-(menerima pendapat orang lain)
- menyusun/mengorganisasi - (tidak memaksakan pendapat)
- internalisasi nilai - (bisa bekerjasama dengan siapapun)
Apabila hasil tes menunjukkan indicator ang tidak berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas konstruksi. Maka prlu ditinjau atau diperbaiki kembali.
Konsep mengenai “hubungan social”, konsep sikap dapat dilihat dari indikatornya secara teoretis (deduksi teori) : dilihat dari pengalaman:
- kesediaan menerima stimulus-(bisa bergaul dengan orang lain)
- kemauan reaksi stimulus-(disenangibanyak temannya)
- menilai stimulus-(menerima pendapat orang lain)
- menyusun/mengorganisasi - (tidak memaksakan pendapat)
- internalisasi nilai - (bisa bekerjasama dengan siapapun)
Apabila hasil tes menunjukkan indicator ang tidak berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas konstruksi. Maka prlu ditinjau atau diperbaiki kembali.
2. Pengujian
Validitas tes secara empirik
Dimaksud dengan validitas empirik
adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat
empiric yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan.
Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas
empirik ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari
segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan
bandingannya (concurrent validity).
a.
Validitas ramalan (Predictive validity)
Validitas
ramalan suatu tes adalah: Suatu kondisi yang menunjukan seberapa jauhkah sebuah
tes telah dapat dengan secara tepat menunjukan kemampuanya untuk meramalkan apa
yang bakal erjadi pada masa mendatang
b.
Validitas Bandingan ( Concurrnt Validity )
Validitas
bandingan juga sering dikenal dengan istilah: validitas sama saat, validitas
pengalaman atau validitas ada sekarang.
c.
Kesimpulan
Analisis butir soal bertujuan untuk memperoleh kualitas soal
yang baik sehingga dapat memperoleh gambaran tentang prestasi siswa yang sebenarnya.Ada
beberapa cara melalukan analisis butir soal: untuk dapat membedakan soal
kategori mudah, sedang dan sukar
v Analisis tingkat kesukaran soal mengkaji
apakah soal Analisis daya pembeda
mempunyai kemampuan dalam membedakan siswa termasuk kategori mempunyai
kemampuan tinggi atau rendah. mengkaji kesahihan alat ukur (soal) dalam menilai
v Daya beda
(discriminating power) adalah kemampuan butir soal untuk membedakan
siswa yang mempunyai kemampuan tinggi dan rendah.
v Pengecoh (distractor) adalah pilihan jawaban yang bukan merupakan
kunci jawaban
v Analisis validitas apa yang seharusnya diukur atau mengkaji
ketepatan soal sebagai alat ukur. mengkaji keajegan atau ketetapan hasil tes
v Analisis reliabilitas manakala tes tersebut diujikan kepada siswa
yang sama lebih dari satu kali.
Referensi
Iriato,
Agus. 2010. STATISTIK. Konsep Dasar dan Aplikasinya. Kencana
Prenada
Media Group. Jakarta
Sudijono Anas, 2009 Pengantar Evaluasi Pendidikan. PT
Raja Grafindo persada Jakarta
Sudjana,
Nana. 1991. Penilaian Hasil Proses Belajar Mengajar. Cetakan III.
Bandung:Rosdakarya.
Zainul,
Asmawi. 2001. Penilaian Hasil Belajar. Jakarta
Tidak ada komentar:
Posting Komentar