Sabtu, 06 Desember 2014

Evaluasi

ANALISIS BUTIR TES
                    
  1. PENDAHULUAN

Salah satu upaya dalam meningkatkan kualitas proses dan hasil belajar sebagai bagian dari peningkatan kualitas pendidikan dapat dilakukan melalui sistem penilaian. Dalam penilaian proses dan hasil belajar siswa di sekolah, guru memberikan suatu evaluasi untuk mengetahui sejauh mana penguasaan materi yang telah dikuasai oleh siswa selama proses  belajar  mengajar mengenai materi yangdisampaikan.
Dalam melaksanakan kegiatan evaluasi, berhasil atau tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian. Untuk melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya adalah butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir soal tertulis yang disediakan bagi setiap tes, atau sekurang-kurangnya pokok pertanyaan yang sudah tertulis dan dipersiapkan sebelumnya. Bagi ujian praktek, maka alatnya adalah lembar pengamatan yang berisi segi-segi yang diamati beserta rentang skor masing-masing.
Idealnya sebelum suatu tes dipergunakan maka tes tersebut harus memenuhi syarat-syarat sebagi tes yang baik, maka tes yang bersangkutan perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut harus memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan suatu analisis butir tes.









  1. Pembahasan

Salah satu untuk memperbaiki proses belajar-mengajar yang  paling efektif adalah dengan jalan mengevaluasi tes hasil belajar yang diperoleh dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes itu kita olah sedemikian rupa sehingga hasil pengolahan itu dapat diketahui komponen-komponen yang manakah dari  proses belajar-mengajar itu yang masih lemah.
Pengolahan tes hasil belajar dalam rangka memperbaiki proses belajar  mengajar dapat dilakukan dengan berbagi cara, antara lain :
a.       dengan membuat analisis soal (item analysis)
b.      dengan menghitung validitas dan keadaan tes.
Menurut Thorndike dan Hagen (1977), analisis terhadap soal-soal (items) tes yang telah dijawan oleh murid-murid mempunyai dua tujuan penting. Pertama jawaban-jawaban soal itu merupakan informasi diagnostic untuk meneliti pelajaran dari kelas itu dan kegagalan-kegagalan belajarnya, sserta selanjutnya untuk membimbing ke arah belajar yang lebih baik. Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan perbaikan (review) soal-soal yang didasarkan atas jawaban-jawaban  merupakan basis bagi penyiapan tes-tes yang lebih baikutny utuk tahun berikutnya. Jadi tujuan khusus dari items analysis ialah mencari soal tes mana yang baik dan mana yang tidak baik, dan mengapa item atau soal itu dikatakan baik atau tidak baik. Dengan mengetahui soal-soal yang tidak baik itu selanjutnya kita dapat mencari tiga hal penting yang dapat dipereroleh dari tiap soal yaitu :
a.       sampai dimana tingkat atau taraf kesukaan soa itu( difficulty level of an item)
b.      apakah soal mempunyai daya pembeda (discriminating power) sehingga dapat membedakan .kelompok siswa yang pandai dengan kelompok siswa yang bodoh.
c.       apakah semua alternative jawaban (options) menarik jawaban-jawaban, ataukah ada yang demikian tidak menarik sehingga tidak perlu dimasukkan ke dalam dalam soal.

Alasan perlunya analisis butir soal
a.       Untuk dapat mengetahui kekuatan dan kelemahan butir tes, sehingga dapat ditentukan butir yang baik atau yang harus direvisi.
b.      untuk menyediakan informasi tentang spesifikasi butir soal secara lengkap, sehingga akan lebih memudahkan bagi dosen dalam menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam bidang lain dn tingkat tertentu.
c.       untuk segera diketahui masala yang terkandung dalam butir soal.
d.      untuk dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal atau bank soal.
Analisis butir tes adalah pengkajian pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas memadai. Analisis yang dilakukan atas dasar uji coba dinamakan analisis empiris. Sedangkan analisis berdasarkan karakteristik yang tampak pada tes tersebut tanpa uji coba dinamakan analisis rasional, karena semata-mata dilakukan atas dasar pertimbangan rasio.Untuk dapat membuat soal tes yang berkualitas dan memadai maka berikut beberapa langkah yang dapat ditempuh sebagai berikut :
1.   Menyusun Kisi-kisi
       a.  Ruang lingkup dari pengetahuan yang akan diukur sesuai dengan rencana pelajaran yang akan ditetapkan dalam kurikulum.
           b.  Proporsi jumlah item dari pada tiap-tiap sub materi.
Proporsi jumlah aitem untuk tiap-tiap sub materi hendaknya sesuai dengan proporsi dari pada luas masing-masing  sub materi. Misalnya apabila apabila dalam suatu materi terdiri dari tiga sub dengan proporsi 25%:40 %:35% maka jumlah itemnya pun harus mengikuti proporsi 25%:40%:35 %.  
c. Jenis pengetahuan atau aspek proses mental yang hendak diukur ada beberapa klasifikasi yang dapat digunakan untuk mengolongkan jenis-jenis pengetahuan. Salah satunya adalah pengetahuan dari Bloom yang membagi jenjang pengetahuan menjadi enam tingkatan yaitu: Ingatan, pemahaman, Penerapan sintesis dan evaluasi. Dalam mengadakan evaluasi hasil belajar sedapat mungkin hendaknya diusahakan agar keenam jenjang pengetahuan tersebut kita ukur.
d.  Bentuk yang akan digunakan
     Bentuk tes yang digunakan hendaknya lebih dari satu bentuk. Misalnya: pilihan ganda  Dengan menjodohkan , atau essay dengan melengkapi dan sebagainya.
2.   Menulis Soal
                         Untuk menuliskan soal-soal/item tes yang baik, maka kita harus berpedoman pada saran atau petunjuk penyusunan item menurut taksonomi Bloom. Menurut Bloom ada tiga ranah dalam hasil belajar, Yaitu Ranah Kognitif, Ranah Afektif dan Ranah Psikomotor.
3.   Menata Soal
                        Setelah soal yang diperlukan untuk suatu tindakan evaluasi mencukupi maka langkah selanjudnaya adalah mengatur soal tersebut. Dalam pengaturan ini kita kelompokan soal-soal itu menurut bentuknya bukan menurut jenis materinya dan bukan pula menurut jenjang pengetahuan yang hendak diukur.
4.    Menetapkan Skor
Setelah pengaturan soal uraian kita lakukan langkah selanjudnya adalah menetapkan besaarnya skor yang diberikan  untuk setiap item. Beberapa skor yang akan diberikan untuk setiap jawaban yang diberikan oleh peserta didik. Cara menskor yang banyak dilakukan adalah memberikan skor satu ( 1 ) untuk setiap jawaban yang betul.
5.    Reproduksi Tes
Setelah semua langkah tersebut diatas dilampaui, maka langkah terakhir adalah memproduksi tes tersebut. Reproduksi ini dapat dalam bentuk ketikan ataupun cetakan. Jumlah reproduksi kita sesuaikan dengan jumlah kebutuhan.
 Ada dua jenis analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas dan reliabilitas.

1.        Analisis Taraf kesukaran
Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi validitas dan realibilitas adalah adanya keseimbangan dari tingkat kesulitan soal tersebut. Keseimbangna yang dimaksudkan adalah adanya soal yang termasuk mudah, sedang dan sukar secara propesional. Tingkat kesukaran soal dipandang dari kesangupan atau kemampuan siswa dalam menjawabnya. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal yang termasuk mudah, sedang dan sukar.
Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal  kategori mudah, sedang, dan sukar. Pertimbangan pertama adalah  adanya keseimbangan, yakni jumlah soal sama untuk ketiga kategori tersebut. Artinya soal mudah, sedang dan sukar jumlahnya seimbang. Perbandingan antara soal mudah-sedang-sukar dapat dibuat 3-4-3 artinya 30% soal kategori mudah, 40% soal kategori sedang  dan 30% lagi soal kategori sukar misalnya, dari 60 pertanyaan pilihan ganda terdapat 18 soal kategori mudah, 24 soal kategori sedang, dan 18 soal kategori sukar.
Persoalan lain adalah menentukan kreteria soal, yaitu ukuran untuk menentukan apakah soal tersebut termasuk mudah, sedang, atau sukar dalam menentukan kriteria ini digunakan Judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu, antara Lain :
a.       Abilitas yang diukur dari pertanyaan tersebut. Misalnya untuk bidang kognitif  aspek pengetahuan dan ingatan dan pemahaman termasuk kategori mudah, aspek penerapan dan analisis termasuk kategori sedang, dan aspek sintesis dan evaluasi termasuk kategori sukar.
b.      Sifat materi yang diujikan atau ditanyakan misalnya ada fakta, konsep, prisip dan hukum, serta generalisasi. Fakta termasuk kedalam kateori mudah , konsep dan prinsip termasuk kedalam kategori sedang, dan generalisasi ( menarik kesimpulan ) termasuk kedalam kategori sukar.
c.       Bentuk soal  misalnya dalam tes objektif, tipe soal pilihan  benar salah  lebih mudah dari pada pilihan berganda obtion tiga atau empat menjodohkan relatif lebih sulit dari pada pilihan berganda jika terdapat lima atau lebih yang harus dipasangkan.

Setelah judgment dilakukan oleh guru kemudian soal tersebut  diujicobakan dan dianalisis  apakah judgment tersebut sesuai atau tidak. Cara melakukan analisis untuk menentukan tingkat kesukaran soal adalah dengan mengunakan rumus sebagai berikut:
Tingkat kesulitan (difficulity index)atau kita singkat TK dapat didefinisikan sebagai proporsi siswa peserta tes yang menjawab benar (crorcker dan Algina,1986:311).definisi itu dapat dinyatakan dengan sebuah rumus dimana TK adalah jumlah peserta yang menjawab benar dibagi dgn jumlah peserta.
P =
Np
N
Keterangan:
P   = tingkat kesukaran
Np= jumlah siswa yang menjawab benar
= jumlah siswa peserta tes
Misalnya: dari 10siswa yang mengikuti uji coba ,pada butir1 terdapat 7orang dapat menjawab benar dan pada butir2 terdapat 2 orang dapat menjawab benar.berapakah tingkat kesukaran kedua butir soal tersebut?
  7
TK (1) = --- = 0,70.
  10

 2
TK (2) = --- = 0,20.
 10
Nilai TK butir merentang antara 0 sampai 1 TK sebuah butir sama dengan nol terjadi bila semua peserta tidak ada yang menjawab benar,sebaliknya Tk sebuah butir akan sama dengan 1(satu) apabila semua peserta menjawab benar pada butir tersebut.Semakin tinggi indeks TK maka butir soal semakin mudah.Dalam THB,TK butir-butir soal diusahakan sedang.Kalau butir soal terlalu mudah atau terlalu sukar bagi dua atau lebih peserta maka sekor tidak lagi dapat membedakan kemampuan para peserta sekiranya di antara mereka terdapat perbedaan kemampuan.butir yang sangat sukar sehingga tidak ada siswa yang dapat menjawab dengan benar menyebabkan butir tersebut kehilangan kemampuannya membedakan siwa yang mempunyai kemampuan tinggi dan rendah.begitu pula dengan butir yang sangat mudah sehiingga semua peserta dapat menjawab benar. Oleh karenanya,butir sebaiknya mempunyai TK yang sedang. Kriteria untuk menentukan rentang untuk TK sedang sangat tergantung jumlah kategori yang diinginkan. Misalnya kategori TK meliputi sukar, sedang dan mudah maka kriteria sedang adalah antara 0,33 sampai 0,66 Berikut pembagian kategori TK ke dalam tiga kelompok:
Rentang TK
Kategori
0,00 – 0,32
Sukar
0,33 – 0,66
Sedang
0,67 – 1,00
Mudah

Namun, bila TK di klasifikasikan ke dalam lima kelompok :sangat sukar ,sukar ,sedang ,mudah dan sangat mudah ,maka butir soal di katakana mempunyai TK sedang bila indeks TK berada antara 0,40-0,59.secara keseluruhan pembagian rentang TK diatur sebagai berikut :
Rentang TK
Kategori
0,00 – 0,19
Sangat sukar
0,20 – 0,39
Sukar
0,40 – 0,59
Sedang
0,60 – 0,79
Mudah
0,80 – 1,00
Sangat mudah

Dalam beberapa situasi ,TK butir soal tidak di usahakan sedang .Pada keadaan di mana diingin kan sebanyak mungkin peserta tes dapat di nyatakan lulus maka butir di usahakan sangat mudah ,missal nya penerimaan siswa di mana diperkirakan jumlah daya tampung lebih banyak daripada pelamar yang mendaftar .Sebalik nya,pada keadaan diinginkan peserta tes sekecil mungkin dapat dinyatakan lulus ,maka butir soal di usahakan sesukar mungkin.

2.      Daya beda

Daya beda (discriminating power) atau kita singkat DB adalah kemampuan butir soal  membedakan siswa yang mempunyai kemampuan tinggi dan rendah . Daya beda berhubungan dengan derajat kemampuan butir membedakan dengan baik perilaku pengambil tes dalam tes yang di kembangkan (anstasi dan urbina ,1997:179). Daya beda  harus di usahakan positif dan setinggi mungkin, Butir soal yang mempunyai daya beda positif dan tinggi berarti butir tersebut dapat membedakan dengan baik siswa kelompok atas dan bawah. Siswa kelompok atas adalah kelompok siswa yang tergolong pandai atau mencapai skor total hasil belajar yang timggi dan siswa kelompok bawah adalah kelompok ssiswa yang bodoh atau memperoleh sekor total hasil belajar yang rendah .DB itu dapat di tentukan basarannya dengan rumus sebagai
berikut:

DB = PT – PR
Atau
DB =
Σ T B   Σ R B
Σ T       Σ R

Keterangan:
PT = proporsi siswa yang menjawab benar pada kelompok siswa yang mempunyai kemampuan  tinggi .
PR = proporsi siswa yang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah.
STB = jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan tinggi.
ST = jumlah kelompok siswa yang mempunyai kemampuan tinggi .
SRB = Jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah .
SR = jumlah siswa yang mempunyai kemampuan rendah

Atau menurut Anas Sudjono untuk mengetahui besar kecilnya angka indek diskriminasi item yang dipergunakan rumus:
D = PA – PB
D = Discriminatory power (angka indek diskriminasi item)
PA – P=  Proposi testee kelompok atas yang dapat menjawab dengan huruf butir item yang bersangkuatan (PH adalah singkatan dari Probortion of the Higher Group) pA atau pH ini dapat diperoleh dengan rumus :
PA =
Dimana :
BA = Banyaknya testee kelompok atas (the higher group) yang menjawab dengan betul butir yang     bersangkutan.
JA = Jumlah testee yang termasuk dalam elompok atas
PB atau PL = proporsi testee kelompok bawah yang dapat menjawab denga betul butir item yang bersangkutan  (pl adalah singkatan dari prorpotion of the Lower Group)
PB atau PL ini dapat diperoleh dengan rumus :
PB =
Dimana :
BB = Banyak testee kelompok bawah (the lower group) yang dapat dengan betul butir yang bersangkutan.
JB = Jumlah testee yang termasuk dalam kelompok bawah.
Sebagai sebuah penjelasan di berikan contoh sebagai berikut : Sebanyak 10 orang mengikuti uji coba  THB berbentuk objektif dengan hasil sebagai berikut:
Siswa
Butir soal
Jumlah
1
2
3
4
5
6
7
8
9
10
A
1
1
1
1
1
1
1
1
1
1
10
B
0
1
0
0
1
0
0
1
0
0
3
C
1
1
1
0
1
1
1
1
1
0
8
D
1
0
1
1
1
1
1
1
1
1
9
E
0
0
0
1
1
1
0
0
0
1
4
F
1
0
1
1
1
1
1
1
1
1
9
G
0
0
1
1
0
1
1
0
1
0
5
H
0
1
0
0
0
1
0
0
0
1
3
I
1
0
0
0
0
0
0
0
1
0
2
J
1
1
1
1
1
1
1
1
1
1
10

Perhitungan DB dapat di lakukan dengan langkah-langkah sebagai berikut:
1.  Menentukan siswa kelompok atas dan bawah .Kelompok atas adalah setengah kelompok siswa (5 orang)yang mamperoleh sekor terendah .penentuan kelompok atas dan kelompok bwah dapat di sajikan dalam tabel berikut:
Kelompok atas
Kelompok bawah
Siswa
Skor
Siswa
Skor
A
10
B
3
C
8
E
4
D
9
G
5
F
9
H
3
J
10
I
2





2.  Menghitung perolehan sekor butir pada kelompok atas dan kelompok bawah.
Kelompok atas
Siswa
Butir soal
1
2
3
4
5
6
7
8
9
10
A
1
0
1
1
1
1
1
1
1
1
C
1
1
1
0
1
1
1
1
1
0
D
1
0
1
1
1
1
1
1
1
1
F
1
0
1
1
1
1
1
1
1
1
J
1
1
1
1
1
1
1
1
1
1
Jumlah
5
2
5
4
5
5
5
5
5
4

Kelompok bawah
Siswa
Butir soal
1
2
3
4
5
6
7
8
9
10
B
0
1
0
0
1
0
0
1
0
0
E
0
1
0
1
1
1
0
0
0
1
G
0
1
1
1
0
1
1
0
1
0
H
0
1
0
0
0
0
0
0
1
1
I
1
0
0
0
0
0
0
0
0
0
Jumlah
1
4
1
2
2
2
1
1
2
2

3.  Menghitung DB
DB dihitung sebagai mana rumusnya sebagai barikut:

a.  Butir 1
DB (1) =
5
-
1
=
4
= 0,80
5
5
­5­

b.  Butir 2
DB (2) =
2
-
4
=
2
= - 0,40
5
5
­5­

Sebuah butir soal yang baik adalah butir soal yang mempunyai DB positif dan signifikan .Daya beda akan positif apabia jumlah siswa kelompok atas yang dapat menjawab dengan benar lebih banyak dari pada jumlah siswa kelompok bawah. Daya beda yang signifikan dimaksudkan sebagai mempunyai indexs minimal+0,30 yang artinya pada butir yang baik jumlah siswa kelompok atas yang dapat menjawab benar minimal30%lebih banyak dari pada jumlah siswa kelompok bawah yang dapat menjawab benar.

Nilai DB akan merentang antara -1,00 hingga +1,00. Dengan mengambil contoh soal diatas,beberapa kondisi ekstrim dapat di jelaskan sebagai berikut:
a. Bila semua siswa kelompok atas dapat menjawab benar dan semua siswa kelompok bawah  menjawab salah,makaDB akan +1,00.

DB =
5
-
0
= + 1,00
5
5

b. Bila semua siswa kelompok atas dapat menjawab salah dan semua siswa kelompok bawah menjawab benar,maka DB -1,00.

DB =
0
-
5
= - 1,00
5
5

c. Bila baik siswa kelompok atas maaupun kelompok bawah dpat menjawab dengan benar maka DB akan 0,00.

DB =
5
-
5
= 0,00
5
5



d. Bila baik siswa kelompok atas maupun kelompok bawah menjawab salah maka DB akan 0,00.

DB =
0
-
0
= 0,00
5
5

Berdasar nilai rentang DB diatas dapat ditarik kesimpulan sebagai berikut:
a.  Bila semua siswa baik kelompok atas maupun kelompok bawah sama-sama menjawab benar atau sama-sama menjawab salah maka butir soal tidak mempunyai kemampuan membedakan yang ditunjukkan oleh DB=0,00.
b.  Bila siwa kelompok atas yang dapat menjawab benar lebih banyak dari pada kelompok bawah yang menjawab benar maka DB akan positif.
c.  Bila siwa kelompok atas yang dapat menjawab benar lebih sedikit dari pada kelompok bawah yang menjawab benar maka DB akan negative.
d.  Butir soal mempunyai DB tinggi apabila siswa kelompok atas yang dapat menjawab benar lebih banyak dibandingkan siswa kelompok bwah yang dapat menjawab benar dengan perbandingan tertentu hingga DB minimal +0,30.

Dalam menghitung DB terdapat beberapa kejadian khusus yang harus diperhatikan:
a.  Bila data di tengah sama maka data yang sama di keluarkan dari analisis. Misalnya: data skor hasil belajar enam orang siswa di urutkan dari tinggi ke rendah adalah sebagi berikut: 10, 9, 7, 7, 4 dan 2. Data skor yang sama adalah 7 dan di keluarkan dari analisis, sehingga perhitungan DB melibatkan siswa yang memperoleh skor 10 dan 9 sebagai kelompok atas dan siswa yang memperoleh skor 4 dan 2 sebagi kelompok bawah.
b. Dalam hal jumlah siswa uji coba sangat banyak maka penentuan kelompok atas dan bawah adalah dengan mengambil 27% siswaa yang memperoleh skor tertinggi sebagai kelompok atas dan 27% siswa yang memperoleh skor terendah sebagai kelompok bawah. Sebanyak 46% siswa di tengah distribusi di keluarkan dan tidak di analisis. Perhitungan daya beda butir di dasarkan pada “aturan 27%”. Menurut Kelly, pada kondisi normal, titik optimum di mana dua kondisi seimbang di capai pada 27% kelompok atas dan bawah (Anastasi dan Urbina, 1997: 182).

Perhitungan DB butir juga dapat dilakukan dengan mengkorelasikan skor butir dengan skor total. Korelasi butir dengan total menunjukkan kesejajaran nilai antara butir dengan total. Bila skor butir bervariasi sejalan dengan variasi skor total maka butir tersebut mampu membedakan dengan baik siswa yang mempunyai kemampuan tinggi dan rendah. Butir di katakan mempunyai DB yang tinggi apabila korelasi butir itu dengan total minimal +0,30. Adapun korelasi antara butir dengan total dapat di lakukan menggunakan rumus product moment, biserial, poin biserial. Phi atau tetrakorik (Crocker dan Algina, 1986:317:319).

3.      Teknik Analisis Fungsi Distraktor (Pengecoh)
Pada tes tes obyektif bentuk multiple choice item telah dikemukakkan bahwa pada tes objektif bentuk multiple choice item tersebut untuk setiap butir yng dikeluarkan dalam tes hasil belajar telah dilegkapi denga beberapa kemungkinan jawaban, atau yang sering di kenal dengan istilah option atau alternative. Tujuan utama dari pemasangan ditraktor pada setiap butir item itu adalah agar ari sekalian banyak testee yang mengikuti trs hasil belajar ada yang tertarik atau bertanggung untuk memilihnya, sebab merekab manenyangkabahwa distraktor yang mereka pilih itu merupakan jawaban betul. Distraktor baru dapat dikatakan telah dapat menjalankan fungsinya dengan baik, apabila distraktor tersebut telah memilki daya rangsang atau daya tarik demikian rupa sehingga testee (khususnnya yang termasuk dalam kategori kemampuannya rendah atau bodoh).
Menganalisis fungsi distraktor sering dikenal dengan istilah lain yaitu menganalisis pola penyebaran jawaban item. Adapun yang dimaksud dengan pola penyebaran jawaban item ialah suatu pola yang dapat menggambarkan bagaimana testee menentuka pilihan jawaban terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item.
Kriteria Untuk Menentukan Soal Yang  Baik dan Tidak Baik
Untuk menentukan apakah suatu soal dikatakan baik atau tidak baik sehingga perlu direvisi, digunakan criteria sebagai berikut :
a.       Untuk soal yang berbentuk benar-salah (true-false)
·         Jika tingkat kesukarannya sama ayau lebih kecil dari 0,16 dikategorika soal yang sukar
·         jika tingkat kesukarannya sama atau lebih besar dari 0,84 dikategorikan soal yang mudah
b.      Untuk soal pilihan ganda (multiple choice)
·         Untuk pilihan ganda denga option 3, jika kesukarannya sama atau lebih kecil dari 0,21 dikatergorikan soal sukar, sedangkan jika tingkat kesukarannya sama atau lebih besar dari 0,79 dikategorikan soal yang mudah.
·         Untuk pilihan ganda denan optian 4, jika tingkat kesukarannya sama atau lbih kecil dari 0,24 dikategorikan sola yang sukar, sedangkan jika tingkat kesukarannya sama atau lebih besar dri 0,76 dikategorikan soal yang mudah
·         jika daya pembeda soal itu adlah 0 atau minus, maka soal itu perlu direvisi/ diperbaiki.
·         Untuk menentukan daya pembeda suatu soal, di samping kriteril pada c tersebut di atas dapat juga dicari dengan menggunakan tabel koefesien biserial.

Analisis butir juga dilakukan dengan memerhatikan pengecoh. Pengecoh (distractor) yang juga dikenal dengan istilah penyesatatau penggoda adalah pilihan jawaban yang bukan merupakan kunci jawaban .pengecoh bukan sekedar pelengkap pilihan, Pengecoh diadakan untuk menyesatkan siswa agar idak mememilih kunci jawaban pengecoh menggoda siswa yang kurang begitu memahami materi pelajaran untuk memilihnya.Agar dapat melakukan fungsinya untuk mengecoh maka pengecoh harus dibuat semirip mungkin dengan kunci jawaban.

            Pengecoh dikatakan berfungsi efektif apabila paling tidak ada siwa yang terkecoh memilih.Pengecoh yang sama sekali tidak dipilih tidak  dapat melakukan fungsinya sebagai pengecoh karena terlalu mencolok dan dimengerti oleh semua siswa sebagai penggecoh soal.Pengecoh yang berdasarkan hasil uji coba tidak efektif direkomendasikan untuk diganti dengan pengecoh yang lebih menarik.
Contoh pengujian karasteristik butir
Sehubungan dengan analisis butir secara klasik dapatdiberikan contoh sebagai berikut: THB uji coba adlah 10 butir soal tes obyektif pilihan ganda dengan empat pilihan.jawaban 10 orang siswa uji coba dilaporkan hasilnyya sebagai berikut:
Siswa
Butir soal
1
2
3
4
5
6
7
8
9
10
A
B
D
C
D
B
B
C
A
C
D
B
B
C
C
A
B
A
C
A
B
C
C
C
D
A
D
A
D
D
B
C
B
D
D
B
A
A
C
B
A
A
C
A
E
A
C
B
B
A
C
D
C
D
B
F
A
D
B
A
D
B
D
B
C
B
G
C
D
D
C
A
D
A
A
C
A
H
B
D
B
A
B
C
D
A
C
D
I
D
D
D
B
C
D
A
C
D
B
J
B
D
A
B
C
D
D
A
C
B
Kunci
B
D
C
A
A
B
D
A
C
B

Dari sebaran jawaban tersebut,penghitungan skor uji coba dan analisis butir dapat diringkaskan dalam tabel sebagai berikut:
Siswa
Butir soal
Jumlah
1
2
3
4
5
6
7
8
9
10
A
1
1
1
0
0
1
0
1
1
0
6
B
1
0
1
1
0
0
0
1
0
0
4
C
0
1
0
0
1
0
1
0
1
1
5
D
0
0
0
1
0
1
0
1
1
0
4
E
0
0
0
0
1
0
1
0
0
1
3
F
0
1
0
1
0
1
1
0
1
1
6
G
0
1
0
0
1
0
0
1
1
0
4
H
1
1
0
1
0
0
1
1
1
0
6
I
0
1
0
0
0
0
0
0
0
1
2
J
1
1
0
0
0
0
1
1
1
1
6
ΣB
4
7
2
4
3
3
5
6
7
5
TK
0,40
0,70
0,20
0,40
0,30
0,30
0,50
0,60
0,70
0,50
DB
0,40
0,60
0
0
-0,20
0,20
0,60
0
0,60
0,20
EP
E
TE
E
E
E
E
E
E
E
E

Ketrerangan:
SB = Jumlah siswa yang menjawab benar pada butir ke-I
TK = Tingkat kesukaran
DB = Daya beda
EP = Efektivitas pengecoh
E = Efektif
TE = Tidak efektif
Bila ditetapkan kriteria untuk memberikanpenelitian butir adalah sebagai berikut:
1.  TK butir harus sedang yaitu antara 0,33 sampai 0,66
2.  DB harus tinggi  yaitu minimal +0,30
3.  Pengecohh paling tidak seorang siswa ada yang memilih.
Berdasarkan ringkasan analisis butir pada tabel di atas  dan kriteria penilaian butir yang baik maka dapat ditarik kesimpulan:
1.Butir 3, 5 dan 6 terlalu sukar
2.Butir 3, 4, 5, 6, 8, dan 10 tidak mampu membedakan kemampuan siswa kelompok atas dan bawah.
3.Pada butir 2 pengecoh A tidak efektif.
Perhitungan analisis butir itu selengkap nya dilakukan sebagai berikut:
1.  Tingkat kesukaran
Misalnya TK butir 1 di hitung sebagai berikut:

TK (1) =
4
= 0,40
10

2.  Daya beda
Perhitungan DB dilakukan dengan langkah sebagai berikut:
a.Menentukan siswa kelompok atas dan bawah.

Kelompok atas
Kelompok bawah
Siswa
Skor
Siswa
Skor
A
6
B
4
C
5
D
4
F
6
E
3
H
6
G
4
J
6
I
2

b.  Menghituung perolehan skor tiap-tiap butir pada siswa kelompok atas dan bawah.
Kelompok atas
Siswa
Butir soal
1
2
3
4
5
6
7
8
9
10
A
1
1
1
0
0
1
0
1
1
0
C
0
1
0
0
1
0
1
0
1
1
F
0
1
0
1
0
1
1
0
1
1
H
1
1
0
1
0
0
1
1
1
0
J
1
1
0
0
0
0
1
1
1
1
Jumlah
3
5
1
2
1
2
4
3
5
3



Kelompok bawah
Siswa
Butir soal
1
2
3
4
5
6
7
8
9
10
B
1
0
1
1
0
0
0
1
0
0
D
0
0
0
1
0
1
0
1
1
0
E
0
0
0
0
1
0
1
0
0
1
G
0
1
0
0
1
0
0
1
1
0
I
0
1
0
0
0
0
0
0
0
1
Jumlah
1
2
1
2
2
1
1
3
2
2

c. Menghitung DB butir.
Misalnya DB untuk butir 1 dapat dihitung sebagai berikut:
DB (1) =
3
-
1
=
2
= 0,40
5
5
­5­
3.  Efektivitas pengecoh
Efektivitas pengecoh dapat dianalisis sebagaimana ditabulasikan dan sebagai contoh dianalisis tiga butir soal sebagai berikut:

Butir
Kunci
Pemilih
Pengecoh
Pemilih
Efektifitas pengecoh
1
B
4
A
C
D
2
2
2
Efektif
Efektif
Efektif
2
D
7
A
B
C
0
1
2
Tidak efektif
Efektif
Efektif
3
C
2
A
B
D
3
3
2
Efektif
Efektif
Efektif
Dan seterusnya

            Butir soal yang tidak memiliki daya pembeda diduga terlalu mudah dan terlalu sukar sehingga perlu diperbaiki atau diganti dengan pertanyaan lain  Suatu alat pengukur dapat dikatakan alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat. Penganalisaan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara:
1.        Pengujian Validitas Tes Secara Rasional
Tes hasil belajar yang setelah dilakukan penganalisaan secara rasional ternyata memiliki daya ketepatan mengukur, disebut tes hasil belajar yang telah memiliki validitas logika (logical validity).
Validitas rasional adalah: validitas yang diperoleh atas dasar hasil pemikiran,
validitas yang diperoleh dengan berpikir secara logis.
Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas rasional ataukah belum, dapat dilakukan penelusuran dari dua segi yaitu:
a.       Validitas Isi ( Content Validity )
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam forum diskusi tersebut, para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi hasil belajar tersebut. Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan.
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk mene¬laah apakah konsep materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka
-angka.
b.      Validitas Konstruksi  ( Construksi Validity )
Secara etimologis, kata “konstruksi” mengandung arti susunan, kerangka atau rekaan. Dengan demikian, Validitas konstruksi dapat diartikan sebagai validitas yang ditilik dari segi susunan, kerangka atau rekaanya.
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus.
Tes hasil belajar dapat dinyatakan sebagai tes yang teh memiliki validitas konstruksi apabila tes hasil belajar tersebut (ditilik dari segi susunan, kerangka atau rekaannya) telah dapat dengan seclaara tepat mencerminkan suatu konstruksi dalam teori psikologis. Tes hasil belajar baru dapat dikatakan telah memiliki validitas susunan apabila butir-butir soal atau item yang membangun tes tersebut benar-benar telah dapat dengan secara tepat mengukur aspek-aspek berpikir (seperti: aspek kognitif, aspek efektif, aspek pdikomotorik dan sebagainya) sebagaimana telah ditentukan dalam tujuan instruksional khusus. Penganalisaan validitas konstruksi juga dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan.
Contoh :
Konsep mengenai “hubungan social”, konsep sikap dapat dilihat dari indikatornya secara teoretis (deduksi teori) : dilihat dari pengalaman:
-
  kesediaan menerima stimulus-(bisa bergaul dengan orang lain)
-
   kemauan reaksi stimulus-(disenangibanyak temannya)
-
    menilai stimulus-(menerima pendapat orang lain)
- menyusun/mengorganisasi - (tidak memaksakan pendapat)
- internalisasi nilai - (bisa bekerjasama d
engan siapapun)
Apabila hasil tes menunjukkan indicator ang tidak berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas konstruksi. Maka prlu ditinjau atau diperbaiki kembali.

2.    Pengujian Validitas tes secara empirik
Dimaksud dengan validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiric yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan bandingannya (concurrent validity).
a.       Validitas ramalan (Predictive validity)
Validitas ramalan suatu tes adalah: Suatu kondisi yang menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukan kemampuanya untuk meramalkan apa yang bakal erjadi pada masa mendatang
b.      Validitas Bandingan ( Concurrnt Validity )
Validitas bandingan juga sering dikenal dengan istilah: validitas sama saat, validitas pengalaman atau validitas ada sekarang.











c.       Kesimpulan    
Analisis butir soal bertujuan untuk memperoleh kualitas soal yang baik sehingga dapat memperoleh gambaran tentang prestasi siswa yang sebenarnya.Ada beberapa cara melalukan analisis butir soal: untuk dapat membedakan soal kategori mudah, sedang dan sukar
v  Analisis tingkat kesukaran soal mengkaji apakah soal Analisis daya pembeda  mempunyai kemampuan dalam membedakan siswa termasuk kategori mempunyai kemampuan tinggi atau rendah. mengkaji kesahihan alat ukur (soal) dalam menilai
v  Daya beda (discriminating power) adalah kemampuan butir soal untuk membedakan siswa yang mempunyai kemampuan tinggi dan rendah.
v  Pengecoh (distractor)  adalah pilihan jawaban yang bukan merupakan kunci jawaban
v  Analisis validitas  apa yang seharusnya diukur atau mengkaji ketepatan soal sebagai alat ukur. mengkaji keajegan atau ketetapan hasil tes
v  Analisis reliabilitas  manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali.















Referensi

Iriato, Agus. 2010. STATISTIK. Konsep Dasar dan Aplikasinya. Kencana
Prenada Media Group. Jakarta
Sudijono Anas, 2009 Pengantar Evaluasi Pendidikan. PT Raja Grafindo persada Jakarta
Sudjana, Nana. 1991. Penilaian Hasil Proses Belajar Mengajar. Cetakan III. Bandung:Rosdakarya.
Zainul, Asmawi. 2001. Penilaian Hasil Belajar. Jakarta






Tidak ada komentar:

Posting Komentar