ANALISIS BUTIR SOAL DENGAN PROGRAM ITEMAN
ITEMAN
merupakan program komputer yang digunakan untuk menganalisis butir soal secara
klasik. Program ini termasuk satu paket program dalam MicroCAT°n
yang dikembangkan oleh Assessment Systems Corporation mulai tahun 1982 dan
mengalami revisi pada tahun 1984, 1986, 1988, dan 1993; mulai dari versi 2.00
sampai dengan versi 3.50. Alamatnya adalah Assessment Systems Corporation, 2233
University Avenue, Suite 400, St Paul, Minesota 55114, United States of
America.
Program ini dapat digunakan untuk: (1) menganalisis data file
(format ASCII) jawaban butir soal yang dihasilkan melalui manual entry data
atau dari mesin scanner; (2) menskor dan menganalisis data soal pilihan ganda
dan skala Likert untuk 30.000 siswa dan 250 butir soal; (3) menganalisis sebuah
tes yang terdiri dari 10 skala (subtes) dan memberikan informasi tentang
validitas setiap butir (daya pembeda, tingkat kesukaran, proporsi jawaban pada
setiap option), reliabilitas (KR-20/Alpha), standar error of measurement, mean,
variance, standar deviasi, skew, kurtosis untuk jumlah skor pada jawaban benar,
skor minimum dan maksimum, skor median, dan frekuensi distribusi skor.
Saat ini telah tersedia ITEMAN tinder Windows 95, 98, NT,
2000, ME, dan XP dengan harga $299. Sebelum menggunakan program Iteman, bacalah
manualnya/buku petunjuk pengoperasionalnya secara seksama. Sebagai contoh,
tahap awal adalah membuat "file data" (control tile) yang berisi 5
komponen utama.
1. Baris pertama adalah baris pengontrol yang
mendeskripsikan data.
2. Baris kedua adalah daftar kunci jawaban
setiap butir soal.
3. Baris ketiga
adalah daftar jumlah option untuk setiap butir soal.
4. Baris keempat adalah daftar butir soal yang
hendak dianalisis (jika butir yang akan dianalisis diberi tanda Y (yes), jika
tidak diikutkan dalam analisis diberi tanda N (no).
5. Baris kelima dan seterusnya adalah data
siswa dan pilihan jawaban siswa.
Setiap
pilihan jawaban siswa (untuk soal bentuk pilihan ganda) diketik dengan
menggunakan huruf, misal ABCD atau angka 1234 untuk 4 pilihan jawaban atau
ABCDE atau 12345 untuk 5 pilihan jawaban.
Cara menggunakan program ini,
pertama data diketik di DOS atau Windows.
Cara termudah adalah menggunakan
program Windows yaitu dengan mengetik data di tempat Notepad. Caranya adalah
klik Start-Programs-Accessories-Notepad.
Gambar
1. Contoh pengetikan data untuk soal bentuk pilihan ganda
30 o n 6 [Jumlah
soal, kode omit, kode tidak dijawab, jmlh karakterl
43142442113424141324213411334 [Kunci jawaban dapat ditulis dengan angka atau hurufl
444444444444444444444444444444 [Jumlah-pilihan] YYYYYYYYYYYYYYYYYYYYYYYYYYYYYY [Soal yang dianalisis, bila tidak
dianalisis ditulis NJ
Dita 123123244113424143324213211334 (Jawaban siswa, dapat ditulis Fauria 423142243413424141124213111233 dengan
angka atau huruf) Fara 423142242113424141324213411334 Nafis 143142242433434141324413431334 Raufan 243142242413434141411213211134 Dina 423342224113423141421213044331
Gambar 2. Contoh
pengetikan data untuk skala Likert.
30 x Y 10 [Jumlah soal, kodc omit, kode tidak dijawab, jmlh karakter]
+++++++-------- +++++-------- +++++--
777777777777777777777777777777
111111111111111111111111111111
|
[Positif/negative pernyataan]
[Jumlah pilihan]
[Kode skala]
|
||
Nurul
|
211214123242343423111231243767
|
[Jawaban siswa,
dapat ditulis
|
|
Imam
|
312214214242443423224562332565
|
dengan angka atau
huruf)
|
|
Ali
|
2242123313324431243254624371YY
|
|
|
Kiki
|
22421112X432443323226556664122
|
|
|
Chanan
|
32421424234244344322653546X343
|
|
|
Gambar 3. Contoh
lain pengetikan data untuk soal bentuk pilihan ganda
Langkah kedua, data yang telah diketik disimpan, misal
disimpan pada file: Tes1.txt. Selanjutnya
untuk menggunakan program Iteman yaitu dengan mengklik icon Iteman. Kemudian isilah
pertanyaan-pertanyaan yang muncul di layar komputer seperti berikut.
Langkah ketiga adalah membaca hasil, yaitu dengan
mengklik icon hsltes1. Hasilnya
adalah seperti pada contoh Gambar 4 berikut.
Gambar
4. Hasil analisis statistik butir soal dengan program
ITEMAN
Keterangan:
Prop. Correct= tingkat
kesukaran butir:,
Biser dan Point Biser.=
korelasi Biserial dan Korelasi Point Biserial,
Alt.=
alternative/pilihan jawaban,
Prop. Endorsing=
proporsi Jawaban pada setiap option
Gambar
5. Hasil analisis statistik tes/skala dengan program ITEMAN
Gambar 6. Hasil scor
butir soal pilihan ganda dari ITEMAN versi 3.00
24
1 Scores for examinees from file
tes1.txt
IWAN SUYAWAN 20.00
TIKA HATIKAH 16.00
YENNY SUKHRAINI 18.00
WIJI PURWANTA 15.00
HENNY LISTIANA 16.00
UJANG HERMAWAN 16.00
NIKEN IRIANTI 17.00
MIMIK RIATIN 18.00
NUR WAHYU RISDIANTO 17.00
RURI SUSIYANTI 17.00
RYSA DWI INDAH YATI 19.00
ANDRIKO 15.00
JOKO SLAMET 5.00
LUKMAN NURHUDA 17.00
OTAH PIANTO 16.00
AKHMAD SYAMSURIZAL 19.00
DENY TRI SETIAWAN 18.00
DEWI SETYOWATI 13.00
ISMAIL SHOLEH 17.00
JEMI INTARYO 16.00
Hasil korelasi
point-biserial (rpbi) dan korelasi biserial (rpbis) berasal dari
perhitungan rumus berikut.
Yp = mean
skor pada kriterion siswa yang menjawab benar soal.
Yt dan St = mean
dan standard deviasi kriterion seluruh siswa.
p = proporsi siswa
yang menjawab benar soal.
U = ordinat kurva
normal.
Korelasi point-biserial (r pbi) tidak sama dengan 0,
korelasi biserial (r bis) paling sedikit 25% lebih besar daripada r pbi untuk
perhitungan pada data yang sama. Korelasi point-biserial (r pbi) merupakan
korelasi product moment antara skor dikotomus dan pengukuran kriterion;
sedangkan korelasi biserial (r bis) merupakan korelasi product moment antara
variabel latent distribusi normal berdasarkan dikotomi benar-salah dan
pengukuran kriterion.
Menurut Millman dan Greene (1989) dalam Educational Measurement, kedua korelasi ini memiliki kelebihan
masing-masing. Kelebihan korelasi point biserial adalah: (1) memberikan
refleksi kontribusi soal secara sesungguhnya terhadap fungsi tes. Maksudnya ini
mengukur bagaimana baiknya soal berkorelasi dengan kriterion (tidak bagaimana
baiknya beberapa secara abstrak); (2)
sederhana dan langsung berhubungan dengan statistik tes; (3) tidak pernah
mempunyai value 1,00 karena hanya variabel-variabel dengan distribusi bentuk
yang sama yang dapat berkorelasi secara sempurna, dan variabel kontinyu
(kriterion) dan skor dikotomus tidak mempunyai bentuk yang sama. Kelebihan
korelasi biserial adalah: (1) cenderung lebih stabil dari sampel ke
sampel, (2) penilaian lebih akurat tentang bagaimana soal dapat diharapkan
untuk membedakan pada beberapa perbedaan point di skala abilitas, (3) value r
bis yang sederhana lebih langsung berhubungan dengan indikator diskriminasi
kurva karakteristik butir (Item Characteristic Curve atau ICC). Kebanyakan para
ahli pendidikan, khususnya di Indonesia ,
banyak yang menggunakan korelasi point biserial daripada korelasi biserial.
Kriteria baik tidaknya butir soal menurut Ebel dan
Frisbie (1991) dalam Essentials of Educational Measurement halaman 232 adalah bila korelasi point
biserial: >0.40=butir soal sangat baik; 0.30 - 0.39=soal baik, tetapi perlu
perbaikan; 0.20 - 0.29=soal dengan beberapa catatan, biasanya diperlukan
perbaikan; < 0. 19=soal jelek, dibuang, atau diperbaiki melalui revisi.
Adapun tingkat kesukaran butir soal memiliki skala 0 - 1. Semakin mendekati 1 soal tergolong mudah dan mendekati 0 soal tergolong
sukar.
a.
Interpretasi Hasil
Analisis Program ITEMAN
Hasil dari analisis ITEMAN dapat
berupa dua file yaitu file statistik dan file skor. Keduanya berupa file ASCII
yang dapat dilihat dengan menggunakan program pengolah kata (word processor).
File statistik hasil analisis
ITEMAN dapat dibedakan ke dalam 2 bagian, yaitu : Statistik butir soal dan
statistik tes (skala). Gambar 4 di atas menunjukkan hasil analisis statistik
butir soal, sedangkan gambar 5 menunjukkan hasil analisis statistik tes.
Interpretasi kedua gambar di atas dapat diuraikan sebagai berikut :
I.
Statistik
Butir Soal
Untuk tes/skala yang terdiri dari
butir-butir soal yang bersifat dikotomi misalnya pilihan ganda, statistik
berikut adalah output dari setiap butir soal yang dianalisis : (lihat gambar 4)
1.
Seq. No adalah
nomor urut butir soal dalam file data.
2.
Scala-item adalah
nomor urut butir soal dalam skala (tes/subtes)
- Prop. Correct
adalah proporsi siswa( peserta tes) yang menjawab benar butir soal. Nilai
ekstrim (mendekati nol atau satu) menunjukan bahwa butir soal tersebut
terlalu sukar atau terlalu mudah untuk peserta tes. Indeks ini disebut
juga indeks tigkat kesukaran soal secara klasikal.
- Biser
adalah indeks daya pembeda soal dengan menggunakan koefisien korelasi
biserial. Nilai positif menunjukan bahwa peserta tes yang menjawab benar
butir soal, mempunyai skor yang relatif tinggi dalam tes/skala tersebut. Sebaliknya
nilai negatif menunjukan bahwa peserta tes yang menjawab benar butir soal,
memperoleh skor yang relatif rendah dalam tes/skala tersebut. Untuk
statistik pilihan jawaban (alternative) korelasi biserial negatif sangat
tidak dikehendaki untuk kunci jawaban dan sangat dikehendaki untuk
pilihan jawaban yang lain (pengecoh).
- Point-biser
adalah juga indeks daya pembeda soal dan pilihan jawaban (alternatif)
dengan menggunakan koefisien korelasi point-biserial. Penafsirannya sama
dengan statistik biserial.
Catatan : Nilai -9.000 menunjukan bahwa
statistik butir soal atas pilihan jawaban tidak dapat di hitung. Hal ini sering kali terjadii
apabila tidak ada peserta tes yang menjawab butir soal/ pilihan jawaban
tersebut
- Statistik
pilihan jawaban (alternative) memberikan informasi yang sama dengan
statistik butir soal. Perbedaannya adalah bahwa statistik pilihan jawaban
dihitung secara terpisah. Untuk setiap piihan jawaban dan didasarkan pada
dipilih tidaknya alternatif tersebut, bukan pada benarnya jawaban. Tanda
(*) yang muncul di sebelah kanan hasil analisis menunjukan kunci jawaban.
II.
Statistik
Tes/Skala
Gambar 5 menunjukkan hasil
analisis statistik untuk tes/skala dengan interpretasi berikut :
1.
N of
items adalah jumlah butir soal dalam tes/skala yang ikut
dianalisis. Untuk tes/skala yang terdiri dari butir-butir soal dikotomi, hal ini
merupakan jumlah total butir soal dalam tes /skala.
2.
N of
examines adalah jumlah peserta tes yang digunakan dalam analisis.
3.
Mean adalah
skor rata-rata peserta tes.
4.
Variance adalah
varian dari distribusi skor peserta tes yang memberikan gambaran tentang
sebaran skor peserta tes.
5.
Std.
Dev adalah deviasi standar dari distribusi skor peserta tes.
Deviasi standar adalah akar dari variance.
6.
Skew adalah
kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk
distribusi skor peserta tes. Kemiringan negatif menunjukan bahwa sebagian besar
skor berada pada bagian atas (skor tinggi) dari distribusi skor. Sebaliknya
kemiringan positif menunjukan bahwa sebagian besar skor berada bagian bawah (skor
rendah) dari distribusi skor. Kemiringan nol menunjukan bahwa skor
berdistribusi secara simetris di sekitar skor rata-rata (Mean).
7.
Kurtosis
adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor
dibanding dengan distribusi normal. Nilai positif menunjukan distribusi yang
lebih lancip (memuncak) dan nilai negatif menunjukan distribusi yang lebih
landai (merata). Kurtosis untuk distribusi normal adalah nol.
8.
Minimun adalah
skor terendah peserta tes dalam tes/skala tersebut.
9.
Maximum
adalah skor tertinggi peserta tes dalam tes/skala tersebut.
10.
Median adalah
skor tengah dimana 50% skor berada pada atau lebih rendah dari skor tersebut.
11.
Alpha adalah
koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks
homogenitas tes/skala. Koefisien alpha bergerak dari 0,0 sampai 1,0. Koefisien
alpha hanya cocok digunakan pada tes yang bukan mengukur kecepatan (speeded
test ) dan yang hanya mengukur satu dimensi (single-trait).
12.
SEM adalah
kesalahan pengukuran standar untuk setiap tes/skala. SEM merupakan estimit dari
deviasi standar kesalahan pengukuran dalam skor tes.
13.
Mean P adalah
rata-rata tingat kesukaran semua butir soal dalam tes secara klasikal dihitung
dengan cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk
semua butir soal dalam tes/skala.
14.
Mean
item-Tot nilai rata-rata indeks daya pembeda dari semua soal
dalam tes/skala yang diperoleh dengan menghitung nilai rata-rata point biserial dari semua soal dalam tes/skala.
15.
Mean-Biserial adalah
juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung nilai
rata-rata korelasi biserial dari semua butir soal dalam tes/skala.
16.
Scale
intercorrelation adalah indeks korelasi antara skor-skor peserta tes
yang diperoleh dari setiap subtes/subskala.
III.
File
Skor
Program
iteman juga memberikan hasil skor untuk setiap peserta tes yang menunjukan
jumlah benar dari seluruh jawaban. Dari contoh diatas, kita dapat melihat skor
peserta tes pada file CONTOH_1.SCR seperti pada gambar 6.
Baris pertama dari output menunjukkan jumlah
karakter untuk identitas peserta tes (dalam contoh di atas 24), jumlah skala
(dalam contoh di atas 1), dan nama file input. Kemudian hasil skala diberikan
secara berurutan sesuai dengan urutan peserta tes dalam file data.
BAB III
KESIMPULAN
KESIMPULAN
Berdasarkan pemaparan di atas ada
beberapa kesimpulan yang bisa diambil yaitu:
1.
Salah satu cara untuk memperbaiki proses
belajar mengajar yang paling efektif adalah dengan jalan mengevaluasi tes hasil
belajar yang diperoleh dari proses belajar mengajar
2.
Pengolahan tes hasil belajar dalam
rangka memperbaiki proses belajar mengajar dapat dilakukan antara lain dengan
melakukan analisis soal
3. Tujuan khusus dari analisis butir soal ialah mencari soal
tes mana yang baik dan mana yang tidak baik, dan mengapa item atau soal itu dikatakan baik atau tidak baik
4.
Soal dapat di analisis dengan
menggunakan analisis kualitatif (teoritis) dan kuantitatif (empiris)
5.
Salah satu cara analisis butir soal
secara kuantitatif dapat dilakukan dengan menggunakan program komputer, seperti
ITEMAN, SPSS, SPS, Statpro, Microsat, Bigstep, Anates dll
DAFTAR PUSTAKA
Depdikbud,
1999, Pengelolaan Pengujian Bagi Guru
Mata Pelajaran, Jakarta.
Djemari
Mardapi, 2004, Penyusunan Tes Hasil
Belajar. Yogyakarta: UNY
Ign.
Masidjo. 1995, Penilaian Hasil Belajar Siswa di Sekolah. Yogyakarta:
Kanisius.
Nana
Sudjana, 2005, Penilaian Hasil Proses
Belajar Mengajar. Bandung: Remaja Rosdakarya
Ngalim
Purwanto, 2004, Prinsip-prinsip dan
Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya.
Suharsimi
Arikunto, 2006, Dasar-dasar Evaluasi
Pendidikan. Jakarta: Bumi Aksara
Sukardjo,
2008, Modul Perkuliahan Evaluasi
Pembelajaran Sains Pascasarjana UNY. Yogyakarta
Tidak ada komentar:
Posting Komentar