Sabtu, 29 Februari 2020

Teori Respon Butir (IRT)

Mohon maaf sebelumnya, bahwa postingan ini merupakan ramuan dari hasil penelusuran sana-sini sebagai pengingat dan belajar tentang teori respon butir. Sekiranya ada yang sedang mempelajarinya mari belajar bersama. Saya posting dengan kesengajaan agar tidak lupa meletakkan di folder dan file mana.

Teori Klasik dan Teori Respon Butir
Teori tes klasik memang telah mendominasi dan banyak digunakan dalam dunia pengukuran dalam beberapa dekade terakhir. Hampir semua konsep validitas dan reliabilitas yang dikenal saat ini merupakan pengembangan dari teori tes klasik. Menurut beberapa pendapat teori tes klasik memiliki  keterbatasan, sehingga berkembanglah teori respon butir atau Item Response Theory (IRT) yang merupakan teori yang dikembangkan untuk memperbaiki keterbatasan-keterbatasan teori tes klasik. Teori Respon Butir biasa disebut juga teori sifat laten (latent trait theory). Konsep dasar Teori Respon Butir adalah, (1) performansi subjek pada suatu tes dapat diprediksi atau dijelaskan oleh seperangkat faktor yang disebut traits, latent traits atau abilitas, dan (2) hubungan antara performansi subjek pada suatu butir dan seperangkat kemampuan laten yang mendasarinya dapat digambarkan oleh suatu fungsi yang menaik secara monoton yang disebut sebagai kurva karakteristik butir (Item characteristic curve-ICC) (Hambleton, Swaminathan, & Rogers, 1991).



 Asumsi dalam Teori Respon Butir
Setidaknya terdapat tiga asumsi dasar dalam Teori Respon Butir yang harus dipenuhi. Asumsi-asumsi tersebut adalah asumsi unidimensi, independensi lokal, dan ketepatan kurva karakteristik butir (Hambleton, dkk, 1991).
1. Asumsi unidimensi
Asumsi ini merujuk pada abilitas yang diukur dalam suatu perangkat soal adalah tunggal. Idealnya, setiap butir tes yang dibuat hanya  mengukur salah satu dari kemampuan peserta tes, bukan mengukur dua atau lebih kemampuan peserta tes. Jika suatu butir mengukur hal yang bersifat multidimensi, maka skor pada butir tersebut merupakan kombinasi dari berbagai kemampuan subjek. Meskipun begitu pada praktiknya asumsi unidimensi ini tidak dapat secara ketat diterapkan karena adanya faktor-faktor yang mempengaruhi seperti kognitif, kepribadian, dan faktor yang berkaitan dengan aspek administrasi tes. Hal yang paling penting dalam asumsi ini adalah adanya satu komponen dominan yang mempengaruhi performasi subjek.

2. Asumsi independensi lokal (local independence)
Asumsi ini merujuk apabila kemampuan-kemampuan yang mempengaruhi performansi tes dijadikan konstan, maka respons subjek terhadap butir manapun akan independen secara statistik. Independensi lokal terhadap butir dapat diartikan bahwa respon subjek pada butir satu tidak berpengaruh terhadap respon pada butir lain atau secara sederhana dapat dikatakan bahwa asumsi indepensi lokal akan terpenuhi apabila jawaban peserta terhadap suatu butir soal tidak bergantung pada jawaban peserta terhadap butir soal yang lain.

3. Asumsi Invariansi
Kurva karakteristik butir haruslah merefleksikan secara benar hubungan antara variabel yang tidak terobservasi dan variabel yang terobservasi. Fungsi ini haruslah bersifat tetap dan tidak berubah. Karakteristik butir tetap atau tidak berubah sekalipun subpopulasi peserta tes yang menjawab butir yang sama itu berubah-ubah. Untuk kelompok yang sama, ciri mereka adalah tetap sekalipun butir yang mereka jawab itu berubah-ubah. Sifat ini disebut juga sebagai invariansi.

Menurut Stark, dkk (2001) paling tidak ada dua keuntungan teori respon butir bila dibandingkan dengan tori tes klasik, yaitu:

a. Parameter butir dan peserta tes tidak saling mempengaruhi, sehingga memungkinkan untuk melihat konstribusi butir sewaktu butir itu ditambahkan atau dikurangi pada suatu perangkat tes.
b. Memungkinkan peneliti untuk melakukan pengukuran yang sangat cermat pada kelompok-kelompok yang ekuivalen namun  berbeda kultur sehingga dapat diketahui ada bias atau tidak pada hasil pengukuran itu.
Penjelasan mengenai hal ini juga dijabarkan lebih lanjut oleh Embretson & Reise (2000) yang mengemukakan sepuluh kelebihan teori respon butir dibanding teori tes klasik, yaitu:
a. Tes yang lebih pendek bisa jadi lebih reliabel dibanding tes yang lebih panjang.
b. Perbandingan skor-skor tes antar berbagai format akan optimal jika tingkat kesulitan tes bervariasi antar peserta.
c. Estimasi-estimasi yang tidak bias bisa diperoleh dari sampel yang tidak representatif.
d. Skor tes memiliki arti manakala dibandingkan dengan karakteristik aitem-aitem.
e. Standard Error of Measurement (SEM) memiliki nilai yang berbeda-beda antar skor (atau pola-pola respon), tetapi bersifat umum antar populasi.
f. Skala yang bersifat interval dicapai dengan menggunakan model pengukuran yang lebih logis.
g. Tes dengan format aitem campuran dapat menghasilkan skor tes yang optimal.
h. Skor-skor yang berubah dapat dibandingkan secara berarti jika tingkat skor awal berbeda.
i. Hasil faktor analisis pada data skor kasar aitem menghasilkan sebuah full information factor analysis.
j. Sifat-sifat aitem sebagai stimulus dapat secara langsung berhubungan dengan sifat-sifat psikometriknya.

Model dalam Teori Respon Butir
Model ogive normal merupakan model bentuk kurve karakteristik item yang sangat dominan pada masa awal penelitian mengenai Teori Respon Butir, namun pada saat ini mulai banyak digantikan oleh model-model logistik. Ada tiga macam model logistik. Perbedaan mendasar antara berbagai model yang populer adalah terletak pada jumlah parameter yang digunakan dalam mendeskripsikan butir. Oleh karena itu penyusunan model dalam perkembangannya merujuk pada jumlah parameter yang digunakan, yaitu parameter indeks kesukaran, daya diskriminasi butir, dan probabilitas tebakan semu.

Model Logistik Satu Parameter (1PL)
Model 1PL ini disebut juga sebagai model Rasch. Pada penyusunan model 1PL ini, karakteristik butir yang dilibatkan hanya satu, yaitu parameter taraf kesukaran butir (bi). Parameter (bi) digambarkan dalam suatu kurva ICC sebagai titik dalam skala kemampuan yang memiliki probabilitas menjawab benar sebesar 0,5. Semakin tinggi taraf kesukaran butir, maka dibutuhkan abilitas yang lebih besar untuk mempertahankan probabilitas 0,5 dalam kurva. Oleh karena itu pada kurva ICC butir-butir yang sulit selalu berada di sebelah kanan butir yang mudah (Azwar, 2015).







Model Logistik Dua Parameter (2PL)
Model logistik dua parameter (2PL) menggunakan dua parameter dalam penyusunan model, yaitu parameter taraf kesukaran butir (bi) dan daya beda butir (ai).






Model Logistik Tiga Parameter (3PL)
Model logistik tiga parameter menggunakan semua parameter butir yang ada, yaitu taraf kesukaran butir (bi) daya beda butir (ai), dan probabilitas tebakan semu (ci).




Gambar Kurve Karakteristik Item dengan 3 parameter ditunjukkan sebagai berikut














Referensi
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar
Hambleton, R. K., Swaminathan, H., & Rogers, J. H. (1991). Fundamentals of Item Response Theory. California: SAGE PUBLICATIONS
Stark, S., Chernyshenko, O. S., Chan, K.-Y., Lee, W. C., & Drasgow, F. (2001). Effects of the testing situation on item responding: Cause for concern. Journal of Applied Psychology, 86, 943-953

Tidak ada komentar:

Posting Komentar

Jangan Lupa Tinggalkan Komentar Sobat... ^_^