CARA MEMBUAT ANALISIS BUTIR SOAL DENGAN EXCEL

Pernahkah Anda menjadi bagian dari sebuah tes yang menggunakan soal pilihan ganda atau essay? Kedua jenis soal yang umum digunakan dalam konteks pendidikan atau seleksi ini, tentunya haruslah dibuat dengan analisis yang matang untuk memastikan kualitas dan validitasnya. Analisis butir soal menjadi aspek penting yang seringkali menjadi acuan dalam pengembangan soal, namun terkadang seringkali diabaikan oleh pengembang soal.

Baca Cepat show

Analisis Butir Soal Pilihan Ganda

Analisis butir soal pilihan ganda adalah proses evaluasi untuk menentukan kualitas kualitas setiap pertanyaan dalam sebuah tes atau soal pilihan ganda. Tujuan utama dari analisis ini adalah merancang soal yang mampu mengukur domain tertentu secara belajar, serta mengidentifikasi dan memperbaiki setiap kelemahan dalam soal pilihan ganda tersebut.

Analisis butir soal pilihan ganda memiliki beberapa komponen, yaitu:

Validitas soal
Reliabilitas soal
Diskriminasi soal
Daya Pembeda soal

Validitas Soal

Validitas soal dapat diartikan sebagai ukuran kualitas soal pilihan ganda dalam mengukur domain tertentu secara belajar atau akurat. Validitas soal dibagi menjadi tiga jenis, yaitu:

Konten validitas
Konstruk validitas
Criterion-related validity

Konten Validitas

Konten validitas menilai relevansi antara butir soal dengan materi yang diajarkan atau domain tertentu yang diukur. Dalam menganalisis konten validitas, perlu dilakukan dengan cara menganalisis kesesuaian jawaban dengan materi yang diukur serta membandingkan pertanyaan dengan topik materi yang dibahas.

Konstruk Validitas

Konstruk validitas menilai kemampuan butir soal dalam mengukur domain tertentu. Dalam menganalisis konstruk validitas, perlu dilakukan dengan cara menganalisis kemampuan pertanyaan mengeksplorasi konstruk yang ingin diukur dan membandingkan hasil pengujiannya dengan teori-teori yang mendukung konstruk yang ingin diukur.

Criterion-related Validity

Criterion-related validity menilai kemampuan soal dalam memprediksi hasil pada tes lain atau pada hasil belajar nyata. Dalam menganalisis criterion-related validity, perlu dilakukan dengan cara membandingkan hasil tes atau hasil belajar dengan hasil tes atau hasil belajar pada tes lain yang memiliki keterkaitan dengan domain tertentu yang diukur.

Baca Juga : CARA MENGECILKAN UKURAN FILE EXCEL 2003

Reliabilitas Soal

Reliabilitas soal adalah ukuran konsistensi ujian dalam mengukur domain tertentu. Soal pilihan ganda yang reliabel dapat menunjukkan bahwa hasil ujian memiliki tingkat konsistensi tinggi dan kurang terpengaruh oleh faktor lain, seperti faktor keberuntungan atau faktor luar seperti keadaan kesehatan atau stress.

Ada beberapa jenis reliabilitas soal, di antaranya:

Test-retest Reliability
Internal consistency reliability
Parallel forms reliability
Inter-rater Reliability

Test-Retest Reliability

Test-retest reliability adalah konsistensi hasil pengukuran pada waktu yang berbeda dengan menggunakan tes yang sama. Hal ini dilakukan dengan memberikan tes yang sama pada dua waktu yang berbeda dan membandingkan hasilnya. Test-retest reliability bermanfaat dalam menguji faktor-faktor yang berdampak pada hasil tes.

Internal Consistency Reliability

Internal consistency reliability menunjukkan konsistensi antara jawaban pada setiap butir soal. Hal ini dilakukan dengan membandingkan jawaban pada tiap soal dan menilai apakah butir soal saling berkaitan atau tidak.

Parallel Forms Reliability

Parallel forms reliability adalah konsistensi hasil pengukuran pada waktu yang berbeda dengan menggunakan tes yang berbeda namun sejenis. Hal ini dilakukan dengan menggunakan dua tes yang sama namun formulasi pertanyaan yang berbeda dan membandingkan hasilnya. Tujuan utama dari parallel forms reliability adalah menguji efek jangka pendek dari mengikuti tes yang sama.

Inter-rater Reliability

Inter-rater reliability menunjukkan konsistensi antara nilai jawaban yang diberikan oleh dua penguji yang berbeda. Hal ini dilakukan dengan membandingkan hasil pengukuran pada tiap butir soal yang dikerjakan oleh dua penguji yang berbeda.

Diskriminasi Soal

Diskriminasi soal adalah kemampuan soal dalam membedakan antara siswa yang memiliki kemampuan lebih tinggi dan siswa yang memiliki kemampuan lebih rendah dalam menguasai domain tertentu. Soal pilihan ganda yang baik harus dapat menentukan siswa yang memiliki kemampuan lebih tinggi dan menempatkan siswa tersebut pada peringkat yang lebih tinggi dalam hasil tes.

Daya Pembeda Soal

Daya pembeda soal adalah kemampuan soal dalam membedakan siswa yang telah memahami materi dengan benar dan menguasai domain tertentu. Soal pilihan ganda yang baik haruslah memiliki daya pembeda yang tinggi sehingga mampu menentukan perbedaan kemampuan siswa yang signifikan.

Baca Juga : Cara Membuat Data Siswa Menjadi Satu Di Excel Dengan Rumus

Analisis Butir Soal Essay

Analisis butir soal essay adalah proses evaluasi untuk menilai kualitas soal essay dalam mengukur domain tertentu secara belajar. Tujuan utama dari analisis ini adalah merancang soal yang lebih efektif dan akurat, serta mengidentifikasi dan memperbaiki setiap kelemahan dalam soal essay tersebut.

Untuk melakukan analisis butir soal essay, terdapat tiga komponen penting yang harus diperhatikan, yaitu:

Ketersediaan petunjuk scoring
Kevalidan instrumen
Kereliablean scoring

Ketersediaan Petunjuk Scoring

Petunjuk scoring adalah set instruksi yang digunakan untuk memberikan penilaian pada soal essay. Petunjuk ini merupakan bagian penting dalam analisis butir soal essay karena dapat mempengaruhi hasil dari tes yang dilakukan.

Ada beberapa jenis petunjuk scoring dalam analisis butir soal essay, di antaranya:

Generic Scoring or Holistic Scoring Method
Criterion Referenced Scoring
Analytic Scoring Method

Generic Scoring or Holistic Scoring Method

Generic Scoring atau Holistic Scoring Method adalah metode penilaian yang mengukur keseluruhan kualitas jawaban siswa dalam satu skor holistik. Skor holistik dapat mengungkapkan pengetahuan dan pemahaman siswa dengan cukup akurat dan efektif.

Criterion Referenced Scoring

Criterion Referenced Scoring adalah metode penilaian yang mengacu pada kriteria tertentu yang telah ditentukan. Hal ini membuat penilaian menjadi lebih obyektif, terstruktur, dan fokus pada domain yang ingin diukur. Namun, metode ini dapat memakan waktu yang lama untuk mengembangkan kriteria yang efektif untuk setiap domain yang ingin diukur.

Analytic Scoring Method

Analytic Scoring Method adalah metode penilaian yang memeriksa beberapa aspek dalam jawaban siswa, seperti struktur, logika, dan penggunaan bahasa. Metode ini memberikan detail yang lebih rendah dibandingkan dengan generic scoring atau criterion referenced scoring, namun memberikan hasil yang lebih obyektif.

Kevalidan Instrumen

Kevalidan instrumen dalam analisis butir soal essay adalah ukuran kapasitas instrumen untuk mengukur domain tertentu. Validitas instrumen dapat diukur melalui beberapa cara, di antaranya:

Content Validity
Construct Validity
Face Validity

Content Validity

Content Validity menilai seberapa baik butir soal essay mewakili domain tertentu yang ingin diukur. Proses evaluasi dapat dilakukan dengan menanyakan sejumlah ahli untuk mempelajari butir soal essay dan memeriksa apakah soal tersebut mewakili domain tertentu yang ingin diukur.

Construct Validity

Baca Juga : CARA BIKIN DATA MENDATAR MENJADI BERDIRI DI EXCEL

Construct Validity menilai kemampuan butir soal essay untuk mengukur konstruk tertentu seperti kreativitas, analisis, dan pemikiran kritis. Evaluasi construct validity dilakukan dengan melakukan uji coba soal pada sejumlah responden dengan kasus tertentu.

Face Validity

Face Validity menilai kemampuan butir soal essay untuk mengekspresikan domain tertentu dengan cara yang tepat dan mudah dipahami oleh siswa. Evaluasi face validity dilakukan dengan memberikan pertanyaan kepada sejumlah siswa untuk memastikan bahwa mereka mengerti dan dapat menjawab pertanyaan-pertanyaan dengan benar.

Kereliablean Scoring

Kereliablean scoring adalah ukuran yang menunjukkan bahwa penilaian yang sama terhadap jawaban siswa akan dihasilkan pada setiap kesempatan yang berbeda. Kereliablean scoring dapat diukur melalui beberapa cara, di antaranya:

Inter-Rater Reliability
Split-Halves Reliability
Test-Retest Reliability

Inter-Rater Reliability

Inter-Rater Reliability adalah ukuran konsistensi antara hasil penilaian yang diberikan oleh dua penguji yang berbeda pada soal yang sama. Evaluasi inter-rater reliability dilakukan dengan membandingkan hasil penilaian antara dua penguji yang berbeda.

Split-Halves Reliability

Split-Halves Reliability adalah ukuran konsistensi antara hasil penilaian dari setiap separuh pertanyaan atau jawaban pada tes. Evaluasi split-halves reliability dilakukan dengan membandingkan nilai penilaian dari separuh pertanyaan pertama dengan nilai penilaian dari separuh pertanyaan kedua.

Test-Retest Reliability

Test-Retest Reliability adalah ukuran konsistensi antara hasil penilaian dari tes atau jawaban yang sama pada waktu yang berbeda. Evaluasi test-retest reliability dilakukan dengan memberikan tes atau jawaban pada dua waktu yang berbeda dan membandingkan nilai jawaban atau tes tersebut.

FAQ

Apa itu analisis butir soal pilihan ganda dan essay?

Analisis butir soal pilihan ganda dan essay adalah proses evaluasi untuk menentukan kualitas kualitas setiap pertanyaan dalam sebuah tes atau soal pilihan ganda dan essay. Tujuannya adalah untuk merancang soal yang mampu mengukur domain tertentu secara belajar, serta mengidentifikasi dan memperbaiki setiap kelemahan dalam soal pilihan ganda dan essay tersebut.

Apa saja yang harus diperhatikan dalam analisis butir soal pilihan ganda dan essay?

Perlu diperhatikan validitas, reliabilitas, diskriminasi, dan daya pembeda dari setiap butir soal dalam analisis butir soal pilihan ganda. Sedangkan pada analisis butir soal essay perlu diperhatikan ketersediaan petunjuk scoring, kevalidan instrumen, dan kereliablean scoring.