>
MEMILIH ITEM UJIAN [ Bagaimana Di Katakan Item Ujian
Berfungsi ? ]
Kandungan ujian adalah kriteria yang penting dalam menentukan pemilihan ujian “norm-reference” atau pun ujian “criterion-reference”. Kandungan ujian norm-reference biasanya mengukur perbandingan pencapaian pelajar berkemampuan tinggi dengan pelajar berkemampuan rendah manakala kandungan ujian berasaskan kriteria ditentukan dengan bagaimana kandungan ujian tersebut dapat mengukur hasil pembelajaran yang difikirkan mustahak. Walaupun tiada ujian dapat menyatakan yang mana satu adalah penting atau mustahak, kandungan yang ditentukan dalam ujian berasaskan kriteria adalah dipilih berdasarkan kepentingan kurikulum sementara kandungan ujian norm-reference adalah dipilih berdasarkan sejauhmanakah ujian tersebut dapat membezakan atau membandingkan pelajar. Mana-mana ujian nasional, negeri maupun daerah akan memaklumkan tahap kemahiran yang patut diperolehi dan tahap pencapaian yang memuaskan. Oleh itu, mana-mana pegawai pendidikan seharus dan sepatutnya memberi tumpuan utama terhadap memilih kandungan ujian yang sesuai atau yang dibentuk. Bagi penduduk Malaysia yang mementingkan skoran yang tinggi, kandungan ujian berpusat akan mempengaruhi pembangunan kurikulum matapelajaran dan piawaian ditahap cemerlang. Ujian norm reference yang sedia ada dikatakan menumpukan kemahiran asas tahap rendah . Kenyataan ini adalah bertentangan dengan cadangan penyelidikan mengenai pengajaran dan pembelajaran yang mahukan pendidik menumpukan kepada konsep kefahaman dan aplikasi kemahiran. Bagi memastikan penyediaan ujian pencapaian piawai, pendidik biasanya akan menumpukan masa pengajaran dengan mengajar apa yang terdapat didalam ujian yang bakal di hadapi. Ini ada kebenarannya terutama jika ujian yang dijalankan akan mengukur pencapaian dan kebolehan pendidik tersebut. Desakan yang mahukan pelajar mendapat keputusan cemerlang, memberi tekanan keatas pendidik yang menyebabkan pelajar memperolehi tahap kemahiran yang rendah. Bagi membolehkan pengetahuan bersama, artikel ini akan cuba memberi sedikit perkongsian pengetahuan dan adalah terbuka kepada perbincangan. Contoh yang akan digunakan adalah contoh item subjektif dari mata pelajaran vokasional Membuat Perabot. Kebiasaannya, sebelum sesuatu ujian diterima dan diguna pakai untuk tujuan peperiksaan, pendidik hendaklah menjalankan pra-ujian keatas pelajar-pelajar. Item-item ini biasanya dibina ketika mesyuarat perealisasian item. Panel pembina item yang adalah terdiri dari guru-guru yang terpilih dikalangan guru-guru yang mengajar mata pelajaran Membuat Perabot di sekolah berkaitan. Item dibina mengikut jadual spesifikasi ujian yang telah di perakui Lembaga Peperiksaan Malaysia dan guru-guru terlibat akan memulakan kerja membina item di mesyuarat tersebut. Panel akan mula menetapkan item ujian yang telah dipersetujui dengan menyemak samada item ujian menepati konstruk dan kandungan konteks dan mematuhi kriteria sembilan point.
Setelah dipersetujui, panel of review (yang biasa terdiri dari Ketua Bidang/Ketua UNIT dan empat hingga lima pegawai unit) akan menjalankan proses menyemak (review). Setelah diterima oleh panel of review barulah item ujian yang telah diperakui dihantar untuk dicetak dan diberikan kepada pegawai pembina yang kemudiannya akan menjalankan pra-ujian disekolah-sekolah yang dilawati.
Selepas tamat lawatan pra-ujian disekolah, pegawai pembina akan akan mengambil data skoran yang diperolehi dari guru/pemeriksa kertas dan dengan mengunakan kaedah menganalisa item subjektif dari Unit Psikometri (OGIF 2003/2004), pegawai pembina akan menganalisa data skoran yang diperolehi dan memaklumkan keputusan hasilan kepada Ketua Sektor Pembinaan dan Pengeluaran Ujian untuk tindakan selanjutnya. Kebiasaannya, jika item ujian tidak memenuhi kehendak spesifikasi, item ujian akan diganti, dibina semula ataudibuang jika perlu.
Bagaimana dikatakan item ujian tersebut berfungsi seperti yang dikehendaki ? Sebagai contoh permulaan dua item aras kesukaran rendah, satu item aras kesukaran sederhana dan satu item aras kesukaran tinggi akan digunakan untuk menerang maksud. Item-item ini telah di uji keatas pelajar di beberapa sekolah menengah vokasional yang menawarkan mata pelajaran vokasional Membuat Perabot. Dari dapatan analisa skoran, tumpuan adalah keatas perkadaran (nilai P), indeks diskriminasi (nilai ID) dan nilai delta.
Jadual 1. Contoh Data Analisa Skoran Pra-Ujian Mata
Pelajaran Membuat Perabot Pegawai pembina akan menganalisa dan menginterpretasikan setiap item ujian yang diperolehi. Untuk perbincangan, S2R, S6R, S8R, S12S, S13S dan S15T akan digunakan. Perkadaran (Nilai P) Nilai P boleh digunakan untuk memberi ukuran aras kesukaran item (Dr.Jamil,2004). Untuk menerangkan maksud jadual, nilai P bagi S2R adalah 0.630, yang bermaksud aras kesukaran item ujian tersebut adalah 63.0 %, ini memberi erti 63.0% pelajar berjaya menjawab item ujian tersebut dengan betul. Nilai P bagi S6R adalah 0.395, yang bermaksud aras kesukaran item ujian tersebut adalah 39.5 %, ini memberi erti 39.5 % pelajar berjaya menjawab item ujian tersebut dengan betul. Nilai P bagi S8R adalah 0.791, yang bermaksud aras kesukaran item ujian tersebut adalah 79.1 %, ini memberi erti 79.1 % pelajar berjaya menjawab item ujian tersebut dengan betul. Nilai P bagi S12S adalah 0.082, yang bermaksud aras kesukaran item ujian tersebut adalah 8.2 %, ini memberi erti 8.2 % pelajar berjaya menjawab item ujian tersebut dengan betul. Nilai P bagi S13S adalah 0.234, yang bermaksud aras kesukaran item ujian tersebut adalah 23.4 %, ini memberi erti 23.4 % pelajar berjaya menjawab item ujian tersebut dengan betul. Nilai P bagi S15T adalah 0.099, yang bermaksud aras kesukaran item ujian tersebut adalah 9.9 %, ini memberi erti 9.9 % pelajar berjaya menjawab item ujian tersebut dengan betul. Nilai Delta Nilai Delta ialai nilai P bagi setiap opsyen yang telah ditukar kepada skor mentah kepada skor standard dengan min 13 dan sisih piawai 4. Nilai Delta juga memberi ukuran aras kesukaran item atau ujian. Semakin kecil nilai P, semakin sukar item atau ujian m manakaln bagi nilai Deltam semakin kecil Delta semakin mudah item atau ujian. Item yang dianggap sederhana mudah ialah yang mempunyai nilai Delta 13.0. (OGIF 2004, pp12) Jadual 2, menunjukkan dapatan nilai P bagi S2R, S6R, S8R, S12S, S13S dan S15T dengan menggunakan Jadual Nilai Delta.
Jadual 2 Penilaian Item -Dapatan Nilai P Indeks Diskriminasi Indeks diskriminasi ialah indeks yang memberi ukuran sejauh mana ujian dan item-item mendisrikinasikan calon berkebolehan tinggi daripada yang sebaliknya. Semakin tinggi nilai indeks tersebut semakin baik ujian atau item tersebut dapat mendiskriminasikan calon. Indeks diskriminasi ujian diberi oleh nilai min r-point biserial iaitu koeffisen korelasi di antara skor item dengan jumlah skor. Ukuran ini dapat memberi maklumat tentang kepelbagaian skor yang diterima oleh pelbagai jenis dan kebolehan calon. Lembaga Peperiksaan Malaysia memberi penilaian ke atas nilai-nilai indeks diskriminasi seperti berikut :
Jadual
3. Perbandingan Nilai Indeks Diskriminasi dengan Jadual Penilaian Item Dari dapatan data analisa, didapati : Nilai indeks diskriminiasi S2R ialah -0.225, dan berpandukan kepada jadual 3, item ujian ini dikatakan sangat tidak baik dan item ini perlu ditolak atau dikaji semula; Nilai indeks diskriminasi S6R ialah 0.067 dan berpandukan kepada jadual 3, item ini dikatakan sangat tidak baik dan perlu ditolak atau dikaji semula; Nilai indeks diskriminasi S8R ialah 0.198, dan berpandukan kepada jadual 3, item ini dikatakan item ini boleh digunakan dengan syarat diperbaiki dan diprauji semula; Nilai indeks diskriminasi S12S ialah -0.0069, dan berpandukan kepada jadual 3, item ini dikatakan sangat tidak baik dan perlu ditolak atau dikaji semula; Nilai indeks diskriminasi S13S ialah 0.61, nilai item ini melebihi 0.4 keatas, dan item ini dikatakan sangat baik; dan Nilai indeks diskriminasi S15T ialah 0.053, dan berpandukan kepada jadual 3, item ini dikatakan sangat tidak baik dan perlu ditolak atau dikaji semula. Hasil dapatan menunjukkan item S2R (p=0.683, ID= -0.225, ND=11.7) adalah mudah, item S6R (p=0.395, ID=0.067, ND=14.1) adalah sederhana tetapi perlu diperbaiki dan ditukar agar ianya menjadi item mudah, item S8R (p=0.791, ID=0.198, ND=9.8) adalah mudah , S12S (p=0.082, ID= -0.069, ND=18.5) adalah terlalu sukar dan harus diperbaiki ketahap sederhana, S13S (p=0.234, ID=0.161, ND=16.0) adalah sukar dan S15T (p=0.099, ID= 0.053, ND=18.4) adalah terlalu sukar. Berdasarkan kepada Laporan Khodori (2003), item aras kesukaran rendah hendaklah boleh dijawab oleh semua pelajar, item aras kesukaran sederhana hendaklah boleh dijawab oleh pelajar pencapaian sederhana dan item aras kesukaran tinggi hendaklah hanya boleh dijawab pelajar pencapaian tinggi. Dari hasilan pengiraan diatas, hanya item S2R dan S8R memenuhi spesifikasi ujian Lembaga Peperiksaan Malaysia, dapatan ini kiranya dapat membantu pendidik terutama pembina item mengkaji semula item yang dibina sesuai dengan kehendak ujian. Dari hasil pengiraan dan keputusan juga, beberapa pandangan adalah dikatakan kemampuan pelajar memahami dan menjawab soalan adalah terbatas. Kemungkinan yang berlaku adalah pelajar tidak diajar komponen yang disoal. Ini sudah tentu menyebabkan pelajar samada tidak menjawab atau pun menjawab dengan salah. Pembina juga harus dan semestinya adalah orang yang ahli dalam bidang mata pelajaran. Pembina juga haruslah berhati-hati ketika membina item. Semestinya makluman mengenai kemampuan setiap pelajar hendaklah diambil kira. Ini adalah berdasarkan konsep criterion-based assessment bahawa “ask only questions that had been taught and learned” supaya keadaan ini akan berlaku adil dan peluang menjawab adalah setara. Panel of review juga seharusnya terdiri dari ahli-ahli yang tahu akan konsep mata pelajaran, memahami kehendak spesifikasi dengan hanya membantu dalam hal editorial dan tidak membantutkan usaha yang telah dijalankan. Komen yang diberi hendaklah berdasarkan pengetahuan dan pembelajaran pelajar, cadangan pembaikan semula hendaklah berdasarkan sukatan mata pelajaran dan kompetensi pelajar. Pihak pengurusan pentaksiran perlu hadir memantau dan membantu dalam penyelarasan pentaksiran bagi memastikan kesahan dan kebolehpercayaan . Proses re-test yang dicadangkan perlu dilakukan sebaik sahaja hasialn item ujian yang dianalisa diperolehi. Walaupun bukan senang dan mudah seperti yang dinyatakan tetapi adalah perlu bagi memastikan kredibiliti badan ujian. Bibiliografi Lembaga Peperiksaan Malaysia (2002), Analisis Item. Kertas Kerja Kursus Pegawai- Pegawai
SPPU. Lembaga Peperiksaan Malaysia (2004), Item Analisa Item Subjektif. OGIF 200/2004. Lembaga Peperiksaan Malaysia (2002), Manual Pelaksanaan Pencerapan dan Pengesanan. Dibina pada 10/12/04 dan dikemaskini pada 10/14/04 oleh Azizi@2004 |