> Memilih Item Ujian

MEMILIH ITEM UJIAN

[ Bagaimana Di Katakan Item Ujian Berfungsi ? ]

 

Kandungan ujian adalah kriteria yang penting dalam menentukan pemilihan ujian “norm-reference” atau pun ujian “criterion-reference”. Kandungan ujian norm-reference  biasanya mengukur perbandingan pencapaian pelajar berkemampuan tinggi dengan pelajar berkemampuan rendah manakala kandungan ujian berasaskan kriteria  ditentukan dengan bagaimana kandungan ujian  tersebut dapat mengukur hasil pembelajaran yang difikirkan mustahak.  Walaupun tiada ujian dapat menyatakan yang mana satu adalah penting atau  mustahak, kandungan yang ditentukan dalam ujian berasaskan kriteria adalah dipilih berdasarkan kepentingan kurikulum sementara kandungan ujian norm-reference adalah dipilih berdasarkan sejauhmanakah ujian tersebut dapat membezakan atau membandingkan pelajar.

Mana-mana ujian nasional, negeri maupun daerah akan memaklumkan tahap kemahiran yang patut diperolehi dan tahap pencapaian  yang memuaskan. Oleh itu, mana-mana pegawai pendidikan  seharus dan sepatutnya memberi tumpuan utama terhadap memilih kandungan ujian yang sesuai atau yang dibentuk. Bagi penduduk Malaysia yang mementingkan skoran yang tinggi, kandungan ujian berpusat akan mempengaruhi pembangunan kurikulum matapelajaran dan piawaian ditahap cemerlang.

Ujian norm reference yang sedia ada dikatakan menumpukan kemahiran asas tahap rendah .  Kenyataan ini adalah bertentangan dengan cadangan penyelidikan mengenai pengajaran dan pembelajaran yang mahukan pendidik menumpukan kepada konsep kefahaman dan aplikasi kemahiran.  Bagi memastikan penyediaan ujian pencapaian piawai, pendidik biasanya akan menumpukan masa pengajaran dengan mengajar apa yang terdapat didalam ujian yang bakal di hadapi. Ini ada kebenarannya terutama jika ujian yang dijalankan akan mengukur pencapaian dan kebolehan pendidik tersebut. Desakan yang mahukan pelajar mendapat keputusan cemerlang, memberi tekanan keatas pendidik yang menyebabkan pelajar memperolehi tahap kemahiran yang rendah.

Bagi membolehkan pengetahuan bersama, artikel ini akan cuba memberi sedikit perkongsian pengetahuan dan adalah terbuka kepada perbincangan. Contoh yang akan digunakan adalah contoh item subjektif dari mata pelajaran   vokasional Membuat Perabot. Kebiasaannya, sebelum sesuatu ujian diterima dan diguna pakai untuk tujuan peperiksaan, pendidik hendaklah menjalankan pra-ujian keatas pelajar-pelajar.

 

Item-item ini biasanya dibina ketika mesyuarat perealisasian item. Panel pembina item yang adalah terdiri  dari guru-guru yang terpilih dikalangan guru-guru yang mengajar mata pelajaran Membuat Perabot di sekolah berkaitan. Item dibina mengikut jadual spesifikasi ujian yang telah di perakui Lembaga Peperiksaan Malaysia dan guru-guru terlibat akan memulakan kerja membina item di mesyuarat tersebut. Panel akan mula menetapkan item ujian yang telah dipersetujui dengan menyemak samada item ujian menepati konstruk dan kandungan konteks dan mematuhi kriteria sembilan point.

 

Setelah dipersetujui, panel of review (yang biasa terdiri dari Ketua Bidang/Ketua UNIT dan empat hingga lima pegawai unit) akan menjalankan proses menyemak (review). Setelah diterima oleh panel of review barulah item ujian yang telah diperakui dihantar untuk  dicetak dan diberikan kepada pegawai pembina yang kemudiannya akan menjalankan pra-ujian disekolah-sekolah yang dilawati.

 

Selepas tamat lawatan pra-ujian disekolah, pegawai pembina akan akan mengambil data skoran yang diperolehi dari guru/pemeriksa kertas dan dengan mengunakan kaedah menganalisa item subjektif dari Unit Psikometri (OGIF 2003/2004), pegawai pembina akan menganalisa data skoran yang diperolehi dan memaklumkan keputusan hasilan kepada Ketua Sektor Pembinaan dan Pengeluaran Ujian untuk tindakan selanjutnya. Kebiasaannya, jika item ujian tidak memenuhi kehendak spesifikasi, item ujian akan diganti, dibina semula ataudibuang jika perlu.

 

Bagaimana dikatakan item ujian tersebut berfungsi seperti yang dikehendaki ? Sebagai contoh permulaan dua item aras kesukaran rendah, satu item aras kesukaran sederhana dan satu item aras kesukaran tinggi akan digunakan untuk menerang maksud. Item-item ini telah di uji keatas pelajar di beberapa sekolah menengah vokasional yang menawarkan mata pelajaran vokasional Membuat Perabot.

 

Dari dapatan analisa skoran,  tumpuan adalah keatas perkadaran (nilai P), indeks diskriminasi (nilai ID) dan nilai delta.

 

Indeks

S1

S2

S3

S4

S5

S6

S7

S8

S9

S10

S11

S12

S13

S14

S15

Skor

Aras Kesukaran

R

R

R

R

R

R

R

R

R

R

S

S

S

T

T

 

N (Jumlah Skor)

269

362

258

203

277

221

278

451

144

102

451

75

253

207.5

90

3641.5

P (Perkadaran)

0.485

0.630

0.457

0.369

0.490

0.395

0.510

0.791

0.257

0.210

0.410

0.082

0.234

0.218

0.099

0.314

IC (Indeks Cuba)

0.905

0.940

0.922

0.897

0.922

0.914

0.888

0.931

0.914

0.784

0.897

0.733

0.879

0.767

0.733

0.948

(ID)Indeks Diskriminasi

0.246

-0.225

-0.076

0.258

0.258

0.067

0.125

0.198

0.706

0.630

0.285

-0.069

0.161

-0.028

0.053

0.329

Nilai Delta

13.2

11.7

13.5

14.4

13.1

14.1

12.9

9.8

15.7

16.2

13.9

18.5

16

16.2

18.4

15

 

Jadual 1. Contoh Data Analisa Skoran Pra-Ujian Mata Pelajaran Membuat Perabot

 

 

 

Pegawai pembina akan menganalisa dan menginterpretasikan setiap item ujian yang diperolehi. Untuk perbincangan, S2R, S6R, S8R, S12S, S13S dan S15T akan digunakan.

 

Perkadaran (Nilai P)

 

 

Nilai P boleh digunakan untuk memberi ukuran aras kesukaran item (Dr.Jamil,2004).

Untuk menerangkan maksud jadual, nilai P bagi  S2R adalah 0.630, yang bermaksud aras kesukaran item ujian tersebut adalah 63.0 %, ini memberi erti 63.0% pelajar berjaya menjawab item ujian tersebut dengan betul.

 

Nilai P bagi S6R adalah 0.395, yang bermaksud aras kesukaran item ujian tersebut adalah 39.5 %, ini memberi erti 39.5 % pelajar berjaya menjawab item ujian tersebut dengan betul.

 

Nilai P bagi S8R adalah 0.791, yang bermaksud aras kesukaran item ujian tersebut adalah 79.1 %, ini memberi erti 79.1 % pelajar berjaya menjawab item ujian tersebut dengan betul.

 

Nilai P bagi S12S adalah 0.082, yang bermaksud aras kesukaran item ujian tersebut adalah 8.2 %, ini memberi erti 8.2 % pelajar berjaya menjawab item ujian tersebut dengan betul.

 

Nilai P bagi S13S adalah 0.234, yang bermaksud aras kesukaran item ujian tersebut adalah 23.4 %, ini memberi erti 23.4 % pelajar berjaya menjawab item ujian tersebut dengan betul.

Nilai P bagi S15T adalah 0.099, yang bermaksud aras kesukaran item ujian tersebut adalah 9.9 %, ini memberi erti 9.9 % pelajar berjaya menjawab item ujian tersebut dengan betul.

 

Nilai Delta

 

Nilai Delta ialai nilai P bagi setiap opsyen yang telah ditukar kepada skor mentah kepada skor standard dengan min 13 dan sisih piawai 4. Nilai  Delta juga memberi ukuran aras kesukaran item atau ujian. Semakin kecil nilai P, semakin sukar item atau ujian m manakaln bagi nilai Deltam semakin kecil Delta semakin mudah item atau ujian. Item yang dianggap sederhana mudah ialah yang mempunyai nilai Delta 13.0. (OGIF 2004, pp12)

 

Jadual 2, menunjukkan dapatan nilai P bagi S2R, S6R, S8R, S12S, S13S dan S15T dengan menggunakan Jadual Nilai Delta.

 

Item Ujian

Nilai P

Nilai Delta

(Indeks Kesukaran)

Penilaian Item

S2R

0.63

11.7

Mudah tetapi boleh terus digunakan

S6R

0.395

14.1

Sederhana dan boleh terus digunakan

S8R

0.791

9.8

Mudah. Boleh digunakan dengan syarat diperbaiki dan diprauji semula

S12S

0.082

18.6

Terlalu sukar. Tidak sesuai digunakan

S13S

0.23

16.0

Sukar. Boleh digunakan dengan syarat diperbaiki dan diprauji semula

S15T

0.099

18.4

Terlalu sukar. Tidak sesuai digunakan

 

Jadual 2  Penilaian Item -Dapatan Nilai P

 

 

Indeks Diskriminasi

 

 

Indeks diskriminasi ialah indeks yang memberi ukuran sejauh mana ujian dan item-item mendisrikinasikan calon berkebolehan tinggi daripada yang sebaliknya. Semakin tinggi nilai indeks tersebut semakin baik ujian atau item tersebut dapat mendiskriminasikan calon. Indeks diskriminasi ujian diberi oleh nilai min r-point biserial iaitu koeffisen korelasi di antara skor item dengan jumlah skor. Ukuran ini dapat memberi maklumat tentang kepelbagaian skor yang diterima oleh pelbagai jenis dan kebolehan calon. Lembaga Peperiksaan Malaysia memberi penilaian ke atas nilai-nilai indeks diskriminasi seperti berikut :

 

Indeks Diskriminasi

Penilaian Item

0.4 ke atas

Sangat Baik

0.30 hingga 0.39

Baik dan boleh terus digunakan

0.20 hingga 0.29

Baik tetapi mungkinboleh diperbaiki dan diprauji semula sebelum digunakan

0.15 hingga 0.19

Item ini boleh digunakan dengan syarat diperbaiki dan diprauji semula

0.14 ke bawah

Sangat tidak baik. Item ini perlu ditolak atau dikaji semula

 

Jadual 3. Perbandingan Nilai Indeks Diskriminasi dengan Jadual Penilaian Item

Dari dapatan data analisa, didapati :

 

Nilai indeks diskriminiasi S2R ialah -0.225, dan berpandukan kepada jadual 3, item ujian ini dikatakan sangat tidak baik dan item ini perlu ditolak atau dikaji semula;

Nilai indeks diskriminasi S6R ialah 0.067 dan berpandukan kepada jadual 3, item ini dikatakan sangat tidak baik dan perlu ditolak atau dikaji semula;

Nilai indeks diskriminasi S8R ialah 0.198, dan berpandukan kepada jadual 3, item ini dikatakan item ini boleh digunakan dengan syarat diperbaiki dan diprauji semula;

Nilai indeks diskriminasi S12S ialah -0.0069, dan berpandukan kepada jadual 3, item ini dikatakan sangat tidak baik dan perlu ditolak atau dikaji semula;

Nilai indeks diskriminasi S13S ialah 0.61, nilai item ini melebihi 0.4 keatas, dan item ini dikatakan sangat baik; dan

Nilai indeks diskriminasi S15T ialah 0.053, dan berpandukan kepada jadual 3, item ini dikatakan sangat tidak baik dan perlu ditolak atau dikaji semula.

 

Hasil dapatan menunjukkan item S2R (p=0.683, ID= -0.225, ND=11.7) adalah mudah, item S6R (p=0.395, ID=0.067, ND=14.1) adalah sederhana  tetapi perlu diperbaiki dan ditukar agar ianya menjadi item mudah, item S8R (p=0.791, ID=0.198, ND=9.8) adalah mudah , S12S (p=0.082, ID= -0.069, ND=18.5) adalah terlalu sukar dan harus diperbaiki ketahap sederhana, S13S (p=0.234, ID=0.161, ND=16.0) adalah sukar dan S15T (p=0.099, ID= 0.053, ND=18.4) adalah terlalu sukar.

 

Berdasarkan kepada Laporan Khodori (2003), item aras kesukaran rendah hendaklah boleh dijawab oleh semua pelajar, item aras kesukaran sederhana hendaklah boleh dijawab oleh pelajar pencapaian sederhana dan item aras kesukaran tinggi hendaklah hanya boleh dijawab pelajar pencapaian tinggi. Dari hasilan pengiraan diatas, hanya item S2R dan S8R memenuhi spesifikasi ujian Lembaga Peperiksaan Malaysia, dapatan ini kiranya dapat membantu pendidik terutama pembina item mengkaji semula item yang dibina sesuai dengan kehendak ujian.

 

Dari hasil pengiraan dan keputusan juga, beberapa pandangan adalah dikatakan kemampuan pelajar memahami dan menjawab soalan adalah terbatas. Kemungkinan yang berlaku adalah pelajar tidak diajar komponen yang disoal.  Ini sudah tentu menyebabkan pelajar samada tidak menjawab atau pun menjawab dengan salah.

 

Pembina juga harus dan semestinya adalah orang yang ahli dalam bidang mata pelajaran. Pembina juga haruslah berhati-hati ketika membina item. Semestinya makluman mengenai kemampuan setiap pelajar hendaklah diambil kira. Ini adalah berdasarkan konsep criterion-based assessment bahawa “ask only questions that had been taught and learned” supaya keadaan ini akan berlaku adil dan peluang menjawab adalah setara.

 

Panel of review juga seharusnya terdiri dari ahli-ahli yang tahu akan konsep mata pelajaran, memahami kehendak spesifikasi dengan hanya membantu dalam hal editorial dan tidak membantutkan usaha yang telah dijalankan. Komen yang diberi hendaklah berdasarkan pengetahuan dan pembelajaran pelajar, cadangan pembaikan semula hendaklah berdasarkan sukatan mata pelajaran dan kompetensi pelajar. 

 

Pihak pengurusan pentaksiran perlu hadir memantau dan membantu dalam penyelarasan pentaksiran bagi memastikan kesahan dan kebolehpercayaan . Proses re-test yang dicadangkan perlu dilakukan sebaik sahaja hasialn item ujian yang dianalisa diperolehi. Walaupun bukan senang dan mudah seperti yang dinyatakan tetapi adalah perlu bagi memastikan kredibiliti badan ujian.

 

 

Bibiliografi

 

Lembaga Peperiksaan Malaysia (2002), Analisis Item. Kertas Kerja Kursus Pegawai-

                                                                 Pegawai SPPU.

Lembaga Peperiksaan Malaysia (2004), Item Analisa Item Subjektif. OGIF 200/2004.

Lembaga Peperiksaan Malaysia (2002), Manual Pelaksanaan Pencerapan dan

                                                                Pengesanan.

Dibina pada 10/12/04 dan dikemaskini pada 10/14/04 oleh Azizi@2004