Sabtu, 27 April 2013

hasil belajar dan alat evaluasi



BAB I
Pendahuluan
Kegiatan yang dilakukan dalam lingkungan sekolah pada umumnya adalah proses belajar mengajar. Yang di sana terdapat guru sebagai pengajar dan murid sebagai siswa yang diajar. Pada umumnya suatu proses belajar mengajar (selanjutnya disebut proses pendidikan) dapat diketahui berhasil atau tidaknya dengan suatu cara tertentu. Cara ini biasa disebut sebagai evaluasi belajar, dan pada umumnya berupa ujian yang diberikan kepada para siswa.
Namun disamping itu evaluasi belajar juga haruslah dibuat secara baik dan profesional. Dalam hal ini soal ujian yang telah diberikan harus dianalisa sehingga terlihat seberapa baik proses pendidikan tersebut dilaksanakan. Dalam hal ini evaluasi hasil belajarlah yang berperan aktif untuk mengetahui itu semua. Perlu diketahui bahwa evaluasi hasil belajar juga memiliki manfaat yang sangat luas, akan tetapi dalam pembahasan kelompok ini hanya akan menggambarkan beberapa point penting saja.
Sebagai para pengajar haruslah mengetahui apakah prinsip-prinsip dalam evaluasi. Sehingga dapat merumuskan suatu evaluasi yang baik dan dapat dijadikan pijakan untuk proses belajar selanjutnya. Dengan demikian proses belajar akan selalu dinamis dan dapat berkembang menuju lebih baik. Selain prinsip evaluasi sebagaipengajar perlu juga mengetahui alat-alat untuk dijadikan sebagai alat evaluasi.
Sehingga terbentuklah suatu kegiatan evaluasi yang baik, yang berguna karena keasliaanya dengan tersiratnya prinsip-prinsip evaluasi tersebut. Dan dengan hasil eavaluasi ini maka dapat dirumuskan langkah-langkah selanjutnya untuk mengambil kebijakan-kebijakan dalam proses pendidikan yang ada. Dengan demikian terlihatlah bahwa evaluasi yang baik dan benar sangatlah mempengaruhi proses pendidikan selanjutnya.
Evaluasi berasal dari kata evaluation dalam bahasa indonesia berarti penilaian. Akar katanya adalah value yang berarti nilai. Dan jika diartikan secara istilah yaitu istilah evaluasi menunjuk kepada atau mengandung pengertian suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu.(Sudijono, 2011 : 1)
Secara umum suatu proses evaluasi dalam pendidikan dapat dikatakan terlaksana secara baik apabila memegang pada prinsip-prinsip dalam melakukan evaluasi, antara lain :
  1. Berprinsip keseluruhan
Dalam evaluasi seharusnya evaluasi tersebut dilaksanakan secara keseluruhan yaitu menyeluruh kesemua bagian. Sehingga evaluasi dapat dikatakan baik karena semua pihak yang dievaluasi dapat melaksanakannya semua.  Dengan kata lain evaluasi hasil belajar harus dapat mencangkup berbagai aspek yang dapat menggambarkan perkembangan tingkah laku yang terjadi pada peserta didik. Dengan demikian evaluasi hasil belajar dapat mengungkap aspek proses berpikir, bersikap, dan bertindak.
Dari hasil evaluasi belajar yang dilakukan secara menyeluruh maka akan didapat hasil hasil secara menyeluruh pula. Yang dengannya menjadi bahan-bahan dan informasi yang lengkap menganai keadaan dan perkembangan subjek didik yang sedang dijadikan sasaran evaluasi.
  1. Berprinsip kesinambungan
Prinsip ini biasanya dikenal dengan prinsip kontinuitas, yang dimaksudkan di sini adalah sebagai suatu evaluasi dapat dikatakan menjadi baik jika evaluasi itu dilakukan secara sambung menyambung dan dilakukan dari waktu ke waktu. Dengan demikian maka akan dapat diperoleh gambaran kemajuan yang terjadi di antara para siswa yang di evaluasi. Dan gambaran kemajuan yang diperoleh dari peserta didik ini dapat dijadikan sebagai langkah untuk menentukan langkah-langkah atau kebajikan-kebajikan yang perlu diambil untuk masa-masa selanjutnya agar tujuan pendidikan dapat dicapai secara baik.
  1. Berprinsip obyektivitas
Prinsip obyektivitas mengandung makna bahwa evaluasi hasil belajar dapat dinyatakan sebagai evaluasi yang baik apabila terlepas dari fakto-faktor yang bersifat subyektif.
Maka dalam melaksanakan evaluasi sebaiknya senantiasa berpikir dan bertindak secara wajar, menurut keadaan yang senyatanya tidak dicampuri oleh kepentingan-kepentingan yangbersifat subyektif. Maka prinsip obyektivitas ini sangat penting dilakukan. Sehingga dalam melakukan evaluasi dapat menghasilkan evaluasi yang murni yang tidak ternodai oleh sifat subyektif yang ada, karena keaslian dan kemurnian evaluasi inilah yang akan dapat digunakan untuk menentukan langkah yang baik selanjutnya.
BAB II
PEMBAHASAN
  1. A.    ALAT EVALUASI
Dalam pengertian umum, alat adalah sesuatu yang dapat digunakan untuk mempermudah seseorang untuk melaksanakan tugas atau mencapai tujuan secara lebih efektif dan efisien. Kata “alat” biasa disebut juga dengan istilah “instrument”. Dengan demikian maka alat evaluasi juga dikenal dengan instrument evaluasi. Dalam kegiatan evaluasi, fungsi alat juga untuk memperoleh hasil yang lebih baik sesuai dengan kenyataan yang dievaluasi. (Arikunto, 2010: 25)
Alat evaluasi dikatakan baik apabila mampu mengevaluasi sesuatu yang dievaluasi dengan hasil seperti keadaan yang dievaluasi. Dalam menggunakan alat tersebut evaluator menggunakan cara atau teknik, dan oleh karena itu dikenal dengan teknik evaluasi. Seperti disebutkan di atas, ada dua teknik evaluasi, yaitu teknik nontes dan teknik tes. (Arikunto, 2010: 26)
  1. Teknik nontes
Teknik evaluasi nontes berarti melaksanakan penilaian dengan tidak menggunakan tes. Teknik penilaian ini umumnya untuk menilai kepribadian peserta didik secara menyeluruh meliputi sikap, tingkah laku, sifat, social, ucapan, riwayat hidup dan lain-lain yang berhubungan dengan kegiatan belajar dalam  pendidikan baik individual maupun secara kelompok. (http://wawan-junaidi.blogspot.com/2010/07/alat-evaluasi-pendidikan-non-tes.html, diakses 21 September 2011)
Suharsimi Arikunto dalam bukunya Dasar-dasar Evaluasi Pendidikan menyatakan  yang tergolong teknik nontes antara lain:
  • Skala bertingkat (rating scale)
  • Kuesioner (questioner)
  • Daftar cocok (check list)
  • Wawancara (interview)
  • Pengamatan (observation)
  • Riwayat hidup

  1. Skala bertingkat (Rating scale)
Skala menggambarkan suatu nilai yang berbentuk angka terhadap sesuatu hasil pertimbangan. Seperti Oppenheim mengatakan: Rating gives a numerical value to some kind of judgement, maka suatu skala selalu disajikan dalam bentuk angka.

Contoh:
Skor atau nilai yang diberikan oleh guru di sekolah untuk menggambarkan tingkat prestasi belajar siswa. Siswa yang mendapat skor 8, digambarkan di tempat paling kanan dan semakin ke kiri adalah penggambaran nilai dibawah 8.


4                5                6               7                 8
  1. Kuesioner (questioner)
Kuesioner (questioner) juga biasa disebut angket. Pada dasarnya kuesioner adalah sebuah daftar pertanyaan yang harus diisi oleh orang yang akan diukur (responden). Dengan kuesioner ini  dapat diketahui keadaan atau data diri, pengalaman, pengetahuan, sikap atau pendapat dan hal lainnya dari diri seseorang.
Suharsimi Arikunto menyatakan bahwa macam kuesioner dapat ditinjau dari beberapa segi.
a)      Ditinjau dari segi siapa yang menjawab, maka ada:
i.            Kuesioner langsung
Kuesioner ini dikatakan langsung karena dikirimkan dan diisi langsung oleh orang yang akan dimintai jawaban tentang dirinya.
ii.            Kuesioner tidak langsung
Kuesioner tidak langsung adalah kuesioner yang dikirimkan dan diisi oleh bukan orang yang dimintai keterangannya.
Sebagai contoh kuesioner diberikan kepada orang tua peserta didik untuk memperoleh data mengenai latar belakang peserta didik sebagai salah satu bahan dalam menganalisis tingkah laku dan proses belajar mereka. (Sudijono, 2011: 84)
b)      Ditinjau dari segi cara menjawab
  1. Kuesioner tertutup
Kuesioner tertutup adalah kuesioner  yang disusun dengan menyediakan pilihan jawaban lengkap sehingga pengisi hanya tinggal memberi tanda pada jawaban yang dipilih. Contoh: dengan memberikan tanda cek ( √ ).
  1. Kuesioner terbuka
Kuesioner terbuka adalah kuesioner yang disusun sedemikian rupa sehingga para pengisi bebas mengemukakan pendapatnya. Kuesioner terbuka disusun apabila jawaban pengisi belum terperinci dengan jelas sehingga jawabannya akan bermacam-macam. Contoh: kuesioner terbuka digunakan untuk meminta pendapat atau keterangan tentang alamat pengisi.
  1. Daftar cocok (check list)
Daftar cocok atau check list adalah deretan pernyataan (yang biasanya singkat-singkat), dimana responden yang dievaluasi tinggal membubuhkan tanda cek ( √ ). Di tempat yang sudah disediakan.







Contoh:
Berilah tanda cek ( √ ) pada kolom yang sesuai dengan pendapat saudara.

Pernyataan
Pendapat
Penting
Biasa
Tidak penting
Olah raga tiap pagi



Aktif mengikuti organisasi



Berkunjung ke kos teman




  1. Wawancara (interview)
Wawancara atau interview adalah suatu metode atau cara yang digunakan untuk mendapatkan jawaban dari responden dengan jalan tanya jawab sepihak.
Wawancara dapat dilakukan dengan 2 cara, yaitu:
a)      Interviu bebas, dimana responden mempunyai kebebasan untuk mengutarakan pendapatnya, tanpa dibatasi oleh patokan-patokan yang telah dibuat oleh subjek evaluasi.
b)      Interviu terpimpin, yaitu interviu yang dilakukan oleh subjek evaluasi dengan cara mengajukan pertanyaan-pertanyaan yang sudah disusun terlebih dahulu. Jadi dalam hal ini responden pada waktu menjawab pertanyaan tinggal memilih jawaban yang sudah dipersiapkan oleh pihak penanya. (Arikunto, 2010: 30)
Anas Sudijono dalam Pengantar Evaluasi Pendidikan menyatakan bahwa kelebihan yang dimiliki oleh wawancara adalah, bahwa dengan melakukan wawancara, pewawancara sebagai evaluator (dalam hal ini guru, dosen, dan lain-lain) dapat melakukan kontak langsung dengan peserta didik yang akan dinilai, sehingga dapat diperoleh hasil penilaian yang lebih lengkap dan mendalam. Karena dengan melakukan wawancara, peserta didik dapat mengeluarkan isi hatinya dengan lebih bebas.
Dengan demikian dapat disimpulkan bahwa teknik wawancara tepat digunakan apabila seorang peneliti ingin mendapatkan data yang mendalam dari seorang atau beberapa responden.  Karena pertanyaan-pertanyaan yang belum jelas dapat diulang dan dijelaskan lagi dan sebaliknya jawaban yang belum jelas dapat diminta lagi dengan lebih terarah dan lebih bermakna.
  1. Pengamatan (observasi)
Pengamatan atau observasi adalah suatu teknik yang dilakukan dengan cara mengadakan pengamatan secara teliti serta pencatatan secara sistematis.
Terdapat 3 macam observasi:
a)      Observasi partisipan, yaitu observasi yang dilakukan oleh pengamat dengan sepenuhnya mengikuti kegiatan kelompok yang sedang diamati.
b)      Observasi sistematik, yaitu observasi dimana factor-faktor yang diamati sudah didaftar secara sistematis dan sudah diatur menurut kategorinya. Dalam observasi sistematik pengamat berada di luar kelompok.
c)      Observasi eksperimental
Observasi eksperimental terjadi jika pengamat tidak berpartisipasi dalam kelompok. Dalam hal ini ia dapat mengendalikan unsur-unsur penting dalam situasi sedemekian rupa sehingga situasi itu dapat diatur sesuai dengan tujuan evaluasi. (Arikunto, 2010: 31)
  1. Riwayat hidup
Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam masa kehidupannya. Dengan mempelajari riwayat, maka subjek evaluasi akan dapat menarik suatu kesimpulan tentang kepribadian, kebiasaan, dan sikap objek yang dinilai. (Arikunto, 2010: 31)

  1. Teknik tes
Menurut Drs. Amir Daien Indrakusuma dalam bukunya evaluasi pendidikan  Tes adalah ” suatu alat atau prosedur yang sistematis dan objektif untuk memperoleh data-data atau keterangan-keterangan yang diinginkan tentang seseorang, dengan cara yang boleh dikatakan tepat dan cepat “.  Selanjutnya didalam bukunya teknik-teknik evaluasi Mukhtar Bukhori mengatakan: “ Tes adalah suatu percobaan yang diadakan untuk mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu pada seorang murid dan kelompok murid”.
Definisi yang selanjutnya dikutip oleh webster’s collegiate “test= any series of questions or exercises or other means of measuring the skill, knowledge, intelligence, capacities of aptitudes or an individual or group.
Dengan terjemahan bahwa Tes adalah serentetan pertanyaan atau latihan atau alat lain yang digunakan untuk mengukur keterampilan, pengetahuan, inteligensi, kemampuan, atau bakat yang dimiliki oleh individu atau kelompok.
Dari beberapa kutipan dan uraian diatas dapat disimpulkan bahwa tes merupakan suatu alat pengumpul informasi tetapi jika dibandingkan dengan alat-alat yang lain, tes ini bersifat lebih resmi karena penuh dengan batasan-batasan.
Ditinjau dari dari segi kegunaan untuk mengukur siswa, maka dibedakan atas adanya 3 macam tes, yaitu :
  1. Tes diagnostik
  2. Tes formatif
  3. Tes sumatif

1)      Tes diagnostik
Tes diagnostik adalah tes yang digunakan untuk mengetahui kelemahan-kelemahan siswa sehingga berdasarkan kelemahan-kelemahan tersebut dapat dilakukan pemberian perlakuan yang tepat. Dengan mengingat sekolah sebagai sebuah tranformasi, maka letak tes diagnostik dapat dilihat pada diagram berikut ini:




input                                                                                    output
Tes diagnostik ke1 dilakukan terhadap calon siswa sebagai input, untuk mengetahui apakah calon tersebut sudah menguasai pengetahuan yang merupakan dasar untuk menerima pengetahuan disekolah yang dimaksudkan. Secara umum tes ini disebut tes penjajakan masuk yang dalam istilah inggris disebut entering behaviour test. Test diagnostik ke1 dilakukan untuk dapat menerima penetahuan lanjutannya. Pengatahuan dasar inibisa disebutdengan pengatahuan bahan prasyarat(pre-requisite). Oleh karena itu tes ini disebut sebagai tes prasyarat atau pre-requisite test.
Contoh:
Untuk mengajarkan perhitungan menghitung korelasi serial, guru harus yakin bahwa siswa sudah menguasai perhitungan tentang rata-rata dan simpangan baku(mean, standar deviasi). Oleh karena itu, sebelum mulai dengan menerangkan teknik korelasi serial tersebut, guru mengadakan test diagnostik untuk mengetahui penguasaan siswa atas mean dan standar deviasi tersebut.
Test diagnostik ke2 dilakukan terhadap calon siswa yang sudah akan mulai mengikuti program. Apabila cukup byak calon siswa yang diterima sehingga diperlukan lebih dari satu kelas, maka untuk pembagian kelas diperlukan suatu pertimbangan khusus. Apakah anak yang baik akan disatukan disatu kelas, ataukah semua kelas akan diisi dengan campuran anak baik,sedang, atau kurang, ini semua memerlukan adanya informasi. Informasi seperti ini dapat diperoleh dengan cara melakukan tes diagnostik. Dengan demikian tes ini berfungsi sebagai tes penempatan (placement test) .
Test diagnostik ke3 dilakukan terhadap siswa yang sedang belajar. Tidak semua siswa dapat menerima pelajaran yang diberikan oleh guru dengan lancar. Sebagai guru yang bijaksana, maka pengajar harus sekali-kali memberikan test diagnostik untuk mengetahui bagian mana dari bahan yang diberikan itu belum dikuasai oleh siswa. Selain itu ia harus dapat mengadakan deteksi apa sebab siswa tersebut belum menguasai bahan. Berdasarkan atas hasil mengadakan deteksi tersebut guru dapat memberikan bantuan yang diperlukan.
Test diagnostik ke4 diadakan pada waktu siswa akan mengakhiri pelajaran. Dengan tes ini guru akan dapat mengetahui tingkat penguasaan siswa terhadap bahan yang ia berikan.
2)      Test formatif
Dari arti kata form yang merupakan dasar dari istilah formatif maka evaluasi formatif dimaksudkan untuk mengetahui sejauh mana siswa telah terbentuk setelah mengikuti sesuatu program tertentu. Dalam kedudukannya seperti ini test formatif dapat juga dipandang sebagai tes diagnostik pada akhir pelajaran. Evaluasi formatif atau test formatif diberikan pada akhir setiap program. Test ini merupakan post test atau test akhir proses.
Pre test                                                                                       post test
(test awal)                                                                                    (tes akhir)
Evaluasi formatif mempunyai fungsi baik bagi siswa, guru, maupun program itu sendiri.
Manfaat bagi siswa
a)      Digunakan untuk mengetahui apakah siswa sudah menguasai bahan proram secara menyeluruh.
b)      Merupakan penguatan bagi siswa.
c)      Usaha perbaikan
d)     Sebagai diagnosis. Bahan pelajaran yang sedang dipelajari oleh siswa merupakan serangkaian pengetahuan, keterampilan, atau konsep. Dngan mengetahui hasil tes formatif, siswa dg jelas dapat mengetahui bagian mana dari bahan pelajaran yang masih dirasakan sulit.
Manfaat bagi guru
a)      Mengetahui sampai sejauh mana bahan yang diajarkan sudah dapat diterima oleh siswa.
b)      Mengetahui bagian-bagian mana dari bahan pelajaran yang belum menjadi milik siswa.
c)      Dapat meramalkan sukses dan tidaknya seluruh program yang akan diberikan.
Manfaat bagi program
Setelah diadakan tes formatif maka diperoleh hasil. Dan hasil tersebut dapat diketahui :
a)      Apakah program yanag telah diberikan merupakan program yang tepat dalam arti sesuai dengan kecakapan anak .
b)      Apakah program tersebut membutuhkan pengetahuan-pengetahuan prasyrat yang belum diperhitungkan .
c)      Apakah diperlukan alat, sarana, dan prasarana untuk mempertinggi hasil yang akan dicapai .
d)     Apakah metode, pendekatan, dan alat evaluasi yang digunakan sudah tepat .

3)       Tes Sumatif
Evaluasi sumatif/ tes sumatif dilaksanakan setelah berakhirnya pemberian sekelompok program / sebuah program yang lebih besar.  Dalam pengalaman di sekolah, tes formatif dapat disamakan dengan ualangan harian,sedang tes sumatif ini dapat disamakan dengan ulagan umum yang biasanya dilaksanakn pada akhir semester.
Manfaat Tes Sumatif.
Manfaat tes sumatif ada 3 yang terpenting,yaitu:
a)      Untuk menentukan nilai.
Apabial tes formatif terutama digunakan untuk memberikan informasi demi perbaikan penyampaian, dan tidak digunakan untuk member nilai atau tidak digunakn untuk menentukankedudukan seorang anak, maka niali dari tes sumatif ini digunakn untuk menentukan kedududkan anak.
b)      Untuk menentukan seorng anak dapat atau tidaknya mengikuti kelompok dalam menerima program berikutnya. Dalam kepentingan ini tes sumatif berfungsi sebagai tes prediksi.
Contohnya; ketiak kenaikan kelas guru mempertimbangkan siapakah kira kira siswa yang mampu mengikuti program di kelas berikutnya.
c)      Untuk mengisi catatan kemajuan belajar siswa yang akan berguna bagi; orang tua,pihak bimbingan dan penyuluhan di sekolah, dan pihak-pihak lain apabila siswa pindah sekolah/ akan melanjutkan belajar/ akan bekerja.
Contohnya; raport yang diberikan setiap akhir semester dan ijazah/ STTB bagi siswa yg lulus dalam tingkat SD/ SLTP /SMA
4.      penilaian penempatan ( pretes)
tujuan utama adalah untuk mengetahui seauh mana peserta didik memliki keterampilan- keterampilan yang diperlukan untuk mengikuti suatu program pembelajaran serta sejauh mana peserta didik telah menguasai kopentensi dasr sebagaimana yang tercantum dalam RPP dan silabus.
1.      berkaitan dengan kesiapan peserta didik menghadapi program baru
2.      menyesuaiakan kemampuan peserta didik dengan program pembelajaran.
4)      Tes Formatif dan tes sumatif dalam praktek

Dalam pelaksanaan di sekolah tes formatif ini merupakan ulangan harian, sedangkan tes sumatif bias dikatakan sebagai ualngan umum yang diadakn di akhir semester.
Dalam pelaksanaannya tes sumatif di sekolah sekolah dikenal dengan THB (tes hasil belajar), TPL (tes prestasi belajar),Ulangan semester.

Kebaikan THB bersama;
a)      Pihak atasan atau pengelola sekolah sekolah dapat membandingkan kemajuan sekolak sekolah yang ada di wilayahnya
b)      Karena dibandingkan antara sekolah yang satu dengan yang alain,maka akan timbul persaingan sehat antar sesame.
c)      Standar pelajaran akan terpelihara dengan sebaik baiknya karena soal soal tes yang akan diberikan oleh Dinas P dan K atau Kanwil



Keburukan THB bersama;
a)      Ada kemungkinan akan terjadi pemberian pelajaran yang hanya berorientasi pada “UJIAN” dengan cara memberikan latihan mengerjakan soal yang sebanyak-banyaknya.
b)      Tidak menghiraukan jika terjadi beberapa bentuk kecurangan karena ada sekolah-sekolah yang ingin mendapat niali baik.
Berhubungan dengan adanya bermacam-macam tes ini dengan sendirinya cara memberikan nilai dan perhitungannya sebagai informasi orestasi siswa juga berbeda-beda.
  1. B.     PERBANDINGAN ANTARA DIAGNOSTIK, FORMATIF, DAN SUMATIF

  1. Ditinjau dari segi fungsinya

Diagnostik :
  1. Untuk mengetahui kelebihan-kelebihan dan kelemahan-kelemahan yang ada pada siswa
  2. Menentukan tingkat penguasaan siswa atas seluruh materi yang telah dipelajarinya
  3. Untuk mengelompokkan siswa berdasarkan kemampuannya dalam menerima pelajaran
  4. Menentukan kesulitan – kesulitan belajar yang dialami siswa, sehingga pendidik dapat membantu mengatasi masalah tersebut dan juga membimbingnya
Formatif :
  1. Untuk mengetahui sejauh manakah suatu proses pembelajaran telah berjalan sebagaimana yang direncanakan
  2. Untuk mengetahui seberapa jauh tujuan yang telah ditetapkan telah tercapai

Sumatif :
  1. Untuk mengetahui sejauhmana peserta didik telah dapat berpindah dari suatu unit ke unit berikutnya
  2. Untuk memberikan tanda kepada siswa bahwa dirinya telah mengikuti suatu program, dan juga menentukan posisi kemampuan siswa dibandingkan dengan kawannya dalam kelompok

  1. 2.      Ditinjau dari segi waktu

Diagnostik :
  1. Pada saat penyaringan calon siswa
  2. Pada saat pembagian kelas atau saat pertama kali guru memberikan pelajaran
  3. Selama pelajaran sedang berlangsung
Formatif :
  1. Selama pembelajaran berlangsung, tujuannya agar pendidik dapat mengetahui informasi kemajuan yang telah dicapai atau kekurangan dan  kesulitan siswa, sehingga pembelajaran dapat berlangsung dengan baik
Sumatif :
  1. Pada akhir catur wulan atau semester akhir


  1. 3.      Ditinjau dari titik berat penilaian
Diagnostik :
  1. Menekan pada aspek kognitif, afektif, dan juga psikomotor
  2. Pada faktor fisik, psikologi, dan lingkungan
Formatif :
  1. Hanya menekan pada aspek atau tingkah laku kognitif saja
Sumatif :
  1. Menekan pada aspek kognitif, namun kadang  pada aspek psikomotorik dan juga terkadang pada aspek afektifnya. Walaupun demikian yang diukur bukan sekedar ingatan dan hafalannya saja melainkan tingkatan yang lebih tinggi

  1. 4.      Ditinjau dari alat evaluasi
Tes diagnostic:
  1. Tes  prestasi belajar yang sudah distandarisasikan
  2. Tes diagnostik  yang sudah distandarisasikan
  3. Tes buatan guru
  4. Pengamatan dan daftar cocok (Check list)

Tes formatif
  1. Tes prestasi belajar yang tersusun secara baik
Tes sumatif
  1. Tes ujian akhir

  1. 5.      Ditinjau dari cara memilih tujuan yang di evaluasi
Tes diagnostik
  1. Memilih tiap-tiap ketrampilan prasyarat
  2. Memilih tujuan setiap program pelajaran secara berimbang
  3. Memilih yang berhubungan dengan tingkah laku fisik, mental , dan perasan
Tes formatif
Mengukur semua tujuan instruksional khusus
Tes sumatif
Mengukur tujuan instruksional umum
6.  Ditinjau dari tingkat kesuliatan tes
Tes diagnostik
Untuk tes diagnostic mengukur ketrampilan dasar, diambil soal tes yang mudah, yang tingkat kesulitannya (indeks kesukaran 0,65 atau lebih.
Tes formatif
Belum dapat ditentukan
Tes sumatif
Rata-rata mempunyai tingkat kesulitan (indeks kesukaran) antara 0,35 sampai 0,70. Ditambah beberapa soal yang sangat mudah dan beberapa lagi yang sangat sukar.
  1. 7.      Ditinjau dari Skoring (cara memberikan skor)
Tes Diagnostik
Tes diagnostic menggunakan standar mutlak dan standar relative (criterion referenced and normreferenced).

Tes Formatif
Hanya menggunakan standar mutlak (criterion referenced).

Tes Sumatif
Kebanyakan menggunakan standar relative (normrferenced), tetapi dapat pula dipakai standar mutlak (criterion referenced).

  1. 8.      Ditinjau dari Tingkat Pencapaian
Menurut Dr. Suharsimi Arikunto bahwa yang dimaksud dengan tingkat pencapaian adalah nilai skor yang dicapai siswa di dalam setiap tes. Lanjut beliau mengtakan bahwa tingkat pencapaian ini tidaklah sama, artinya, tinggi rendahnya tuntutan terhadap tingkat pencapaian tergantung pada  fungsi dan tujuan masing-masing tes. (Suharsimi, 2005: 47)

(1)   Tes Diagnostik
Tes Diagnostik ini bermacam-macam, oleh karena itu tingkat pencapaiannya juga tidak sama. Te diagnostic yang sifatnya memonitor kemajuan, maka tingkat pencapaian yang diperoleh siswa merupakan informasi tentang keberhasilannya. Oleh karena itu tindakan guru selanjutnya adalah menyesuaikan dengan hasil tes diagnostic tersebut. Kemudian tes prasyarat, tes ini sifatnya khusus, yang memiliki fungsi untuk mengetahui penguasaan bahan prasyarat  untuk kelanjutan studi bagi pengetahuan berikutnya.

(2)   Tes Formatif
Tes ini, jika ditinjau dari segi tujuan, maka fungsinya adalah digunakan untuk mengetahui apakah siswa sudah mencapai tujuan instruksional umum yang diuraikan menjadi tujuan instruksional khusus. dalam system pendidikan lama, belum ada tuntutan terhadap pencapaian TIK namun pada tahun 1975, dengan keluarnya kurikulum tahun 1975 dan modul, tingkat pencapaian untuk tes formatif adalah 75%. Oleh karena itu, siswa yang belum mencapai skor tersebut diwajibkan untuk menempuh kegiatan perbaikan yang sering disebut renudial program sampai siswa yang bersangkutan lulus dalam tes yang berarti telah mencapai skor 75%. (Suharsimi, 2005: 48).

(3)   Tes Sumatif
Fungsi tes sumatif adalah memberikan tanda kepada siswa bahwa mereka telah mengikuti suatu program dan menentukan posisi kemampuan siswa dibandingkan dengan kawan dan kelompoknya. Oleh karena itu, tidak diperlukan suatu tuntutan harus berapa tingkat penguasaan yang dicapai oleh siswa tersebut. Namun tidak berarti tes sumatif tidak penting. Perlu diingat bahwa te sumatif ini dilakukan pada akhir program, berarti nilainya digunakan untuk menentukan apakah siswa tersebut naik kelas atau lulus. Secara terpisah, tidak ditentukan tingkat pencapaiannya, namun secara keseluruhan akan dikenakan suatu norma tertentu, yaitu norma kenaikan kelas atau norma kelulusan.
 9. Ditinjau dari cara Pencatatan Hasil
(a)    Tes Diagnostik
Jika ditinjau dari cara pencatatan hasil, maka tes diagnostik hasilnya dicatat dan dilaporkan dalam bentuk profil.
(b)   Tes Formatif
Sedangkan tes formatif cara pencatatannya yaitu prestasi setiap siswa dilaporkan dalam bentuk catatan berhasil atau gagal menguasai sesuatu tugas.
(c)    Tes Sumatif
Tes sumatif jika ditinjau dari dari cara pencatatan hasil, maka pencatatannya keseluruhan skor atau sebagian skor dari tujuan-tujuan yang dicapai.

BAB III
KESIMPULAN
Dari pembahasan di  atas maka dapat di simpulkan :
  1. Dalam rangka kegiatan pembelajaran, evaluasi dapat diartikan sebagai suatu proses sistematik dalam menentukan tingkat pencapaian tujuan pembelajaran yang telah ditetapkan. Maka dari itu seorang pengajar/ Guru haruslah mengetahui prinsip-prinsip dalam evaluasi Sehingga dapat merumuskan suatu evaluasi yang baik dan proses belajar mengajar akan berjalan dengan baik.
  2. Evalusi yang di lakukan dengan non test yaitu melaksanakan penilaian dengan tidak menggunakan tes sedangkan evaluasi yang dilakukan dengan tes berarti penilaian dengan menggunakan test .
  3. Evaluasi yang dilakukan di sekolah, Khususnya di suatu kelas yang salah satunya adalah untuk mengukur siswa. Dilihat dari segi kegunaan mengukur siswa maka di bedakan menjadi 3 macam tes, Yaitu :
a)      Tes Diagnostik (Untuk mengetahui kelemahan-kelemahan siswa)
b)      Tes Formatif (Untuk mengetahui apakah siswa sudah menguasai bahan program secara menyeluruh)
c)      Tes Sumatif (Ulangan Harian/semester)
  1. Evaluasi diarahkan pada komponen-komponen sistem pembelajaran, yang meliputi input, proses, dan output.
  2. Karakteristik siswa yang dievaluasi dalam ruang lingkup kegiatan belajar mengajar adalah dalam bidang kognitif, afektif, dan psikomotor.




Daftar Pustaka

Arikunto, Suharsimi. 2010. Dasar-dasar Evaluasi Pendidikan. Bumi Aksara. Jakarta



By ishaq madeamin on Sabtu, 18 Juni 2011
Pada tulisan sebelumnya tentang validitas sudah diposting, postingan yang membahas secara teori mengenai validitas sebuah alat evaluasi termasuk jika alat evaluasi tersebut adalah hasil tes atau soal.

Pada postingan kita kali akan membahas tentang cara menganalisis (menghitung) tingkat validitas tiap butir soal yang sebelumnya soal tersebut diperoleh data-datanya melalui proses uji coba, teknik analisis yang digunakan adalah dengan menggunakan Microsoft Excel 2007.
Validitas butir soal diartikan soal tersebut diujicoba untuk menentukan apakah butir-butir soal tersebut sahih digunakan atau tidak pada evaluasi yang sebenarnya
Langkah-langkah Validitas
Rumus yang digunakan dalam menentukan tingkat validitas butir soal tes objektif dapat menggunakan Korelasi Product Moment dengan Simpangan, secara matematis dituliskan:
Misalkan:
Anda memiliki 4 butir soal (variabel X: X1, X2, X3, dan X4), selanjutnya soal terebut diuji oleh 9 0rang atau responden. Hasil uji coba seperti di masukkan pada halaman kerja Microsoft Excel (lihat gambar)

Dengan menggunakan persamaan Korelasi Product Moment dengan Simpangan, kita menghitung validitas butir soal nomor 1 (X1), dengan langkah-langkah berikut ini:
  1. Hitung skor total jawaban benar tiap responden (variabel Y) 
  2. Hitung skor rata-rata butir soal nomor 1 (variabel X1)
  3. Hitung skor rata-rata semua responden (Skor rata-rata variabel Y)
  4. Hitung x1 untuk responden pertama dengan rumus =skor responden 1 - skor rata-rata butir soal nomor, selanjutnya dengan responden ke-2 sampai ke-9
  5. Hitung y dengan untuk responden pertama dengan rumus =skor responden 1 - skor rata-rata semua responden, selanjutnya dengan responden ke-2 sampai ke-9
  6. Hitung x1^2 (^=pangkat) untuk responden ke-1 sampai responden ke-9, kemudian jumlahkan hasilnya
  7. Hitung x1*y (*=kali) untuk responde ke-1 sampai responden ke-9, kemudian jumlahkan hasilnya
  8. Hitung y^2 (^=pangkat) untuk responden ke-1 sampai responden ke-9, kemudian jumlahkan hasilnya
  9. Kali hasil jumlah langkah 6 dan8
  10. Cari nilai akar dari langkah 9
  11. Terakhir, bagi langkah ke-7 dengan langkah 10
  12. Jika benar Anda memperoleh jawaban 0,8111
Lanjutkan mencari validitas untuk butir soal nomor 2 (X2), dan seterusnya. Dengan variabel Y tetap sebagai pembanding.

Di atas dijelaskan tentang cara uji validitas dengan menggunakan Korelasi Product Moment dengan Simpangan, dengan cara mencari variabel-variabel tertentu. Dengan rumus yang sama kita akan mencari nilai validitas atau bisa dikatakan membuktikan nilai validitas di atas dengan menggunakan fungsi PEARSON pada Microsoft Excel.

Bentuk umum Fungsi PEARSON
=PEARSON(Array1;Array2)

Keterangan:
Array1 disebut sebagai variabel X (sesuai butir soal: X1, X2, X3, dan X4)
Array2 disebut sebagai variabel Y (Skor total yang diperoleh responden)

Berikut langkah-langkah uji validitas dengan fungsi PEARSON pada soal butir 1 (X1), yaitu:
  1. Aktifkan cell dibagian bawah nilai rata-rata X1 atau sesudah jawaban validitas dengan menggunakan rumus Korelasi Product Moment dengan Simpangan (Untuk menempatkan jawaban nilai validitas dengan fungsi Pearson)
  2. Ketikkan rumus PEARSON: =PEARSON(B3:B11;F3:F11)
  3. Tekan Enter
  4. Muncul jawaban 0,8111 (Jawaban yang sama jika menggunakan rumus Korelasi Product Moment dengan Simpangan)
  5. Untuk butir 2, 3, dan 4 cukup mendrag nilai validitas butir soal nomor 1 dengan sebelumnya mengunci variabel Y (F3:F11) dengan menekan F4 sehingga hasilnya (=PEARSON(B3:B11;$F$3:$F$11)
  6. Selesai
Selanjutnya, jika nilai validitas diperoleh dengan 2 cara dan hasil yang sama (hanya sebagai pembuktian bahwa rumus Korelasi Product Moment dengan Simpangan sama dengan fungsi PEARSON pada Excel) maka perlu dilakukan konsultasi dengan kriteria-kriteria validitas [baca di sini].

Berdasarkan konsultasi nilai validitas yang diperoleh dengan kriteria-kriteria validitas, Anda bisa membuat kesimpulan terhadap butir-butir soal yang dianalisis, apakah soal tersebut valid atau tidak valid? atau valid tanpa perlu mengkoreksi butir soal tersebut, atau bisa jadi kriterianya rendah misalnya valid sedang sehingga perlu dikoreksi soalnya dan setelah itu baru dikatakan valid.



UJI VALIDITAS DAN RELIABILITAS

Dalam penelitian, data mempunyai kedudukan yang paling tinggi, karena data merupakan penggambaran variabel yang diteliti dan berfungsi sebagai alat pembuktian hipotesis. Benar tidaknya data, sangat menentukan bermutu tidaknya hasil penelitian. Sedang benar tidaknya data, tergantung dari baik tidaknya instrumen pengumpulan data.  Pengujian instumen biasanya terdiri dari uji validitas dan reliabilitas.
A. Definisi Validitas dan Reliabilitas
Validitas adalah tingkat keandalah dan kesahihan alat ukur yang digunakan. Intrumen dikatakan valid berarti menunjukkan alat ukur yang dipergunakan untuk mendapatkan data itu valid atau dapat digunakan untuk mengukur apa yang seharusnya di ukur (Sugiyono, 2004:137). Dengan demikian, instrumen yang valid merupakan instrumen yang benar-benar tepat untuk mengukur apa yang hendak di ukur.
Penggaris dinyatakan valid jika digunakan untuk mengukur panjang, namun tidak valid jika digunakan untuk mengukur berat. Artinya, penggaris memang tepat digunakan untuk mengukur panjang, namun menjadi tidak valid jika penggaris digunakan untuk mengukur berat.
Uji validitas berguna untuk mengetahui apakah ada pernyataan-pernyataan pada kuesioner yang harus dibuang/diganti karena dianggap tidak relevan. Teknik untuk mengukur validitas kuesioner adalah sebagai berikut dengan menghitung korelasi antar data pada masing-masing pernyataan dengan skor total, memakai rumus korelasi product moment, sebagai berikut :

Item Instrumen dianggap Valid jika lebih besar dari 0,3 atau bisa juga dengan membandingkannya dengan r tabel. Jika r hitung > r tabel maka valid.
Uji reliabilitas berguna untuk menetapkan apakah instrumen yang dalam hal ini kuesioner dapat digunakan lebih dari satu kali, paling tidak oleh responden yang sama akan menghasilkan data yang konsisten. Dengan kata lain, reliabilitas instrumen mencirikan tingkat konsistensi. Banyak rumus yang dapat digunakan untuk mengukur reliabilitas diantaranya adalah  rumus Spearman Brown

Ket :
R 11 adalah nilai reliabilitas
R b adalah nilai koefisien korelasi
Nilai koefisien reliabilitas yang baik adalah diatas 0,7 (cukup baik), di atas 0,8 (baik).
Pengukuran validitas dan reliabilitas mutlak dilakukan, karena jika instrument yang digunakan sudah tidak valid dan reliable maka dipastikan hasil penelitiannya pun tidak akan valid dan reliable. Sugiyono (2007: 137) menjelaskan perbedaan antara penelitian yang valid dan reliable dengan instrument yang valid dan reliable sebagai berikut :
Penelitian yang valid artinya bila terdapat kesamaan antara data yang terkumpul dengan data yang sesungguhnya terjadi pada objek yang diteliti. Artinya, jika objek berwarna merah, sedangkan data yang terkumpul berwarna putih maka hasil penelitian tidak valid. Sedangkan penelitian yang reliable bila terdapat kesamaan data dalam waktu yang berbeda. Kalau dalam objek kemarin berwarna merah, maka sekarang dan besok tetap berwarna merah.
dirangkum dari :
Sugiyono. 2007. Metode Penelitian Administrasi. Bandung,Alfabeta.



Uji Validitas dan Reliabilitas


1.      Pengertian Validitas dan Reliabilitas Intrumen

Validitas dan Reliabiltas Instrumen
Analisis validitas dan reliabilitas merupakan salah satu analisis kehandalan instrument penelitian. Instrument penelitian yang handal merupakan salah satu faktor pendukung kehandalan hasil penelitian. Penelitian akan valid dan reliabel apabila data yang dihasilkan juga valid dan reliabel. Data yang valid dan reliabel akan didapatkan jika instrumen penelitian yang digunakan juga valid dan reliabel.
Pertanyaan-pertanyaan untuk mengukur variabel yang kita teliti sebelumnya harus dilakukan uji validitas dan reliabilitas. Bila  instrumen/alat ukur tersebut tidak valid maupun reliabel, maka tidak akan diperoleh hasil penelitian yang baik.
A.     Validitas
Validitas adalah indeks yang menunjukkan sejauh mana suatu alat  pengukur betul-betul mengukur apa yang akan diukur.
Ada beberapa jenis validitas, namun yang paling banyak dibahas adalah validitas konstruk.  Konstruk atau kerangka konsep adalah istilah dan definisi yang digunakan untuk menggabarkan secara abstrak kejadian, keadaan, kelompok  atau individu yang menjadi pusat perhatian penelitian. Konsep itu kemudian  seringkali masih harus diubah menjadi definisi yang operasional, yang menggambarkan bagaimana mengukur suatu gejala. Langkah selanjutnya adalah menyusun pertanyaan-pertanyaan/ pernyataan-pernyataan yang sesuai dengan definisi itu.
Untuk mencari definisi konsep tersebut dapat ditempuh dengan berbagai cara sebagai berikut:
1. Mencari definisi konsep yang dikemukakan para ahli. Untuk ini perlu dipelajari buku-buku referensi yang relevan.
2.  Kalau dalam literatur tidak dapat diperoleh definisi konsep-konsep penelitian, maka peneliti  harus mendefinisikan sendiri    konsep tersebut. Untuk tujuan ini peneliti dapat mendiskusikan dengan ahli-ahli yang kompeten dibidang konsep yang akan diukur.
3.  Menanyakan definisi konsep yang akan diukur kepada calon responden atau orang-orang yang memiliki karakteristik yang sama dengan responden (Ancok: 1989). Misalnya peneliti ingin mengukur konsep “religiusitas”. Dalam mendefinisikan konsep ini peneliti dapat langsung menanyakan  kepada beberapa calon responden tetnang ciri-ciri orang yang religius. Berdasar jawaban calon responden, kemudian disusun kerangka suatu konsep. Apabila terdapat konsistensi antra komponen-komponen konstruk yang  satu dengan lainnya, maka konstruk itu memiliki validitas.  
Cara yang paling banyak dipakai untuk mengetahui validitas konstruk suatu instrumen/alat pengukur ialah dengan mengkorelasikan skor/nilai yang diperoleh pada masing-masing pertanyaan/pernyataan dari semua responden dengan  skor/nilai total semua pertanyaan/pernyataan dari semua responden. Korelasi antara skor/nilai setiap pertanyaan/pernyataan dan skor/nilai total haruslah signifikan berdasarkan ukuran statistik tertentu misalnya dengan menggunakan teknik korelasi product moment.

B.     Reliabilitas
Reliabilitas adalah indeks yang menunjukkan sejauh mana suatu alat pengkur dapat dipercaya atau dapat diandalkan. Reliabilitas menunjukkan kemantapan/konsistensi  hasil pengukuran. Suatu alat pengukur dikatakan mantap  atau konsisten, apabila untuk mengukur sesuatu berulang kali, alat pengukur itu menunjukkan hasil yang sama, dalam kondisi yang sama.
Setiap alat pengukur seharusnya memiliki kemampuan untuk memberikan hasil pengukuran yang mantap atau konsisten. Pada alat pengukur fenomena fisik seperti berat dan panjang suatu benda, kemantapan atau konsistensi hasil pengukuran bukanlah sesuatu yang sulit diperoleh. Tetapi untuk pengukuran fenomena sosial, seperti sikap, pendapat, persepsi, kesadaran beragama, pengukuran yang mantap atau konsisten, agak sulit dicapai.
Berhubung gejala sosial tidak semantap fenomena fisik, maka dalam pengukuran fenomena sosial selalu diperhitungkan unsur kesalahan pengukuran. Dalam penelitian sosial kesalahan pengukuran ini cukup besar. Karena itu untuk mengetahui hasil pengukuran yang sebenarnya, kesalahan pengukuran ini perlu diperhitungkan. Makin kecil kesalahan pengukuran, semakin reliabel alat pengukurnya. Semakin besar kesalahan pengukuran, semakin tidak reliabel alat pengukur tersebut.
Teknik-teknik untuk menentukan reliabilitas ada tiga yaitu: a. teknik ulangan, b. teknik bentuk pararel dan c. teknik belah dua. Dalam tulisan ini akan dijelaskan satu teknik saja yaitu teknik belah dua.
Teknik belah dua merupakan cara mengukur reliabilitas suatu alat ukur dengan membagi alat ukur menjadi dua kelompok. Adapun langkah-langkahnya adalah sebagai berikut:
a.  Mengajukan instrumen kepada sejumlah responden kemudia dihitung validitas itemnya. Item yang valid dikumpulkan menjadi satu, item yang tidak valid dibuang.
b.  Membagi item yang valid tersebut menjadi dua belahan. Untuk mebelah instrumen menjadi dua, dapat dilakukan dengan salah satu cara berikut: 1). Membagi item dengan cara acak (random). Separo masuk belahan pertama, yang separo lagi masuk belahan kedua; atau (2) membagi item berdasarkan nomor genap-ganjil. Item yang bernomor ganjil dikumpulkan menjadi satu dan yang bernomor genap juga dijadikan satu. Untuk menghitung reliabilitasnya skor total dari kedua belahan itu dikorelasikan.
2.      Pertanyaan tentang materi :
  1. Apakah yang dimaksud dengan Validitas?
  2. Apakah yang dimaksud dengan Reliabilitas
  3. Jelaskan cara yang paling banyak dipakai untuk mengetahui validitas konstruk suatu instrumen/alat pengukur?
  4. Sebutkan teknik-teknik untuk menentukan Reliabilitas?
3.      Jawaban :
  1. Validitas adalah indeks yang menunjukkan sejauh mana suatu alat  pengukur betul-betul mengukur apa yang akan diukur.
  2. Reliabilitas adalah adalah indeks yang menunjukkan sejauh mana suatu alat pengkur dapat dipercaya atau dapat diandalkan.
  3. Cara yang paling banyak dipakai untuk mengetahui validitas konstruk suatu instrumen/alat pengukur ialah dengan mengkorelasikan skor/nilai yang diperoleh pada masing-masing pertanyaan/pernyataan dari semua responden dengan  skor/nilai total semua pertanyaan/pernyataan dari semua responden.
  4. a. teknik ulangan, b. teknik bentuk pararel dan c. teknik belah dua.

4.      Contoh Validitas dan Reliabilitas Instrumen
Suatu instrumen penelitian akan digunakan untuk mengukur kinerja aparatur negara. Instrumen tersebut telah dikonsultasikan kepada para ahli aparatur dan dinyatakan siap untuk diujicoba. Uji coba diberlakukan terhadap sampel 25 responden yang tahu masalah aparatur. Berdasarkan 25 responden tersebut dapat dikelompokkan 27% responden yang membrikan skor tinggi dan 27% skor rendah (27% responen 0,27 x 25 = 27), seperti tertera dalam tabel berikut.
Kelompok Skor Tinggi dan Rendah Pada Instrumen
Untuk Mengukur Kinerja Aparatur Negara
Skor-Skor Kelompok Tinggi
Skor-Skor Kelompok Rendah
126
81
128
96
135
104
135
107
135
108
140
108
142
109
= 135,1
S1 = 6,1
S12 = 38,1
 = 101, 85
S1 =  10,2
S1 = 104,4
Untuk menguji daya pembeda secara signifikan digunakan rumus t-test sebagai berikut :
  dimana 
selanjutnya rumus (t)
Untuk mengetahui apakah perbedaan itu signifikan atau tidak, maka harga t hitung tersebut perlu dibandingkan dengan harga t table. Bila t hitung lebih besar dengan t valid, maka perbedaan itu signifikan, sehingga intrumen dinyatakan valid.
Berdasarkan table t, dapat diketahui bahwa bila tingkat kesalahan 5%, dengan dk 12 maka harga t table = 1,78. (dk = n1 + n2- 2 + 7 = 7 =12). Ternyata harga t hitung 7,37 jauh lebih besar signifikan antara kelompok skor tinggi (X1) dan kelompok rendah (X2). Hal ini dapat disimpulkan bahwa instrument tersebut valid.


Azuar Juliandi ©2007. Http:/Www.Azuarjuliandi, Pengujian Validitas Dan Reliabilitas, Pengujian Validitas Menggunakan Excel



H A R T O N O

Dosen Fakultas Tarbiyah dan Keguruan UIN Sulthan Syarif Kasim Riau

Kamis, 25 Maret 2010

EVALUASI PEMBELAJARAN

EVALUASI TES HASIL PEMBELAJARAN DI PERGURUAN TINGGI
Oleh : Hartono


PENGOLAHAN TES HASIL BELAJAR
A. Pengolahan Lembar Jawaban Tes Objektif
Analisis tes hasil belajar bentuk objektif dapat diketahui dari dua kriteria atau dua parameter, yaitu indeks kesukaran dan indeks daya diskriminasi. Menurut Fernandes (1984) analisis tes meliputi tingkat kesukaran tes, daya beda, dan efektifitas pengecoh. Analisis juga untuk menguji efektifitas distraktor pada setiap butir soal untuk menentukan apakah setiap distraktor yang dibuat sudah berfungsi dengan baik. Hasil analisis ini akan menghasilkan suatu keputusan apakah butir soal itu nantinya dapat dipakai, diperbaiki atau dibuang.
Salah satu cara yang dapat ditempuh untuk mengetahui tingkat kesukaran, daya beda dan efektifitas distraktor pada soal bentuk objektif adalah dengan menggunakan analisis psikometrik klasik. Teori tes klasik mempunyai beberapa kelemahan, antara lain perhitungan tingkat kesukaran dan daya pembeda soal sangat bergantung pada sampel yang digunakan dalam analisis. Kondisi sampel sangat mempengaruhi hasil analisis, bila sampel yang digunakan memiliki rentang dan sebaran kemampuan yang tinggi maka hasil analisisnya akan berbeda dengan rentang dan sebaran kemampuan siswa yang rendah. Sebagai contoh daya pembeda soal akan tinggi bila tingkat kemampuan siswa sangat bervariasi atau mempunyai rentang kemampuan yang besar. Sebaliknya daya pembeda soal akan kecil bila tingkat kemampuan siswa mempunyai rentang kemampuan yang kecil. Oleh karena itu kondisi sampel sangat mempengaruhi perhitungan statistik yang dihasilkannya.
Guna mengatasi kelemahan dari teori tes klasik, maka langkah yang dapat ditempuh adalah berhati-hati dalam mengambil sampel. Dengan kata lain sampel yang digunakan harus benar-benar mewakili (representatif) dari populasi. Bila sampel yang digunakan tidak representatif maka akibatnya hasil analisis tidak bisa digeneralisasikan pada populasi. Berikut ini akan dibahas karakteristik tes yang akan menentukan kualitas tes.
1. Tingkat Kesukaran
Untuk menghitung tingkat kesukaran (p) cara yang paling mudah dan paling umum digunakan adalah jumlah peserta tes yang menjawab benar pada soal yang dianalisis dibandingkan dengan peserta tes seluruhannya.
Untuk menentukan butir soal tersebut mudah, sedang atau sukar dapat digunakan kriteria sebagai berikut : (Bahrul Hayat, 1997)

Tabel Tingkat Kesukaran Soal
Proportion correct (p) dan Kategori Soal
P > 0,70 = Mudah
0,30 < 70 =" Sedang" 30 =" Sukar" p =" 0,600" d =" niT" nit =" Banyaknya" nt =" Banyaknya" nir =" Banyaknya" nr =" Banyaknya" d =" pT" 40 =" Bagus" 39 =" Bagus" 29 =" Belum" 20 =" Jelek" 100 =" 80">
B. Pengolahan Lembar Jawaban Tes Essay
1. Cara Memeriksa tes Essay
Memeriksa tes bentuk essay lebih sulit dibandingkan dengan bentuk tes objektif. Siapapun yang menilai lembar jawaban tes objektif hasilnya pasti sama. Sedangkan memeriksa tes essay hasilnya bisa berbeda kalau yang memeriksa orangnya berbeda, sekalipun kriteria jawaban yang tepat sudah ditetapkan. Itu sebabnya bentuk tes ini disebut dengan tes subjektif.
Untuk menghindari faktor subjektifitas maka sebaiknya sebelum memeriksa lembar jawaban dipersiapkan dulu kriteria jawaban yang benar. Ada dua cara yang bisa dilakukan dalam memeriksa lembar jawaban tes objektif.
Lembar jawaban diperiksa perorang. Maksudnya setelah selesai memeriksa punya si A dan diberi skor lalu memeriksa punya si B, lalu si C dan seterusnya.
Lembar jawaban diperiksa nomor demi nomor. Misalnya satu lokal terdiri dari 30 orang, maka pemeriksaan lembar jawaban dilakukan mulai nomor satu pada seluruh lembar jawaban essay. Setelah selesai dilanjutkan dengan nomor dua untuk seluruh lembar jawaban mahasiswa demikian seterusnya.
Bila dibandingkan cara pertama dengan cara kedua maka cara kedua lebih objektif. Sedangkan cara pertama lebih subjektif. Oleh karena itu sebaiknya untuk memperoleh hasil yang lebih objektif gunakan cara kedua.

2. Pemberian Skoring pada tes Essay
Pemberian skoring dapat dipilih dari beberapa skala pengukuran, misalnya skala 1-4, 1-10 dan 1-100. Sebaiknya jangan memberikan skor nol. Mulailah skoring dari angka 1. Semakin tinggi skala pengukuran yang digunakan maka hasilnya semakin halus dan akurat. Pemberian skor ini berlaku sama untuk semua nomor soal.
Setelah menetapkan skoring langkah selanjutnya adalah menetapkan pembobotan sesuai dengan tingkat kesukaran soal. Sebaiknya gunakan skala 1-10. misalnya soal yang mudah diberi bobot 2, sedang bobotnya 3 dan soal yang sulit bobotnya 5.
Ada juga yang melakukan penilaian lembar jawaban tidak mengikuti cara di atas, dimana setiap soal langsung diberi bobot nilai tanpa mempertimbangkan skala pengukuran. Sehingga skala pengukuran tiap item tidak sama.
Proses penetapan skornya adalah sebagai berikut:
1. skor setiap Item diperoleh dengan cara nilai setiap item dikali Bobot.
2. Jumlahkan total nilai (skor kerja) setiap item lalu dibagi dengan skor ideal.
Untuk lebih jelasnya berikut akan diberikan contoh perhitungan.
Nilai rata-rata sebelum diberi bobot adalah 35/6 = 5,833
Nilai rata-rata setelah diberi bobot adalah 104/35 = 2,971
Pemberian bobot dalam pengolahan lembar jawaban soal essay sangat penting, karena skor diberikan benar-benar atas dasar kemampuan. Kenyataan juga menunjukkan bahwa setiap item tes tingkat kesukarannya berbeda.

C. Penetapan Nilai dan Kelulusan Hasil belajar
Menetapkan nilai hasil belajar dapat dilakukan dengan dua cara yaitu menggunakan acuan patokan dan menggunakan acuan norma. Masing-masing memiliki kelemahan dan kelebihan. Oleh karena itu sebaiknya dipakai keduanya dengan cara bergantian.
Perhitungan skor di atas masih dalam bentuk skor mentah, oleh karena itu hasil perhitungannya perlu diolah lagi guna menentukan nilai akhir. Setidak-tidak nya ada dua fungsi yaitu:
menentukan posisi dan prestasi atau nilai siswa dibandingkan dengan kelompoknya.
menentukan batas kelulusan berdasarkan kriteria yang ditentukan.
Untuk menentukan batas kelulusan setidak-tidaknya dapat dilakukan dengan tiga cara, yaitu batas lulus aktual, batas lulus ideal dan batas lulus purposif. Berikut akan dijelaskan secara ringkas.
Batas lulus aktual
Batas lulus aktual didasarkan pada nilai rata-rata aktual yang dicapai oleh kelompok mahasiswa, yang perlu dihitung adalah nilai rata-rata dan standar deviasinya. Skor yang dinyatakan lulus adalah skor di atas X + 0,25SD.
Batas lulus ideal
Batas lulus ideal hampir sama dengan batas lulus aktual, karena batas lulus ideal juga menggunakan rata-rata dan simpangan baku. Bedanya batas lulus ideal rata-ratanya ditentukan setengah dari skor maksimum. Sedangkan simpangan baku sepertiga dari nilai rata-rata ideal.
Batas lulus purposif
Batas lulus purposif mengacu pada penilaian acuan patokan, sehingga tidak perlu menghitung nialai rata-rata dan simpangan bakunya. Nilai dibuat berdasarkan kriteria tertentu yang sudah ditetapkan. Misalnya batas kelulusan adalah skor di atas 75% dari skor maksimum. Misalnya nilai maksimum mahasiswa di kelas 80. maka batas kelulusannya adalah 75% x 80 = 60. jadi mahasiswa yang dinyatakan lulus adalah yang nilainya lebih dari 60. sedangkan mahasiswa yang nilainya kurang dari 60 dinyatakan tidak lulus.
D. Konversi Hasil Scoring Menjadi Nilai Akhir
Kesalahan sering terjadi pada pemberian nilai akhir, dimana hasil skoring dianggap sebuah nilai akhir. Padahal seharusnya hasil skoring tersebut harus dikonversi dulu menjadi nilai akhir dalam bentuk skala yang sudah ditetapkan sebelumnya, dalam bentuk skala 1-4, skala 1-10 dan skala 1-100. berikut akan dibahas cara mengkonversi hasil skor menjadi nilai akhir.

Konversi Sederhana
Cara ini sangat sederhana dan mengabaikan tingkat ketelitian dan keakuratan data, tidak mustahil akan terjadi kesalahan interpretasi. Karena cara ini mengabaikan tingkat variansi kemampuan mahasiswa. Misalnya kriteria yang digunakan dalam bentuk persentase.
Nilai 10 bila mencapai angka 100%
Konversi dengan Menggunakan Mean dan Standar Deviasi
Cara ini lebih akurat karena sudah mempertimbangkan tingkat variansi hasil belajar, sehingga nilai akhir sangat ditentukan oleh kelompoknya. Bila standar deviasinya kecil maka interval nilainya juga kecil. Sebaliknya bila standar deviasinya besar, maka interval nilainya juga besar. Konversi cara ini biasanya dilakukan untuk penilaian standar 10 dan standar 4 atau standar huruf.
Kriteria yang digunakan untuk melakukan konversi skor mentah menjadi standar 10 adalah sebagai berikut:
M + 2,25 (SD) = 10
M + 1,75 (SD) = 9
M + 1,25 (SD) = 8
M + 0,75 (SD) = 7
M + 0,25 (SD) = 6
M - 0,25 (SD) = 5
M - 0,75 (SD) = 4
M - 1,25 (SD) = 3
M - 1,75 (SD) = 2
M - 0,25 (SD) = 1

Catatan : M = Mean atau nilai rata-rata
SD = Standar Deviasi

Kriteria yang digunakan untuk melakukan konversi skor mentah menjadi standar 4 atau standar huruf adalah sebagai berikut:
E. Penetapan Nilai Akhir Semester
Penetapan nilai akhir semester biasanya berdasarkan total nilai mandiri, terstruktur, mid semester dan semester. Setelah diperoleh totalnya lalu di konversi menjadi huruf. Persoalan biasanya timbul saat menetapkan interval nilai A,B, C dan D. Untuk menetapkan interval seharusnya dimulai dari batas kelulusan.
Misalnya batas kelulusan adalah 60. lebih dari atau sama dengan 60 dinyatakan lulus. Kurang dari 60 tidak lulus. Maka perhitungan intervalnya adalah sebagai berikut.
1. Hitung range skor tertinggi dengan skor terendah, dalam hal ini skor tertinggi (H)100 terendah (L) 60. R = H – L = 100 – 60 = 40
2. Tetapkan banyak intervalnya, misalnya yang dinyatakan lulus minimal C. nilai yang dinyatakan lulus adalah A, B, C. Bararti banyak nya interval adalah 3.
3. Menentukan rentang interval.


4. Membuat interval nilai
Jika kita menginginkan nilai plus dan minus diperhitungkan maka proses penetapan intervalnya sebagai berikut:
1. Hitung range skor tertinggi dengan skor terendah, dalam hal ini skor tertinggi (H)100 terendah (L) 60. R = H – L = 100 – 60 = 40
2. Tetapkan banyak intervalnya, misalnya yang dinyatakan lulus minimal -C. nilai yang dinyatakan lulus adalah A+, A, A-, B+, B, B-, C+, C, C-. Bararti banyak nya interval adalah .
3. Menentukan rentang interval.
4. Membuat interval nilai


Dari dua contoh di atas menunjukkan bahwa semakin banyak interval yang digunakan (menggunakan plus dan minus) maka nilai yang ditetapkan semakin halus. Sebaliknya semakin sedikit interval yang digunakan (tidak menggunakan plus dan minus) maka nilai yang ditetapkan semakin kasar.F. Penutup
Demikianlah uraian ringkas tentang pengolahan nilai hasil belajar. Apa yang sudah dipaparkan adalah menurut konsep dan teori evaluasi pendidikan sepanjang yang penulis ketahui. Masih ada hal-hal lain yang seharusnya dimasukkan dalam tulisan ini antara lain bagaimana mengolah nilai yang menggunakan non tes, uji kurva normal, Z skor dan T skor, mengubah data ordinal menjadi data interval dll. Namun karena keterbatasan waktu hanya ini yang bisa disajikan. Kalau ada kelemahan dan kesalahan mohon kritik dan saran yang membangun. Mudah-mudahan tulisan kecil ini bermanfaat bagi peserta workshop evaluasi pembelajaran.

1 komentar: