performance assessment and portfolios


PEFORMANCE ASSES SMENT AND PORTFOLIOS
PENILAIAN KINERJA DAN FORTOFOLIO”
Sumber: Measurement And Assessment

OLEH:
                                    Nama              : Riki Chandra Wijaya
                                    NIM                : 018/MPIPA/2012
                                   
Mata Kuliah   : Penilaian Otentik
                                    Dosen              : Dr. Syamsurizal













PROGRAM PASCA SARJANA
MAGISTER PENDIDIKAN MIPA
UNIVERSITAS JAMBI
2012





Pendahuluan
Penilaian kinerja siswa merupakan salah satu alternatif penilaian yang difokuskan pada dua aktivitas pokok, yaitu: 1) observasi proses saat berlangsungnya unjuk keterampilan dan 2) evaluasi hasil cipta atau produk. Penilaian bentuk ini dilakukan dengan mengamati saat siswa melakukan aktivitas di kelas atau menciptakan suatu hasil karya sesuai dengan tujuan pembelajarannya. Kecakapan yang ditampilkan siswa adalah variabel yang dinilai. Penilaian terhadap kecakapan siswa didasarkan pada perbandingan antara kinerja siswa dengan target yang telah ditetapkan. Proses penilaiannya dilakukan mulai persiapan, melaksanakan tugas sampai dengan hasil akhir yang dicapainya (Depdikbud, 1993: 8). Sejalan dengan pendapat tersebut, Popham (1994:139) mengemukakan bahwa: "Performance as-sessment is approach to measuring a student's status based on the way that the student completes a specified task". Stiggins (1991: 85) mengemukakan bahwa dalam penilaian kinerja siswa, guru menghendaki respon yang "authentic" atau yang asli berupa aktivitas yang dapat diamati.Tugas yang diberikan bisa dalam bentuk lisan atau tertulis, yang jenis tugasnya disesuaikan den-gan tujuan pembelajaran. Menurut Popham (1994: 141) penilaian terhadap kinerja siswa setidaknya memiliki tiga sifat, yaitu: kriteria ganda (multiple criteria), standar kualitas yang telah dispesifikasi (perspectified quality standards) dan penaksiran penilaian (judgmental appraisal).
Dalam penilaian terhadap kinerja siswa, target pencapaian hasil bela-jar yang dapat diraih meliputi aspek-aspek berikut ini: 1) Knowledge; 2) Reasoning; aplikasi pengetahuan dalam berbagai konteks pemecahan masalah; 3) Skill; kecakapan dalam berbagai jenis keterampilan komunikasi, visual, karya seni, dan lain-lain; 4) Product; dan 5) Affect; berhubungan dengan perasaan, sikap, nilai, minat, motivasi (Stiggins, 1994: 171). Selanjutnya dikemukakan bahwa diantara kelima target tersebut, penilaian kinerja siswa sangat efektif untuk menilai pencapaian target dari reasoning, skill dan karya cipta. Untuk dapat melakukan penilaian terhadap keterampilan (skill) dan karya cipta siswa diperlukan alat ukur terhadap kinerja siswa yang disebut dengan tes kinerja. Menurut Yacobs (1992:137), bahwa tes ini menyediakan cara mengukur skill dan kemampuan yang tidak dapat diukur dengan tes tertulis.
Tes kinerja merupakan tes yang penugasannya disampaikan dalam bentuk lisan atau tertulis dan proses penilaiannya dilakukan sejak siswa melakukan persiapan, me-laksanakan tugas sampai dengan hasil akhir. Sebagai alat penunjang dalam melaksanakan tes perbuatan digunakan lembar ob-servasi atau sebuah format pengamatan kinerja atau penampilan siswa. Dalam lembar pengamatan tertera aspek-aspek yang diamati sesuai dengan target pembelajarannya. Berdasarkan deskriptor-deskriptor yang nampak selama proses pengamatan, ditentukanlah skor kinerja siswa dengan berpe-doman pada kriteria penilaian yang telah ditetapkan sebelumnya.
Langkah-langkah yang harus diperhatikan dalam mengembangkan metode ini adalah: kejelasan karakter penampilan yang akan dinilai, pengembangan tugas atau latihan (sifat, materi, jumlah), dan prosedur pen-skoran meliputi teknik, pencatatan hasil, identifikasi dan keterampilan penilaian. Sebagai contoh, aspek-aspek kinerja siswa apa saja yang akan dinilai? Sifatnya individual atau kelompok? Prosedur penyekorannya meng-gunakan skala, rubrik atau catatan harian? Bagaimana kriteria penilaian dari masing-masing aspek kinerja siswa? Selain itu sangat dibutuhkan pelibatan siswa secara penuh mulai dari perencanaan, pengembangan dan penggunaannya. Standar untuk tugas-tugas sebelumnya harus ditetapkan secara jelas termasuk juga identifikasi prestasi yang harus didemonstrasikan, kondisi demonstrasi dan standar kualitas yang ditetapkan. Demikian pula kriteria penilaian dari tiap-tiap kinerja siswa yang akan diamati harus sudah di-mengerti dan disepakati bersama siswa. Melalui cara tersebut, penilaian ter-hadap kinerja siswa dapat dirasakan lebih terbuka dan adil bagi semua siswa, karena siswa mempunyai acuan yang jelas dalam mengerjakan tugas dari guru.

1.      Penilaian kinerja lebih mennggambarkan pengaturan dan aplikasi keadaan nyata dari pada penilaian paper and pencil tes.
Penilaian kinerja dibagi ke dalam tiga jenis yaitu:
a.      Penilaian kinerja actual.
Sebuah penilaian kinerja yang sebenarnya terjadi dalam pengaturan yang sebenarnya di mana aktivitas nyata terjadi atau dalam simulasi yang kembali menciptakan pengaturan yang sebenarnya. Contoh dari penilaian kinerja yang kebanyakan orang alami adalah bagian mengemudi pemeriksaan lisensi/surat-surat pengemudi. Pada tes pertama adalam menulis ujian  yang didesain untuk mengetahui aplikasi pengetahuan dasar dalam kesuksesan dan keamanan berkendara kendaraan bermotor.
b.      Penilaian kinerja analog.
Dalam banyak situasi tidak mungkin untuk menilai orang dalam kondisi nyata karena konsekuensi potensial dari kegagalan, dan penilaian kinerja analog  dapat dilakukan. Sebagai contoh, operator tenaga nuklir harus merencanakan harus sertifikasi ulang setiap beberapa bulan, dan proses sertifikasi ulang mereka memerlukan operasi penilaian dari sistem pengendali tenaga  nuklir.
c.       Penilaian kinerja buatan.
Penilaian kinerja Buatan adalah jauh lebih realistis daripada kategori sebelumnya dan biasanya melibatkan kondisi yang hanya menetapkan bahwa pengambil tes harus mempertimbangkan ketika melakukan tugasnya.
2.      Penilaian kinerja melibatkan beberapa kriteria penilaian.
Perbedaan ini mengharuskan kinerja siswa harus dievaluasi pada beberapa kriteria. (Popham, 1999, 2000).
3.      Penilaian kinerja melibatkan evaluasi subjektif dari kinerja murid.
Sedangkan penilaian tradisional dapat menjadi nilai secara obyektif, penilaian kinerja asli melibatkan subjektif dari kinerja siswa (Popham, 1999, 2000)
Beberapa pendidik mengacu pada penilaian kinerja sebagai penilaian otentik atau penilaian alternatif.
Untuk melengkapi situasi yang lebih, tidak semua orang menggunakan penilaian kinerja untuk menggambarkan prosedur. Beberapa pendidik menggunakan penilaian otentik untuk merujuk pada prosedur dasar yang sama yang kita sebut sebagai penilaian kinerja. Mereka umumnya lebih memilih istilah penilaian otentik karena menyiratkan bahwa penilaian lebih dekat dalam menggambarkan situasi nyata.
Sebagian lebih besar pendidik  mengenal, banyak tujuan-tujuan belajar tidak dapat diukur menggunakan standar tugas kertas dan pensil, dan situasi ini adalah di mana penilaian kinerja lebih dibutuhkan atau lebih unggul. Perhatikan contoh berikut:
a.       Kelas laboratorium. Siswa mungkin diminta untuk menunjukkan kemampuan mereka memecahkan masalah, melakukan percobaan, menggunakan mikroskop, membedah binatang, mengevaluasi komposisi kimia, memperkirakan kecepatan obyek, menghasilkan diorama s, atau putih laporan lab.
b.      Kelas matematika. Siswa mungkin diperlukan untuk menunjukkan kemampuan kuantitatif dalam memecahkan masalah dengan masalah dibangun di sekitar masalah kehidupan nyata di berbagai bidang seperti teknik, arsitektur, lansekap, polling politik, keuangan bisnis, ekonomi, atau anggaran keluarga.
c.       Inggris, bahasa asing, kelas debat. Dalam kelas ini lebih menekankan keterampilan komunikasi, penilaian kinerja
d.      Kelas IPS. Siswa mungkin diperlukan untuk menunjukkan penggunaan peta dan bola dunia, debat lawan posisi di bidang politik, membuat presentasi lisan, menghasilkan diorama, menunjukkan kemampuan memecahkan masalah, atau menulis makalah tema.
e.       Kelas kesenian. Siswa biasanya terlibat dalam berbagai proyek seni yang menghasilkan produk kerja.
f.       Kelas musik. Siswa terlibat dalam kinerja mulai dari resital solo untuk produksi kelompok.
g.      Kelas pendidikan fisika.
Penilaian kinerja dapat menjadi pendekatan utama untuk penilaian di kelas seperti seni, musik, pendidikan jasmani, teater, dan toko.
Bahkan di kelas yang tradisional menggunakan paper and pencil tes yang umum digunakan, dan  penilaian kinerja dapat menjadi penilaian tambahan berarti yang sangat berguna.
Pedoman untuk mengembangkan kinerja yang efektif
Memilih tugas kinerja yang tepat
a.       Pilihlah tugas kinerja yang memberikan penilaian paling langsung dari tujuan pendidikan yang Anda ingin mengukur.
Salah satu prinsip yang telah menyentuh beberapa kali penggunaan adalah bahwa Anda harus memilih teknik penilaian yang menyediakan pengukuran yang paling langsung dari tujuan pendidikan yang menarik.
b.      Pilihlah tugas kinerja yang memaksimalkan kemampuan Anda untuk menggeneralisasi hasil penilaian. Salah satu pertimbangan yang paling penting ketika memilih tugas kinerja adalah memilih salah satu yang akan memungkinkan Anda untuk menggeneralisasi hasil untuk tugas-tugas yang sebanding.
c.       Pilihlah tugas kinerja yang mencerminkan keterampilan yang penting dalam pembelajaran. Sebagai aturan umum, penilaian kinerja yang  harus digunakan hanya untuk menilai keterampilan yang paling penting atau esensial.
d.      Pilihlah tugas kinerja yang mencakup lebih dari satu tujuan pembelajaran. Karena penilaian kinerja sering membutuhkan waktu yang luas tersebut dan komitmen energi, sangat diinginkan untuk memilih tugas yang memungkinkan penilaian dari beberapa tujuan pendidikan yang penting.
e.       Pilihlah tugas kinerja yang focus bagi anda dalam mengevaluasi pada proses dan / atau produk yang Anda paling tertarik sebelum memilih tugas kinerja Anda harus menentukan apakah Anda terutama tertarik dalam menilai proses siswa terlibat dalam, produk hasil produksi, atau beberapa kombinasi dari dua.
Penilaian ahli (misalnya, Nitko, 2001) merekomendasikan bahwa focus anda pada proses terjadi saat:
a.       Tidak ada produk yang dihasilkan.
b.      Urutan tertentu pada langkah atau prosedur yang diajarkan.
c.       Langkah-langkah tertentu atau prosedur penting yang menunjang untuk keberhasilan.
d.      Proses jelas dapat diamati.
e.       Analisis proses dapat memberikan umpan balik yang konstruktif.
f.       Anda memiliki waktu untuk berperanan dalam mengamati siswa ketika melakukan tugas tersebut.
Fokus pada produk dianjurkan bila:
a.       Sebuah produk yang sama baiknya dapat diproduksi dengan menggunakan prosedur yang berbeda.
b.      Proses ini tidak secara langsung diamati.
c.       Kualitas produk dapat dinilai secara obyektif.

f.       Memilih Tugas kinerja Yang Memberikan Realisme yang Diinginkan. Dalam hal in perubahan yang butuh dipertimbangkan ialah seberapa dekat tugas Anda perlu mencerminkan aplikasi kehidupan nyata. Ini ialah sepanjang garis perbedaan antara penilaian kinerja aktual, analog, dan artifisial. Perbedaan ini dapat dikonseptualisasikan sebagai sebuah kontinum, dengan tugas kinerja aktual menjadi tugas kinerja yang paling realistis dan paling artifisial. Meskipun tidak mungkin untuk melakukan penilaian kinerja aktual atau bahkan analog di kelas, variabilitas yang cukup besar dalam tingkat realisms dapat ditemukan dalam penilaian kinerja artifisial. Grönlund (1998) mengidentifikasi empat faktor yang perlu dipertimbangkan ketika menentukan seberapa realistis penilaian kinerja Anda:
         Sifat dari tujuan pendidikan yang diukur.
         Sifat sekuensial dari instruksi.
         Kendala-kendala praktek.
         Sifat dari tugas.
g.      Memilih Tugas kinerja dengan keterampilan Ukur Yang "Teachable. "Artinya, pastikan  penilaian kinerja anda dapat mengukur keterampilan yang diperoleh melalui instruksi langsung dan tidak satupun yang mencerminkan kemampuan bawaan. Tanyakan kepada diri sendiri, "Dapatkah siswa menjadi lebih mahir pada tugas ini sebagai hasil dari instruksi yang diberikan?" Popham (1999) mencatat bahwa ketika kriteria evaluasi fokus pada "keterampilan mendidik" memperkuat hubungan antara instruksi dan penilaian, membuat keduanya lebih bermakna.
h.      Memilih Tugas Kinerja Yang Adil untuk Semua Siswa. Pilih tugas yang adil untuk semua siswa tanpa memandang jenis kelamin, etnis, atau status sosial ekonomi.
i.        Memilih Tugas Kinerja Yang Dapat Dinilai dengan Mengingat Waktu dan Sumber daya yang tersedia. Mempertimbangkan kepraktisan dari tugas kinerja. Misalnya, bisa dengan penilaian yang realistis akan selesai ketika mempertimbangkan biaya, waktu, ruang, dan peralatan yang dibutuhkan? Pertimbangkan faktor-faktor seperti ukuran kelas, apa mungkin praktis dalam kelas kecil sepuluh siswa dan mungkin tidak praktis dalam kelas 30 siswa. Dari pengalaman kami umumnya bagi guru dalam meremehkan waktu bagi siswa dalam menyelesaikan sebuah proyek atau kegiatan pembelajaran. Hal ini terjadi karena guru sebagai seorang yang merasa ahli pada tugas dan dapat melihat cara yang mudah untuk langsung menyelesaikannya.
j.        Memilih Tugas kinerja Yang Dapat Mencetak dalam manner Handal. Pilihlah tugas kinerja yang akan memperoleh respon siswa yang dapat diukur secara objektif, akurat, dan dapat diandalkan.
k.      Memilih Tugas kinerja Yang Mencerminkan Tujuan Pendidikan yang tidak dapat diukur dengan menggunakan Tindakan Tradisional. Seperti yang akan anda pelajari ketika  menggambarkan kelebihan dan kelemahan dari penilaian kinerja anda, ada beberapa keterbatasan yang signifikan terkait dengan penggunaan penilaian. Akibatnya, sebagian besar penilaian para ahli menyarankan Anda menggunakan mereka untuk mengukur tujuan pendidikan yang hanya tidak dapat dinilai menggunakan paper and pencil test.
Tabel 10.1
Mengembangkan instruksi
Karena tugas-tugas kinerja sering membutuhkan respon siswa yang cukup kompleks, penting bahwa instruksi Anda tepa dalamt menentukan jenis respon yang Anda harapkan. Karena orisinalitas dan kreativitas dipandang sebagai hasil yang diinginkan, tugas kinerja sering memberikan siswa kebebasan yang cukup besar dalam bagaimana mereka mendekati tugas. "Tugas utama selanjutnya dalam pengembangan penilaian kinerja adalah untuk mengembangkan instruksi yang jelas untuk menentukan apa yang siswa harapkan."
Berikut adalah daftar pertanyaan yang perlu anda pertimbangkan ketika mengevaluasi kualitas instruksi Anda. (Misalnya, Nitko, 2001)
• Apakah instruksi Anda sesuai dengan tingkat pendidikan siswa Anda?
• Apakah petunjuk Anda berisi jargon yang tidak perlu dan bahasa terlalu teknis?
• Apakah instruksi Anda jelas menentukan tujuan atau tujuan tugas?
• Apakah instruksi Anda dengan jelas menentukan jenis respon yang Anda harapkan?
• Apakah instruksi Anda menentukan semua parameter penting dari tugas kinerja (misalnya, batas waktu, penggunaan peralatan atau bahan)?
• Apakah instruksi Anda jelas menentukan kriteria yang akan Anda gunakan ketika mengevaluasi respon siswa?
• Apakah siswa dari latar belakang budaya dan etnis yang beragam menafsirkan petunjuk secara akurat?
Tabel 10.2
Mengembangkan prosedur untuk mengevaluasi tanggapan
Apakah Anda mengevaluasi proses, produk, atau kombinasi dari keduanya, sangat penting bahwa Anda mengembangkan prosedur yang sistematis, objektif, dan dapat diandalkan untuk mengevaluasi respon siswa. Penilaian kinerja pada dasarnya dibangun-respon penilaian, dan penilaian tersebut banyak masalah yang berhubungan dengan skor esai kita bahas dalam bab 9.
"Langkah utama dalam pengembangan penilaian kinerja adalah untuk mengembangkan prosedur untuk mengevaluasi respon siswa."
Tabel 10.2
l.        Pilihlah kriteria penting yang akan dipertimbangkan ketika mengevaluasi tanggapan siswa. Mulailah dengan memilih kriteria atau karakteristik respon yang akan anda pekerjakan ketika menilai kualitas respon siswa. Kami merekomendasikan bahwa Anda memberikan pertimbangan yang cermat untuk pemilihan karakteristik nyata karena ini mungkin adalah langkah yang paling penting dalam mengembangkan prosedur skoring yang baik.
m.    Tentukan standar eksplisit yang menggambarkan berbagai tingkat kinerja. Untuk setiap criteria yang Anda ingin evaluasi, Anda harus mengembangkan dengan jelas pernyataan standar yang membedakan antara tingkat kinerja.
n.      Tentukan apa jenis prosedur yang akan Anda gunakan. Rubrik Scoring dapat diklasifikasikan baik secara holistik atau analitik.
Dengan menganalisa rubrik guru dapat menilai secara kriteria-demi-kriteria berdasarkan rubric yang holistik dari masing-masing skor tunggal yang mencerminkan kualitas keseluruhan respon siswa.
Linn dan grounlund (2000) mengidentifikasi skala rating dan checklist sebagai alternative yang populer untuk skor rubrik tradisional. Perhatikan perbedaan yang kecil antara skala rating dan rubrik tradisional, mereka menemukan skala rating biasanya menggunakan penilaian kualitas (misalnya, luar biasa, baik, rata-rata, marginal, rendah) untuk menunjukkan kinerja pada masing-masing kriteria yang dioppositekan dengan standar deskriptif pada penilaian rubrik. Pada dasarnya dari kualitas penilaian, beberapa skala rating menunjukkan frekuensi penilaian (misalnya, selalu, sering, kadang-kadang, jarang, tidak pernah). Tabel 10.3 memberikan contoh skala penilaian menggunakan deskripsi verbal.
Sejumlah jenis skala penilaian yang umum digunakan dalam menskorkan penilaian kinerja. Pada beberapa skala rating deskripsi verbal diganti dengan angka untuk memudahkan mencapai tujuan. Tabel 10.4 memberikan contoh skala penilaian numerik. Variasi lain, disebut sebagai skala penilaian grafis, menggunakan garis horizontal dengan posisi peringkat diletakkan sepanjang garis. Tabel 10.5 memberikan contoh skala penilaian grafis. Akhirnya tipe-tipe yang paling sering digunakan ialah menggabungkan format grafis dengan frase deskriptif patokan poin. Hal ini biasanya disebut sebagai skala grafis deskriptif. Linn dan Grönlund (2000) menunjukkan bahwa jenis skala rating memiliki sejumlah keunggulan yang mendukung penggunaan dalam penilaian kinerja. itu dapat memberikan informasi lebih lanjut kepada siswa tentang kinerja mereka dan membantu guru menilai kinerja siswa dengan objektivitas yang lebih besar dan akurasi. Tabel 10.6 memberikan contoh skala penilaian deskriptif grafis. Ketika mengembangkan skala rating biasanya diinginkan untuk memiliki antara tiga dan tujuh poin rating. Misalnya, minimal Anda ingin skala rating Anda untuk memasukkan peringkat miskin, rata-rata, dan sangat baik. Kebanyakan ahli menyarankan bahwa termasuk lebih dari tujuh posisi tidak berguna karena penilai biasanya tidak dapat membuat diskriminasi lebih halus dari ini.
checklist Penilaian yang sederhana ya / tidak.
Checklist lain adalah prosedur yang sering digunakan untuk mencetak penilaian kinerja. Checklist mirip dengan skala rating, tapi sementara skala rating lebih memperhatikan kualitas kinerja atau frekuensi perilaku, daftar periksa memerlukan jawaban yang sederhana penilaian ya / tidak. Tabel 10.7 memberikan contoh checklist yang dapat digunakan dengan anak-anak sekolah dasar. Linn dan Grönlund (2000) menunjukkan bahwa penggolongan paling berguna dalam pendidikan dasar karena penilaiannya sebagian besar didasarkan pada pengamatan daripada penilaian dengan pengujian formal. Daftar periksa juga sangat berguna untuk melihat keterampilan yang dapat dibagi menjadi serangkaian perilaku.
Menerapkan Prosedur untuk Meminimalkan Kesalahan dalam Penilaian.
Langkah besar terakhir dalam perkembangan penilaian kinerja adalah dengan menerapkan prosedur penting  untuk meminimalkan kesalahan dalam penilaian.
Ketika mendiskusikan skor-skor item pada essay dalam bab sebelumnya, kita mencatat bahwa banyak faktor bisa menyebabkan kesalahan dalam proses penilaian. Faktor serupa perlu dipertimbangkan ketika mencetak penilaian kinerja. Sumber umum dari kesalahan ketika guru menilai kinerja siswa meliputi berikut ini.
·         Efek halo. Kami memperkenalkan Anda dengan konsep efek harapan ketika membahas skor item esai, mencatat bahwa efek ini ikut berperanan ketika guru mencetak tes yang memungkinkan meninjau karakteristik yang tidak relevan dari siswa untuk mempengaruhi skor. Dalam konteks dari fenomena ini sering disebut sebagai efek halo. Efek halo adalah suatu kecenderungan dari penilai yang dipengaruhi oleh sifat positif atau negatif tunggal, tidak berhubungan dengan sifat atau keterampilan yang dinilai, bahwa efek peringkat dari karakteristik siswa. Dengan kata lain, jika siswa terkesan pada tingkah laku guru  dengan ketepatan waktu dan sikap yang baik, guru mungkin cenderung menilai mereka lebih baik pada saat memberikan penilaian kinerja. Jelas ini harus dihindari karena merusak keabsahan hasilnya.
·         Kemurahan hati, tingkat kesalahan, dan kesalahan tendensi sentral. Kesalahan terjadi karena beberapa guru cenderung memberikan semua siswa peringkat yang baik sedangkan kesalahan lebih parah terjadi karena beberapa guru cenderung memberikan semua siswa peringkat yang rendah. Kesalahan tendensi sentral terjadi karena beberapa guru cenderung memberikan nilai semua siswa dalam kisaran menengah (misalnya, menunjukkan kinerja rata-rata). Keringanan, tingkat keparahan, dan pusat kesalahan kecenderungan semua mengurangi kisaran skor dan membuat skor kurang dapat diandalkan.
·         Bias pribadi. Bias pribadi dapat merusak peringkat jika guru memiliki kecenderungan untuk membiarkan stereotipe mempengaruhi peringkat kinerja siswa.
·         Kesalahan logika. Kesalahan logika terjadi ketika seorang guru mengasumsikan bahwa ada dua karakteristik yang terkait dan cenderung itu memberikan penilaian yang setara berdasarkan asumsi ini (Nitko, 2001). Contoh dari kesalahan logis guru yaitu dengan asumsi bahwa semua siswa dengan skor bakat tinggi harus melakukannya kinerja dengan baik di semua bidang akademik, dan membiarkan keyakinan ini mempengaruhi peringkat mereka dalam pembelajaran.
·         Efek urutan. Efek urutan adalah perubahan dalam angka yang muncul selama proses penilaian. Efek ini sering disebut sebagai penyimpangan penilai atau pengrusakan reliabilitas. Nitko (2001) mencatat bahwa ketika para guru mulai menggunakan skor rubrik mereka sering menetapkan aturan yang kurang erat dan sebagai akibatnya terjadi penurunan reliabilitas.
Jelas sumber-sumber kesalahan dapat merusak keandalan skor dan validitas interpretasi skor. Oleh karena itu, penting bagi guru untuk mengambil langkah-langkah dalam meminimalkan pengaruh faktor-faktor yang mengancam keakuratan penilaian.
Berikut terdapat beberapa saran untuk meningkatkan keandalan dan ketepatan peringkat guru yang didasarkan pada pengalaman kita sendiri dan rekomendasi dari penulis lain (misalnya, Linn & Grönlund, 2000; Nitko, 2001; Popham, 1999, 2000).

a.       Sebelum Pemberian Penilaian tersebut, kita harus Memiliki Satu atau Lebih Kolega Terpercaya Evaluasi Rubrik Scoring. Jika Anda memiliki guru-guru lain yang akrab dengan area review kinerja dan dapat memberikan kritik rubrik skor Anda, mereka mungkin dapat mengidentifikasi keterbatasan sebelum Anda memulai penilaian.
b.      Tiba Kemungkinan Tingkat Kinerja Diperoleh tanpa Mengetahui Identitas pelajar. Hal ini sesuai dengan rekomendasi yang kami buat berkaitan dengan soal essay grading. Scoring Anonymous mengurangi kemungkinan peringkat akan dipengaruhi oleh efek halo, bias personal, atau kesalahan logis.
c.       Tingkat Kinerja setiap siswa pada Satu Tugas sebelum Memproses ke Tugas selanjutnya. Lebih mudah untuk menerapkan kriteria scoring yang seragam ketika Anda mencetak satu tugas untuk setiap siswa sebelum melanjutkan ke tugas berikutnya. Artinya, tingkatan jumlah tugas satu untuk semua siswa sebelum melanjutkan ke tugas kedua. Bila mungkin, Anda juga harus menyusun ulang secara acak siswa atau proyek mereka sebelum pindah ke tugas berikutnya. Ini akan membantu mengurangi efek urutan.
d.      Jadilah Seorang yang Peka terhadap kelonggaran, Ketelitian, atau Kecenderungan Kesalahan Inti. Seperti anda memperingkatkan tugas yang anda buat, anda harus menjaga ketelitian dalam penghitungan Anda menggunakan setiap titik pada skala penilaian yang dibuat. Jika itu sudah jelas ada sedikit variasi di peringkat yang Anda buat (semua sangat tinggi, semua sangat rendah, atau semua di tengah), Anda mungkin perlu mengubah praktik peringkat Anda untuk lebih akurat agar dapat mencerminkan perbedaan dalam kinerja siswa Anda '.
e.       Melakukan Analisis Keandalan awal untuk Menentukan Apakah Ratings Keunggulah Anda diterima. Misalnya, menskorkan bagian dari penilaian. Atau bahkan sub bagian, untuk menentukan konsistensi dalam peringkat. Topic Khusus 10.2 menyediakan pembahasan tentang isu-isu reliabilitas dalam penilaian kinerja dan menggambarkan beberapa pendekatan untuk memperkirakan reliabilitas peringkat.
f.       Memiliki Lebih dari Satu Tingkatan pada masing-masing kinerja Siswa. Menggabungkan dari beberapa peringkat guru biasanya akan membuat nilai lebih dapat diandalkan daripada peringkat dari satu guru saja. Hal ini sangat penting ketika hasil penilaian akan memiliki konsekuensi yang signifikan bagi siswa.

Kelebihan dari penilaian kinerja
         Penilaian kinerja dapat mengukur kemampuan yang tidak dapat dinilai dengan menggunakan penilaian lainnya. Mungkin kekuatan terbesar dari penilaian kinerja adalah bahwa penilaian kinerja dapat mengukur kemampuan yang tidak bisa diukur dengan jenis penilaian lain. Jika Anda ingin mengukur kemampuan seperti kemampuan siswa untuk terlibat dalam debat lisan, melukis gambar, lagu mesin, atau menggunakan mikroskop, penilaian kinerja sesuai dengan kebutuhan anda.
         Penggunaan penilaian kinerja konsisten dengan teori belajar modern. Teori belajar yang modern menyatakan bahwa untuk belajar yang optimal terjadi jika siswa perlu mengintegrasikan informasi baru dengan pengetahuan yang sudah ada dan secara aktif terlibat dalam tugas-tugas kompleks yang mencerminkan aplikasi kehidupan nyata. Banyak ahli setuju bahwa penilaian penilaian kinerja yang konsisten dengan prinsip-prinsip yang didukung oleh teori belajar modern tersebut.
         Penggunaan penilaian kinerja dapat mengakibatkan instruksi yang lebih baik. Karena guru dapat termotivasi mengajarkan untuk menguji kemampuan siswa, penggunaan penilaian kinerja dapat membantu memperluas instruksi untuk menutupi tujuan pendidikan yang lebih kompleks yang paralel terhadap aplikasi kehidupan nyata.
         Penilaian kinerja dapat mengambil pembelajaran lebih bermakna dan membantu memotivasi siswa. Penilaian kinerja secara inheren menarik bagi guru dan siswa. Untuk banyak siswa pengujian dalam kondisi yang serupa dengan yang akan mereka hadapi di dunia nyata lebih berarti dari kertas-dan-pensil tes. Akibatnya, siswa mungkin akan lebih termotivasi untuk secara aktif terlibat dalam proses penilaian.
         Penilaian kinerja memungkinkan Anda untuk menilai proses serta produk. Penilaian kinerja guru memberikan kesempatan untuk evaluasi produk dan proses-yaitu, mengevaluasi cara siswa memecahkan masalah dan melakukan tugas-tugas serta produk yang mereka hasilkan.
         Penggunaan penilaian kinerja memperluas pendekatan Anda untuk penilaian. Sepanjang teks ini kita memiliki keuntungan menggunakan pendekatan multiple ketika menilai prestasi siswa. Kami setuju dengan komentar dari departemen pendidikan AS (1997):
Sebuah ukuran tunggal atau pendekatan tidak mungkin cukup mengukur pengetahuan, keterampilan, dan prosedur yang rumit dicakup oleh standar konten ketat. Beberapa ukuran dan pendekatan dapat digunakan untuk memanfaatkan kekuatan dari masing-masing teknik pengukuran, meningkatkan utilitas dari sistem penilaian dan memperkuat keabsahan keputusan berdasarkan hasil penilaian. (P.9)
Kelemahan dari penilaian kinerja
         Scoring penilaian kinerja dalam cara yang dapat diandalkan sulit. Mungkin kritik yang paling umum dari penilaian kinerja adalah bahwa karena subjektivitas yang melekat dalam mencetak penilaian kinerja sering menghasilkan skor yang diandalkan baik di seluruh penilai dan sepanjang waktu. Artinya, penilai yang sama kemungkinan akan menetapkan nilai yang berbeda dari nilai kinerja yang sama pada waktu yang berbeda, dan dua penilai yang berbeda cenderung untuk menetapkan nilai yang berbeda untuk kinerja yang sama.
         Penilaian kinerja biasanya menyediakan pengambilan sampel secara terbatas dari domain konten, dan sulit untuk membuat generalisasi tentang keterampilan dan pengetahuan proses siswa. Karena siswa biasanya mampu merespon hanya sejumlah tugas kinerja, ada pengambilan sampel secara terbatas dari domain konten.
         Penilaian kinerja yang memakan waktu dan sulit untuk membangun, mengelola, dan skor. Penilaian kinerja tidak cepat dan mudah, dibutuhkan waktu yang cukup untuk mengembangkan tugas-tugas kinerja yang baik dan prosedur penilaian, untuk memungkinkan siswa tepat waktu dalam menyelesaikan tugas, dan bagi Anda untuk lebih memadai dalam mengevaluasi kinerja mereka. Dapat disesalkan, tidak ada jalan pintas untuk membuat mereka cepat dan mudah. Seperti Stiggins (2001) mencatat:
Penilaian kinerja adalah kompleks. Apakah mengharuskan pengguna untuk mempersiapkan dan melakukan penilaian dengan cara yang bijaksana dan ketat. Mereka bersedia untuk menginvestasikan waktu dan energi yang diperlukan dalam menempatkan siswa mereka langsung dalam kondisi real. (Hal.186)

         Ada keterbatasan praktis yang dapat membatasi penggunaan penilaian kinerja. Selain tuntutan waktu yang tinggi, keterbatasan praktis lainnya mungkin membatasi penggunaan penilaian kinerja.
Portofolio
Portofolio adalah kumpulan bukti yang mewakili prestasi dan belajar dalam program modul / kursus atau studi.
http://www.ukcle.ac.uk/resources/personal-development-planning/portfolios/one/
Pedoman untuk mengembangkan penilaian portofolio
         Tentukan tujuan dari portofolio. Langkah pertama dalam mengembangkan adalah menentukan tujuan atau penggunaan portofolio. Ini adalah hal utama yang penting karena akan sangat menentukan isi portofolio siswa Anda. Misalnya, Anda akan perlu memutuskan apakah portofolio akan digunakan murni untuk meningkatkan pembelajaran, sebagai dasar untuk kelas (yaitu, portofolio scorable), atau beberapa kombinasi dari keduanya.
         Memutuskan apa jenis item yang akan ditempatkan dalam portofolio. Hal ini juga penting untuk menentukan apakah akan menampilkan portofolio "karya terbaik" siswa, produk perwakilan, atau indikator kemajuan atau pertumbuhan.
         Tentukan siapa yang akan memilih item untuk dimasukkan dalam portofolio. Guru harus memutuskan siapa yang akan bertanggung jawab untuk memilih item yang akan disertakan dalam portofolio: guru, siswa, atau keduanya. Ketika memilih item prinsip harus memilih item yang kehendak memungkinkan guru atau lainnya tepatnya membuat kesimpulan yang valid tentang kemampuan siswa dan pengetahuan.
         Menetapkan prosedur untuk mengevaluasi atau mencetak portofolio. Portofolio siswa biasanya mencetak menggunakan rubrik skor serupa dengan yang dibahas dalam konteks mencetak esai dan penilaian kinerja.
a.       Tentukan kriteria evaluasi yang harus dipertimbangkan ketika mengevaluasi produk karya siswa.
b.      Menyediakan standar eksplisit yang menggambarkan berbagai tingkat kinerja pada masing-masing criteria
c.       Menunjukkan apakah kriteria akan dievaluasi dalam holistik atau secara analitis.
         Mendorong keterlibatan siswa dalam proses. Siswa secara aktif terlibat dalam proses penilaian adalah tujuan dari semua penilaian kinerja, dan penilaian portofolio memberikan kesempatan yang sangat baik untuk meminta keterlibatan siswa. Seperti kita menyarankan, siswa harus dilibatkan semaksimal mungkin dalam memilih tem apa yang termasuk dalam portofolio mereka. Dengan demikian, mereka harus terlibat dalam menjaga portofolio dan mengevaluasi kualitas produk dalam kandungannya.
Kelebihan dari penilaian portofolio
         Portofolio sangat baik mencerminkan prestasi siswa dan pertumbuhan dari waktu ke waktu. Mungkin kekuatan terbesar dari portofolio adalah bahwa mereka lebih baik dalam menggambarkan kemajuan siswa selama jangka waktu tertentu.
         Portofolio dapat membantu memotivasi siswa dan membuat mereka lebih terlibat dalam proses pembelajaran. Karena siswa biasanya membantu memilih item untuk dan mempertahankan portofolio, mengevaluasi kemajuan mereka saat mereka melakukannya, mereka mungkin lebih termotivasi untuk terlibat aktif dalam proses pembelajaran dan penilaian.
         Portofolio dapat meningkatkan kemampuan siswa untuk mengevaluasi kinerja mereka sendiri dan produk. Karena siswa biasanya diminta untuk mengevaluasi kemajuan mereka sendiri, diharapkan bahwa mereka akan menunjukkan peningkatan self-assessment keterampilan.
Ketika digunakan dengan benar portofolio dapat memperkuat hubungan antara instruksi dan penilaian. Karena portofolio sering menggabungkan produk terkait erat dengan instruksi kelas, mereka dapat membantu memperkuat hubungan antara instruksi dan penilaian.
         Portofolio dapat meningkatkan komunikasi guru dengan siswa maupun orang tua. Menyediakan secara rutin siswa-guru konferensi untuk meninjau isi portofolio dengan cara yang sangat baik untuk meningkatkan komunikasi.
Kelemahan dari penilaian portofolio
         Portofolio Scoring dengan cara yang handal sulit dilakukan. Scoring portofolio yang andal adalah tugas yang sangat menantang. Selain kesalahan diperkenalkan oleh penilaian subjektif dari penilai dan sulit menetapkan kriteria scoring yang spesifik, standarisasi memadai isi portofolio sering mengakibatkan komparatif terbatas di seluruh siswa.
         Melakukan penilaian portofolio yang benar adalah proses yang memakan waktu dan menjadi beban. Pendidik sebagian besar setuju bahwa untuk portofolio yang efektif  perlu teknik penilaian yang berkomitmen untuk proses dan bersedia untuk menginvestasikan waktu dan energi yang diperlukan untuk membuat mereka bekerja.
Singkatnya, portofolio memiliki kekuatan dan kelemahan yang signifikan. Di sisi positif yang mereka berikan pada keadaan dasar dalam kerangka kerja untuk memeriksa kemajuan siswa, mendorong partisipasi siswa dalam proses penilaian, meningkatkan komunikasi, dan memperkuat hubungan antara instruksi dan penilaian. Jelas, ini adalah fitur terpuji. Pada sisi bawah mereka menuntut waktu dan energi dan memiliki keandalan yang dipertanyakan. Pertimbangkan komentar dari Hopkins (1998):
Penggunaan portofolio memiliki potensi besar untuk memperkaya penilaian pendidikan dan mahasiswa tetapi tidak harus dilihat sebagai alternatif untuk tes tradisional dan ujian. Siswa masih perlu untuk menunjukkan kemahiran pada tugas-tugas seragam dirancang untuk menjadi sampel yang representatif dari tujuan suatu program studi. Salah Satu mungkin memiliki tugas yang indah dalam portofolio ilmu (koleksi batu, daun, serangga, percobaan) tetapi memiliki kesenjangan yang besar dalam pemahaman tentang hukum utama fisika, genetika, dan sebagainya. (Hal. 311)

Komentar

Postingan populer dari blog ini

Kendala Nissan X trail susah hidup

Analisis Struktur dengan menggunakan Metode Matrik