performance assessment and portfolios
PEFORMANCE
ASSES SMENT AND PORTFOLIOS
“PENILAIAN KINERJA DAN FORTOFOLIO”
Sumber:
Measurement And Assessment
OLEH:
Nama : Riki Chandra Wijaya
NIM : 018/MPIPA/2012
Mata Kuliah : Penilaian Otentik
Dosen : Dr. Syamsurizal
PROGRAM PASCA
SARJANA
MAGISTER
PENDIDIKAN MIPA
UNIVERSITAS
JAMBI
2012
Pendahuluan
Penilaian kinerja siswa
merupakan salah satu alternatif penilaian yang difokuskan pada dua aktivitas
pokok, yaitu: 1) observasi proses saat berlangsungnya unjuk keterampilan dan 2)
evaluasi hasil cipta atau produk. Penilaian bentuk ini dilakukan dengan
mengamati saat siswa melakukan aktivitas di kelas atau menciptakan suatu hasil
karya sesuai dengan tujuan pembelajarannya. Kecakapan yang ditampilkan siswa
adalah variabel yang dinilai. Penilaian terhadap kecakapan siswa didasarkan
pada perbandingan antara kinerja siswa dengan target yang telah ditetapkan.
Proses penilaiannya dilakukan mulai persiapan, melaksanakan tugas sampai dengan
hasil akhir yang dicapainya (Depdikbud, 1993: 8). Sejalan dengan pendapat
tersebut, Popham (1994:139) mengemukakan bahwa: "Performance
as-sessment is approach to measuring a student's status based on the way that
the student completes a specified task". Stiggins (1991: 85)
mengemukakan bahwa dalam penilaian kinerja siswa, guru menghendaki respon yang
"authentic" atau yang asli berupa aktivitas yang dapat diamati.Tugas
yang diberikan bisa dalam bentuk lisan atau tertulis, yang jenis tugasnya
disesuaikan den-gan tujuan pembelajaran. Menurut Popham (1994: 141) penilaian
terhadap kinerja siswa setidaknya memiliki tiga sifat, yaitu: kriteria ganda
(multiple criteria), standar kualitas yang telah dispesifikasi (perspectified
quality standards) dan penaksiran penilaian (judgmental appraisal).
Dalam penilaian terhadap
kinerja siswa, target pencapaian hasil bela-jar yang dapat diraih meliputi
aspek-aspek berikut ini: 1) Knowledge; 2) Reasoning; aplikasi
pengetahuan dalam berbagai konteks pemecahan masalah; 3) Skill;
kecakapan dalam berbagai jenis keterampilan komunikasi, visual, karya seni, dan
lain-lain; 4) Product; dan 5) Affect; berhubungan dengan
perasaan, sikap, nilai, minat, motivasi (Stiggins, 1994: 171). Selanjutnya
dikemukakan bahwa diantara kelima target tersebut, penilaian kinerja siswa sangat
efektif untuk menilai pencapaian target dari reasoning, skill dan karya cipta.
Untuk dapat melakukan penilaian terhadap keterampilan (skill) dan karya cipta
siswa diperlukan alat ukur terhadap kinerja siswa yang disebut dengan tes
kinerja. Menurut Yacobs (1992:137), bahwa tes ini menyediakan cara mengukur
skill dan kemampuan yang tidak dapat diukur dengan tes tertulis.
Tes kinerja merupakan
tes yang penugasannya disampaikan dalam bentuk lisan atau tertulis dan proses
penilaiannya dilakukan sejak siswa melakukan persiapan, me-laksanakan tugas
sampai dengan hasil akhir. Sebagai alat penunjang dalam melaksanakan tes
perbuatan digunakan lembar ob-servasi atau sebuah format pengamatan kinerja
atau penampilan siswa. Dalam lembar pengamatan tertera aspek-aspek yang diamati
sesuai dengan target pembelajarannya. Berdasarkan deskriptor-deskriptor yang
nampak selama proses pengamatan, ditentukanlah skor kinerja siswa dengan
berpe-doman pada kriteria penilaian yang telah ditetapkan sebelumnya.
Langkah-langkah yang harus
diperhatikan dalam mengembangkan metode ini adalah: kejelasan karakter
penampilan yang akan dinilai, pengembangan tugas atau latihan (sifat, materi,
jumlah), dan prosedur pen-skoran meliputi teknik, pencatatan hasil,
identifikasi dan keterampilan penilaian. Sebagai contoh, aspek-aspek kinerja
siswa apa saja yang akan dinilai? Sifatnya individual atau kelompok? Prosedur
penyekorannya meng-gunakan skala, rubrik atau catatan harian? Bagaimana
kriteria penilaian dari masing-masing aspek kinerja siswa? Selain itu sangat
dibutuhkan pelibatan siswa secara penuh mulai dari perencanaan, pengembangan
dan penggunaannya. Standar untuk tugas-tugas sebelumnya harus ditetapkan secara
jelas termasuk juga identifikasi prestasi yang harus didemonstrasikan, kondisi
demonstrasi dan standar kualitas yang ditetapkan. Demikian pula kriteria
penilaian dari tiap-tiap kinerja siswa yang akan diamati harus sudah
di-mengerti dan disepakati bersama siswa. Melalui cara tersebut, penilaian
ter-hadap kinerja siswa dapat dirasakan lebih terbuka dan adil bagi semua
siswa, karena siswa mempunyai acuan yang jelas dalam mengerjakan tugas dari
guru.
1. Penilaian kinerja lebih
mennggambarkan pengaturan dan aplikasi keadaan nyata dari pada penilaian paper
and pencil tes.
Penilaian
kinerja dibagi ke dalam tiga jenis yaitu:
a.
Penilaian kinerja actual.
Sebuah
penilaian kinerja yang sebenarnya terjadi dalam pengaturan yang sebenarnya di
mana aktivitas nyata terjadi atau dalam simulasi yang kembali menciptakan
pengaturan yang sebenarnya. Contoh dari penilaian kinerja yang kebanyakan orang
alami adalah bagian mengemudi pemeriksaan lisensi/surat-surat pengemudi. Pada
tes pertama adalam menulis ujian yang
didesain untuk mengetahui aplikasi pengetahuan dasar dalam kesuksesan dan
keamanan berkendara kendaraan bermotor.
b.
Penilaian kinerja analog.
Dalam
banyak situasi tidak mungkin untuk menilai orang dalam kondisi nyata karena
konsekuensi potensial dari kegagalan, dan penilaian kinerja analog dapat dilakukan. Sebagai contoh, operator
tenaga nuklir harus merencanakan harus sertifikasi ulang setiap beberapa bulan,
dan proses sertifikasi ulang mereka memerlukan operasi penilaian dari sistem pengendali
tenaga nuklir.
c.
Penilaian kinerja buatan.
Penilaian
kinerja Buatan adalah jauh lebih realistis daripada kategori sebelumnya dan
biasanya melibatkan kondisi yang hanya menetapkan bahwa pengambil tes harus mempertimbangkan
ketika melakukan tugasnya.
2.
Penilaian
kinerja melibatkan beberapa kriteria penilaian.
Perbedaan
ini mengharuskan kinerja siswa harus dievaluasi pada beberapa kriteria.
(Popham, 1999, 2000).
3. Penilaian kinerja melibatkan
evaluasi subjektif dari kinerja murid.
Sedangkan
penilaian tradisional dapat menjadi nilai secara obyektif, penilaian kinerja
asli melibatkan subjektif dari kinerja siswa (Popham, 1999, 2000)
Beberapa
pendidik mengacu pada penilaian kinerja sebagai penilaian otentik atau
penilaian alternatif.
Untuk
melengkapi situasi yang lebih, tidak semua orang menggunakan penilaian kinerja
untuk menggambarkan prosedur. Beberapa pendidik menggunakan penilaian otentik untuk
merujuk pada prosedur dasar yang sama yang kita sebut sebagai penilaian
kinerja. Mereka umumnya lebih memilih istilah penilaian otentik karena
menyiratkan bahwa penilaian lebih dekat dalam menggambarkan situasi nyata.
Sebagian
lebih besar pendidik mengenal, banyak
tujuan-tujuan belajar tidak dapat diukur menggunakan standar tugas kertas dan
pensil, dan situasi ini adalah di mana penilaian kinerja lebih dibutuhkan atau
lebih unggul. Perhatikan contoh berikut:
a.
Kelas laboratorium. Siswa mungkin
diminta untuk menunjukkan kemampuan mereka memecahkan masalah, melakukan
percobaan, menggunakan mikroskop, membedah binatang, mengevaluasi komposisi
kimia, memperkirakan kecepatan obyek, menghasilkan diorama s, atau putih
laporan lab.
b.
Kelas matematika. Siswa mungkin
diperlukan untuk menunjukkan kemampuan kuantitatif dalam memecahkan masalah
dengan masalah dibangun di sekitar masalah kehidupan nyata di berbagai bidang
seperti teknik, arsitektur, lansekap, polling politik, keuangan bisnis, ekonomi,
atau anggaran keluarga.
c.
Inggris, bahasa asing, kelas debat.
Dalam kelas ini lebih menekankan keterampilan komunikasi, penilaian kinerja
d.
Kelas IPS. Siswa mungkin diperlukan
untuk menunjukkan penggunaan peta dan bola dunia, debat lawan posisi di bidang politik,
membuat presentasi lisan, menghasilkan diorama, menunjukkan kemampuan
memecahkan masalah, atau menulis makalah tema.
e.
Kelas kesenian. Siswa biasanya terlibat
dalam berbagai proyek seni yang menghasilkan produk kerja.
f.
Kelas musik. Siswa terlibat dalam
kinerja mulai dari resital solo untuk produksi kelompok.
g.
Kelas pendidikan fisika.
Penilaian kinerja dapat menjadi
pendekatan utama untuk penilaian di kelas seperti seni, musik, pendidikan
jasmani, teater, dan toko.
Bahkan
di kelas yang tradisional menggunakan paper and pencil tes yang umum digunakan,
dan penilaian kinerja dapat menjadi
penilaian tambahan berarti yang sangat berguna.
Pedoman
untuk mengembangkan kinerja yang efektif
Memilih tugas kinerja
yang tepat
a.
Pilihlah tugas kinerja yang memberikan
penilaian paling langsung dari tujuan pendidikan yang Anda ingin mengukur.
Salah
satu prinsip yang telah menyentuh beberapa kali penggunaan adalah bahwa Anda
harus memilih teknik penilaian yang menyediakan pengukuran yang paling langsung
dari tujuan pendidikan yang menarik.
b.
Pilihlah tugas kinerja yang
memaksimalkan kemampuan Anda untuk menggeneralisasi hasil penilaian. Salah satu
pertimbangan yang paling penting ketika memilih tugas kinerja adalah memilih
salah satu yang akan memungkinkan Anda untuk menggeneralisasi hasil untuk
tugas-tugas yang sebanding.
c.
Pilihlah tugas kinerja yang mencerminkan
keterampilan yang penting dalam pembelajaran. Sebagai aturan umum, penilaian
kinerja yang harus digunakan hanya untuk
menilai keterampilan yang paling penting atau esensial.
d.
Pilihlah tugas kinerja yang mencakup
lebih dari satu tujuan pembelajaran. Karena penilaian kinerja sering
membutuhkan waktu yang luas tersebut dan komitmen energi, sangat diinginkan
untuk memilih tugas yang memungkinkan penilaian dari beberapa tujuan pendidikan
yang penting.
e.
Pilihlah tugas kinerja yang focus bagi
anda dalam mengevaluasi pada proses dan / atau produk yang Anda paling tertarik
sebelum memilih tugas kinerja Anda harus menentukan apakah Anda terutama tertarik
dalam menilai proses siswa terlibat dalam, produk hasil produksi, atau beberapa
kombinasi dari dua.
Penilaian
ahli (misalnya, Nitko, 2001) merekomendasikan bahwa focus anda pada proses
terjadi saat:
a.
Tidak ada produk yang dihasilkan.
b.
Urutan tertentu pada langkah atau
prosedur yang diajarkan.
c.
Langkah-langkah tertentu atau prosedur
penting yang menunjang untuk keberhasilan.
d.
Proses jelas dapat diamati.
e.
Analisis proses dapat memberikan umpan
balik yang konstruktif.
f.
Anda memiliki waktu untuk berperanan dalam
mengamati siswa ketika melakukan tugas tersebut.
Fokus
pada produk dianjurkan bila:
a.
Sebuah produk yang sama baiknya dapat
diproduksi dengan menggunakan prosedur yang berbeda.
b.
Proses ini tidak secara langsung
diamati.
c.
Kualitas produk dapat dinilai secara
obyektif.
f.
Memilih Tugas kinerja Yang Memberikan
Realisme yang Diinginkan. Dalam hal in perubahan yang butuh dipertimbangkan
ialah seberapa dekat tugas Anda perlu mencerminkan aplikasi kehidupan nyata.
Ini ialah sepanjang garis perbedaan antara penilaian kinerja aktual, analog,
dan artifisial. Perbedaan ini dapat dikonseptualisasikan sebagai sebuah
kontinum, dengan tugas kinerja aktual menjadi tugas kinerja yang paling
realistis dan paling artifisial. Meskipun tidak mungkin untuk melakukan
penilaian kinerja aktual atau bahkan analog di kelas, variabilitas yang cukup
besar dalam tingkat realisms dapat ditemukan dalam penilaian kinerja
artifisial. Grönlund (1998) mengidentifikasi empat faktor yang perlu
dipertimbangkan ketika menentukan seberapa realistis penilaian kinerja Anda:
•
Sifat dari tujuan pendidikan yang
diukur.
•
Sifat sekuensial dari instruksi.
•
Kendala-kendala praktek.
•
Sifat dari tugas.
g.
Memilih Tugas kinerja dengan
keterampilan Ukur Yang "Teachable. "Artinya, pastikan penilaian kinerja anda dapat mengukur
keterampilan yang diperoleh melalui instruksi langsung dan tidak satupun yang
mencerminkan kemampuan bawaan. Tanyakan kepada diri sendiri, "Dapatkah
siswa menjadi lebih mahir pada tugas ini sebagai hasil dari instruksi yang
diberikan?" Popham (1999) mencatat bahwa ketika kriteria evaluasi fokus
pada "keterampilan mendidik" memperkuat hubungan antara instruksi dan
penilaian, membuat keduanya lebih bermakna.
h.
Memilih Tugas Kinerja Yang Adil untuk
Semua Siswa. Pilih tugas yang adil untuk semua siswa tanpa memandang jenis
kelamin, etnis, atau status sosial ekonomi.
i.
Memilih Tugas Kinerja Yang Dapat Dinilai
dengan Mengingat Waktu dan Sumber daya yang tersedia. Mempertimbangkan
kepraktisan dari tugas kinerja. Misalnya, bisa dengan penilaian yang realistis
akan selesai ketika mempertimbangkan biaya, waktu, ruang, dan peralatan yang
dibutuhkan? Pertimbangkan faktor-faktor seperti ukuran kelas, apa mungkin
praktis dalam kelas kecil sepuluh siswa dan mungkin tidak praktis dalam kelas
30 siswa. Dari pengalaman kami umumnya bagi guru dalam meremehkan waktu bagi
siswa dalam menyelesaikan sebuah proyek atau kegiatan pembelajaran. Hal ini
terjadi karena guru sebagai seorang yang merasa ahli pada tugas dan dapat
melihat cara yang mudah untuk langsung menyelesaikannya.
j.
Memilih Tugas kinerja Yang Dapat
Mencetak dalam manner Handal. Pilihlah tugas kinerja yang akan memperoleh
respon siswa yang dapat diukur secara objektif, akurat, dan dapat diandalkan.
k.
Memilih Tugas kinerja Yang Mencerminkan
Tujuan Pendidikan yang tidak dapat diukur dengan menggunakan Tindakan
Tradisional. Seperti yang akan anda pelajari ketika menggambarkan kelebihan dan kelemahan dari
penilaian kinerja anda, ada beberapa keterbatasan yang signifikan terkait
dengan penggunaan penilaian. Akibatnya, sebagian besar penilaian para ahli
menyarankan Anda menggunakan mereka untuk mengukur tujuan pendidikan yang hanya
tidak dapat dinilai menggunakan paper and pencil test.
Tabel 10.1
Mengembangkan
instruksi
Karena
tugas-tugas kinerja sering membutuhkan respon siswa yang cukup kompleks,
penting bahwa instruksi Anda tepa dalamt menentukan jenis respon yang Anda
harapkan. Karena orisinalitas dan kreativitas dipandang sebagai hasil yang
diinginkan, tugas kinerja sering memberikan siswa kebebasan yang cukup besar
dalam bagaimana mereka mendekati tugas. "Tugas utama selanjutnya dalam
pengembangan penilaian kinerja adalah untuk mengembangkan instruksi yang jelas
untuk menentukan apa yang siswa harapkan."
Berikut adalah daftar
pertanyaan yang perlu anda pertimbangkan ketika mengevaluasi kualitas instruksi
Anda. (Misalnya, Nitko, 2001)
• Apakah instruksi Anda
sesuai dengan tingkat pendidikan siswa Anda?
• Apakah petunjuk Anda
berisi jargon yang tidak perlu dan bahasa terlalu teknis?
• Apakah instruksi Anda
jelas menentukan tujuan atau tujuan tugas?
• Apakah instruksi Anda
dengan jelas menentukan jenis respon yang Anda harapkan?
• Apakah instruksi Anda
menentukan semua parameter penting dari tugas kinerja (misalnya, batas waktu,
penggunaan peralatan atau bahan)?
• Apakah instruksi Anda
jelas menentukan kriteria yang akan Anda gunakan ketika mengevaluasi respon
siswa?
• Apakah siswa dari
latar belakang budaya dan etnis yang beragam menafsirkan petunjuk secara
akurat?
Tabel 10.2
Mengembangkan
prosedur untuk mengevaluasi tanggapan
Apakah
Anda mengevaluasi proses, produk, atau kombinasi dari keduanya, sangat penting
bahwa Anda mengembangkan prosedur yang sistematis, objektif, dan dapat
diandalkan untuk mengevaluasi respon siswa. Penilaian kinerja pada dasarnya
dibangun-respon penilaian, dan penilaian tersebut banyak masalah yang
berhubungan dengan skor esai kita bahas dalam bab 9.
"Langkah utama
dalam pengembangan penilaian kinerja adalah untuk mengembangkan prosedur untuk
mengevaluasi respon siswa."
Tabel 10.2
l.
Pilihlah kriteria penting yang akan
dipertimbangkan ketika mengevaluasi tanggapan siswa. Mulailah dengan memilih
kriteria atau karakteristik respon yang akan anda pekerjakan ketika menilai
kualitas respon siswa. Kami merekomendasikan bahwa Anda memberikan pertimbangan
yang cermat untuk pemilihan karakteristik nyata karena ini mungkin adalah
langkah yang paling penting dalam mengembangkan prosedur skoring yang baik.
m.
Tentukan standar eksplisit yang
menggambarkan berbagai tingkat kinerja. Untuk setiap criteria yang Anda ingin evaluasi,
Anda harus mengembangkan dengan jelas pernyataan standar yang membedakan antara
tingkat kinerja.
n.
Tentukan apa jenis prosedur yang akan
Anda gunakan. Rubrik Scoring dapat diklasifikasikan baik secara holistik atau
analitik.
Dengan
menganalisa rubrik guru dapat menilai secara kriteria-demi-kriteria berdasarkan
rubric yang holistik dari masing-masing skor tunggal yang mencerminkan kualitas
keseluruhan respon siswa.
Linn
dan grounlund (2000) mengidentifikasi skala rating dan checklist sebagai
alternative yang populer untuk skor rubrik tradisional. Perhatikan perbedaan
yang kecil antara skala rating dan rubrik tradisional, mereka menemukan skala
rating biasanya menggunakan penilaian kualitas (misalnya, luar biasa, baik,
rata-rata, marginal, rendah) untuk menunjukkan kinerja pada masing-masing
kriteria yang dioppositekan dengan standar deskriptif pada penilaian rubrik.
Pada dasarnya dari kualitas penilaian, beberapa skala rating menunjukkan
frekuensi penilaian (misalnya, selalu, sering, kadang-kadang, jarang, tidak
pernah). Tabel 10.3 memberikan contoh skala penilaian menggunakan deskripsi
verbal.
Sejumlah
jenis skala penilaian yang umum digunakan dalam menskorkan penilaian kinerja.
Pada beberapa skala rating deskripsi verbal diganti dengan angka untuk memudahkan
mencapai tujuan. Tabel 10.4 memberikan contoh skala penilaian numerik. Variasi
lain, disebut sebagai skala penilaian grafis, menggunakan garis horizontal
dengan posisi peringkat diletakkan sepanjang garis. Tabel 10.5 memberikan
contoh skala penilaian grafis. Akhirnya tipe-tipe yang paling sering digunakan
ialah menggabungkan format grafis dengan frase deskriptif patokan poin. Hal ini
biasanya disebut sebagai skala grafis deskriptif. Linn dan Grönlund (2000)
menunjukkan bahwa jenis skala rating memiliki sejumlah keunggulan yang
mendukung penggunaan dalam penilaian kinerja. itu dapat memberikan informasi
lebih lanjut kepada siswa tentang kinerja mereka dan membantu guru menilai
kinerja siswa dengan objektivitas yang lebih besar dan akurasi. Tabel 10.6 memberikan
contoh skala penilaian deskriptif grafis. Ketika mengembangkan skala rating
biasanya diinginkan untuk memiliki antara tiga dan tujuh poin rating. Misalnya,
minimal Anda ingin skala rating Anda untuk memasukkan peringkat miskin,
rata-rata, dan sangat baik. Kebanyakan ahli menyarankan bahwa termasuk lebih
dari tujuh posisi tidak berguna karena penilai biasanya tidak dapat membuat
diskriminasi lebih halus dari ini.
checklist
Penilaian yang sederhana ya / tidak.
Checklist
lain adalah prosedur yang sering digunakan untuk mencetak penilaian kinerja.
Checklist mirip dengan skala rating, tapi sementara skala rating lebih
memperhatikan kualitas kinerja atau frekuensi perilaku, daftar periksa
memerlukan jawaban yang sederhana penilaian ya / tidak. Tabel 10.7 memberikan
contoh checklist yang dapat digunakan dengan anak-anak sekolah dasar. Linn dan
Grönlund (2000) menunjukkan bahwa penggolongan paling berguna dalam pendidikan
dasar karena penilaiannya sebagian besar didasarkan pada pengamatan daripada
penilaian dengan pengujian formal. Daftar periksa juga sangat berguna untuk
melihat keterampilan yang dapat dibagi menjadi serangkaian perilaku.
Menerapkan
Prosedur untuk Meminimalkan Kesalahan dalam Penilaian.
Langkah
besar terakhir dalam perkembangan penilaian kinerja adalah dengan menerapkan
prosedur penting untuk meminimalkan
kesalahan dalam penilaian.
Ketika
mendiskusikan skor-skor item pada essay dalam bab sebelumnya, kita mencatat
bahwa banyak faktor bisa menyebabkan kesalahan dalam proses penilaian. Faktor
serupa perlu dipertimbangkan ketika mencetak penilaian kinerja. Sumber umum
dari kesalahan ketika guru menilai kinerja siswa meliputi berikut ini.
·
Efek halo.
Kami memperkenalkan Anda dengan konsep efek harapan ketika membahas skor item
esai, mencatat bahwa efek ini ikut berperanan ketika
guru mencetak tes yang memungkinkan meninjau karakteristik yang tidak relevan
dari siswa untuk mempengaruhi skor. Dalam konteks dari fenomena ini sering
disebut sebagai efek halo. Efek halo adalah suatu kecenderungan dari penilai
yang dipengaruhi oleh sifat positif atau negatif tunggal, tidak berhubungan
dengan sifat atau keterampilan yang dinilai, bahwa efek peringkat dari
karakteristik siswa. Dengan kata lain, jika siswa terkesan pada tingkah laku guru dengan ketepatan waktu dan sikap yang baik,
guru mungkin cenderung menilai mereka lebih baik pada saat memberikan penilaian
kinerja. Jelas ini harus dihindari karena merusak keabsahan hasilnya.
·
Kemurahan hati, tingkat kesalahan,
dan kesalahan tendensi sentral. Kesalahan terjadi
karena beberapa guru cenderung memberikan semua siswa peringkat yang baik
sedangkan kesalahan lebih parah terjadi karena beberapa guru cenderung
memberikan semua siswa peringkat yang rendah. Kesalahan tendensi sentral
terjadi karena beberapa guru cenderung memberikan nilai semua siswa dalam
kisaran menengah (misalnya, menunjukkan kinerja rata-rata). Keringanan, tingkat
keparahan, dan pusat kesalahan kecenderungan semua mengurangi kisaran skor dan
membuat skor kurang dapat diandalkan.
·
Bias pribadi.
Bias pribadi dapat merusak peringkat jika guru memiliki kecenderungan untuk
membiarkan stereotipe mempengaruhi peringkat kinerja siswa.
·
Kesalahan logika.
Kesalahan logika terjadi ketika seorang guru mengasumsikan bahwa ada dua
karakteristik yang terkait dan cenderung itu memberikan penilaian yang setara
berdasarkan asumsi ini (Nitko, 2001). Contoh dari kesalahan logis guru yaitu dengan
asumsi bahwa semua siswa dengan skor bakat tinggi harus melakukannya kinerja
dengan baik di semua bidang akademik, dan membiarkan keyakinan ini mempengaruhi
peringkat mereka dalam pembelajaran.
·
Efek urutan.
Efek urutan adalah perubahan dalam angka yang muncul selama proses penilaian.
Efek ini sering disebut sebagai penyimpangan penilai atau pengrusakan
reliabilitas. Nitko (2001) mencatat bahwa ketika para guru mulai menggunakan
skor rubrik mereka sering menetapkan aturan yang kurang erat dan sebagai akibatnya
terjadi penurunan reliabilitas.
Jelas
sumber-sumber kesalahan dapat merusak keandalan skor dan validitas interpretasi
skor. Oleh karena itu, penting bagi guru untuk mengambil langkah-langkah dalam
meminimalkan pengaruh faktor-faktor yang mengancam keakuratan penilaian.
Berikut terdapat beberapa saran
untuk meningkatkan keandalan dan ketepatan peringkat guru yang didasarkan pada
pengalaman kita sendiri dan rekomendasi dari penulis lain (misalnya, Linn &
Grönlund, 2000; Nitko, 2001; Popham, 1999, 2000).
a. Sebelum
Pemberian Penilaian tersebut, kita harus Memiliki Satu atau Lebih Kolega
Terpercaya Evaluasi Rubrik Scoring. Jika Anda memiliki guru-guru lain yang
akrab dengan area review kinerja dan dapat memberikan kritik rubrik skor Anda,
mereka mungkin dapat mengidentifikasi keterbatasan sebelum Anda memulai
penilaian.
b. Tiba
Kemungkinan Tingkat Kinerja Diperoleh tanpa Mengetahui Identitas pelajar. Hal
ini sesuai dengan rekomendasi yang kami buat berkaitan dengan soal essay
grading. Scoring Anonymous mengurangi kemungkinan peringkat akan dipengaruhi
oleh efek halo, bias personal, atau kesalahan logis.
c. Tingkat
Kinerja setiap siswa pada Satu Tugas sebelum Memproses ke Tugas selanjutnya.
Lebih mudah untuk menerapkan kriteria scoring yang seragam ketika Anda mencetak
satu tugas untuk setiap siswa sebelum melanjutkan ke tugas berikutnya. Artinya,
tingkatan jumlah tugas satu untuk semua siswa sebelum melanjutkan ke tugas
kedua. Bila mungkin, Anda juga harus menyusun ulang secara acak siswa atau
proyek mereka sebelum pindah ke tugas berikutnya. Ini akan membantu mengurangi
efek urutan.
d. Jadilah
Seorang yang Peka terhadap kelonggaran, Ketelitian, atau Kecenderungan Kesalahan
Inti. Seperti anda memperingkatkan tugas yang anda buat, anda harus menjaga ketelitian
dalam penghitungan Anda menggunakan setiap titik pada skala penilaian yang
dibuat. Jika itu sudah jelas ada sedikit variasi di peringkat yang Anda buat
(semua sangat tinggi, semua sangat rendah, atau semua di tengah), Anda mungkin
perlu mengubah praktik peringkat Anda untuk lebih akurat agar dapat mencerminkan
perbedaan dalam kinerja siswa Anda '.
e. Melakukan
Analisis Keandalan awal untuk Menentukan Apakah Ratings Keunggulah Anda
diterima. Misalnya, menskorkan bagian dari penilaian. Atau bahkan sub bagian, untuk
menentukan konsistensi dalam peringkat. Topic Khusus 10.2 menyediakan
pembahasan tentang isu-isu reliabilitas dalam penilaian kinerja dan
menggambarkan beberapa pendekatan untuk memperkirakan reliabilitas peringkat.
f. Memiliki
Lebih dari Satu Tingkatan pada masing-masing kinerja Siswa. Menggabungkan dari
beberapa peringkat guru biasanya akan membuat nilai lebih dapat diandalkan
daripada peringkat dari satu guru saja. Hal ini sangat penting ketika hasil
penilaian akan memiliki konsekuensi yang signifikan bagi siswa.
Kelebihan
dari penilaian kinerja
•
Penilaian kinerja dapat mengukur
kemampuan yang tidak dapat dinilai dengan menggunakan penilaian lainnya.
Mungkin kekuatan terbesar dari penilaian kinerja adalah bahwa penilaian kinerja
dapat mengukur kemampuan yang tidak bisa diukur dengan jenis penilaian lain.
Jika Anda ingin mengukur kemampuan seperti kemampuan siswa untuk terlibat dalam
debat lisan, melukis gambar, lagu mesin, atau menggunakan mikroskop, penilaian
kinerja sesuai dengan kebutuhan anda.
•
Penggunaan penilaian kinerja konsisten
dengan teori belajar modern. Teori belajar yang modern menyatakan bahwa untuk
belajar yang optimal terjadi jika siswa perlu mengintegrasikan informasi baru
dengan pengetahuan yang sudah ada dan secara aktif terlibat dalam tugas-tugas
kompleks yang mencerminkan aplikasi kehidupan nyata. Banyak ahli setuju bahwa
penilaian penilaian kinerja yang konsisten dengan prinsip-prinsip yang didukung
oleh teori belajar modern tersebut.
•
Penggunaan penilaian kinerja dapat
mengakibatkan instruksi yang lebih baik. Karena guru dapat termotivasi
mengajarkan untuk menguji kemampuan siswa, penggunaan penilaian kinerja dapat
membantu memperluas instruksi untuk menutupi tujuan pendidikan yang lebih
kompleks yang paralel terhadap aplikasi kehidupan nyata.
•
Penilaian kinerja dapat mengambil
pembelajaran lebih bermakna dan membantu memotivasi siswa. Penilaian kinerja
secara inheren menarik bagi guru dan siswa. Untuk banyak siswa pengujian dalam
kondisi yang serupa dengan yang akan mereka hadapi di dunia nyata lebih berarti
dari kertas-dan-pensil tes. Akibatnya, siswa mungkin akan lebih termotivasi
untuk secara aktif terlibat dalam proses penilaian.
•
Penilaian kinerja memungkinkan Anda
untuk menilai proses serta produk. Penilaian kinerja guru memberikan kesempatan
untuk evaluasi produk dan proses-yaitu, mengevaluasi cara siswa memecahkan
masalah dan melakukan tugas-tugas serta produk yang mereka hasilkan.
•
Penggunaan penilaian kinerja memperluas
pendekatan Anda untuk penilaian. Sepanjang teks ini kita memiliki keuntungan
menggunakan pendekatan multiple ketika menilai prestasi siswa. Kami setuju dengan
komentar dari departemen pendidikan AS (1997):
Sebuah ukuran tunggal atau
pendekatan tidak mungkin cukup mengukur pengetahuan, keterampilan, dan prosedur
yang rumit dicakup oleh standar konten ketat. Beberapa ukuran dan pendekatan
dapat digunakan untuk memanfaatkan kekuatan dari masing-masing teknik
pengukuran, meningkatkan utilitas dari sistem penilaian dan memperkuat
keabsahan keputusan berdasarkan hasil penilaian. (P.9)
Kelemahan
dari penilaian kinerja
•
Scoring penilaian kinerja dalam cara
yang dapat diandalkan sulit. Mungkin kritik yang paling umum dari penilaian
kinerja adalah bahwa karena subjektivitas yang melekat dalam mencetak penilaian
kinerja sering menghasilkan skor yang diandalkan baik di seluruh penilai dan
sepanjang waktu. Artinya, penilai yang sama kemungkinan akan menetapkan nilai
yang berbeda dari nilai kinerja yang sama pada waktu yang berbeda, dan dua
penilai yang berbeda cenderung untuk menetapkan nilai yang berbeda untuk
kinerja yang sama.
•
Penilaian kinerja biasanya menyediakan
pengambilan sampel secara terbatas dari domain konten, dan sulit untuk membuat
generalisasi tentang keterampilan dan pengetahuan proses siswa. Karena siswa
biasanya mampu merespon hanya sejumlah tugas kinerja, ada pengambilan sampel
secara terbatas dari domain konten.
•
Penilaian kinerja yang memakan waktu dan
sulit untuk membangun, mengelola, dan skor. Penilaian kinerja tidak cepat dan
mudah, dibutuhkan waktu yang cukup untuk mengembangkan tugas-tugas kinerja yang
baik dan prosedur penilaian, untuk memungkinkan siswa tepat waktu dalam
menyelesaikan tugas, dan bagi Anda untuk lebih memadai dalam mengevaluasi
kinerja mereka. Dapat disesalkan, tidak ada jalan pintas untuk membuat mereka
cepat dan mudah. Seperti Stiggins (2001) mencatat:
Penilaian kinerja adalah kompleks.
Apakah mengharuskan pengguna untuk mempersiapkan dan melakukan penilaian dengan
cara yang bijaksana dan ketat. Mereka bersedia untuk menginvestasikan waktu dan
energi yang diperlukan dalam menempatkan siswa mereka langsung dalam kondisi
real. (Hal.186)
•
Ada keterbatasan praktis yang dapat
membatasi penggunaan penilaian kinerja. Selain tuntutan waktu yang tinggi,
keterbatasan praktis lainnya mungkin membatasi penggunaan penilaian kinerja.
Portofolio
Portofolio adalah kumpulan bukti yang
mewakili prestasi dan belajar dalam program modul / kursus atau studi.
http://www.ukcle.ac.uk/resources/personal-development-planning/portfolios/one/
Pedoman
untuk mengembangkan penilaian portofolio
•
Tentukan tujuan dari portofolio.
Langkah pertama dalam mengembangkan adalah menentukan tujuan atau penggunaan
portofolio. Ini adalah hal utama yang penting karena akan sangat menentukan isi
portofolio siswa Anda. Misalnya, Anda akan perlu memutuskan apakah portofolio
akan digunakan murni untuk meningkatkan pembelajaran, sebagai dasar untuk kelas
(yaitu, portofolio scorable), atau beberapa kombinasi dari keduanya.
•
Memutuskan apa jenis item yang akan
ditempatkan dalam portofolio. Hal ini juga penting
untuk menentukan apakah akan menampilkan portofolio "karya terbaik"
siswa, produk perwakilan, atau indikator kemajuan atau pertumbuhan.
•
Tentukan siapa yang akan memilih
item untuk dimasukkan dalam portofolio. Guru harus
memutuskan siapa yang akan bertanggung jawab untuk memilih item yang akan
disertakan dalam portofolio: guru, siswa, atau keduanya. Ketika memilih item
prinsip harus memilih item yang kehendak memungkinkan guru atau lainnya
tepatnya membuat kesimpulan yang valid tentang kemampuan siswa dan pengetahuan.
•
Menetapkan prosedur untuk
mengevaluasi atau mencetak portofolio. Portofolio
siswa biasanya mencetak menggunakan rubrik skor serupa dengan yang dibahas
dalam konteks mencetak esai dan penilaian kinerja.
a. Tentukan
kriteria evaluasi yang harus dipertimbangkan ketika mengevaluasi produk karya
siswa.
b. Menyediakan
standar eksplisit yang menggambarkan berbagai tingkat kinerja pada
masing-masing criteria
c. Menunjukkan
apakah kriteria akan dievaluasi dalam holistik atau secara analitis.
•
Mendorong keterlibatan siswa dalam
proses. Siswa secara aktif terlibat dalam proses penilaian
adalah tujuan dari semua penilaian kinerja, dan penilaian portofolio memberikan
kesempatan yang sangat baik untuk meminta keterlibatan siswa. Seperti kita
menyarankan, siswa harus dilibatkan semaksimal mungkin dalam memilih tem apa
yang termasuk dalam portofolio mereka. Dengan demikian, mereka harus terlibat
dalam menjaga portofolio dan mengevaluasi kualitas produk dalam kandungannya.
Kelebihan
dari penilaian portofolio
•
Portofolio sangat baik mencerminkan
prestasi siswa dan pertumbuhan dari waktu ke waktu. Mungkin kekuatan terbesar
dari portofolio adalah bahwa mereka lebih baik dalam menggambarkan kemajuan
siswa selama jangka waktu tertentu.
•
Portofolio dapat membantu memotivasi
siswa dan membuat mereka lebih terlibat dalam proses pembelajaran. Karena siswa
biasanya membantu memilih item untuk dan mempertahankan portofolio,
mengevaluasi kemajuan mereka saat mereka melakukannya, mereka mungkin lebih
termotivasi untuk terlibat aktif dalam proses pembelajaran dan penilaian.
•
Portofolio dapat meningkatkan kemampuan
siswa untuk mengevaluasi kinerja mereka sendiri dan produk. Karena siswa
biasanya diminta untuk mengevaluasi kemajuan mereka sendiri, diharapkan bahwa
mereka akan menunjukkan peningkatan self-assessment keterampilan.
Ketika
digunakan dengan benar portofolio dapat memperkuat hubungan antara instruksi
dan penilaian. Karena portofolio sering menggabungkan produk terkait erat
dengan instruksi kelas, mereka dapat membantu memperkuat hubungan antara
instruksi dan penilaian.
•
Portofolio dapat meningkatkan komunikasi
guru dengan siswa maupun orang tua. Menyediakan secara rutin siswa-guru
konferensi untuk meninjau isi portofolio dengan cara yang sangat baik untuk
meningkatkan komunikasi.
Kelemahan
dari penilaian portofolio
•
Portofolio Scoring dengan cara yang
handal sulit dilakukan. Scoring portofolio yang andal adalah tugas yang sangat
menantang. Selain kesalahan diperkenalkan oleh penilaian subjektif dari penilai
dan sulit menetapkan kriteria scoring yang spesifik, standarisasi memadai isi
portofolio sering mengakibatkan komparatif terbatas di seluruh siswa.
•
Melakukan penilaian portofolio yang benar
adalah proses yang memakan waktu dan menjadi beban. Pendidik sebagian besar
setuju bahwa untuk portofolio yang efektif perlu teknik penilaian yang berkomitmen untuk
proses dan bersedia untuk menginvestasikan waktu dan energi yang diperlukan
untuk membuat mereka bekerja.
Singkatnya, portofolio
memiliki kekuatan dan kelemahan yang signifikan. Di sisi positif yang mereka
berikan pada keadaan dasar dalam kerangka kerja untuk memeriksa kemajuan siswa,
mendorong partisipasi siswa dalam proses penilaian, meningkatkan komunikasi,
dan memperkuat hubungan antara instruksi dan penilaian. Jelas, ini adalah fitur
terpuji. Pada sisi bawah mereka menuntut waktu dan energi dan memiliki
keandalan yang dipertanyakan. Pertimbangkan komentar dari Hopkins (1998):
Penggunaan
portofolio memiliki potensi besar untuk memperkaya penilaian pendidikan dan
mahasiswa tetapi tidak harus dilihat sebagai alternatif untuk tes tradisional
dan ujian. Siswa masih perlu untuk menunjukkan kemahiran pada tugas-tugas
seragam dirancang untuk menjadi sampel yang representatif dari tujuan suatu
program studi. Salah Satu mungkin memiliki tugas yang indah dalam portofolio
ilmu (koleksi batu, daun, serangga, percobaan) tetapi memiliki kesenjangan yang
besar dalam pemahaman tentang hukum utama fisika, genetika, dan sebagainya.
(Hal. 311)
Komentar
Posting Komentar