当我们考虑对学习进行评价时,大多数人想到的都是考试多重选择测试、学期论文测试、口试,或许还有操作测验。目前还有人对其他的评价方式感兴趣。本章我将从传统的考试方式开始,再述及其他评价学生学习的方法。
先说说以下九种结论性言论:
1.学生学什么既取决于你的教学,同样也取决于你的考试和评定方式。
2.别把考试简单地看作一种划分评分等级的手段。考试对你和你的学生而言都有促进学习的作用。
3.采用某些可为你和你的学生提供反馈的、不划分等级的考试及评定。
4.根据你的教学目标检查你的评定方式。你真正确定什么是你希望实现吗?例如,较高层次的思维能力。
5.有些目标(价值观念,动机,态度,某些技能)用传统考试是无法测量的,要从其发展状态寻找评价依据。
6.评定不是考试的同义词。你可以根据课内外活动的情况评定学生的学习。
7.课程结束后,学生就不能再依靠你来评定他们的学习质量了。如果我们目标之一是继续学习,那就需要让学生学会做自我评定。
8.不要仅凭一两次考试就确定评分等级。各种不同的评定方式会为你确定合适的评分等级提供更好的依据。
9.总之,评定并不单单是课程结束时为确定学生评分等级而进行的活动。对学生而言,各种评定可以成为他们的学习经历。贯穿于一门课程的评定将你的教学目标传达给学生,因此他们可以更有效地学习;它能发现学生学习中存在的种种错误理解,从而帮助你改进教学;它能助你调整一门课程的教学进度;并且,毫无疑问,它还能助你把划分评分等级的工作做得更好。
由于许多课程的评分等级在很大程度上是由考试分数决定的,对学生来说,考试已成为课程中最令他们产生挫折感的因素之一,并引发了大量公开的或隐蔽的敌对行为。一旦教师试图超越通常只要求记住课本和讲课中提到的知识的做法进行考试,他们马上就会被学生的抱怨所淹没:“这是我遇到的最令人难以理解的考试!”
减少学生的受挫感与寻衅行为
对大多数新教师来说,考试后学生针对他们产生的种种寻衅行为都令他们极为不安。这种情绪有可能损害教师与班级的融洽关系,并可能成为学生学习的真正障碍。因此,设法减少这类寻衅行为的各种办法看来都值得一试。
要解决这个问题,最明显无疑的办法是减少与参加考试直接有关的受挫感。在这方面有一种辅助手段是强调课程本身对学生长远目标的实现可能起到的促进作用,因而在这样的情形中对一个好分数的需求并不是唯一的需求。
考试前向学生说明你如何进行考试和为什么要进行考试会有帮助作用。可通过不打分的练习考试为学生提供指点。采用定期的学习评定(不一定要打分)帮助学生评价他们自己的进步情况,同时帮助你发现存在的问题,加上经常性的有关你为什么要测试评定学习和如何来测试评定学习的说明,应该能够减少学生对考试的忧虑和受挫感。
然而,无论你如何强调长远目标,考试仍将在相当大的程度上决定着学生做什么。你希望学生记住细节吗?那么就对他们进行常见的细节记忆考试吧。
但如果你希望实现更多的目标,那就要把你的目标都交代清楚,并确信你所采用的考试能够衡量这些目标的实现与否。如果你像第2章“备课倒计时”中所建议的那样,采用布卢姆教育目标分类或比格斯观察所得的学习结果构成分类,那就要在每次考试之前提醒学生注意这些分类层次。麦克奈特、哈维、阿萨纳休以及阿拉德(McNett, Havey, Athanassion, and Allard, 2000)利用布卢姆分类来组织他们的全部课程教学。他们在开课之初就讨论布卢姆分类中有关各种思维层次的描述,并在布置和评价研究论文及其他作业时再次提及。
设计考试与评定的方法
学习评定的第一步,是列出你的教学目标。一旦你对各项目标作了具体说明,你就能够确定哪一种评定方式适合哪一种目标了。你可能会吃惊地发现在特定的分类中你的考试项目堆积起来会有那么多。教师设计的考试的一个主要错误就是对最容易衡量的事物提问。
保持平衡的一个方法是建立一个坐标方格,沿侧面列出各项目标,沿上端列出内容范围。然后如果你在写入各条目时使两方面相符,就能将你的考试调节到能适当安排期望目标与内容的程度。
由于有些课程考试强调回忆事实,许多学生就要求教学强调熟记事实的东西。一个学生写了张纸条评价我:“这位老师非常有趣也非常好,但我对他的教学评价不高,因为他没有给我们足够的事实。今后我会得到什么样的工作取决于我的评分等级,除非我每节课都能记两三页笔记,否则我就没什么机会通过得A来打败其他学生。”
学生起初会对要求他们思考的考试反感,但是如果你强调这种考试能够衡量他们运用自身知识的能力,那你就能对他们的学习目的产生极大的影响。我们收到的一份学生评论也指出了这一点:“本课应该更多地进行这样的考试。它促使我们应用我们已学到的知识。”马顿与索尔约(1976b)表明对理解力有要求而不是记忆详细事实的考题导致形成了不同的为今后考试和提高记忆力服务的学习方式。福斯和费希尔(Foos and Fisher,1988)证实需要推论的考试对学习的帮助大于需要记忆知识的考试。
无可否认,设计比较复杂、较高层次目标的衡量标准更为困难。但是,我相信,我们所作的每一份努力都将对学生的动机与学习产生影响。而且,对这些目标的考虑,也会对你突破传统的考试形式有所帮助。例如,在我执教的心理学入门课上,期望目标包括增强对行为的好奇心,认识各种通常可能被忽视的行为特征,以及提高对行为进行客观描述和分析的能力。为了实现期望目标,我有时以放电影或录像带作为激发学生兴趣的手段,并设计了与学生对所观看电影的反应有关的考试题;或者要求学生离开教室15分钟,然后回来报告他们观察到的一些有趣的行为。我曾将各种科学杂志带进课堂,要求学生在其中找出一篇他们感兴趣的文章并写下他们对该文章的看法。我还要求学生分析报纸上登载的新闻,以培养他们进行批判性阅读的能力。考试中采用多少与教学目标而不是与典型试题联系更为明显的材料,对于参加考试的学生来说更令人兴奋——评起分来也更有意思。
考试的时间安排
考试对于教学目标的实施和学生学习方式的影响极其重要。因此,我在由14个教学周组成的学期中,第一周对学生进行的是不记成绩的测验,第三周或第四周过后才进行一次记成绩的考试。为了减少考试对学生的压力,我在学期末确定学生的最终成绩时很少考虑学期初那部分考试的成绩。但初期的考试非常重要,它促使学生开始学习,使他们毫不耽误地一直学到常规的期中考试;它还能帮助你及早发现问题,而此时发现的问题都还是可以纠正的。因此学期初进行的考试必然要求你对你所期望和需要的学习方式进行精心构造。即便如此,初期考试的目的仍更具激发动机和诊断意义而非评价意义。
通常我也对学生实行期中考试和期末考试。其实各类考试的分量和次数是要看你所教学生的背景情况而定的。正如“个性化教学方式”(Keller,1968)所证明的那样,在对于学生而言是新领域的一年级课程中,开学初期经常进行一些小测验对学习是有促进作用的。总之,无论如何我都希望使学生摆脱为考试而学习的状态,这样他们才能成为有评价自身学习能力的终身学习者。这意味着当学习者逐渐成熟老练时,就应减少经常性测验。这或许还意味着随着学习者的进步,试题也应对更强的综合能力和更细致的分析提出要求。出于这个原因,我对学生实施的考试都是累积性的。这就是说,所有的考试都既包括上一次考试过后所学的内容,也包括以前考过的内容。要给学生机会,以使他们能够就进行考试或其他评定的日期提出自己的看法,因为他们了解存在什么可能影响正式考期的潜在的冲突事项。
考试的组织
在设计考试时,你可能会采用混合型试题,以平衡对不同的教育目标的测量。本节以下部分将描述各种类型的试题的优点与不足之处,同时就考题的编排提出忠告。
选择试题类型
将要出题考试的教师往往处于一种相互冲突的情形之中。实施考试涉及两道颇费时间的程序:第一,组织考试;第二,评定成绩。遗憾的是,事实普遍说明最容易组织的考试往往最难以评定成绩,反之亦然。
教师们经常只根据教学班级的规模来选择考试的类型,大班采用多项选择考试,中等规模的班级采用简答题考试,小班则采用短论文考试。班级规模显然是一个重要因素,但你的教育目标应该更加重要。这样考试就几乎始终必然包括某些短论文题、难题或者其他有分析、综合或应用要求的题目。
习 题 在数学、科学以及其他某些学科中,考试通常都由习题组成。习题的价值取决于它们能在何种程度上使学生得以施展你在教学目标中所规定的种种解决问题的技能。有些习题过于陈腐老套,在表明学生是否理解解题步骤方面已无多大价值;另一些习题则答案的得出在极大程度上有赖于单调乏味的计算,结果只有很小一部分能用于考试。在后一种情况下你可以提供导向特定阶段的计算结果,要求学生完成解题;或者采用有关正确的解题过程的多项选择题,例如:“下列问题中哪个可以用过程X加以解决?”如今许多教师在考试中采用的是那些可有不止一种解法的习题或有一个以上正确答案的习题。
简答题 这儿有个简答题的例子:“举例说明你自身对‘精致’这一概念的体验。”答题时,学生可以向另一个学生解释概念的方式或以思考一种事实与一般原理之间关系的方式,来描述自己的体验。
这类考题也有局限性,往往不难猜测如何回答才是教师所期望的。而且,这类考题可以一种固定的样式呈现在学生面前,只给答题留出很小的空间。学生雇“线人”打探考试的势头因此受到抑制。简答题允许复述指定的材料内容而不要求详细作答。令人遗憾的是,许多简答题考试考的仅仅是对具体事实的回忆。
简答题可以编得更好,而不仅仅是考查事实。例如,如果你想要提高学生分析或判断方面的技能,可提供实例材料或对某个实验的描述,问问学生他们会提出什么样的问题,然后可为学生提供他们能用于分析的附加资料。简答题也可要求学生解答一道习题,或者提出一个与先前学过的知识有关的假设。下面就是一个例子,该考题取自老化心理学课程:
1.考虑到男女经历中年期的方式有所不同,同时考虑到抑郁症作为一种精神病症状在中年期多发的事实,是否可能中年男女患抑郁症的原因也各有不同?
短论文题 虽然在某些情况下简答题考试非常有用,我仍要建议大家,可能的话,在大多数高校课程的考试中至少设置一道短论文题。实验表明,采用短论文题考试时学生的学习效率高于采用客观题考试时。因此,短论文考试除了具有可用作评价手段的价值之外,你还应该考虑其潜在的教育价值,如激发学生对各种概念联系、应用可能或思维状况的思考。一种策略是在考试的前一周向学生分发一些考试题,并告诉学生这些试题的类型就是你将在考试中用到的题型;而事实上你可能确实会用到其中的一种。
由于带评语的短论文考试试卷可发还学生,这种考试就为学生有条理、创造性地思考一个主题提供了练习的机会,同时也为他们根据所学领域内某个经验较为丰富、能力较强者的标准检查自己的思想提供了机会。约翰逊(Johnson,1957)曾证实,当学期初有关考试的卷面评价强调创造性时,期终考试中学生的创造性就提高了。
最后,如果你本人批阅试卷(或至少批阅其中一部分),你就可以从中获得有关学生学习情况的绝好信息。虽然教师也能从学生对客观题考试的反应中获取信息,但在批阅主题论文考试卷的过程中,学生的学习情况对教师的冲击看来更大一些,也更强烈一些。
是非题 尽管是非题考试出题容易,一般情况下我仍不提倡采用这种类型的考试。托彼诺和布劳钦指出,学生考试后往往会把错误的考题记成正确的——这可对你实现你的教学目标毫无益处。如果你一定要采用这类考试,那么就让学生对他们的选择作出解释。这样做能够鼓励学生思考,并帮助你搞清考试中出现某些常见误解的原因所在。
多项选择题与配对题 未必多数教师能够凭借纯粹由多项选择题构成的考试来恰当地检查他们设定的所有教学目标。学生必须区分正确答案与其他答案,在这方面,配对题类似于多项选择题。不过,从某种意义上说,多项选择题仍是非常有用的。这类试题既可用以考查简单知识,也可用以考查精确的辨别能力;既可以衡量运用各种概念或原理的能力,也可以评价解决问题的素质如何。不过,这类试题是不可能用以评价观念结构、概念联系或许多高级思维技能的。
要把多项选择题编好是很难的。(事实上你这种试卷编得越多,就越能了解要编一道恰当合理、准确和内涵丰富的试题得耗费多长时间。)由于存在这样的难处,除非有数百名学生一年或连续数年用这种试卷,否则就不值得编。下表是有关如何编制这类试题的提示。
