也许你还记得,在第四章里我们已经指出,标准化考试是学校里很普遍的一种评价类型。我们都应该记得我们当年在教室里度过的日子:我们将削好的2B铅笔工整地摆放在桌面上,带着颤抖等待着老师阅读完考试指令并下令“打开试题册、考试正式开始”。也许你还记得离现在更近的考试,如学校职能测试或美国大学入学考试等。在上述情况下你所经历的就是标准化考试。这种考试的结果将被用于帮助别人判定你对所学内容掌握的多少和好坏程度。他们是通过将你的分数与参加考试的其他学生的分数进行比较而做出如此判定的。
近些年来在美国的公立学校里标准化考试已变得越来越普遍。由于社会上呼吁,应该对学生的学习承担更多的责任、提供更严格的考试,从而促使许多州要求学生在不同阶段都得通过标准化考试。据估计,在美国,每年有各种各样的学生标准化考试大约127,000,000次。每年将近9亿美元被用于研究、管理和评阅这些考试(Wilis,1990)。由于教师们总是会面临如何管理、转换和处理这些标准化考试的结果,我们现在就把我们的注意力转到这种评价方式上来。我们将检验标准化考试的全过程,并将讨论这种标准化考试的分数是如何评判出来,又有何用处。
标准化考试过程
人们之所以称之为标准化考试是因为标准化考试的监考、评分方法的一贯性和统一性。虽然这种考试的举行地点、时间可能不一样,但任何一名国家标准化考试的考生与其他参加该考试的学生的考试条件总是大体一致的。这种一致性包括所能控制的、可能影响学生考试成绩的因素;所用的材料、时间限制、口头指令、初步演示、学生提问的原则、以及其他被认为可能影响考分的细节问题(Anastasi,1988)。
例如,当你参加SAT或者ACT考试时,你完成该考试的条件总是与其他所有参加该考试的同学完成该考试的条件一样的。给你们的考试指令相同,试卷和答题纸是一样的,你们所要回答的问题处于同一难度水平和类型,你们所允许使用的答题工具是一样的(铅笔、计算器等等),完成每部分考试所允许的时间总量是一样的,而且,你们的分数也是按同样的方法进行评判的。正因如此,你就能够将你的考试成绩与其他参加该考试的学生的考试成绩进行比较,即使它们的参考时间和地点与你都不一样。能够将数量众多的学生的成绩进行比较是标准化考试最大的优点。
除了能将许多学生的成绩进行比较外,标准化考试还有其他几个优点。他们不仅能有效地检测出数量众多的学生的学习情况,而且相对比较快捷、费用较低。它们的评分公平而客观。它们比教师自行设计的考试更具信度、秩序性。虽然标准化考试有如此多的优点,但它们仍然经常遭到来自各方面的批评,说它们过于强调低水平的基本技能,带有文化、种族、性别歧视等(例如,Linn,1991;Wiggins,1989)。通常,当标准化考试被滥用,或者其结果被错误解释时,人们对于标准化考试的非议就更加尖锐了。
每一种标准化考试总是被用于一定的学生群,而且,几乎只用于情况类似的学生。例如,有的标准化考试,如艾奥瓦州基本技能考试(ITBS),或加尼福利亚州能力考试(CAT),是用于在全美范围内对特定年级的学生的知识面进行检测。由于每一位参加ITBS考试的学生都是在同等条件下进行考试的,而且总是按照标准的方式进行评分的,就使得该考试可以对来自全国各地的学生的成绩进行比较。
作为一名教师,你可能监考标准化考试,并将学生的考分向学生机家长进行解释说明。在监考标准化考试的过程中,你必须准确按照所提供的指令行事,这一点非常重要。否则,将导致考试结果不够准确,从而可能给你的学生带来损失。在监考标准化考试时的一个主要职责就是给所有学生一个平等的发挥好自己水平的机会。因此,你必须确保每一个学生都已得到必须的考试材料、都有自己的座位、都享有同样的时间。此外,你必须用平稳、清晰的声音、相对较慢的语速,认真阅读考场指令,以便教室里的所有学生都能听见。如果你的语气、语调有所变化,或带着面部表情,都可能暗示出你对指令的强调。在学生考试过程中,你还必须对他们进行监视,确保学生们在大致同一时间开始和结束考试,并杜绝他们在考场上作弊。每一种标准化考试都会提供监考指令,你应该严格遵守这些指令。
即使你不知道所要考核的内容,你也能帮助你的学生如何在标准化的考试中获得更高的分数。通过帮助他们掌握一些考试技巧,你能使他们更好地将他们所知道的东西转达出来。懂得如何有效地完成标准化考试的学生可能更易于获得高分(Anastasi,1988)。虽然这种考试经验并不能改变你的学生所掌握的知识内容的多少,但它能让他们更好地展示出自己所学到的知识。这就是为什么你应该在标准化考试前夕为学生提供模拟考试的机会,以便让他们熟悉标准化考试的题型和考试条件。你可能还会建议学生应该在什么时候需要进行猜测性作答,以及如何安排他们的考试时间。这些指导能帮助学生在考场上避免不适感和增加自信——对于成绩较差的学生尤其有用,从而能大大提高他们的考试成绩(Anastasi,1981; Wahlstrom& Boersman, 1968)。
解释说明标准化考试结果
近些年来标准化考试的作用与日俱增,相应地,教师的一个职责——向学生及其家长传达考试结果的意义,也就越来越重要。虽然你们大多数人对于标准化考试的过程非常熟悉,却很少有人曾经不得不对别人解释说明一个标准化考试的结果。在这一章里,我们对报告标准化考试分数的各种方法进行讨论。了解了这一点,你便能用这种信息对你的学生的学习进步情况进行评价,并能提高你自身的教学水平。
效标参照分数与常模参照分数
为了对考试分数进行解释说明,你必须将某一个特定的分数与某一标准进行比较。在众多的标准中,被用得最多的两个标准是:(1)其他同学的分数;(2)一个确定的标准。如果你是将学生的分数与其他学生的分数进行比较,那么,你采用的方法就叫做常模参照方式。如果你采用这种方式,那么,一个学生考试中所答对或答错的题目数(被称为原始分数)就没那么重要,而更为重要的是,他的成绩与其他参考学生的成绩的对比度。常模参照的考试分数不能为我们提供充足的信息,以便让我们知道一个学生究竟已经掌握了哪些专门知识,而哪些方面还需要进行补习。常模参照的考试分数所能展示的就是,某一个学生的成绩与其他参加该考试的学生成绩的对比情况,这种对比也许是在同一个班里,也许是同一个学校,同一个区,同一个州甚或全国范围内。正因为将所有参考的学生进行对比是可行的,即使这些学生来自不同学校,身处国家的不同地方,所以,一些学校和地方机关常常根据常模参照的考试结果作出一些政策性决定。
如果你将学生的原始分数与一个确定的标准进行比较,那么,你采用的方法就叫作效标参照方式。在这种途径中,学生考试中答对或答错的题目数就直接被用以判定他是否已经掌握某些特定的知识。当一个学生的分数低于所确定的标准时,出题人就认为该学生没有充分掌握所检测的知识。效标参照考试的结果能提供很详细的信息,以便确定该学生是否已经掌握特定的知识,以及该学生在哪些方面还需要补习。因此,在评价、计划、或改变班级教育指导时,效标参照考试的结果要有用得多。然而,效标参照考试却几乎无法提供信息让你将你的学生的成绩与其他学生的成绩进行对比。表8-2对常模参照考试和效标参照考试做了一个比较。
表8-2 常模参照考试和效标参照考试
|
常模参照考试
|
效标参照考试
|
|
以其他参考学生的成绩为参照物对学生的成绩进行报告
|
以一个确定的标准为参照物对学生的成绩进行报告
|
|
对于学生总的学习情况提供信息
|
对于特定的知识的掌握情况提供信息
|
|
有益于国家、州和地方机关进行政策决定
|
有益于为学生个体制定最合适的教育方法
|
标准分数的类型
标准化考试的结果通常是采用常模参照分数进行计分的。请一定记住这些常模参照分数主要表示出一个学生与其他参考学生的相对成绩。而这种相对比较的范围,可称为常模组,可能是只局限于一个班级、一个学校、或者一个区,也可能扩大到一个州,甚至全国范围内。为了能对标准分数进行准确的解释说明,你必须意识到这种相对性,意识到这个常模组的存在。然后,你只能以这个常模组中的其他成员为参照,对你的学生的成绩进行讨论。你还必须指导这些标准化考试的分数意味着什么。
标准化考试通常以5种记分方式中的一种或多种进行记分,这五种计分方式为:Z分数记分法、T分数、百分距记分法、标准九分记分法和分数群积分法。虽然每一种类型的记分法的描述及其计算法都已经有人论及(参见Arasian, 1991; Aanstasi, 1988)。然而,我们仍将对每一种类型进行概括性介绍。
所有的标准化分数都属常模参照分数,因为它们表示了一个学生与其他参加该考试的学生的相对成绩。具体地说,标准化分数表示出了一个原始分数与常模的评价分数的对比度。例如,这个分数能表示出一个学生比参加该考试的中等水平学生考得更好或更差。一个标准分数表示出一个个体分数是高于或低于平均分,以及高出或低于平均分多少。重要的是,由于每一类型的标准分都是相对于平均分而言的,因此,各种类型之间的标准分数可以进行比较。例如,Z分数记分法中的+1分相当于T分数中的60分、百分比记分法中的84分和标准九分记分法中的7分。
标准分数是以正态曲线(参见图8-1)中的几个已知特点为依据的。这个钟壮图描绘出了对各个个体分数的期望频率。曲线的最高点,位于中点,表示大部分学生的分数被期望接近于平均分数。如果你将视线由中间的平均分数点向两端移动,你会发现,越来越少的人被期望获得很高或者很低的分数。
一组分数的标准差正好反映出这些分数相对于平均分的变化幅度。如果标准差小,就说明这些分数间的差距不大,都比较接近平均分。如果标准差大,就说明这些分数间的变化幅度较大,或者说有较多过高或者过低的分数。
在对学生们的分数进行比较时,标准分数不仅要考虑到平均分,还需要考虑到标准差。正如前面已经指出,所有的标准分数都能表示出一个个体分数与其常模中平均分的对比度。它们表示出:(1)该分数是高于或者低于平均分;(2)比平均分高出或低出多少,这就与标准差有关了。为了使得我们的报告更加统一,我们将每一种类型的标准分数的特点和刻度都标在其正态曲线上,并将一些个体分数标在正态曲线的刻度上。这与测量距离没什么两样。如果你想测量一个书架的长度,不管你采用英尺、厘米尺、手臂长度,还是采用别的尺度,书架的长度总是保持不变的。尽管这样做显得有些复杂,但当我们如此对一些普通的标准分数进行分析时,问题会变得更加清晰明了。
Z分数(Z Score)是标准分数中最基本的类型。在Z分数记分刻度上,平均分为0分,每一个标准差为一个单位(参加图8-1)。正的分数表示高于平均分;负的分数表示低于平均分。数字越大,说明这个原始分数离平均分的距离越大。因此,如果一个学生所得的原始分数等于平均分,他的Z分数就为0.00。如果他所得的分数高于平均分一个标准差,该学生的Z分数就为1.00。依据这个尺度,如果一个Z分数为-2.00,就表示一个低于平均分两个标准差的原始分数。由此我们已经发现,我们并不知道这个学生所得的原始分数,只知道他的分数与常模组中其他学生分数的对比度。还应指出的是,Z分数记分法一般精确到小数点后两位。一个Z分数为-1.50表示一个低于平均分一个半标准差的分数。
T分数(T Score)所标记的刻度将50作为其正态曲线的中间点(即平均值),每一个标准差代表10分(参加图8-1)。如果一个学生的原始分数等于平均分,他所得到的T分数就为50分。如果一个分数高出平均分一个标准差,就为60分,高出两个标准差即为70分,依此类推。这种记分法的优点在于没有负分和带小数点的分数。即使是低于平均分的分数也用正数表示。例如一个低于平均分一个半标准差的分数(用Z分数表示为-1.50),而用T分数表示则为35分(50减去15)。
另外一种常见的标准分记分法为百分距分数记分法(percentile rank)。当你获得ACT或SAT考试成绩时,你的分数好像就是用百分距记分法进行记分的。百分距记分法的正态曲线也有一些已知的、稳定的特点。一个按照百分距记分法所得的分数能表示出百分之几的参考人数所得的分数高于或低于某一分数。在该正态曲线中,高出和低于平均分的分数正好各占一半。因此,一个按照百分距记分法所得的50分表示该学生的原始分数为平均分,他的分数高于等于常模组中的50%的分数。一个PR的70分表示该学生的成绩好于等于常模组中的70%。百分距记分法中高于50分者表示其原始分数高于平均分,反之亦然。虽然一些百分距记分法中的分数看起来与T分数很相似,因为两者的中间分数也不能显示一个学生究竟答对了多少道题。它们仅仅表示该学生相对于其他参加该考试的学生而言对考试的完成情况。
标准九分制记分法(Stanine scores)是一种教育界普遍使用的标准化考试的记分法。标准九分制记分法得名于其正态曲线中的刻度值。在其正态曲线刻度上,5为中间点,即平均值,每一个标准差为2。该刻度上的最高分值为9,因此,该刻度就被称为标准九分刻度。标准九分制分数与T分数一样,不存在负分和带小数的分数。标准九分制分数被认为是较典型的易于解释说明的分数,因为它们不知Z分数或T分数精确。采用这种记分法,5分即表示该原始分数等于平均分。标准九分制中9分表示一个原始分数高出平均分两个标准差。一个低于平均分一个标准差的原始分数对应的标准九分制分数为3分。
年级同等水平(Grade Equivalent, GE)记分法因易于解释说明而在教育界被广泛采用。年级同等水平记分法用于对参加同一考试的不同年级水平的学生成绩进行比较。例如,如果一个学生的原始分数相当于参加该考试的七年级学生所得的分数,那么,该学生的年级同等水平分数即为7分。小数点后的数字用于表示该学年的各个月份,1表示该学年的第一个月,10代表夏季。因此,如果一个学生获得的年级同等水平分数为7.6分,就意味着该学生获得了一个七年级学生在该学年的第六个月(大约在二月份)能够获得的分数。年级同等水平分数记分法是被用于对大量不同年级水平的学生进行测试,并用于为学生的每一学年的每个月测算评价分数。
值得指出的是,使用该方法记分的前提是,不同年级水平的学生都参加同一考试。如果该考试是对五年级学生进行测试的,那么,该常模体中的所有学生都参加这个五年级水平考试,而不会有更高或更低水平的考试。在这个例子中,如果一个五年级的学生获得了一个9.1分的GE分数,就说明他的分数大体相当于处于九年级第一学期的学生所获得的分数。这个分数只能说明这个五年级的学生将五年级的教学内容掌握到了一个九年级学生所掌握到的程度。它并不意味着这个五年级学生能够完成九年级的作业。
请记住,没有哪一个考试能够完全准确地检测出学生的知识和能力。某些偏差乃至错误是在所难免的。正因如此,当今许多考试中心不再只依据一次考分而对学生的成绩进行判定,而是依据该学生参加统一考试所获得的多次分数,当然,其前提是如果他或她多次参加同一考试。而只有从由该学生的多次分数组成的分数群中才能真正找到反映出学生的真实水平的分数,而这个分数通常是在分数群里居中的那个分数。而且,这个分数群还能表示出学生每次分数与该真实分数的差距大小。虽然分数群不及其他分数类型那样确切,但它仍是利用标准化考试结果的一种有效方式。分数群能够杜绝我们试图对那些考试差距并不大的学生进行过于细微的区分。
对标准化考试的总结
通常教师们都得面临对标准化考试进行监考、阅卷并向学生及其家长解释说明考试结果,并利用考试结果进行分析以便改善教学。重要的是,你对这些考试的作用应该报以恰如其分的认识,而不能滥用它们。尤其是刚刚入道的教师们,常常容易以一种过于机械的方式向学生家长通报和解释标准化考试的结果。你必须明确标准化考试的分数能说明什么和不能说明什么,而你要能够恰如其分地将这些信息反馈给学生家长。
