无论是在课堂设置,大学入学要求,还是以驾驶执照获得简单的东西,今天很少有人在今天的社会中可以避免考试的必要性。这些测试中收到的分数说了关于我们所知道的事情。我们的知识水平可以通过测试来测量,可以提供与其他个体的比较,作为相对标准或绝对或预定标准。当个人对验收的性能与预定或绝对标准进行比较时,它被称为标准参考测试。
虽然采取测试的概念没有改变,但我们开发和解释测试的方式在过去的40到50年里发生了大幅变化。其中一个剧烈的变化开始在20世纪60年代初塑造,当时一个名叫罗伯特Glaser创造了这句话的绅士标准-参考测量并撰写了常规参考和标准参考测量之间的区别。直到那个时间,使用与相对标准的考生比较考试的规范参考测试是惯常模型。自20世纪60年代初以来,当介绍标准参考测量时,与开发和使用标准引用的测试相关的程序已被精制到良好的实践中。
标准参考测试的目的是通过测试所代表的特定知识体系来衡量个人的技能或掌握程度。结果,在开发标准引用的测试时必须考虑某些设计特征。首先,我们必须考虑考试应涵盖的材料。由于我们希望能够从测试性能中进行掌握的推论,所涵盖标准参考测试中涵盖的主题需要通过准确且狭义地定义域的特定目标,教学目标或结果来决定。为审查编写的项目的格式和数量必须是我们正在确定掌握的内容区域的代表性采样。在标准参考测试开发中的最终作品涉及设置性能标准或截止分数。有许多描述性的短语与分类考生的标准引用的测试结果相关联。示例包括,通过/失败,掌握/非尺寸,认证/未经认证,许可/不获得许可,熟练/不熟练。绩效标准或截止分数的设定允许我们以究竟考虑为个人测试者做出的决定。
当我们希望从测试表现中推断出一个人可以做的事情时,标准参考测试很有用。标准引用的测试的成功并不意味着完美的知识;相反,它意味着个人已经达到了既定的绩效标准。此时,考生已经证明了被认为是掌握,熟练或认证所需的技能和能力水平。
标准参考测试的日常例子比比皆是。在小学年期间,有测试可以确定一些简单的东西,因为学生是否可以告诉时间或者是否知道他们是否知道乘法表等基础数学概念。几年后,大多数人都采取标准参考的考验,以获得驾驶执照,表明他们拥有可接受的技能,可以在道路上安全地操作车辆。进入劳动力后,我们社会的许多成员都需要通过标准引用的测试,以便进入他们所选的专业,例如医生证明它们能够适当地照顾和治疗患者。
生命的几个阶段是免于以一种形式的标准引用的测试。由于通常对测试的需求增加,并且标准参考测试的巨大实用性,其在测量竞技场的位置是保证的。
参考:
- 伯克,A。(ed。)。(1984)。标准参考测试构建指南。巴尔的摩:约翰霍金斯大学出版社。邦德,L. A.(1996)。规范和标准参考测试。
- 华盛顿特区:评估和EV的Eric Clearinghouse(ERIC文件再生业编号ED410316)。从http://www.ericdigests.org/1998-1/norm.htm中检索
- Ebel,L.(1979)。教育测量要点(第3辑。)。Englewood Cliffs,NJ:Prentice-Hall。
- Linn,L.(ed。)。(1989)。教育测量(第3辑。)。纽约:美国教育委员会 - Macmillan。
- Lyman,B。(1998)。测试得分和他们的意思(第6届)。Centrham Heights,Ma:Allyn&Bacon。
- Popham,W.(1978)。标准参考测量。Englewood Cliffs,NJ:Prentice-Hall。