许多心理学家使用标签如成就测验、能力倾向测验,和能力测试不严密地和nonpsychologists作为同义词使用它们。缺乏精度是可以理解的,因为在实际实践中,测试轴承这些标签通常似乎非常相似,用于类似用途。这个条目解释理论成果之间的区别,资质,能力测试;描述了这些测试的主要用途;并提供简要概述分量表广泛用于这些测试的类型和构造措施。
理论测试的区别
成就测试是用来评估的程度的人开发了一种特定运动技能或学到的具体知识。通常情况下,一个成就测试一段时间后给予的指令旨在教电动机或认知技能。典型的成就测验是周期性的课堂考试管理决定学生学到了多少。其他的例子包括书面和驾驶考试获得驾照,学术评估测试(SAT)和美国大学入学测试(ACT)的高中学生考虑学院和研究生记录考试(GRE)由大学生想去研究生院。
理论上,成就测验的目的是容易让衡量在多大程度上一个考生掌握运动技能或知识的领域。然而在实践中,成就测试结果通常解释为未来表现的指标。例如,虽然SAT和GRE等成就测验评估考生的知识应计的教育经历,那些考试成绩是用来预测成功的可能性在更高级的和具有挑战性的项目。这个惯例con-founds(即性能评估。成就测验的,描述性的)函数预测能力倾向测试的目标。
许多成就和能力倾向测试外貌很相似,但能力倾向测试的主要目的是预测。他们是为了获取信息,可用于预测人的未来行为的某些方面。能力倾向测试评估考生的学习能力的认知和运动技能。通常,基础广泛的测试得分的言语理解是用来预测考生学习的潜力和使用新的认知技能。事实上,最常见的使用能力倾向测试是在一个教育计划或预测未来表现职业设置。然而,一些能力倾向测试测量运动技能(例如,手眼协调能力或运行的时间总是)。这样的能力倾向测试得分是用来预测考生的学习能力(使用)的运动技能。
资质和能力测试的区别是微妙的,和许多心理学家和出版商使用名词。不过,总体而言,能力测试评估认知和运动技能,已经获得了很长一段时间,并非归因于任何特定程序的指令。例如,如韦氏智力测验
成人智力Scale-Third版(WAIS-III)和斯坦福-比奈智力量表,第五版(SB5)衡量言语理解、工作记忆、知觉组织和处理速度。这些能力不是任何特定程序的指令的结果。相反,他们被认为是人的母语能力的函数,从生活经验中学习。能力测试是描述性的,他们评估人们的知识和技能,但他们也预测,因为他们测量品质被认为影响人的学习新技能、解决新问题的能力。
总之,心理学家区分成就,资质,在理论水平能力测试。成就测试描述人们的现状,能力倾向测试预测他们未来的行为,和能力测试评估他们与生俱来的潜力。能力,然而在实践中,成就和能力测试往往在形式上类似于用于类似用途。
常见的测试之间的差异
心理学家创造了这样一个各种各样的测试,即使是开发一个系统分类是具有挑战性的。大多数测试的认知能力(如Kendrick认知测试为老年人和皮博迪个人成就测试),但许多测试还测量运动技能(例如,奥康纳的手指灵巧测试和使用一般能力倾向测验电池[GATB])。大多数测试需要使用语言和阅读能力(例如,多维能力电池(MAB)和微分能力倾向测验(DAT)),但一些使用非语言手段,测量资质(如非言语智力测试,第二版和皮博迪图片词汇测试)。此外,测试能力测量数量的不同,他们的标准化,管理的方式。
的资质
一些测试衡量一个资质(如电气和电子产品测试和人员评估选择系统)但很多测量多个资质(例如,军事职业资质电池(ASVAB)和球能力电池(BAB))。这两种方法各有优势。
Multi-aptitude电池获得信息广泛的认知和运动技能,让考生比较的相对优势和劣势。这些工具是有用的在个人或组织寻求信息指导职业教育决策。尽管许多multi-aptitude和multi-ability测试电池存在,所有通常衡量一组相对标准的结构。
更专门的仪器测量单个构造非常有用当更有针对性的预测是可取的。获取的信息结构,比如创意和艺术潜力常常需要使用专门的工具用于特定目的。此外,一个资质仪器旨在衡量阅读、数学、空间、或机械技能可能比multi-aptitude电池更精确地测量这些技能。
标准化
标准化考试是那些被管理一群人(称为常模组)获得的信息每个可能的考试成绩的可能性。比较分数的考生的分数获得由人民组成规范组允许心理学家解释分数。标准化考试成绩通常报告的标准分数,年龄相同的分数,或年级相当于分数。
至关重要的是,规范集团用来解释一个考生的分数比较提供了一个有意义的依据。例如,它会误导来解释一个高中学生的成就测验分数使用规范中学生组成的集团。尽管问题确定在这个例子中是显而易见的,更微妙的问题最近才开始被避免。例如,比较分数上的女性获得测试获得的分数常模组由专门的男性在许多情况下产生一个可疑的解释。然而,这种做法是很多年前不太标准。
出于这个原因,许多测试有多个标准组。测试与小学生使用,例如,可能有一个规范集团组成的一年级学生,第二个标准组组成的二年级学生,等规范集团由六年级。此外,单独的规范组男孩和女孩可能是用于每个年级水平。额外的规范组织类型的例子可以开发一个测试包括女大学毕业生,成功的木匠,非洲裔美国律师和招募男性。
准确规范的解释一个测试是不可能没有相关的规范,但规范集团的发展是昂贵和耗时。这就产生了两个问题。首先,许多测试只有一个或几个标准组。这种做法迫使用户最相关规范的基础上建立解释组而不是直接相关规范组。有时相关规范组相匹配的性别、文化背景,或民族遗产的考生不可用,所以用户被迫作出最好的解释可能在这种情况下。第二,获得标准组的费用也意味着一些出版规范组织没有电流。每个群考生出生在一个世界,从前面的队列在重要的方面有所不同。规范的解释测试结果的准确性和有效性下降作为规范群体变得越来越过时了。
虽然几乎所有的资质和能力测试标准,列举了典型的课堂成就测验。一般来说,大量列举了测试报告的项目正确回答和解释的百分比的预先确定的标准(例如,> 90%,B = 89% - -80%;> 70% =通过和< 69% =失败)。测试解释通过比较考生的表现到一个预先确定的标准,而不是一个规范集团被称为标准参照。两个标准参照测试的优点是获得的分数等测试本身是有意义的,没有人工约束是对考生的数量可以执行在一个给定的水平。
测试管理
最有成就、资质和能力测试可以管理一个人或一群人。从历史上看,选择管理测试一组是必不可少的测试如坐,所采取的行动,和GRE考试每年成千上万的人。然而,在某些情况下可以从行为观察获得的信息由心理学家同时管理单个的测试是相当重要的。尽管更昂贵和耗时的,选择一个个性化的管理测试是很重要的。这个选项时更可能是理想的管理一个测试对儿童,青少年,和个人学习障碍或其他问题,会干扰他们的性能测试。一些测试,特别是智力测试旨在衡量认知能力,设计专门为个人管理。
在过去的十年中,出现了额外的测试管理选项:计算机管理测试。计算机管理结合的优势经济政府大量的个人的可能性,一些测试期间的管理行为观察。例如,响应时间(即。的时间,需要考生回答这个问题)可以被记录在计算机管理测试。此外,基于项目反应理论可以定制测试考生的能力水平。
计算机管理是现在一些测试的主要选择。例如,GRE是由计算机考生在美国,加拿大和世界上许多其他领域,除非特殊的纸质管理安排。这种趋势可能会加速,使用最广泛的标准化考试可能会提供一个选项在十年内为计算机管理。
技能的测量
数以百计的天平已经开发测量各种方面的成就,资质和能力。许多测试关注具体内容空间等领域,数学,语言和运动技能。许多测试,衡量一个认知或运动技能提供另一个(在某些情况下更精确)测量技术测量的multi-aptitude电池和智力测试。尽管这个神奇的多种选择,大多数主要的测试评估相同的技能选择集。虽然技巧的特定名称不同测试测试和微妙的差异同样命名测试,结构测量的各种测试非常相似。
以下部分描述的一些最常见的测量认知和运动技能和一些综合得分相结合获得这些技能的信息。
认知能力
语言能力:能够理解词语的意思,句子,段落和有效地使用它们。措施的技能评估考生理解思想表达的文字,显然他或她如何原因。一些测试包括独立分量表来测量组件的语言知识。例如,ASVAB包括词汇知识测试和段落的理解。WAIS-III,马伯,SB5包含词汇测试。SB5还包括测试语言关系。DAT包含以下测试:语言推理和语言用法:拼写和语法。
数值计算能力用数字表示:能理解的想法。测试项目包括一些组合评估数值计算(即。,能进行加、减、并执行其他算术计算)和数字推理(即。,数字)的考生可以考虑和理性。尺度,这种技能的评估方面各种题为算术,方程,数值计算能力,和定量。
空间能力:可视化的能力或形式的心理图像观察固体的计划在平坦的一张纸。一些项目需要人看一个图,确定一个对象会在三维空间中完成。别人问受访者看一个照片或图画完成对象和可视化的三维空间对象看起来好像是如何旋转到一个不同的位置。相关技能是衡量测试题为块设计、矩阵推理,矩阵,折纸和切割、模式分析、空间关系和空间。
抽象推理:能够理解思想提出了不使用文字或数字。抽象推理测试存在的问题的大小,形状,位置,使用图片或数量,形状,模式,或其他非语言、非数值形式。天平测量空间能力衡量这种能力的一个方面。其他尺度测量方面的这种能力名为形成知觉,对象组装,完成图片,和图片安排等等。
理解:使用演绎推理的能力(在较小程度上,归纳推理)获得社会相关问题和问题的解决方案。这些测试评估考生的实际判断和常识和能力来处理他们的社会和文化环境。其他尺度测量方面的资质是名为荒谬和相似之处。
运动技能
在某种意义上运动技能代表人类能力的输出函数。理解和解决问题的人类大脑内部发生未被注意的,但是产品的心理活动表达用语言或通过一些体育活动。许多运动技能测试要求人们使用他们的认知技能之前做一些物理反应。例如,文书的测试速度和准确性(即。、扫描列表的名称或街道地址,以查看它们是否匹配或者是按字母顺序排列)要求人们使用认知和运动技能。其他的例子包括块设计(即。,安排块指定设计)和数字符号(即。,将随机安排符号转换为数字使用匹配的一个关键的符号和数字)。
以下三个测试提供纯净运动技能的评估。他们需要人来执行的任务很简单,不需要理解的认知技能。因此,他们提供一个清晰的测量个人的执行物理任务的能力。
运动协调:协调能力的眼睛和手或手指快速、精确、准确的运动。测试的运动协调人们用一页纸的小盒子,要求他们做个记号在短暂的指定时间内尽可能多的盒子。
手指灵巧:能力小,快速,准确的运动用手指打字和移动等小物体快速、准确地如在装配两个或两个以上的对象。手指灵巧的测试需要人组装简单的物体,如把一个垫圈上铆钉和分解对象(如洗衣机返回洗衣机和铆钉和铆钉的存储位置。
手灵巧度:迅速用手做协调运动的能力和熟练。要求人们更加纯熟的测试对象在指定位置或将对象从一个地方移动到指定的位置。
综合得分
综合分数分数通过结合两个或两个以上的测试获得的分数。通常,考试分数都解释的意义作为一个独立的分数和作为一个组合的一部分。情报的概念可能是最著名的复合。许多智力测试收益率三个综合得分:语言智力、性能情报,和一个整体或全面智能评分。概念化情报的另一种方法是在心理过程形成认知行为的基础。beplay体育在线登录这种观点表明,知识行为包括理解、组织、思考,记住。重要的认知能力测试得到的综合得分,以反映这一观点的情报言语理解、知觉组织、加工速度和工作记忆。
语文智力:通过结合分数口头措施,数值和空间能力。这种组合提供了一个总体衡量人的抽象推理能力和理解和学习新技能的能力。这个组合是深受语言技能。
性能情报:通过结合分数措施需要抽象推理和操纵的对象,如块,珠子,图片,或拼图。这个组合提供了一定程度的抽象推理能力,更少的依赖使用单词和语言能力。能够理解非语言材料复合数据更加突出。
情报:通过结合语文智力得分和性能情报。在测试中如WAIS-III马伯,SB5,这个组合包含信息从口头五六个测试和性能的复合材料。在multi-aptitude电池如DAT和使用GATB,这个组合包含信息从语言能力的措施,数值能力和空间能力。
语言理解能力:这个组合提供了一个总体衡量个人的理解和处理语言信息的能力。措施,评估得分是通过结合词汇,一般信息,处理模糊信息的能力来解决问题时,提出了口头形式。
知觉组织:这个组合提供个人的信息分析信息的能力,提出了一种非语言形式和组织成有意义的模式。是通过结合措施,要求个人得分与图片,块,或矩阵。
处理速度:这个组合提供信息的速度的人可以使用抽象的符号。通过结合考试分数是评估工作的能力和抽象的符号,没有任何可存取的语言意义。
工作记忆:此复合材料提供的信息在内存中保存信息的能力和使用它来解决问题。它是通过结合考试分数要求个人记得模式形成的珠子的照片,数字和字母。
持久的贡献
心理测试的发展是最重要的一个心理文明的和持久的贡献。事实上,心理学家指出Rene诉达文说和大卫·鲁宾斯基作为心理测试服务相同的功能的心理学家显微镜和望远镜为微生物学家和天文学家。测试提供心理学家能够看到的现象,否则会不可见。许多丰富的利益心理导致了现代社会不可能一直没有使用心理测试。
早期的心理学家开始工作的第一个测试成果,资质和能力在1800年代末。研究和创新,第二次世界大战主要集中在测量方法的发展职业兴趣和认知和运动技能。心理测量的现代科学是由于几十年的研究测试,如测试由心理学家的富有成果的多样性。虽然心理学家认真开发测试解决全方位的社会需求,他们的生产力领域的成就,资质和能力测试是无与伦比的。
引用:
- 美国教育研究协会,美国心理协会,和国家教育委员会测量。(1999)。教育和心理测试的标准。华盛顿特区:美国教育研究协会。
- 美国心理协会,联合委员会测试实践。(2005)。教育公平的测试实践的代码。华盛顿特区:作者。
- Anastasi,。& Urbina),美国(1997年)。心理测试(第七版)。上台北:普伦蒂斯霍尔。
- 哈姆布赖顿,r·K。罗宾,F。和兴,d . (2000)。项目反应模型教育和心理的分析测试数据。h·e·a·Tinsley & s d·布朗(Eds),手册的应用多元统计和数学建模(页553 - 581)。圣地亚哥CA:学术出版社。
- 国家教育委员会测量。(1995)。在教育测量代码的专业责任。麦迪逊,WI:作者。
- 间谍,r。& Plake b . s . (Eds)。(2005)。16心理测量年鉴。林肯,NE:布罗心理测量研究所。
- 沃尔什,w . B。,贝茨:大肠(1995)。测试和评估(第四版)。上台北:普伦蒂斯霍尔。