智力的评估具有悠久而丰富多彩的历史,其发展反映了心理学作为一个领域的发展。从弗朗西斯·加尔顿(Francis Galton)和詹姆斯·麦基恩(James McKean Cattell)的早期作品到查尔斯·斯皮尔曼(Charles Spearman)和戴维·韦克斯勒(David Wechsler)的开创性贡献,再到艾伦(Alan)和纳德恩·考夫曼(Nadeen Kaufman),杰克·纳格利里(Jack Naglieri)的当代作品,智力评估促进了科学和临床临床的成长心理学。本文的目的不是对当前和有前途的工具进行全面审查,而是要强调涉及智力评估的重要方法和关键问题。
评估
有很多方法可以分类各种智力评估,但是本文使用两个基本类别来促进该主题的处理:经典评估(基于经典理论和概念的智力方法)和现代方法(这些方法基于更多的方法最近的理论方法)。
经典评估
斯坦福 - 比尼特情报量表
法国心理学家阿尔弗雷德·比内特(Alfred Binet)和西奥多·西蒙(Theodore Simon)的目标是检查儿童与平均水平成就同龄人的心理能力。在20世纪的前几十年中,Binet和Simon将情报定义为对实际生活至关重要的基本教师。他们将这一教师称为判断,良好的感觉,实践意义,主动性以及使自己适应环境的能力。缺乏判断力的人可能是白痴或痴迷的人,但是一个有良好判断的人也不能。的确,Binet和Simon认为,与判断相比,其余的知识能力并不重要。BINET-SIMON量表要求儿童完成一系列的心理活动,直到物品变得太困难,无法正确回答。测试的规范是根据他们能够正确回答的项目类型允许对每个学生进行“心理年龄”的估算。
刘易斯·特里曼(Lewis Terman)在1912年修订并扩展了Binet-Simon量表,使用大型美国样本进行标准化,并将其更名为Stanford-Binet Intelligence量表。Terman将智力定义为参与抽象思维的能力。Terman因评估孩子的工作而闻名,以预测他们是否会在以后的生活中取得成功。他发现,与平均水平的同龄人相比,有天赋的孩子倾向于更健康,更高,在领导和社会适应性方面更好地发展。
Stanford-Binet量表已通过Gale Roid进行了第五版(SB5)的修订,可在整个生命周期中使用。它已经与4,800名参与者进行了规范,包括1,400名2至5岁的儿童。斯坦福大学评估了两个领域(口头和非语言推理)和五个因素(流体推理,视觉空间处理,定量推理,工作记忆和知识)。每个因素通过每个域中的不同子测验评估。例如,有流体推理的口头和非语言子测验。斯坦福大学提供了许多必须操纵的物体,例如块和五颜六色的玩具,以增加幼儿的关注和享受。评估每个子测验大约需要5分钟才能进行管理。
Wechsler秤
戴维·韦克斯勒(David Wechsler)主要在20世纪中叶至后期工作,将情报视为个人有目的地采取行动,合理思考并有效地应对环境的全球能力。韦克斯勒还认为,情报受到非智能因素(例如人格)的影响。Wechsler Intelligence for Childrent for Children(WISC-IV)现在是第四版,已有2,200名儿童与2000年美国人口普查的多样性紧密相匹配。WISC-IV可用于评估6至16岁零11个月的儿童。它产生了全面的智商分数和四个指数分数:口头理解,其中包括相似性,词汇和理解活动;感知推理,包括矩阵推理,块设计和图片概念;工作记忆,包括字母数字测序和数字跨度;和处理速度,其中包括符号搜索和编码。子测验尚未按重要性顺序排列,而是汇编以评估一般的精神能力。
Wechsler还设计了Wechsler学前班和智力的初级规模,现在是其第三版(WPPSI-III)。现有版本已与1,700名儿童进行规范,可与2岁零6个月至7年的儿童一起使用3个月。对4岁以下的儿童进行了对四个子测验(例如接受词汇,信息,块设计和物体组装)的较短评估,这些评估衡量了感知组织和言语理解。年龄较大的孩子被管理七个子测验(例如,信息,词汇,单词推理,块设计,矩阵推理,图片概念和编码),以衡量感知组织,口头理解和处理速度能力。在最新的修订中,WPPSI-III进行了修订,目的是使幼儿更愉快,并能够更好地维持他们的注意力,并消除任何种族,性别,地区或社会经济偏见。
Wechsler成人情报量表目前为16岁或以上的年龄以上的第三版(WAIS-III)。最新版本是在1990年代初期在美国规范的,有2,450人被视为代表成年人口的人。WAIS-III分为言语和性能量表。在言语量表中发现的六个标准子测验是信息,数字跨度,算术,词汇,相似性和理解力。性能量表中发现的五个标准子测验是块设计,图片布置,矩阵推理,图片完成和数字符号编码。
伍德考克 - 约翰逊的认知能力测试
伍德考克 - 约翰逊三世认知能力测试(WJ III)提供了不同的认知评估观点。WJ III是基于Cattell-Horn-Carroll(CHC)认知能力理论的唯一评估之一。CHC理论认为智能在三层层次结构中。第一层由69个狭窄的认知能力组成,包括记忆,流利度和编码。第二层由七个认知能力群组成,包括短期记忆,处理速度,流体推理,听觉处理,视觉空间思维,长期检索和理解性知识。第三层被称为一般智力能力,代表了所有认知能力的组合。WJ III也可用于评估工作记忆和执行功能。
WJ III在美国有8,818人的规范,可以向2至90岁以上的任何人进行管理。这项评估与伍德考克 - 约翰逊三世(Woodcock-Johnson III)的成就测试一起进行了规范,这些测试共同构成了从业人员经常一起管理的完整电池。该评估是计算机评分的,可以根据标准分数,百分比排名,年龄和等级等效分数以及一般智力能力来报告其结果。标准电池中有10个子测验,包括言语理解,视觉审计学习,空间关系,声音混合,概念形成,视觉匹配,数字逆转,不完整的单词,听觉工作记忆和视觉审计学习延迟。扩展电池上还有10个子测验。一次不需要所有20个子测验,但评估旨在结合选定的子测验以获取最相关和最合适的信息。该手册提供了各种方法来结合子测验,以辨别心理学家正在寻求的确切信息。该评估通常需要40分钟至2小时才能进行管理。
当代方法
考夫曼电池
艾伦(Alan)和纳丁·考夫曼(Nadeen Kaufman)对智力进行了两项重大评估,这两者都是创新的,这是由于其强大的理论基础。Kaufman评估儿童评估电池,第二版(KABC-II)已有3,025名儿童的规范,并针对3岁至18岁的儿童进行管理11个月。KABC-II基于两种智力理论。首先,评估的CHC模型基于一种理论方法,可以区分流体和结晶能力。在KABC-II中,CHC模型更经常使用,因为它是为讲英语作为母语的孩子而设计的,因此,通过对语言能力和单词知识的测试,将不太在于不利。第二个模型基于俄罗斯科学家A. R. Luria的神经心理学工作,通过不包括对语言能力或单词知识的评估来强调口头过程。这使得不说英语作为母语或患有表现力或接受语言障碍的儿童更容易获得Luria模型。
对KABC-II进行了修订,以提供与来自各种背景的不同儿童合作时更公正的评估,从而导致种族之间的分数差异较差。该评估已在15多个国家 /地区进行标准化,改编和翻译,行政时间通常为30至60分钟。
考夫曼青少年和成人情报测试(KAIT)在美国已有2,000人规范,适合11岁以上的人。规范样本被认为是性别,种族,考生或父母教育等特征地理区域。KAIT包含11个子测验,这些子测试构成了三个量表,结晶,流体和延迟的召回量表。管理大约需要1小时。
认知评估系统
- P. Das,Jack Naglieri和John Kirby提出了一种计划在中学的计划,以实现人类智能模型(Pass)模型,部分基于Luria的神经心理学研究。基于Pass理论,DAS和Naglieri开发了认知评估系统(CAS)。CAS评估基本认知功能的四个方面。计划评估认知控制,设定目标,知识以及计划策略的有效性。注意力评估专注于某些刺激的能力,同时忽略他人。同时处理的处理能够评估整个刺激的能力。连续的处理评估记住某些短语并使用它们来更好地理解概念的能力。
认知评估系统在1990年对来自不同背景的2200名儿童进行了标准化。规范组的组成在性别,种族,年龄,地区,社区环境,能力水平,课堂安置和父母教育方面反映了普通人群。CAS可以与5岁至17岁的儿童一起使用11个月。
差异能力量表(DAS)
柯林·埃利奥特(Collin Elliot)避免了智能一词,并且没有在差异能力量表(DAS-II)中使用它,因为他相信该术语有多种定义和相当大的误解。DA旨在评估儿童的认知优势,劣势和其他能力。它的规范是居住在美国的3,475名儿童和青少年,他们在性,种族,年龄,父母教育水平,地区和学龄前入学方面进行了分层。它适用于2岁零6个月至17岁的儿童。DAS旨在减少考生的挫败感和测试时间,因为用于不同年龄水平的特定起点和终点。
有两种不同的电池可供儿童管理:学龄前水平适用于2岁,6个月至5岁的11个月的年龄,而学龄儿童的级别适用于6岁至17岁的11个月。这17个子测验分为12个核心和5个诊断子测验。核心子测试用于计算一般概念能力综合,该综合能力综合评估个人执行复杂的心理任务的能力。子测验还用于计算言语能力,非语言能力,非语言推理能力和空间能力得分。
非语言测试
数十年来,非语言测试的创建和使用(例如乌鸦矩阵)在智能测试中发挥了作用。然而,人们对语言与智能测试的混淆的越来越关注导致了智能测试的其他非语言方法的发展。现在,存在非语言评估,可与有才华和才华横溢的学生以及那些不说英语作为第一语言或有特殊需要的人使用。
研究人员提出了有关使用非语言测试的多个警告。首先,首先进行其他评估后,应使用非语言评估。其次,尽管目标是非语言评估有助于评估非英语说话者,但很难找到没有某种文化偏见的评估。第三,评估程序是非语言的,但是一个人用来回答问题的认知过程可能涉及借鉴词汇或数学技能。第四,如果口服非语言评估,则不再被视为非语言,因为需要口头技能来理解指示。结果,许多心理学家更喜欢使用涉及伴随指示的非语言评估。由于上述所有原因,一些心理学家更喜欢使用标准,口头评估,例如CAS或KABC-II,这对减少人口差异有希望,但该主题仍然有争议。
乌鸦的进步矩阵
Raven的渐进式矩阵(1998)是一种非语言评估的形式,最初是在1938年设计的,目的是评估个人查看抽象形象刺激,使用类比和得出结论的能力。彩色渐进式矩阵是为5至11岁的儿童设计的。最广泛使用的版本是标准的渐进式矩阵,是为6至17岁的那些年龄设计的,但也可以与成年人一起使用。先进的渐进式矩阵是为具有更高智力能力的老年青少年和成年人设计的。这三个版本都是根据Spearman的统一智力理论构建的。
非语言智能的综合测试
非语言智能(CTONI)的综合测试是一种常用的非语言评估,由六个为6至89岁年龄的人设计的子测验组成。它已经使用来自30个不同州的2,901人组成的组进行了标准化。该样本中包括各种性别,种族,年龄和地理区域的人。该样本还包括一些参加通识教育课程的残疾学生。该仪器使用一系列需要使用类似思维,测序或分类来解决的视觉问题来衡量抽象的思维能力,解决问题和推理。它需要40到60分钟才能进行管理,并且可以口服或使用哑剧。
Naglieri非语言能力测试
Naglieri非语言能力测试(NNAT)旨在为幼儿园至12年级的儿童进行管理,并针对100,000多名学生进行了规范。NNAT对于任何可能从非语言评估中受益的学生都很有用,包括有天赋和才华横溢的学生,学习障碍或听力受损。评估是通过显示渐进式矩阵的图表来管理的,因此不需要口头指示。这有助于确保评估完全非语言,以减少任何混淆变量的机会。NNAT大约需要30分钟才能进行管理,并且可以在组设置中进行管理。
通用非语言智能测试
通用的非语言智能测试(单位)适用于5至17岁的儿童进行管理。它的标准化了来自美国各地的2,100名儿童的样本,并另外还有1,765名儿童,这些儿童用于测试其有效性和可靠性。该单元是通过使用八个无语言的手势(即,竖起大拇指,挥舞,停止,点头,摇头摇动,张开手耸肩,棕榈滚动和指向的)来管理。该单元由六个子测验组成,这些子测试评估类似推理,空间内存,立方体设计,对象存储器,符号记忆和迷宫。该单元类似于其他非语言评估,包括矩阵,但还包括需要操纵物体和手势的使用以及铅笔和纸的项目。
智力评估的关键问题
弗林效应
在1980年代初期,社会学家詹姆斯·弗林(James Flynn)指出,情报测试成绩显示了过去几十年来平均表现的逐渐增长。这种现象已被称为弗林效应,几乎在每个国家和几乎所有评估中都观察到了(尽管这种效果似乎在非语言评估上是明显的)。增加很小(大约1-2个IQ指向一代),但在延长的时间内可观。Flynn效应的原因是广泛争议的,并且超出了本文的范围,但是效果对心理学家的主要影响是确保计算智能测试的分数并与更新的规范进行了比较。弗林(Flynn)记录了几个案例,其中得分已符合过时的规范,从而得出了上级智商或大型智商的结论,而当前规范将导致更为中等的结论。
天才
传统上,智力测试的临界分数或偶尔被用来识别知识分子。例如,学区可能将有天赋的学生定义为在特定情报评估中以前3%至5%的成绩(例如WISC-IV,SB5或WJ III)中的一名。但是,在许多国家,在过去的四分之一世纪中,人们出现了广泛的天才定义。这种变化的部分原因是,人们认识到可以多方面的天才,即传统的智力评估的识别能力有限,以及少数群体在有天赋的计划中的代表性不足(即,当前的考验都认为当前的测试是有限的。对少数族裔学生有偏见)。这导致了对天才的非传统评估的发展,包括教师和家长评级,基于绩效的评估和同伴提名。上述的非语言评估越来越多地用于有天赋的识别系统。这些替代方案的影响似乎有限,但是需要大量的研究和评估对替代评估的开发和使用。
创造力
过去十年来,由于人们对创造力与心理健康和解决问题的能力的关系的认识越来越多,因此创造力的研究爆炸性增长。创造力的大多数概念都包括认知和非认知因素,因此认知评估提供了有关创造力的重要但有限方面的信息。发散思维(DT)是创造力最常见的认知方面。从历史上看,创意思维(TTCT)的Torrance测试一直是使用最广泛的不同思维测试。TTCT有两个版本,分别是言语和人物,每个版本的两种形式(a和b)。可以计算出流利度(响应次数),独创性(响应的统计不频),灵活性(响应似乎来自不同类别的程度)和阐述(响应超出典型答案的程度)。共识评估技术,学生生产可以评估创造力的产品,是对不同思维测试的流行替代方法,但它一直是应用环境中有限研究的主题。
主要发展
本文回顾的评估代表了过去50至60年中认知评估的主要主题,但咨询心理学家还有数百个其他认知评估。过去一个世纪的主要发展是依赖更强的理论模型和在测试发展中的研究,对语言作用的认可(既是某些测试者的优势和劣势),以及实现需求按日常测试进行常规测试,以说明Flynn效应。
参考:
- Carroll,J。B.(1993)。人类认知能力:因子分析研究的调查。纽约:剑桥大学出版社。
- Fancher,R。E.(编辑)。(1985)。智力人士:智商争议的制造商。纽约:诺顿。
- Flynn,J。R.(2006)。束缚大象:资本案例,智商和弗林效应。心理学,公共政策和法律,12,170-189。
- 人类智能:http://www.intelltheory.com/
- Neisser,U。等。(1996)。情报:已知和未知数。美国心理学家,51,77-101。
- Sattler,J.M。(1990)。评估儿童(第三版,修订版)。加利福尼亚州圣地亚哥:萨特勒。