智慧是什么?这是很难说。它似乎在很大程度上取决于是谁问。这个话题已经订婚思想家至少只要人们写下自己的想法,甚至更长时间。结果使用条款。如果有人提到一个很聪明的朋友,例如,听者肯定会有一些一般的想法是什么意思。愚蠢的概念同样直观。来一个真正的协议都需要不同的东西,然而,可能更加困难。被聪明的知道很多事实意味着什么?这意味着能够迅速解决数学问题? Is fast reaction time important? Does a high score on an IQ insure survival for a week in the jungle with just a spear? Most introductory psychology textbooks attempt to provide a quick theoretical definition. Here’s a favorite: intelligence is “the capacity to understand the world and the resourcefulness to cope with its challenges.”
在《心理科学》是非常重要的,一个操作的定义构造之前学习经验。操作上定义的东西(或实施)手段来定义它的方式将允许测量。这一原则使心理学家回避所有的哲学争论这么智能通过定义它的本质:智力是智力测验测量。这是大多数研究情报的定义涉及到测量使用,无论如何。这引入了一个优雅的简单性和激怒循环论点,然而。考虑下一个逻辑问题是:智力测验测量什么?当然,情报。又什么情报?等等。
很明显,需要一个更好的答案的问题:智力测试真正衡量什么?回答可能首先需要一个题外话关于心理测试和它们是如何工作的。基本定义:心理测试是一种客观的、标准化的测量样本的行为。每个部分的定义是很重要的,如果要正确理解智力测试。
首先,这个术语标准化:一个标准化的测量是一个过程,在完全相同的方式进行每次有人需要测试。这意味着给定的指令必须是相同的,和所有其他测试条件,如期限和类型的位置,以及环境温度等微妙和照明,应该在任何程度上保持不变,这是可能的。
说它是客观意味着得分一样标准化的测试条件。个人观点和感受的人评分测试不能被允许影响给出的分数。这意味着管理的手工测试必须是非常具体的哪些答案是正确的,哪些不是,所以不涉及个人的判断。
第三部分定义可能是最重要的和最经常被遗忘的:测试成绩只是一个样本的行为。它不是一个衡量,换句话说,人的总体能力,而是它只是衡量这个人是如何能够执行在一个特定的场合,在一个特定的地点和时间。任何曾经采取考试与睡眠不足或在很嘈杂的环境意识到一个测试可能并不总是给一个真正衡量一个人的能力。
鉴于这个定义,似乎心理测试应该易于设计;人们尝试所有的时间。几件事把韦氏儿童智力量表,第四版(WISC-IV),从世界杂志的“你是什么样的情人?然而,“测验。除了上述的标准,成为一个良好的心理测试,评估仪器需要建立可靠性、有效性,并适当的规范。
测试可靠性实际上也是同样的道理,人——一致性和可靠性。如果一个人需要一个测试今天显示他们调整和正常,一周后,相同的测试表明,人可能是一个连环杀手,有可靠性的问题。两次试验法的可靠性是最常见的测量,它只是它听起来像什么。的数学测试的结果之间的相关性被一群受试者在两个不同的时期。如果一个强大的两组分数之间存在正相关关系,这意味着人们倾向于做相同的两倍,因此试验是可靠的。有时使用替代形式而不是建立可靠性:构造形式不同但功能等价的两个不同版本的测试,然后受试者参加两个考试。如果他们都执行相同的,试验是可靠的。这个实际上是相当具有挑战性,因为它需要设计两个版本的测试,真的只是喜欢对方。另一种可靠性测量广泛应用:分半的可靠性。这是衡量除以一个测试在一半人把它和比较上半年项目上的得分在下半场比分。 This one is also very tricky to use, and it is only useful with tests that are only trying to measure one thing, otherwise there would be many different and non-equivalent ways to split the test into two sets of items.
另一个重要的测量测试效度是非常有用的。这通常是定义为一个测试在多大程度上它声称测量措施。稍微复杂,但更精确的定义来自于教育和心理测试标准(美国心理协会的合资企业,美国教育研究协会教育委员会和国家测量):“一个测试是有效的推论是适当的,有意义和有用的。”这个定义是很重要的,因为心理测试的主要目的,特别是智力测试,是推断人民。
几种不同的有效性对智力测试很重要。预测效度是指测试的程度可以预测未来的行为。这是通过检查测量测试之间的关系和未来的标准;例如,SAT分数用来预测大学平均成绩。这有时也称为criterion-related有效性,并经常使用的标准分数在另一个测试相同的构造。智商测试,例如,不会把它当真如果不显示性能在新的测试高度相关性能测试去整容,韦氏或斯坦福-比奈。内容效度的程度是一个充分测试被测样品的行为。考虑一个数学类的乘法和长除法的主要焦点。将累计期末考试仅覆盖减法是一个有效的衡量学生是否学会了材料?
最后,建构效度是指测试得分的程度实际上代表所需的理论构建。构造是一个广泛的、模糊的心理概念,如领导能力或智力;一般来说,太复杂的东西真的是衡量一个数字。可以以多种方式建立建构效度,包括确定干预效果的研究或发展变化对考试成绩的影响与理论一致。例如,如果有一个新的测量的抑郁和一组抑郁的人需要测试之前和之后都已经建立了有效的治疗,然后抑郁分数测试最好下去。如果分数不,这显然不是测量是为了测量。同样,每一个主要的智商测试词汇分测验。如果相同的测试给一群二年级和一群6年级学生,年纪大一点的孩子们应该得到更高的分数。如果他们不这样做,显然不是词汇被测量。
现在,假设一个人刚刚一个新的智力测试,分数是50。这是什么意思?等待进一步的信息测试是可用的,这意味着一无所有。知道50是什么意思的唯一途径是给很多人测试,看看大多数人的频率分布。如果平均(平均)测试是一个30岁的人得分50做的非常好。如果指的是70年,那个人已经做得相当糟糕。给测试的结果很多人给分数意义被称为规范。根据规范,平均得分的主要智力测试的两个孩子是100,和所有其他相应分数评判。
智力测试已经存在了大约一个世纪。阿尔弗雷德·比奈(1857 - 1911)1905年创造了第一个现代智力测验,以及赫伯特西蒙。他这样做的理由是很重要的知道:巴黎学派系统想要识别所需的补救课程的学生。当时,特殊教育(事实上,精神发育迟滞的想法本身)很新,和法国更主动地寻求帮助这些孩子比美国在同一时期。法国法律来要求孩子需要特殊帮助应该接受它,很明显,一个客观的方法识别那些孩子是必要的(至少更客观,比要求教师选择儿童和删除它们不同的教室)。更简单,测试是为了确定智力较低的人,不是来识别正常或高智商的人。
然而,到1916年,有一个美国版,斯坦福-比奈,Lewis Terman写的。从最初的版本到现在,考试总是产生一个分数,这被认为是一种有时被称为g,或者一般智力。这就是著名的智商,它代表智商。以前真的是一个商:心理年龄比实际年龄。例如,一个五岁孩子的心理年龄5会智商的5/5,或1。与精神三岁五岁智商的3/5,或者。6。删除那些讨厌的小数,使数据更容易处理,它成为标准的实践结果乘以100,所以前两个例子会智商100和60,分别。斯坦福-比奈不再估计心理年龄,但智商这个词仍然广泛使用,尽管是非常不准确的。同时,现代测试产生的不仅仅是一个分数。
斯坦福-比奈测试现在在其第五版,这是一个相当复杂的模型的情报。测试结构测量五个不同智力因素在语言和非语言领域,共有十子。五个因素:流体推理、知识,定量推理,空间视觉处理和工作记忆。除了十个分测验成绩,因此,测试提供了五个因子得分和熟悉全面智商,以及不同的语言和非语言智商。而原始的测试目的是为了孩子,目前斯坦福-比奈赋范样本从两岁的孩子一直到八十五岁的成年人。
斯坦福-比奈的现代后裔是原来的测试,但最经常的心理测试是其主要竞争对手的WAIS-III(韦氏成人智力量表,第三版)。极冰原起源于大卫·斯坦福-比奈韦氏的信念,一直为孩子设计的,没有成人的最佳测试。韦氏正与成年精神病人在贝尔维尤医院,他很快意识到,比奈测试的评分系统(和早期斯坦福-比奈)与一个成年人来说简直一点意义也没有。虽然意义说sevenyear-old精神五岁,举个例子,这将是毫无意义的说一个38岁的病人有心理年龄只有35。韦氏因此发表自己的测试是在1939年,专为成年人和智商得分用他所谓的偏差而不是精神/时间比率计算。
分数比较一组规范人的年龄,和分数被分配到那个人站在比较其他成年人他或她自己的年龄。极冰原赋范在一个样本的年龄在16到八十九。它是适合年龄在16到七十二年。十一个单项成绩被组织成两个尺度,口头和性能。得分时,它产生,除了全面智商、言语智商和性能的智商。
极冰原的成功后,韦氏设计自己的孩子测试,生产威(韦氏儿童智力量表,现在在其第四版)和WPPSI(韦氏学龄前儿童智力的主要尺度,现在修改,称为WPPSI-R)。WISC-IV是6 - 16,和WPPSI涵盖了年龄范围从三到七年。WISC-IV和极冰原WPPSI-R结构很相似,有一些差异的单项成绩反映不同年龄段的能力;他们智商产生相同的模式:全面,语言,和性能。
除了斯坦福-比奈和韦氏测试,有很多其他人,但他们使用的一小部分的次数每年使用这两个。一些相当坚实的智力测试评估婴儿,这可能是最好的婴儿Development-II的量表。贝利可以用于非常年幼的孩子,与标准表,开始一个月的年龄和42个月。这是一个巧妙的测试,主要包括参与适龄的孩子玩耍,仔细观察孩子的广泛发展的里程碑。智商是很不稳定的在生命的头几年,尽管高分贝利没有任何的保证,异常低的分数可以准确预测后考试成绩或学校的表现;例如,测试做了出色的检测在智障儿童将测试范围的智商。
尽管这些测试都是基于特定的理论概念情报涉及多个因素,他们仍然主要用于产生一个数字,仍然通常被称为智商,旨在提供一个全球通用能力的措施。这样他们基本上失败了,至少在分数是如何使用的,以反映意见的广泛多样性中可见各种情报理论家的工作。他们这样做,然而,反映一个有影响力的思想家的观点,查尔斯•斯皮尔曼提出,情报包含的主要是一个潜在的一般能力,他称g。斯皮尔曼的有影响力的观点之外其他的观点。
第一个试图衡量智力,比比奈,来自于19世纪晚期,一段有时被称为铜管乐器的时代心理学,心理学家之间严重的机械工厂命名的技能都建立自己的设备,而不是购买产品不存在。周期也当弗朗西斯·高尔顿爵士和他的美国弟子,詹姆斯·麦肯卡特尔,认为情报需要敏锐的感官能力和快速的反应时间,和他们试图衡量智能间接通过各种物理测量,特别是反应时间。
这种感觉敏锐的智能方法在很大程度上消失在比奈发表了他的第一个考验,但它仍然有一些现代信徒如阿瑟·延森,谁会使用一种叫做反应时间/装置动作时间(RT-MT)装置在他尝试文化差异研究的情报。该装置由一组灯旁边的小按钮,控制台摆扇形状,一个按钮底部的风扇。主体是一只手在底部的按钮和等待。一盏灯时,主体移动,手按钮相邻光尽可能迅速。设备措施反应时间(主题需要多长时间将手从第一个按钮)和运动时间之间的时间间隔(以手第一个按钮,按第二个)。延森称相当高的智力测试这些测量和传统之间的相关性,但是这种方法并没有被广泛。
雷蒙德·卡特尔产生一个有影响力的智力理论在1940年代被提出,而不是一个g因子,主要有两种类型的情报,他称之为流体和固定智力。流体智力是语言,相当受文化偏见,主要由一个人的内在的学习和解决问题的能力。这就是当一个任务所需的情报需要适应一个新环境。固定智力由一个人所学到的,因此由知识而不是解决问题的能力(尽管流动智力需要增加固定智力)。大部分的研究灵感来自卡特尔的理论关心的是所谓的智力下降。大量的研究表明,流体智力下降可能随着年龄的增长,固定智力没有。
俄罗斯心理学家a。r . Luria提出了一个截然不同的理论,也依赖于两种不同的心理过程的概念。基于他的研究脑部受伤的士兵,他决定有两种不同的心理活动体现在智力测验:同步和连续处理。同时处理是发生在一个任务需要执行多个不同的心理活动在同一时间。空间任务是一个很好的例子。画画时,一个人掌握的整体形状所吸引,同时也分别绘制它的组件。连续处理,只有一个精神进行操作,对解决数学问题是有意义的,但将是一个灾难作为一种绘画方法甚至一个简单的形状像一个三角形。人必须预先确定的特定长度的画线,在一定角度下看彼此,只是希望他们排队。
但是,一些理论更复杂。在1930年代,Thurstone提出一组七个主要心理能力(pma)和吉尔福德在1960年代末提出他的智力结构模型中,可能有多达150个不同的因素。理论提出了多种类型的情报来取代单一一般因子方法近年来各种各样的经历了一次复兴与Robert Sternberg triarchic模型的情报。triarchic模型提出了三个独立的存在类型的情报:分析能力,创造力,实用。分析情报标准智商测试是测试的,现在一个明确定义的问题可接受的“正确”答案。创造性智力关注一个人是否在小说情况下自适应反应并生成新的想法。斯特恩伯格批评的标准测试完全没有测试这个。实践智慧,其他地区通常被忽视的测试中,情报用于处理日常问题,通常没有一个正确的答案;而是多种可能的解决方案,比其他的一些更好。
霍华德·加德纳在1983年决定超越Sternberg通过增加的数量种类在他的多元智能理论进一步的情报。加德纳称,至少有七个相对独立类型的人类智能:语言智能、逻辑数学、空间、音乐、身体动觉智能、人际交往、自我认知等。他进一步指出,尚未完全确立,数量,可能会有更多。他最近提出的几个额外的候选人:自然,精神,和生存的智慧。虽然这些迄今为止很难衡量,加德纳的思想已被证明非常受教育者,因为他们代表的摆脱依赖单一的考试成绩可能没有价值的一些非常真实的技能和能力,以区分不同的人从另一个。
引用:
- Fancher, r . e .情报男人:制造商的智商争议。纽约:w.w.诺顿,1985。