定量方法通常被定义为用于检查群体之间的差异以及变量之间相对于可量化现象之间的关系的各种程序。潜在可量化现象的列表是巨大的,包括任何类型的行为,态度,知觉,知识领域或其他可以通过数值测量的现存特征。定量方法在物理,生物学和社会科学的各个学科中都应用,并反映了统计和测量领域的贡献。统计数据包括用于汇总数字数据和测试假设的程序,而测量包括用于将有意义数字分配给研究人员感兴趣的特征或变量的过程。
使用定量方法的研究设计类型包括真实的实验(也称为完全随机的设计),准实例和非实验性设计(也称为被动观察或相关性)。这些设计之间的不同之处在于,研究人员在研究中对某些因素进行控制以及存在随机化的程度的程度。此外,可以将定量方法分类为仅用于描述目的的方法(即,以分布形状,中心趋势和可变性来表征数据),以及根据假设测试的测试来绘制推论的方法。
定量方法的起源
历史背景
当前用途的定量方法论是从生物学,数学,心理学,社会学,统计学,计量学和政治学的各个学科演变而来的,并且可以大致分为统计和测量领域。尽管这些领域确实具有共同的根源,但考虑到统计方法进行测量分析,相反,对有效和可靠的措施进行有意义的统计检验的依赖,但尽管如此,统计和测量领域仍然具有独特的历史起源。
对于那些曾经参加过统计课程的人来说,术语统计信息通常会想到记忆公式,规则清单和繁琐计算的图像。然而,现代统计的早期历史远非乏味,通常以意识形态和哲学上的冲突,痛苦的竞争以及在某些情况下,在该领域发展的主要参与者中终身仇恨。现代统计推理的第一个证据出现在17世纪后期,当时首先提出了现代统计理论(例如概率,可变性和机会)的统计概念。Many would argue that among the most profound developments in the history of statistics were Karl Pearson’s mathematical formulation of the correlation coefficient in 1896 and Sir Ronald A. Fisher’s first publication describing analysis of variance in 1921. Their work not only incited debate within the statistical community but also served as the impetus for subsequent advances in the field following both Pearson’s nonexperimental design tradition and Fisher’s randomized experimentation approach. During the past half century, new statistical procedures have extended our ability to study quantitative phenomena by accommodating simultaneous testing of multiple dependent variables (e.g., multivariate analysis of variance), modeling of more complex relationships among multiple variables (e.g., path analysis and structural equation modeling), and analysis of complex data structures (e.g., hierarchical linear modeling and multilevel modeling).
与统计方法论的历史相似的是,测量方法或心理计量学的发展可以追溯到柏拉图等早期哲学家以及包括伽利略在内的科学家,他们拥护量化物理现象的重要性。但是,许多现代测量原则可以更直接地归因于心理学领域的进步。例如,定量心理学的创始人古斯塔夫·费希纳(Gustav Fechner)是第一个提出在严格控制条件下获得心理措施的方法之一。Other early contributions to measurement from the field of psychology include Charles Spearman’s development of factor analysis in 1904 as a means for understanding intelligence, L. L. Thurstone’s scaling methods for measuring attitudes, and James M. Cattell’s writings on the importance of large samples as the basis for group intelligence tests. Since the mid-1900s, among the most significant innovations in the field of measurement have been improvements in procedures for estimating reliability, such as the reliability coefficient presented by Lee J. Cronbach in 1951, as well as the realization of item response theory, which now dominates large-scale standardized testing and has made possible advances in the computer adaptive testing that is used with many assessments such as the Graduate Record Examination.
哲学基础
尽管有些人认为定量方法论很大程度上源于逻辑实证主义,但实际上,定量方法论,尤其是在社会科学中应用的,主要源于后期证明主义。逻辑实证主义者拥护一种对现实的确定性观点,其中可以在秩序和规律性的世界中绝对验证知识。相比之下,后期主义者认为现实比确定性更不确定性和概率更为概率。使用统计推理方法的研究人员同样在一个范式中运行,在这种范式中,关于知识的陈述必须以不确定性和概率为依据。此外,统计实践基础的后置态的另一个基本原则是波普的伪造概念。正如开始统计学课程中的任何学生所知道的那样,对假设进行了检验,不是出于验证的目的,而是出于伪造的目的,即永远无法证明假设是真实的,而只能被证明。因此,示例大部分定量方法的统计方法需要一个哲学框架,而哲学框架比逻辑实证主义少得多。
概念和基本原则
概率和机会
推论统计分析的基本前提是希望使用样品推断出较大人群的特征。由于任何给定样本仅代表较大感兴趣的人群的一个子集,因此即使随机选择样本,选择用于研究的特定样本也不能充分代表人口。因此,在尝试使用样本数据估计人口特征或参数时,始终存在机会或不确定性。出于相同的原因,使用统计程序进行假设检验的研究人员永远不能100%确定其测试结果是正确的,或者结果实际上反映了选择用于研究的样本的特质。
定量分析中的不确定性概念是统计中显着性测试的基础,还体现了犯下1型或类型2误差的风险。类型1误差类似于假阳性,当研究人员错误地确定数据中存在关系或差异时,实际上这种关系或差异不存在时发生。It should be noted that such an error does not represent an ethical breach but rather an incorrect finding based on any number of reasons, including features of the study’s design, characteristics of the subjects in the study, or violation of one or more statistical assumptions, where assumptions represent a prescribed set of conditions necessary for conducting any given statistical test. Furthermore, there is always some risk of committing a type 1 error when conducting statistical tests. When researchers set a particular confidence level, level of significance, or alpha prior to conducting their statistical analyses, they are in essence indicating the probability of type 1 error they are willing to risk.
始终可能发生的另一种决策错误是类型2误差,类似于虚假负面。犯下2型错误的研究人员无法检测到人群中实际存在的显着差异或关系。在这种情况下,据说他们的测试缺乏力量。统计检验可能由于各种因素而具有不足的功率,包括较小的样本量,过度严格的显着性水平,违反统计假设,研究的设计或变量的不可靠度量。
关于两种类型错误的相对严重性,没有绝对共识。这显然取决于研究的性质和误差的潜在后果。例如,在某些类型的医学研究中,未能正确识别药物可能有效地减轻威胁生命的疾病(2型错误)可能会出现更严重的错误,而不是错误地确定这种药物在它是有效的情况下是否有效不是。但是,按照惯例,大多数研究人员倾向于将其alpha(或1型错误的风险)设置为.05或.01和2型误差为.20,这表明对1型错误的公差较小。
变化性
使用定量方法固有的是对理解变异性的兴趣。实际上,这是对诸如甜豌豆大小,苏格兰士兵的胸围以及酿造啤酒中使用的啤酒花的特征的各种现象的差异的好奇心,从而推动了早期统计理论的发展。通过他们的观察,科学家们指出了与他们观察到的事件相关的变化方面的规律性和不可预测性。对可变性的这种迷恋为研究人员应用于理解,解释或预测差异的当前推论统计分析提供了基础。这种差异可能在群体之间的差异,跨时间的变化或变量之间的关系中表现出来。同样,测量领域是基于评估和分类的兴趣,作为理解多样性的一种手段。因此,假定要研究的现象之间存在差异,这对于有意义地应用定量方法是必需的。
从定量方法论的角度来看,可变性通常分为系统性和随机性。可变性性质的这种区别在统计和测量中都是正确的。在统计分析中,显着性测试通常包括两个组成部分:解释和无法解释的方差。解释的组成部分代表了可归因于研究中所检查的因素的可变性,例如治疗效果,动机影响等,而无法解释的或随机的成分反映了在研究控制之外的因素,例如个体差异或环境分散注意力。因此,应该很明显的是,从事统计分析的研究人员寻求最大化系统方差并最大程度地减少随机方差,这通常被赋予噪声或滋扰的状态。同样,在测量中,无论是从心理测试还是生理测量方法中,一组分数的可变性通常都被分配为与感兴趣特征和由于测量错误而导致的随机误差差异相关的系统差异。
错误
错误是任何类型的随机或系统方差的存在,会对研究结果或措施的健全性产生不利影响。如上所述,有两种不同类型的决策错误对于进行统计假设检验至关重要。但是,定量方法论中错误的概念具有许多伪造。采样误差,测量误差和预测误差是损害通过统计分析和测量获得的信息实用性的外部方差的来源。测量可靠性和有效性的概念分别与存在或不存在随机和系统误差有关。可以降低可靠性的随机错误的示例包括考试的情绪状态,猜测,记忆失误和评分错误。相比之下,可能会降低有效性的潜在系统错误包括学习障碍,阅读理解和人格属性,这些属性始终导致各种措施的膨胀或低估得分。一般而言,错误在应用定量方法中被认为是不受欢迎的。设计合理研究的许多建议都集中在尝试最大程度地最大程度地减少潜在错误来源的尝试。
控制
在定量方法论的背景下,控制基本上是通过排除研究结果的合理的替代解释来最大程度地减少或解释无关可变性的能力。如果没有足够的控制,研究人员无法明确解释其研究的发现。控制可以采取多种形式,包括在研究中操纵条件,使某些因素保持恒定,随机化以及可能混淆变量以研究其效果。操纵和随机化都是Fisher开创的实验研究设计的标志。构成基于证据研究的基础的这种设计通常被称为黄金标准,因为它们能够控制大多数外部变量。由于无法充分控制外部因素,因此有时认为非实验性和准实验设计都被认为不那么严格。然而,当许多研究人员的研究主题不适合操纵变量或随机化时,许多研究人员都会使用此类设计。
定量方法的类型
统计程序
没有单个分类法来对无数或目前正在使用的无数统计程序进行分类,并且完整列表的汇编将令人生畏。但是,可以使用几种分类标准来说明不同方法的特征。例如,统计程序通常被二分为描述性与推论。在推论统计中,通常根据如何测量变量(例如,分类还是连续)组织程序,分析是一个或多个独立变量,是一个或/或一个独立变量,是在某个时间点还是在某个时间点收集数据在两个或多个时间点上,或在多大程度上对数据的基本特征进行了假设。常用统计程序的示例包括分析方差以检查组之间的平均值差异,卡方检验独立性以分析分类变量之间的关联以及多元回归以确定一组变量解释或预测某些结果的程度。在过去的几十年中,已经开始看到更大的应用包括结构方程建模,分层线性建模和增长曲线分析的更新,更复杂的多元程序。
测量程序
测量程序是用于评估可靠性和有效性的定量工具,以确定给定目的和人群的得分适当性。评估可靠性的传统方法包括Cronbach的Alpha和测试方法。在某些情况下,基于项目响应理论(IRT)的程序取代了传统方法。尽管最初几乎完全用于大规模测试,但基于IRT的方法,尤其是Rasch分析,越来越流行,可以分析来自情感措施(例如人格清单和态度量表)的分数。与有效性相关的程序包括各种技术,包括因子分析,相关性和其他统计方法,以提供对特定度量分数的含义和适当性的支持。
定量方法的未来
考虑到目前在许多竞技场中正在授权的基于证据的研究的重视,定量研究可能会继续蓬勃发展。没有孩子留下的立法以及其他联邦指令不仅强调了随机试验的应用,而且还规定了产生有效和可靠分数的工具的使用,这意味着偏爱定量结果指标。此外,随着计算机功能的增加,技术正在允许开发复杂的统计和心理测量方法,这些方法将使定量研究人员能够以研究人员目前无法设想的方式分析其数据。例如,二十年前,层次线性建模主要是一个概念。现在可以在越来越多的应用研究中可以看到,以捕获以某种层次结构方式聚集的更准确的数据,例如,当学生都体验相同的教室或客户共享同一治疗师时,就会发生。定量方法的未来发展可能会继续扩大我们了解行为,事件和过程及其相互关系的复杂性的能力,以至于可以量化这种现象。
参考:
- Cowles,M。(1989)。心理学的统计学:历史观点。新泽西州希尔斯代尔:劳伦斯·埃尔鲍姆(Lawrence Erlbaum)。
- Crocker,L。和Algina,J。(1986)。古典和现代测试理论简介。纽约:霍尔特,里纳哈特和温斯顿。
- Michell,J。(2003)。定量命令:实证主义,天真的现实主义和定性方法在心理学中的地位。理论与心理学,13,5-31。
- Pedhazur,E。J.和Schmelkin,L。P.(1991)。测量,设计和分析:一种综合方法。新泽西州希尔斯代尔:劳伦斯·埃尔鲍姆(Lawrence Erlbaum)。