元分析使用统计技术来总结来自不同实证研究的结果,以了解更多关于这个主题。换句话说,荟萃分析汇集了许多不同研究的结果,尽管在某些专业背景下,研究的数量可能只有两项。因为这些定量回顾是分析的分析,所以它们实际上是元分析。这种做法也被称为研究综合,这一术语更完整地包含了进行此类审查所涉及的步骤。荟萃分析可以被认为是对某一特定主题的实证研究历史,因为它追踪了随着时间积累的效应,并试图表明研究人员使用的不同方法可能会使其效应在规模或方向上发生变化。
Meta分析理由和程序
就像在任何科学领域一样,社会心理学通过判断积累的证据来取得进步。因此,文献综述的研究可能是极具影响力的,特别是当荟萃分析被用于回顾他们。在过去的三十年里,学术界已经接受了这样一种立场,即评审本身就是一种科学方法,应该遵循可识别的步骤,以达到最准确和有效的效果。
首先,分析师仔细定义了现象中心的变量,并考虑了研究问题的历史和文献中的典型研究。通常,研究问题将被定义为两个变量之间的关系,例如独立变量在从属变量上的影响。例如,与男性相比,审查可能会考虑妇女使用更具关系导向的领导风格的程度。通常,分析师还将考虑哪些情况可能会改变有关的关系。例如,分析师可能预测,女性将以更加与男性的方式导致的风格,并且当研究审查本质上的公共关系(例如,护士主管,小学校长)时,这种趋势将特别存在。
分析师必须很好地注意决定哪些研究属于Meta分析,下一步是该过程的下一步,因为任何结论可能达到样本中的研究方法的限制。通常,通过专注于使用更强的方法的研究来分析利润,尽管哪种特定方法“强”可能会因地区而异。而基于实验室的研究(例如,社会认知,劝说)倾向于重视内部有效性,超过外部有效性,基于现场的研究(例如,领导风格,政治态度)倾向于扭转这些价值。
理想情况下,Meta分析将定位在受试者上进行的每项研究。然而,对于某些主题来说,由于可用的研究数量庞大,任务可能会非常令人生畏。仅仅是一个例子,在1978年的Meta分析中,Robert Rosenthal和Donald B. Rubin报道了345项实验者预期效应的研究。最重要的是要定位尽可能多的研究,这可能适合使用尽可能多的技术(例如,计算机和互联网搜索,电子邮件到有源研究人员,咨询参考列表,手动搜索相关期刊)。如果有太多的研究包括全部,分析师可能会从研究中随机采样,或者更常见,将重点缩小到有意义的札幌。
一旦研究样本在手中,每项研究都针对可能影响研究结果的相关维度进行编码。为了允许可靠性统计,两个或多个编码器必须执行此编码。在某些情况下,分析师可能会要求专家判断关于特定尺寸的研究中使用的方法(例如,领导风格的程度是面向关系的程度)。在其他情况下,分析师可能会要求培训没有培训他们对审查研究的各个方面的看法(例如,领导职位是公共的程度)。
要包含在元分析中,一项研究必须提供一些最小的定量信息,这些信息解决了变量与比较组,F-Tests,T检验的方法和标准偏差。单独站立,这些统计测试将毫不困扰着这种现象。
当测试出现在单个标准化度量标准中时,效果大小,情况通常会显着阐明。最常见的效果大小是D(两组之间的标准化平均差异)和R(r(两个变量之间的关联的相关系数)。每个效果大小接收正面或负符号以指示效果的方向。As an example, a 1990 meta-analysis that Blair T. Johnson and Alice H. Eagly conducted to examine gender differences in leadership style defined effect sizes in such a way that positive signs were stereotypic (e.g., women more relationship-oriented) and negative signs were counterstereotypic (e.g., men more relationship-oriented). Typically, d is used for comparisons of two groups or groupings (e.g., gender differences in leadership style) and r for continuous variables (e.g., self-esteem and attractiveness).
然后,审阅者分析效果大小,首先检查平均效果大小以评估其幅度,方向和意义。更高级分析检查不同的研究方法是否改变或中等,效果大小的幅度。在所有这些分析中,复杂的统计数据有助于表明研究的效果是否始终如一地同意一般趋势。其他技术有助于揭示哪些特定的研究结果与其他技术最广泛不同,或者检查文献中出版物偏见的合理性。出版物偏见的检查可能尤为重要,当调查下的现象是否是真实的。在这种情况下,发表的研究可能更有可能找到比未发表的研究的模式。例如,许多疑问存在所谓的PHI效应,这是指“思想阅读”。对存在PHI的研究检测的任何审查都必须对期刊可能倾向于接受现象的确认,而不是对其的讨论的可能性来敏感。
可用于检测出版物偏差的存在各种策略。例如,Rosenthal和Rubin的故障安全N提供了一种方法来估计平均值的研究数量,这将改变平均效果大小以不可思议。如果数字很大,那么它直观地难以置信,发布偏见是一个问题。其他,更复杂的技术允许审阅者推断出什么效果大小值,未介入的研究可能会采取以及如何将这些价值观影响平均效果大小。当元分析审查的目标是检查统计显着性或现象的简单幅度时,出版物偏差的检测尤为重要。当审查的目标是检查尺寸如何在研究的效果尺寸更大或更小或较小时,或者当它们在其迹象中逆转时,偏差偏差是一个远远少的担忧。实际上,仅仅在效果大小的范围内的广泛变化经常表明缺乏出版物偏差。
荟萃分析结果的解释和介绍是该过程的最后一步。一次考虑是审查中平均效果大小的程度。1969年,Jacob Cohen非正式地分析了心理研究通常产生的效果的程度,并提供了判断效果大小的准则。表1显示了D,R和R2的这些标准;后一统计学表示一个变量解释另一个变量的程度。为了说明,小效果大小(d = 0.20)是15岁女孩之间的高度差异,中等效果(d = 0.50)是文书和半熟练工人之间的智能分数的差异,以及一个大的效果(d = 0.80)是大学教授和大学新生之间的情报评分差异。重要的是要认识到定量幅度只是解释效果大小的一种方式。
即使是非常小的平均效果尺寸也可能具有很大的进口实用或应用的背景。例如,在政治办公室的近距离竞争中,即使是具有小效果大小的大众媒体运动可能会扭转结果。
理想情况下,META分析了不仅通过显示典型效果的尺寸而且通过表明当研究变大或更小的效果时,或者通过在方向上逆转时显示何时何时何时显示效果。最佳,Meta分析了关于该现象的测试理论。例如,约翰逊和鹰派的荟萃分析领导风格的性别差异表明,与他们的社会角色理论假设一致,妇女与男性有关的关系,尤其是当领导作用本质上的公共交易时。
Meta-Analyses提供了过去研究的经验历史,并提出了未来研究的有希望的方向。由于仔细进行的荟萃分析,初级研究可以设计完整的文学,因此有更好的机会促进新知识。通过这种方式,科学可以最有效地推进以产生新的知识。
参考:
- 科恩,j .(1969)。行为科学的统计功率分析。纽约:学术出版社。
- Cooper,H. M.和Hedges,L. V.(EDS)。(1994)。研究综合手册。纽约:罗素圣人。
- Johnson, B. T., & Eagly, A. H.(2000)。社会心理学研究的定量综合。《社会与人格心理学研究方法手册》(H. T. Reis & C. M. Judd编),第496-528页。伦敦:剑桥大学出版社。
- Lipsey,M. W.,&Wilson,D. B.(2001)。实用的Meta分析。千橡木,加利福尼亚州:贤者。