在刑事司法系统中,目击者在身份测试或阵容中表达的信心已被认为是证人可能的可靠性或准确性的指标。相反,心理学研究人员淡化了目击者识别信心的诊断价值。尽管仅相对较小的识别准确性方差比例与置信度的差异有关,但使用所谓的置信度准确率(CA)校准程序的最新研究表明,在识别决策后立即进行信心 - 可以提供有用的信心(但不是无误的)犯罪调查人员的指针,可能是正面的,但不是负面的(即阵容拒绝)阵容的决定的准确性。但是,这一结论肯定不适用于法庭上表达的信心判断,因为到了此时,识别后的影响(例如阵容管理员或其他证人的反馈)有机会塑造任何后来的信心判断。在观看阵容之前,证人表达的判决也不适用于判决。未来在该领域进行研究的主要挑战是定义获得可靠的CA校准的边界条件,这反过来将增强诊断识别决策可能准确性的能力。
目击者在检查警察阵容或照片传播时,或者在法庭上证明罪犯的身份时,通常会在记忆中表达某种信心。众所周知,他们的信心对警察,律师和陪审员对证词可能可靠性的评估产生了强大的影响。然而,众所周知,目击者的信心有时是一种识别可能准确性的极其误导的提示。以下各节检查识别信心何时对罪犯的身份以及何时可能误导了信心。
目击者的信心引起了重大兴趣,因为信心是一种易于获得的指数,有可能为刑事司法部门提供有关目击者识别响应可能可靠性的指南。Given the crucial role that identifications can play in some investigations and trials, together with the overwhelming evidence of eyewitness fallibility provided by DNA exoneration cases and experimental simulations of identification tests, knowing how much weight should be attached to witnesses’ confidence estimates is an important forensic issue.
Even prior to attending an identification test, witnesses may express a particular degree of confidence in their capacity to identify the offender, with the confident witness likely to impress police investigators. These assessments are likely to be influenced by a variety of factors such as witnesses’ evaluations of the strength of the memorial image for the offender, their recollections of the quality of view they had of the offender at the time of the crime, their perceptions of how good a recall they displayed when interviewed by the police, and so on. To date, there is no evidence to indicate that such preidentification test confidence assessments should be considered as a guide to the likely accuracy of an identification.
Factors for and Against a Confidence-Accuracy Relationship
现在,当在确定决策和识别准确性之后表达时,就有有关信心之间关系的大量文献。研究人员为识别信心和准确性之间的牢固关系提出了引人注目的论点。例如,在识别记忆理论和研究中,记忆信号强度与识别准确性和信心之间的牢固联系为期望有意义的CA关系提供了牢固的依据。此外,对犯罪者的记忆非常强烈的目击者很可能会迅速识别,并且明显的识别速度可轻松或速度,从而为信心提供了潜在的可靠提示。其他支持来自对心理物理歧视的研究,表明信心很可能会调节决策过程而不是结果。
然而,反对牢固的CA关系的争论已经更加一致地提出,这些观点通过证明了人类判断的各个领域的过度自信加强了这些观点。质疑有意义的CA关系的一些理由包括我们的(a)无法审查所有应塑造信心的因素;(b)过于专注于确认性证据的趋势;(c)将置信度的主观判断转化为某种数字置信价值的问题;(d)依靠提示信心,虽然有时是垂直的,但也可能会产生误导(例如,阵容中的面孔似乎非常熟悉,不是因为它是罪犯的,而是因为在事件的背景下看到了。以前,或证人可能会推断出阵容中最熟悉的面孔一定是犯罪者,因为他们对犯罪有很好的看法);(e)几乎不可避免地会暴露于识别后的社会影响力,从而产生可延展的信心判断。
信心准确性相关
For some time the dominant view among eyewitness memory researchers has been that postidentification confidence does not provide a particularly informative guide to the likely accuracy of an identification decision. It has been generally accepted that the CA relationship is best described as lying between weak (at worst) to modest (at best) for witnesses who make a positive identification (i.e., choosers) from either a culprit-present lineup or a culprit-absent lineup— indicated by CA correlations that seldom exceed 0.3— and virtually nonexistent (correlations around 0) for witnesses who reject either of these lineups (non-choosers). Note, however, that the correlations for choosers have been shown to be higher when, for example, (a) the encoding and test stimuli have been allowed to vary as they do in the real world, (b) stimulus encoding conditions were optimal, and (c) witnesses were encouraged to be self-aware with respect to their preidentification decision behaviors by being asked to view a video of their own identification decision before giving a confidence assessment.
尽管发现适度的CA相关性显然是可靠的,但它并未提供有关CA关系的完整图片。这需要补充置信度与识别决策结果(准确,不准确)之间的相关性,并检查CA关系的其他特征,特别是对CA校准和过度自信/不受信心的模式的检查。相关系数反映了与置信度变化相关的决策准确性的差异。For the eyewitness identification paradigm, which typically involves a witness making a single identification decision, this therefore reflects variance explained at the level of the group but is not informative about the likely accuracy of a witness’s decision accompanied by a specific level of confidence (e.g., 70% confident or 90% confident). Information about the latter is, however, obtainable by applying the calibration approach to the examination of the CA relationship and, since the late 1990s, a number of studies of the CA relationship in eyewitness identification have used this approach.
Confidence-Accuracy Calibration
在概念层面上,该过程非常简单,确定每个识别置信度(10%,20%等)的准确识别决策的比例。这为绘制校准曲线和校准,过度自信/自信和分辨率统计的推导提供了基础。对校准曲线的检查提供了直接指示与置信度不同的识别准确性水平。例如,以100%置信度做出的判断可能以85%的精度为特征。当然,完美的校准的特征是0%置信度的0%精度,10%置信度的精度为10%,直至100%置信度的精度达到100%。比较获得的和理想的校准曲线,不仅可以说明任何脱离完美校准1,由于0分别表示越来越多的自信和不受信心的正面和负面的出现)。除了校准程序提供的指南外,还具有特定置信度的标识决策的可能准确性外,它还提供了一个分辨率统计量,该统计量(例如相关系数)表明了与置信度相关的决策准确性方面的差异。
现在,许多研究将校准方法应用于目击者鉴定范式内CA关系的研究。尽管这些研究仅取样了有限的法证相关变量,而且实际上,这些变量在每个变量上都有有限的水平,但它们至少使用了几种不同的刺激材料和事件(包括中央和外围目标)(包括中央和外围目标)。已经引起了不同的正确和错误标识率,编码和测试之间的保留间隔不同(最长为1周);阵容目标和箔的相似性各不相同;并改变了阵容指令。
Studies with adult participants have presented calibration curves, for positive identification responses (or choosers), that roughly parallel the ideal calibration curve. In other words, as confidence increases so too does accuracy in a systematic manner, a pattern not suggested by the typically modest CA correlations reported in these same studies. Generally, however, the curves indicate some degree of overconfidence, with accuracy rates at the high end of the confidence scale (i.e., 90% to 100% confident) typically around the 75% to 90% level. In contrast, no such systematic patterns have been detected for participants who rejected the lineup (i.e., nonchoosers). Three other findings are also noteworthy. First, in association with confidence estimates of 90% to 100%, diagnosticity ratios— indicating the ratio of hits to false alarms—were substantially higher than for lower confidence estimates. Second, participants whose identification responses were very fast were better calibrated than those whose identifications were slow. The latter finding is to be expected given that participants with an exceptionally strong memory for the culprit should not only identify the culprit when present in the lineup, and be appropriately confident, but should also be less likely to falsely identify an innocent suspect, thereby reducing the likelihood of confident, incorrect responses. Third, there is some evidence that interventions designed to improve adults’ scaling of confidence judgments (by causing them to reflect carefully on the encoding and identification test conditions or the possibility that their identification decision could be mistaken) can reduce overconfidence and improve CA calibration.
令人鼓舞的是,还使用各种形式的面部识别范式在许多研究中也报道过类似的CA校准发现模式以前是在研究阶段提出的。具体而言,这些研究表明,在面部识别范式的绝对和相对判断版本中,对正面和相对判断版本的正面决策(但不是负面)的校准进行了强大的校准,但是随着任务难度的增加,过度自信更为明显(例如,较短的刺激刺激暴露持续时间在研究或任何一项研究或测试)。
必须强调的校准研究的一个特征是,在识别回应后立即获得了参与者证人的信心判断,从而确保他们不受任何后识别后影响的影响(例如,阵容管理员或其他证人)已知会对信心判断产生深远的影响,这与识别响应的准确性无关。因此,尽管校准研究说明了有意义的CA关系,但目击者的研究人员强烈同意,在某些延迟(例如,在法庭上)提供的置信度评估可能对识别可能准确性的准确性具有很大的误导。
并非所有使用校准方法获得的CA关系的证据都对CA关系呈正。例如,使用10至13岁儿童的样本进行的研究突出了CA校准差和极端自信,这是由准确率有时低至30%的置信度判断,其信心判断为90%至100%。此外,到目前为止,儿童在识别中的过度自信已被证明对旨在减少其的干预措施具有抵抗力。
Applied Implications
尽管在测试通过校准方法在各种法医相关条件下获得的发现的一般性的一般性方面还有很多要做的事情,但是从应用的角度来看,目前的发现至关重要。如前所述,虽然CA相关性解决了通过信心解释的群体级别差异,但校准方法提供了对具有特定置信度的特定标识的可能准确性的额外见解。可用的数据强烈表明,警察调查人员应密切关注证人在身份证明时征求的信心估计,因此不受任何社会影响。具体而言,阵容中对嫌疑人的极其自信(和快速)的认同,虽然绝不保证是准确的,但应向警察调查人员发出信号,犯罪嫌疑人是罪魁祸首,因此刺激了一个更接近的罪魁祸首寻找支持证据。但是,当犯罪嫌疑人的识别不是以极高的信心制造,并且可能是以一种繁重的方式制造的,它应该表明对犯罪嫌疑人是否是罪魁祸首的真实怀疑,并提醒调查人员,他们应该强烈考虑他们alternative hypotheses about the culprit’s identity. In contrast, investigators should not attempt to interpret the likely accuracy of witnesses’ rejections of a lineup based on the associated confidence levels. Although lineup rejections have diagnostic value with respect to the guilt or innocence of the suspects, the witnesses’ confidence levels do not assist in that diagnosis.
与基于实验模拟的这些结论相一致的令人鼓舞的是对实际刑事案件的发现的一些分析。在这项档案工作中,当针对犯罪嫌疑人有强有力的(未身份)证据(肯定没有证明犯罪嫌疑人是罪魁祸首)时,非常有信心的证人身份证明对警察嫌疑人的识别要比对无辜的阵容箔更强烈地指出。
Barriers to the Use of the Calibration Approach
校准方法在目击者鉴定中的CA关系研究中的应用显然很有价值。不幸的是,该方法更广泛地应用存在一个主要障碍。正如发表的工作所表明的那样,在目击者识别环境中使用这种方法需要极大的样本量。典型的目击者识别任务模拟了现实世界的调查:目击者观察犯罪,观看阵容并进行积极的身份或拒绝阵容。换句话说,每个参与者证人只提供一个数据点。但是,稳定的校准曲线和统计数据(对于选择器或非选择者)需要大约200至300个数据点,以进行检查。因此,现有的具有鉴定范式的已发表的研究的特征是样本量大大超过了许多实验室所能实现的实现。相比之下,新旧的面部识别范式允许进行大量重复措施,进而为每个参与者的校准统计数据推导。这个样本量问题的结果之一是,未来关于校准如何在法医相关条件下变化的研究可能会非常缓慢。
Confidence Malleability
社会影响对身份信心的影响和信心的可延展性的问题已经提到,并且在其他地方也特别讨论了这些问题。但是,这里需要对这些问题进行一些进一步的讨论,以解决对识别信心的讨论。
如前所述,经验证据表明,证人信心判断对于如果在身份识别时征求了积极识别决定的可能准确性。但是,从身份证明到审判结束时,证人可能会与警察,其他证人和律师进行各种进一步的互动,并经常在法庭上出现。尽管这些相互作用都与识别测试中指出的决策的准确性无关,但它们确实有可能显着影响该决定中任何随后的信心表达。例如,这可能意味着在法庭上表达的任何信心判断可能与实际识别测试时做出的任何信心判断都大不相同。反过来,尽管在确定决策时信心可能会说明准确性的信息,但这些随后的信心表达可能不会。
已证明会影响后识别判决的一些关键变量包括确认和脱离不一致的反馈反馈,以了解所提供的标识的准确性,例如阵容管理员或其他证人。这种反馈可能是从这些来源之一的明确口头反馈的形式,也可能涉及更微妙的言语或非言语提示。无论反馈何时以及如何提供反馈,它的影响都是为了使证人确认反馈,如果它消除信心并降低信心,就会使证人变得更加可信或可信。换句话说,可以影响信心判断但不可能的基本判断准确性的提示可以使陪审员或多或少地使证人变得可信。因此,一个错误地确定无辜警察怀疑的证人在做出身份证明时可能并不特别有信心,但在法庭上的某个阶段可能会非常有信心。正是由于这些原因,目击者研究人员在身份证明时强烈认可了对信心的任何评估的收集,因为那时信心判断对准确性具有最大信息,并且对身份信心的证明价值几乎没有信心证人可能会在法庭上表达的判决。
References:
- Brewer,N。(2006)。目击者识别信心的使用和滥用。法律和犯罪学心理学,11,3-24。
- Brewer,N。和Wells,G。L.(2006)。目击者识别中的信心准确性关系:阵容指令,箔相似性和目标基本速率的影响。实验心理学杂志:应用,12,11-30。
- Cutler,B。L.和Penrod,S。D.(1989)。目击者识别准确性和信心之间关系的法定相关主持人。应用心理学杂志,74,650-652。
- Juslin, P., Olsson, N., & Winman, A. (1996). Calibration and diagnosticity of confidence in eyewitness identification: Comments on what can be inferred from the low confidence-accuracy correlation. Journal of Experimental Psychology: Learning, Memory, and Cognition, 22, 1304-1316.
- Kassin, S. M., Tubb, V. A., Hosch, H. M., & Memon, A. (2001). On the “general acceptance” of eyewitness testimony research: A new survey of the experts. American Psychologist, 56, 405-H6.
- Keast,A.,Brewer,N。和Wells,G。L.(印刷中)。儿童在目击者识别任务中的元认知判断。实验儿童心理学杂志。
- Lindsay,D.S.,Read,J.D。和Sharma,K。(1998)。对人识别的准确性和信心:目击条件差异很大时的关系牢固。心理科学,9,215-218。
- Sporer,S。L.,Penrod,S。D.,Read,J.D。,&Cutler,B。L.(1995)。选择,信心和准确性:目击者识别研究中信心准确性关系的荟萃分析。心理公告,118,315-327。
Return to the overview of目击者记忆在法医心理学。