测试翻译和适应 - iResearchNet

用于实践和研究的心理测试的翻译和适应需要仔细注意偏见和等效性问题。彻底的翻译方法有助于减少偏差并增强测试的多语言版本的等效性。同等重要的是等价的统计验证。

等效性解决了跨文化观测和测试分数可比性的问题。Lonner描述了四种类型：功能，概念，度量和语言等效性。这些是指跨文化的行为和概念的可比性问题与测试项目特征（形式，含义结构）的问题。范德维杰（Van de Vijver）还讨论了四种类型的等效性。构造无定义是指在文化中如此不同的构造，无法比较。当量表跨文化群体测量相同的基础构造和法制网络时，就会发生构建等效性，但可能不会以相同的方式定义。使用测量单位等效性，仪器的测量尺度是等效的（例如，间隔水平），但它们的起源在各组之间是不同的。在此级别上的等价可能会限制两种语言版本的仪器的可比性。这两个版本的起源可能看起来相同（都包括间隔尺度），但是由于对所使用的响应格式（例如，李克特量表）的熟悉程度不同，这两个版本并不相同。如果两个文化群体在响应方式上有所不同（例如默许），则相同。 At the highest level of equivalence is scalar equivalence or full score comparability. Equivalent instruments at this level measure a concept with the same interval/ratio scale across cultures and the origins of the scales are similar. At this level, bias has been ruled out and direct cross-cultural comparisons of scores on an instrument can be made.

偏见对等效性产生负面影响，并指限制文化群体测试分数可比性的因素。当构造在各个文化群体之间不相同时（例如，不完整的构造覆盖范围）时，就会发生构建偏差。方法偏差可能会限制标量等效性，并且可能源于仪器的特定特征（例如差异响应样式）或其给药。项目偏见可能是由于翻译和项目配方差而造成的，并且因为在文化群体中，项目内容可能不同样相关。

使用适当的翻译程序可以最大程度地减少偏见并帮助建立等效性。国际测试委员会（ITC）发布了翻译指南，以鼓励人们关注翻译或改装工具的跨文化有效性。上下文指南强调最大程度地减少结构，方法和项目偏差，并在开始仪器翻译之前评估跨文化群体的构建体相似性或等效性。开发准则是指翻译过程本身，而管理指南提出了最大程度地减少方法偏差的方法。解释指南建议验证仪器语言版本之间的等价性。

翻译或调整测试时已经确定了两种一般方法。在应用方法中，实际上是翻译项目的。项目内容并未将其更改为新的文化背景，并且假定项目的语言和心理适当性。通过适应方法，某些项目实际上可以翻译，而另一些项目则需要修改措辞和内容，以增强其对新文化的适当性。如果对构造偏见有关注，则选择这种方法。对于这两种方法，对等效性和偏见的缺乏都很重要。在ITC指南和其他工作的基础上，应在翻译或调整测试时考虑以下内容。

双语者流利的原始语言和目标语言应执行翻译。可以使用一个人或委员会。使用熟悉目标文化的测试翻译人员，评估的结构以及评估原则最大程度地减少了可能由字面翻译产生的项目偏见。

翻译团队同意了最佳翻译之后，该措施应由其他人独立反向反译成原始语言。然后将反翻译版本与语言等效性的原始版本进行比较。如果这两个版本不完全相同，则研究人员与团队合作，通过翻译/反向翻译过程修改有问题的项目，直到达成协议就等效性达成协议为止。但是，这个过程不能保证良好的比例翻译，因为它通常以翻译版本的可读性和自然性为代价而导致字面翻译。为了最大程度地减少这个问题，应咨询语言学专家。测试说明还需要进行翻译/反向翻译过程。

一旦有两种语言版本的等效性的判断证据，就必须对翻译量表进行测试。一种方法是对双语者进行两种版本。然后可以使用统计方法比较项目响应。如果版本之间发现项目差异，则对翻译进行审查并相应地更改。此外，就传达的含义的相似性而言，可以使用一小部分双语个体从两个版本中对每个版本进行评分。然后将有问题的项目完善，直到令人满意。

一小部分参与者说的目标语言还可以提供有关每个项目的口头或书面反馈。例如，研究人员可以随机选择比例项目并提出探测问题（例如，您的回答是什么意思？）。被认为是不合理的响应被仔细检查，翻译改变了。该方法提供了有关原始项目在翻译中的含义的洞察力。另一种方法可能涉及受访者对项目清晰度和预定规模的适当性的看法。不清楚的项目或不拟合的项目已更改。最后，可以使用焦点小组的方法，其中参与者对翻译版本做出反应，并与研究人员讨论他们与项目相关的含义及其对项目的清晰度和文化适当性的看法。可以根据参与者的回答更改项目措辞。

除了提到的判断证据外，还必须执行统计方法以验证等效性和缺乏偏见。Cronbach的alpha，项目 - 统计比例的相关性以及项目的均值和变化提供了有关仪器心理测量特性的信息。例如，可靠性系数显着不同，可能表明项目或构造偏差。将这些仪器的不同语言版本的这些统计数据进行比较提供了有关等效性的初步数据。

也可以使用因子分析，多维缩放和聚类分析在尺度上测量构建，概念和测量等效性。与构建和测量单位等价相比，标量或完整得分等效性更难建立，并且各种偏见（例如，项目和方法偏见）可能威胁到这种等价水平。可以通过研究所有文化群体的项目得分的分布来找到项目偏差。项目响应理论，其中检查了差异项功能，可以用于此目的，因为方差分析（ANOVA），逻辑回归，均值（SEM）不变性分析的多组标准误差和多组均值和协方差结构分析。最后，在测量培养物的构造时，可以评估导致方法偏差的因素。

从英语转化为其他语言的心理措施有许多例子。例如，明尼苏达州多相个性库存2（MMPI-2），包括青少年形式（MMPI-A），有近20种语言可用。Myers-Briggs类型指标的多语言版本，强烈的兴趣清单，加利福尼亚心理库存16个人格因素问卷（16 pf），自我指导的搜索，Millon Clinical Multixial Contectory-III，修订了NEO人格库存（NEO PI-R），HARE，HARE还可以使用精神病清单重新介绍，贝克抑郁量清单，州特征焦虑量表和韦希斯勒智能测试。

通常，可以从测试的开发人员或分销商中访问有关翻译的可用性和心理测量特性的信息。然而，尚不清楚如何执行上述措施的翻译以及测试是否适用于不同的文化和语言环境。

如果一个人使用已转化为特定目标人群的语言的测试，但尚未针对该人群进行专门开发和规范，那么几乎没有什么可以保证项目难度和相关性，文化偏见，理解的因素的等效性。/解码和在不同文化背景下的有效性。除了语言，文化和相关性之外，甚至不能假定在适应性翻译中存在特定测试的因素结构。例如，在某些特定的文化/语言适应性中，有关NEO PI-R的5或6因子解决方案的讨论中观察到了这一点。然而，全世界的心理学家正在努力发展现有英语版仪器的文化敏感和语言准确的翻译。他们还为特定的民族和民族人口制定措施。

参考：

/Egisdottir，S.，Gerstein，L。H.，＆Qinarba§，D。C.（2007年10月9日）。跨文化咨询研究中的方法论问题：等效，偏见和翻译。咨询心理学家。从...获得http://tcp.sagepub.com/content/early/2007/10/09/0011000007305384.Abstract
Brislin，R。W.（1986）。研究工具的措辞和翻译。在W. J. Lonner和J. W. Berry（编辑）中，跨文化研究中的现场方法（第137-164页）。加利福尼亚州比佛利山庄：圣人。
伯恩（B. M.）（2004）。使用AMOS图形测试多组不变性：较少行进的道路。结构方程建模：多学科期刊，11，272-300。
Cleary，T。A.和Hilton，T。L.（1968）。项目偏差的调查。教育和心理测量，28，61-75。
Hambleton，R。K.（2001）。下一代ITC测试翻译和适应指南。欧洲心理评估杂志，第17卷，第164-172页。
Hambleton，R。K.和De Jong，J。H. A. L.（2003）。翻译和调整教育和心理测试的进步。语言测试，20，127-134。
Little，T。D.（2000）。关于跨文化研究中结构的可比性：对张和伦斯沃尔德的批评。跨文化心理学杂志，31，213-219。
Lonner，W。J.（1985）。跨文化咨询中的测试和评估问题。咨询心理学家，13，599-614。
Van de Vijver，F。J. R.和Hambleton，R。K.（1996）。翻译测试：一些实用指南。欧洲心理学家，1，89-99。
Van de Vijver，F。J. R.和Leung，K。（1997）。跨文化研究的方法和数据分析。加利福尼亚州千橡市：圣人。

参考：

也可以看看：