罗夏测验在中国的发展 | 研究速递

作者： 蒋艳华冯妮·达米蒂·胡塔加隆 在线发表日期： 2021年3月18日 https://doi.org/10.1027/1192-5604/a000140

摘要本文尽可能全面地总结了罗夏测验在中国的发展和研究现状。罗夏测验在中国的发展可以分为两个阶段：起步阶段和发展阶段。起步阶段的研究主要有：罗夏测验的引入和本土化、对精神分裂症的研究，以及智力与人格的测量。发展阶段的研究主要有：罗夏测验的推广和本土化、变量、指标和衍生量表的研究、临床心理学应用、人才测评、与眼动技术的结合、团体罗夏墨迹测验，以及综述研究。本文还根据罗夏测验在国内的发展和现状，总结了现有研究取得的成果和存在的问题，并对未来在中国研究罗夏测验提出了展望。

本研究回顾了罗夏测验引入中国后国内开展的各项研究，总结了研究成果和存在的问题，并提出了今后在中国研究罗夏测验的方向。在张雨（2016）观点的基础上，我们把罗夏测验在中国的发展分为起步阶段和发展阶段。起步阶段，罗夏测验被引入中国，研究者开始进行系统研究。发展阶段，罗夏测验的引入逐渐增多，相关研究也开始多元化。

罗夏测验的起步阶段（20世纪40年代至2000年）

罗夏测验的引入和本土化

罗夏测验传入中国，最早要追溯到20世纪40年代和50年代的凌敏猷、龚耀先和罗传方。他们做了一些初步研究，比如研究贝克系统、尝试建立国人常模等，但此后二十年里，罗夏测验没能继续发展（Exner，2001/2013b）。1985年，龚耀先等人重新开始建立常模，选用了综合系统（CS），到1987年初步建成了常模（Exner，2001/2013b）。接着，龚耀先等人在1991年出版了《罗夏测验手册》。此外，凌文辁和滨治世（1988）在《心理测验法》一书中全面介绍了克洛普弗系统，袁军翻译的《心理诊断法》也在1997年出版（Rorschach，1921/1997）。

陈明等人（1997）收集了666名中国健康成年人的综合系统数据，并与美国1990年的常模数据做了比较。结果显示，美国样本在多个变量上的得分高于中国样本，这些变量包括Zf、Blends、W、S、M、m、FC、CF、WSumC、T+V+Y+C'、H、(H)、(Hd)、Ad、INCOM、AG和MOR，而F、A、An和PSV的得分则低于中国样本。这些差异都具有统计学意义（p < .01）。

对精神分裂症的研究

李丽（1987）报告了慢性精神分裂症患者的罗夏测验特征。李绍贵和龚耀先（1988）比较了精神分裂症组和对照组的差异。分析发现，精神分裂症组出现了许多与精神障碍有关的回答，他们的知觉准确性也低于对照组。李秋香（1986）根据罗夏测验的知觉理论，指出精神分裂症的知觉和思维障碍与知觉或中介的扭曲有关。她还和同事发现，精神分裂症组在F+%、M、Ma、FM和FC等变量上的得分低于对照组，差异显著（李秋香等，1989）。李丽英等人（1993）指出，神经症组比对照组有更多情绪不稳和性格内倾的表现。王斌等人（1993）描述了精神分裂症、抑郁症和躁狂症患者的罗夏测验特征，发现这三组在多个变量上差异显著，这些变量包括R、P、W、M、H、Sx、F+%、X+%、X-%、Afr、Zf、Zd、D分数、S-CON、DEPI、SCZI（p < .01）。陈天宁（1999）比较了13到15岁精神分裂症患儿和对照组的罗夏测验结果。均数比较显示，精神分裂症患儿的总测验时间、F+%（各年龄段均如此），以及13岁组的S、M、Fc、Clob、F%，14岁组的D、F、Hd、Ad，15岁组的FM、Ad等变量得分都显著低于对照组儿童。频数分析显示，精神分裂症患儿在M、H（13岁组）、EC、Ad（14岁组）以及FM、Ad（15岁组）等变量上得分显著低于对照组。两种分析都表明，15岁精神分裂症患儿在Dd变量上的得分显著高于对照组儿童。蒋宏斌等人（2000）分析了精神分裂症患者的罗夏测验特征，发现他们联想能力丰富但整合能力弱，局部知觉增强，M反应多，色彩反应少，经验类型偏内倾，形状质量差，辨识现实的能力受损，而且在情绪受到刺激时反应不佳。

智力与人格的测量

胡赤怡和龚耀先（1989）用罗夏测验和艾森克人格问卷（EPQ；龚耀先，1983）测量了作家和数学教师的人格差异。结果显示，作家在R、H/R、Isolate/R、AG/R、内容类别数、Id/R、Zsum/Zf、M/R、FM/R、m/R、C'、CF'以及Blends/R等变量上的得分高于数学教师，而在首次反应平均时间、Hd/H、Zf/R、FC/R和F/R上的得分低于数学教师。这些差异都具有统计学意义（p < .01）。朱心峰和龚耀先（1995）对罗夏测验和韦氏成人智力量表中图像订版（龚耀先，1982）进行了相关研究。结果表明，变量R、W、DQ+、DQv/+、DQo、M、Zf、Zsum、EA、Blend、CS、X+%和F+%与智力存在正相关（r = .32–.62），而X-%与智力存在负相关（r = -.35）。吴艳红等人（1998）对大学生使用罗夏测验和EPQ，发现外向组和内向组在罗夏测验上存在显著差异，这表明罗夏测验能够区分不同的人格特点。郭庆科（1999）对综合系统和16PF（朱宝龄、戴忠恒，1988）做了比较研究，结果显示多个罗夏变量与16PF之间存在显著相关（r = -.4–.4）。

罗夏测验的发展阶段（2000年至今）

罗夏测验的推广和本土化

从2000年起，徐光兴在研究生课程中教授罗夏测验（马惠霞，2016）。他还在自己的著作《跨文化适应的留学生活——中国留学生心理健康与援助》（2000）和《临床心理学——心理健康与援助知识》（2001）中介绍了罗夏测验，并报告了一些罗夏测验案例。

孟宪璋在《实用心理测验》（解亚宁、戴晓阳，2006）中介绍了勒纳防御量表（LDS），在《心理评估》（姚树桥，2007）中介绍了综合系统。同时，他还翻译出版了两本书：《罗夏测验综合系统工作手册》（Exner，2001/2013b）和《罗夏测验解释入门》（Exner，2000/2013a）。任滨海（2007）对攻击性内容（AgC）的本土化做了研究，编制了一个包含60个内容的中国版AgC列表，信度很好。李婷玉（2016）按照综合系统的要求，收集了广东省326名健康成年人的数据，建立了广东省成年人罗夏测验常模。结果显示，这个常模的信度良好到优秀（重测信度和评分者信度的组内相关系数分别为.44至.98（DQv和Hx除外）和.51至1.00），内容效度和效标效度也较好。熊敏（2014）比较了中国、以色列和美国的罗夏测验样本，何海波（2015）比较了中国、美国和日本的样本。这两项研究都表明，罗夏测验存在显著的文化差异，因此需要有适合当地文化的常模。

其他出版物包括杨东和吉沅洪的《实用罗夏墨迹测验》（2008），以及孔德生和李艳秋的《罗夏墨迹测验：综合系统的临床应用研究》（2013）。同时，从2010年起，清华大学多次邀请国际罗夏与投射方法学会理事布鲁斯·史密斯举办罗夏测验高级培训课程（马惠霞，2016）。

变量、指标和衍生量表

刘国华和孟宪璋（2003）总结了攻击性变量的研究，指出了研究中存在的一些问题。他们还修订并建立了一个包含12个攻击性变量的新框架，这12个变量是：AG、MOR、AgC、AgPot、AgPast、主动攻击（AAg）、被动攻击（PAg）、外显攻击（OAg）、内隐攻击（CAg）、攻击情绪（AgE）、心理伤害（Mh）和身体伤害（Ph）（刘国华、孟宪璋，2007b）。他们在服刑人员和大学生样本中检验了这个新框架的信度和效度，并探讨了EPQ与新攻击性变量的相关。分析显示，评分者一致性较好，但效度和相关性还需要进一步研究（刘国华、孟宪璋，2007a，2007b）。严文华和孟宪璋（2007）再次检验了这个新框架，结果表明AgC、AgPot、AgE、Mh和攻击总分与简明精神病评定量表（BPRS）的敌意因子显著相关，而且AgC和攻击总分在BPRS敌意因子高分组和低分组之间差异显著。刘秀菊（2006）研究了MOR、AgPast和受损的客体关系，发现MOR和AgPast与抑郁和自杀有关。应贤慧（2006）考察了五个攻击性变量（AgPast、MOR、Ag、AgC、AgPot）和A型行为类型问卷的关系。研究发现，A型行为组在Ag变量上的得分显著低于非A型行为组（p < .01）。因素分析显示，攻击性变量可以分为三个因子：指向客体的攻击（AgPast、MOR）、被攻击的对象（Ag、AgC）和潜在攻击（AgPot）。

李丹丹（2007）在服刑人员样本中研究了Ag和AgC。结果表明，AgC有较好的实证效度，Ag与MMPI的Pd量表得分负相关，AgC与Pd量表得分正相关。姜永华（2006）用罗夏测验研究儿童的攻击行为，认为国外学者提出的攻击性变量在测量中国儿童攻击行为方面也有一定价值。王春芳（2006）检验了AgC的效度，报告其信度很好（Cohen's k = .87）。AgC能区分高攻击组和低攻击组，而且大学男生的AgC得分显著高于女生。

余萍（2008）对抑郁指数（DEPI）的研究表明，该指数的信度可以接受（Cohen's k > .70），且能有效区分抑郁症患者和健康人。洪伟（2008）比较了抑郁症患者治疗前后的DEPI，发现治疗后DEPI得分显著降低，这为DEPI具有一定的实证效度提供了支持。姜永华等人（2015）也使用DEPI测量大学生的抑郁情绪，发现DEPI可以测量抑郁。孙茗（2011）研究了DEPI和应对缺陷指数（CDI），结果表明DEPI和CDI的κ系数可以接受，使用CDI能为DEPI带来增量效度，提高诊断准确性。李秀丽（2007）对自杀星座（S-CON）进行了研究，结果显示S-CON的所有变量都有足够的评分者一致性，S-CON在识别抑郁症患者以及有自杀观念和行为的个体方面有价值。

刘红霞（2009）研究了自我中心指数（Ego），探讨了正常、抑郁和躁狂样本中Ego、MOR与自尊量表（SES）和内隐联想测验（IAT）的关系。结果没有支持Exner关于高Ego与高自尊相关的观点，但表明MOR可以反映外显自尊，也就是说，MOR低的人外显自尊高。唐玉春（2011）检验了自我损伤指数（EII-2）的信度和效度，发现EII-2的评分者信度可以接受，而且EII-2能区分精神障碍患者和对照组，还能区分不同严重程度和类型的精神障碍。吴晓玲（2013）检验了EII-2和罗夏述情障碍量表（RAS）的信度和效度。结果如下：（1）EII-2评分者信度很好，具有一定的区分效度；（2）RAS评分者信度很好，但效度还需要进一步研究和验证。孟宪璋和李婷玉（2015）研究了精神分裂症患者和对照组在EII上的差异，结果显示与对照组相比，精神分裂症患者的自我功能受损严重，EII能区分精神分裂症患者和对照组。

陈亚兴（2007）检验了LDS的信度和效度，小样本研究结果表明信度和效度较好。不同人群有不同的防御机制，LDS可以作为临床诊断的辅助工具。此外，彭红军等人（2008）指出，自主性互惠量表（MOA）的信度和效度可以接受。唐洁（2004）的研究也表明，MOA能区分健康人和患者，特别是低水平的客体关系。

蔡成后和申荷永（2007）对大学生罗夏自我概念变量进行了研究。结果显示，自我概念变量的信度可以接受，能较好地测量自我概念。通过因素分析，这些变量被分成四个因子：内省[（2）、FD、Hd+(H)+(Hd）]，积极关注（Fr+rF、Ego），现实感[H：Hd+(H)+(Hd）、H、SumV、An+Xy]和消极关注（MOR）。

秦美蓉等人（2015）探讨了精神分裂症患者在压力相关罗夏变量上的性别差异。结果显示，在CDI、D、es、Adjes、m、SumY、FM+m、SumC'+SumT+SumV+SumY和L等变量上存在显著的性别差异。

陈欣欣和周圆（2007）通过文献综述探讨了罗夏测验的结构效度，并介绍了罗夏评定量表（RRS）及其应用。郭庆科等人（2007）将RRS与一些罗夏自我概念变量做了相关分析，结果表明变量（Pure H、H%、An+Xy和Sx）可以测量健康人的自我概念。王艳红等人（2009）发现，罗夏测验中的人际关系变量与RRS中的人际关系指标之间存在显著相关。

临床心理学

刘军（2001）用综合系统评分和解释了两个中国案例，探讨了它在临床心理学中的应用。王雪芹（2009）报告了一个海洛因成瘾者的罗夏测验案例。齐亚菲（2010）将SCL-90和情绪实验与临床个案研究相结合，探讨了罗夏测验的心理诊断效度。结果表明，罗夏测验在临床心理诊断和评估中是有效的。屠雯静和袁军（2010）采用个案研究结合半结构访谈的方法，指出罗夏测验与其他诊断方法相比有明显优势，是诊断大学生情绪障碍的一种独特而有效的工具。

钟慧等人（2007）用罗夏测验探讨了注意缺陷多动障碍（ADHD）儿童的特征和可能的投射机制。结果显示，ADHD儿童在Zf、COP、3r+2/R、Zd、X+%和Sum6等变量上的得分低于对照组儿童，而在AG、Lambda、Sum Shading、X-%、SCZI、DEPI和CDI上的得分高于对照组（p < .05），而且罗夏测验能投射出ADHD儿童内心世界的一些特征。此外，张宁（2008）发现，儿童心理适应状况不同，他们在一些罗夏变量上也会表现出显著差异，比如适应良好的对照组儿童反应数R更低，平均反应时间更短，人类解剖回答更多，人类解剖回答的比例也更高。

陈欣欣（2008）检验了罗夏测验在心理健康评估中的效度。结果支持了罗夏测验在临床心理健康背景下的有效性。张楠（2013）用罗夏测验测量成人依恋。结果表明，男性的焦虑水平低于女性。她还建立了一个成人依恋的结构方程模型。模型中代表焦虑维度的变量有CF、颜色-阴影混合、Y、m、Food和T>1。代表回避维度的变量有FM、Mp、Hum con、p、MOR、Cg、(Hd)+(Ad)+(H)+(A)、(Hd)+(Ad)+Hd+Ad和T=0。该模型有较好的信度、结构效度和效标效度。蔡成后等人（2014）探讨了罗夏测验激活情结的特征及其在临床实践中的应用。研究发现，罗夏图片能激发更多的消极情绪，与之相关的同类情结表现具有明显的激活情结特征。

人才测评

王万里（2008）通过比较罗夏测验、面试和16PF，证实了罗夏测验在人事测评中的有效性以及它在选拔人才方面的潜力。郭庆科等人（2009）研究了罗夏测验在人员素质评估中的有效性。结果表明，罗夏测验能够测量信息处理能力、情绪管理能力、自我认知能力和人际沟通能力。曲春晓（2010）也使用罗夏智力变量（F+、Fo、Fu、F-、Ab、Art、Ay、F）来评估企业员工的智力，结果表明罗夏测验能弥补传统智力测验的不足，是企业管理者评估员工智力的有用工具。李鑫（2010）综合了罗夏测验的相关研究，回顾了争议，并讨论了罗夏测验在人才测评中的问题和实际价值。

与眼动技术的结合

张德玄等人（2009）用眼动技术检验了罗夏测验的客观性。结果显示，10张图片的首次反应时间、注视次数和平均注视时间均存在显著差异。张新波（2011）证实，抑郁个体和非抑郁个体在眼动指标上存在显著差异；同时，在黑白和彩色两类图片上，平均注视时间、轨迹图和热点图也存在显著差异。李军和贾凤芹（2014）比较了抑郁症患者和对照组在反应阶段的眼动特征。结果显示，抑郁症患者的注视次数、总注视时间和眼跳次数都显著低于正常对照组（p < .05），而抑郁症组的平均眼跳幅度显著大于对照组（p < .05）。邹璐和贾凤芹（2014）研究了不同认知风格被试观看罗夏图片时的眼动特征，结果也表明场独立型和场依存型被试之间存在明显差异。

团体罗夏墨迹测验

日本学者高桥雅春在经典罗夏测验基础上发展了团体罗夏测验（GRIT），并建立了标准化常模（李敏，2001）。在中国，关于GRIT的研究主要有两项。李敏（2001）研究了中国样本中GRIT的诊断标准和信度。结果表明，中国和日本样本之间没有显著的文化差异，在此基础上，研究者提出了中国的诊断标准。曲琛（2007）修订并开发了新的GRIT，并在青少年样本中进行了检验。结果显示，新GRIT具有重测信度、评分者一致性、会聚效度和实证效度。

综述

还有一些相关的文献综述和元分析。例如，郭庆科和孟庆茂（2003）总结了罗夏测验在西方的发展历史和研究现状，肯定了它的价值，并根据前人研究提出了一些问题。丛中（2009）通过了解罗夏测验的发展历史、实施过程并分析存在的问题，促进了对罗夏测验更加公正客观的认识，以及它在人格测验、心理咨询等临床心理学领域的应用。孔德生等人（2015）基于国外研究，总结了罗夏测验中“装好”和诈病反应的研究，指出该研究仍处于初步阶段，有必要进一步研究并建立专门的装好和诈病量表。

李艳秋等人（2014）使用元分析方法，将18项正常成人样本的罗夏综合系统研究结果与Exner（2005）的16国常模进行了比较。结果表明，综合系统的113个变量中，有23个变量在16国联合样本和Exner常模之间存在显著差异。他们认为Exner常模存在一定偏差和偏好倾向。

总结与未来展望

本文全面总结了中国罗夏测验的研究情况。上述研究成果表明已经取得了一些成绩：

国内研究者在罗夏测验的普及和本土化方面做了很多工作。一些书籍出版或翻译引进，部分高校在课程中教授这一测验（包括一些培训）。在建立中国罗夏测验常模方面，也做了一些探索性的工作，并取得了一定成果，比如初步建立了广东省常模。
国内研究者还围绕罗夏测验的理论和应用开展了大量研究，包括信度和效度、各种指标（变量、指标和衍生量表），以及临床和管理等领域的应用。
国内研究者将新技术应用到了罗夏测验的研究中，比如眼动技术和团体罗夏测验。这表明中国的罗夏测验在不断发展。

但是，也存在以下几个具体问题：

虽然对罗夏测验本土化做了一些尝试，但仍处于起步阶段，有些只是区域性工作，距离全国常模还有很长的路要走。
临床应用的研究和经验还不足以支持有说服力的结论。临床研究主要集中在精神分裂症上。有关测验本身和各项指标信度与效度的数据还不够充分。研究多属探索性质，涉及的领域也较少。
研究还没有与国际接轨，大部分是综合系统的研究，而西方国家已经发展了新的罗夏测验系统。
缺少专门研究和应用罗夏测验的机构。在中国甚至没有权威机构能购买到正版的罗夏图片和参考书。

今后的工作应包括：

更广泛地推广罗夏测验。与国际接轨，在高水平大学定期举办罗夏培训课程，邀请海外权威专家培训，更新罗夏测验最新方法（如R-PAS）。应建立中国罗夏协会，定期研讨和探索罗夏测验，引进正版图片和参考书。在引进国外计算机辅助罗夏软件的基础上，开发中文版软件，并着手建立中国罗夏测验常模。
进一步研究整个测验和各种罗夏指标，提高罗夏测验的信度和效度。应开展更多的临床应用研究。罗夏测验在临床测量、心理咨询、精神障碍诊断与治疗以及人事管理等方面都是一个有价值的工具。因此，国内研究者和临床工作者应更加重视罗夏测验的应用，帮助它成为真正有用、有价值的工具。同时，也可以继续探索罗夏测验在新领域的应用。
随着新技术的发展，罗夏研究与这些技术的结合将得到重视，比如脑电技术、眼动技术和元分析等。

总结

本文全面综述了罗夏测验在中国的发展和研究现状。作者收集了国内有关罗夏测验的文献，通过阅读和分析文献撰写了本文。罗夏测验传入中国可追溯到20世纪40年代和50年代的凌敏猷、龚耀先和罗传方。罗夏测验在中国的发展可以分为起步阶段和发展阶段两个阶段。起步阶段（20世纪40年代至2000年），罗夏测验被引入中国，研究者开始进行系统研究。文章主要介绍了以下领域：罗夏测验的引入和本土化、对精神分裂症的研究，以及智力和人格的测量。发展阶段（2000年至今），罗夏测验的引入逐渐增多，相关研究开始多元化。文章从以下几个方面进行了介绍：罗夏测验的推广和本土化、变量、指标和衍生量表、临床心理学、人才测评、与眼动技术的结合、团体罗夏墨迹测验，以及综述研究。最后，作者总结了现有研究取得的成果和存在的问题，并对未来在中国研究罗夏测验提出了展望。

当前研究中存在的问题主要有：

对罗夏测验的本土化和建立常模的工作仍处于起步阶段，有的只是区域性工作，距离全国常模还有很长的路要走。
临床应用的研究和经验不足以支持有说服力的结论。临床研究主要集中在精神分裂症上。有关测验本身和各项指标信度与效度的数据还不够充分。研究多属探索性质，涉及的领域也较少。
研究还没有与国际接轨，大部分是综合系统的研究，而西方国家已经发展了新的罗夏测验系统。
缺少专门研究和应用罗夏测验的机构。在中国甚至没有权威机构能购买到正版的罗夏图片和参考书。

注：罗夏墨迹测验的中文专业术语尚未有统一标准，更准确的阅读请参考原文。