如果你最近在简历、对象档案、微信签名里看到 "INFP"、"ENTJ" 这种字母串,恭喜,你进入的这个赛道叫 MBTI。一个被 HR 拿来团建、被相亲群拿来筛选、被朋友圈拿来人设装修的四字母系统。
但心理学界的评价——礼貌地说——不太配合演出。
它在学界不是"有点争议",是被集体翻白眼 30 年
1991 年,美国国家研究委员会(National Research Council)发了一份报告,对各种人格测试做了检阅。关于 MBTI,他们写得相当客气但杀伤力极强:
"该测试的流行,与其被证实的科学价值不成比例,令人不安。"
更狠的评价来自人格心理学家 Robert Hogan:
"大多数人格心理学家把 MBTI 看作一个有点精致的幸运饼干。"
沃顿商学院教授 Adam Grant 写过一篇著名的吐槽,标题直接就是 《MBTI 是 nerd 版的占星术》。他亲自测过,第一次是 INTJ(冷静理性战略家),几个月后再测变成了 ESFP(派对动物)。他问的是一个很朴素的问题:到底是我在那几个月里脱胎换骨了,还是这个测试在糊弄我?
这种怀疑后来被他总结成一句更冷的话:"MBTI 的准确度大概在占星术和心电图中间,偏占星术那边。"
最硬的那一刀:5 周后你可能就换人了
心理测量学里有个基本概念叫 test-retest reliability(重测信度)——同一个测试,短时间内测两次,结果应该基本一样。一个号称能分辨 16 种"天生人格"的工具,按理说不能每次测都送你一个新身份。
Pittenger(2005)综述多项独立研究给出的数字是:间隔 5 周再测,有 39% ~ 76% 的人会拿到一个完全不同的四字母类型。维基百科引用的数字则是:9 个月内重测,只有约 50% 的人保持同一类型;超过 9 个月这个比例掉到 36%。
Myers-Briggs 官方当然不服,他们在 2018 年手册里给出的数据是:在 4 周重测里,65% 的人四个字母全对,93% 至少三个对得上,并且强调这"比随机高 8 倍"。
这里其实双方都没撒谎,但问题在于:一个分类测试,如果你每三次能被重新分配一次身份,它还适不适合被写在简历上?
2025 年,Erford 在 Journal of Counseling & Development 发了一篇 25 年 MBTI Form M 的心理测量学综述,结论微妙:内部一致性(同一次测里题目的协同性)有 0.845–0.921,确实不差;但他顺手点了名——这 25 年里,关于 MBTI 结构效度和重测信度的高质量研究,几乎是空白。
官方数据好看,第三方数据难看,学界想要的数据压根没人做。这就是 MBTI 科学性话题的真实画面。
另一刀:它测出来的根本不是"两极"
MBTI 的设计逻辑是:E 和 I 是对立的,T 和 F 是对立的。你要么这头,要么那头。理论上测出来应该是双峰分布(两个驼峰,中间少人)。
实际数据长什么样?正态分布——一个钟形曲线,大多数人挤在中间。
也就是说,一个得分 51 的"轻度外向"和一个得分 49 的"轻度内向",他们俩的真实状态几乎一模一样,但 MBTI 会把他们塞进两个命名不同、描述相反的盒子里,再告诉他们:"你们是两种人。"
难怪 Scientific American 引用的一项研究发现:大五人格在预测 37 项生活结果上,准确率差不多是 MBTI 式测试的两倍。更尴尬的是,同一篇文章里,MBTI 的预测准确度"大致落在科学和占星术中间"。
而且 MBTI 少了一个重要维度——神经质(neuroticism)。而神经质恰好是大五里预测抑郁、焦虑、职业满意度、甚至自杀风险最强的那个。MBTI 的"温柔"某种程度上正是因为它偷偷回避了所有会让你不舒服的信息。
"那为什么我测出来的真的很像我?"
因为巴纳姆效应(Barnum Effect)——人会把足够模糊、足够好听的描述自动对号入座。同样的机制让星座运势看起来很准,让塔罗牌感觉命中。MBTI 的类型描述写法,从这个角度看,和杂志上"双鱼座本周运势"的套路是一条赛道。
UMass Amherst 的心理学家 Susan Krauss Whitbourne 直接这么说:MBTI 和星座本质上是一回事,都吃的是巴纳姆效应的红利。
Scientific American 还挖到一个很有意思的数据:只有 10% 的人说自己不喜欢 MBTI 结果,而对大五的这个数字是 19%。MBTI 的用户体验更好——代价是更弱的预测力。 这就是我们喜欢它的原因:它夸你、不得罪你、给你一个能挂在胸口的标签。
那它就一无是处了吗?
也不至于。MBTI 作为自我反思的话题启动器挺好用——第一次约会、面试破冰、朋友圈自我介绍,它起到的是一个"词汇表"的作用,而不是诊断工具。问题只在于:当它被写进 HR 招聘流程、相亲筛选条件、"xx 型请勿打扰" 时,它承载了自己承载不起的决策权重。
知乎有句话总结得不错:与其说 MBTI 的维度本身有问题,不如说它这种思辨式的建构方式,不符合当代心理测量的科学标准。 它是 1940 年代两位没有心理学博士学位的女性基于荣格理论的尝试——放在那个年代算有勇气,放在 2026 年的 HR 系统里就有点尴尬。
你也可以来我们这里玩一圈
如果你看腻了四字母、想换一套不装科学但同样能聊出东西的坐标系,可以试试我们的 SBTI 人格测试——15 个维度 29 种类型(外加一个隐藏款),我们从来没说自己是学术标准,但至少我们没把"心理测量学"三个字印在脸上。
想看性别换了之后你会变成谁,试 GSTI 性转人格测试。想看你这颗脑子在互联网上变成了什么东西,试 赛博基因检测。
测试的意义在于你愿意多看自己一眼,而不是测试本身多么神圣。MBTI 的问题不在于它好玩,而在于它被好多人当成了圣经。幸运饼干可以吃,但别拿它填人生志愿表。
本文是心理学科普和自我观察材料,不构成医学、心理咨询或诊断建议。