很多“心理测试”一上来就问:“你是否常常在命运的裂缝里感到灵魂被理解?”看起来很深,实际上很难回答。
好问卷不是把题目写得像心理学。好问卷要让不同人在相似理解下作答,让同一个人在相近状态下重复作答时不至于乱跳。
题目要具体
“我很有责任感”听起来简单,但每个人理解不同。有人觉得按时交作业是责任感,有人觉得照顾家人是责任感,有人觉得不背叛朋友才是责任感。
更好的题目会落到行为:“我会在截止日期前完成答应别人的任务。”它仍然不完美,但比抽象品德更可回答。
问卷测的不是诗意,而是可比较的回答。越具体,噪音越少。
题目要中性
“我懦弱地逃避冲突”不是好题目,因为“懦弱”已经在骂人。被骂的人会防御,防御之后答案就不可靠。
中性题目可以写成:“当我预期谈话会引发冲突时,我倾向于推迟表达自己的想法。”这句话不羞辱人,只描述行为。
娱乐测试可以更有风格,但如果想保留一点测量价值,也应该避免让题目直接替用户下判决。
不要一题测三件事
“我喜欢社交、讨厌孤独,并且经常主动组织聚会。”这是一道坏题。因为一个人可能喜欢社交但不爱组织,也可能讨厌孤独但不主动。
这种题叫双重或多重问题。用户不知道该按哪一部分回答,结果自然会混乱。
好的题目一次只测一个点。听起来不华丽,但靠谱。
选项也很重要
很多测试只有“是/否”,这会强迫中间状态的人乱选。人格特质通常是连续的,所以 Likert 量表更常见,比如从“非常不同意”到“非常同意”。
但选项太多也会增加负担。对互联网测试来说,五点或七点通常已经足够。关键是每个选项含义清楚,不要让用户猜。
信度和效度不是装饰词
信度问的是:测量稳不稳?效度问的是:你到底有没有测到你说自己在测的东西?
一份问卷可以很稳定但没效度,比如每次都稳定地测到用户今天饿不饿;也可以看起来很有洞察但不稳定,每次结果都像抽签。
严肃量表需要数据验证。娱乐测试不一定需要完整验证,但至少应该诚实告诉用户:这不是临床测评。
jiligulu 怎么看这件事
本站的很多测试是互联网表达工具,不是心理诊断工具。我们会尽量让题目清楚、有趣、有边界,但不会假装它们拥有临床量表的证据。
好问卷的底线不是“显得很懂你”,而是尊重用户:让问题可回答,让结果不越界。
本文是心理学科普和自我观察材料,不构成医学、心理咨询或诊断建议。