IQ测试也有“硬伤”
2015年01月16日 来源:科技日报 作者:基思·E·斯坦诺维奇
IQ测试一直是微信朋友圈中一个长盛不衰的主题。也许在完成某个不太靠谱的IQ测试,并晒出得分后,你会被“智商不够是硬伤”的评论击中。但最近,研究者告诉我们,其实。
下面这篇文章来自基思·斯坦诺维奇,他认为传统的IQ测试中并没有涉及会影响在现实世界中做决定的某些重要部分,一些在IQ测试中分数很高的人,有可能会有被认为存在理性障碍的逻辑思考缺陷。也许那些专业的心理学名词不好理解,但认真思考一下作者在文中提出的测试问题,也是一次不错的脑力体操。
毫无疑问,你肯定认识几个IQ超高、却连连做出错误决定的家伙。这类人的行为告诉我们,“智商包含了所有认知能力”这种想法让我们遗漏了一些东西。
传统的IQ测试中并没有涉及会影响在现实世界中做决定的某些重要部分。在IQ测试中分数很高的人有可能会有被称作理性障碍的逻辑思考缺陷。
产生理性障碍的一个原因是人们趋向于认知吝啬(cognitive misers)——当试图解决问题时,他们采取简单的方法,而这常常会导致错误的解决方案。另一个原因是“智力构件”缺陷(mindware gap),出现在当一个人缺少理性思考所需的特定知识、规则或策略时。
我创造出“理性障碍”这一名词(与“阅读障碍”类似),它指的是尽管拥有足够的智商,但却无法理性地思考与行动;旨在提醒人们注意,认知生活中有很大一部分是IQ测试无法衡量的。
——认知吝啬——
你是“认知吝啬”者吗
认知心理学几十年的研究表明,理性障碍有两种起因。一是过程问题,一是内容问题;对于这两者人们已经了解了很多内容。
过程问题的产生是因为我们倾向为认知吝啬者。当解决一个问题的时候,我们能够从几种认知机制中做出选择。其中一些机制需要更高的计算能力,帮助我们更为精确地解决许多问题,但它们速度慢,要求注意力集中并且与其他认知任务发生干扰。人类是认知吝啬的,因为我们的本能就是默认选择那些需要更少计算的过程机制,尽管它们没那么精准。
你是一个认知吝啬者吗?想想下面的问题吧:
杰克看着安妮,安妮看着乔治。杰克已婚而乔治未婚。那么是否有一位已婚人士看着一位未婚人士?
A)是的
B)不是
C)不能确定
超过80%的人会选择C,但正确答案是A。以下是进行逻辑思维的过程:安妮是唯一一个婚姻状况未知的人。你需要考虑两种可能的情况——已婚或者未婚,来确定你是否有足够的信息得出结论。如果安妮已婚,那么答案是A:已婚的安妮看着未婚的乔治。如果安妮未婚,那么答案依旧是A:这种情况下,已婚的杰克看着未婚的安妮。我们称这种将所有可能性考虑进去的思维过程为完全析取推理(fully disjunctive reasoning)。在问题中并没有说明安妮的婚姻状况,这向人们表明他们没有掌握足够多的信息,于是答题者没有考虑到所有情况就做出了最简单的推断(C)。
对于大多数人来说,当被明确告知需要进行完全析取推理时,他们会这么做的(比如上题中没有“不能确定”这个选项)。但是大多数人不会自动去进行这个思考过程,而是否进行完全析取推理的倾向与智力没有多少关系。
个人偏见:认知吝啬的另一个特征
认知吝啬者的另一个特征是“个人偏见”——以自我为中心思考问题的倾向。在2008年的一项研究中,我和我同事向一组被试者提出了以下思考题:
假设美国交通部(Department of Transportation)发现:某款德国车在车祸中对其他车内人员造成死亡的概率是一般典型家庭轿车的八倍。联邦政府正在考虑限制这款德国车的销售和使用。那么请回答以下两个问题:你认为在美国是否应该禁止这款德国车的销售?你认为是否应该禁止这款车在美国街道上行驶?
接着我们换了一个陈述方式,向另一组被试者提出这道思考题——与之前美国交通部的真实数据一致,但车祸死亡率增高的不是德国车,而是一款美国车:
假设交通部发现:福特探险者(Ford Explorer)在车祸中对其他车内人员造成伤亡的概率是一般典型家庭轿车的八倍。德国政府正在考虑限制福特探险者的销售和使用。那么请回答以下两个问题:你认为在德国是否应该禁止福特探险者的销售?你认为是否应该禁止这款车在德国街道上行驶?
我们发现,在我们测试的美国被试者中,当要禁止的是德国车在美国的使用时,支持率是相当高的:78.4%的人认为应该禁止该款车的销售,73.3%的人认为不应该让这款车上路。但对于在德国是否应该禁用美国车的问题,被试者的回答有了明显的不同:尽管问题中陈述的美国车有着和德国车同样不好的安全记录,只有51.4%的人认为应该禁止销售,仅有39.2%的人认为在德国不应该让这款美国车上路。
这项研究表明,当评估一种状况时,我们总是倾向于从自我的角度出发。我们带着个人偏见去权衡已有的证据、进行道德判断,这就常常导致理性障碍的发生,而理性障碍是独立于可测量的智力之外的。在对认知吝啬者的其他趋势的研究中,情况同样如此,比如属性替代(attribute substitution)和错误联接(conjunction errors),它们与智力的关系即便有也非常微弱,而传统的智力测试基本上没有对它们进行测量。
——智力构件缺陷——
“智力构件”缺陷也是“硬伤”
理性障碍的另一个原因是知识储备不足。我们需要获取专项的知识来进行理性的思考和行动。哈佛大学认知科学家戴维·帕金斯(David Perkins)创造了名词“智力构件”(mindware),指的是理性思考时需要从记忆中提取规则、数据、程序、策略以及其他认知工具(如关于概率、逻辑以及科学推理的知识)。如果这些知识缺失,就会造成“智力构件”缺陷——而这恰恰又是典型的智力测试没有测量的部分。
智力构件的一个方向是概率思维(probabilistic thinking),这是能够被测量的。在继续阅读之前试着回答以下问题:
假设XYZ病毒性综合征是一种严重的疾病,患病率是千分之一。同时,假设诊断该疾病的测试方法总是能够正确地指出患病之人确实患有此病。最后,假设该测试方法偶尔会误诊,将一个健康之人判断为该病患者。这种假阳性率是5%,意味着该测试错误地将一个健康之人判断为该病患者的概率是5%。
接着我们随机选择一个人并执行该测试,测试结果为阳性:即患有XYZ病毒性综合征。假设我们对于这个人的病史一无所知,那么该人确实患有XYZ的概率是多少?(将结果用0—100%的百分数表示)
最为常见的答案是95%——但这是错误的。人们常常忽略整个题目第一部分的陈述——千分之一
的人会患有XYZ综合征。如果其余没有患病的999人被测试,那么根据5%的假阳性率,这意味着在他们之中大约有50人(0.05×999)将被测试出患有XYZ。因此,每测试出阳性的51个病人中,只有一个人是确实患有XYZ的。由于患病率相对较低而假阳性率相对较高,大多数测试呈阳性的人都没有真的患病。那么这个问题的答案,一个测试呈阳性的人真正患有XYZ综合征的概率是1/51,大约是2%。
科学思考能力可以轻松测量
智力构件的另一个方向——用科学思维思考的能力,同样也是标准的智力测试缺失的,但它同样可以被轻松地测量。比如下题:
进行一项试验来检测某一新型治疗方案的功效。结果总结记录如下:
200名患者进行了治疗,有了好转;75名患者进行了治疗,没有好转;50名患者没有进行治疗,有了好转;15名患者没有进行治疗,没有好转。
在继续阅读之前,用是或否来回答这个问题:这种治疗方案有效吗?
大多数人会回答“是”。他们将注意力放在进行治疗并且情况好转的大量病人上(200),此外还有一个事实是,在这些接受治疗的病人中,情况好转的人数(200)多于没有好转的人数(75)。由于好转的概率(275人中200人好转,200/275=0.727)看起来很高,所以人们倾向于相信这种治疗方案起了作用。但是这里有一个科学性错误:没有考虑对照组,甚至有的医生也会犯这样的错误。在对照组中,没有进行这项治疗的人也有发生好转的情况,这种可能性(未进行治疗的65人中50人好转,50/65=0.769)甚至高于进行治疗后好转的可能性,这表明被测试的治疗方案完全没有效果。
假设检验:四卡片选择
还有一个智力构件问题是关于假设检验的。正如英国伦敦大学学院(University College London)彼得C·沃森(Peter C. Wason)展示的,假设检验也能够被可靠地测量,但它同样也是IQ测试缺失的部分。在继续阅读之前,试着解决下面这个“四卡片选择”难题:
如图,桌上有四张卡片。每张卡片的一面是数字,另一面是字母。两张卡片是字母面向上,另外两张是数字面向上。如果要证明规则“对于这四张卡片,若字母面为元音,数字面是偶数”的正确性,你的任务是决定需要翻开哪张或哪几张卡片才能验证该规则的真伪,并指明哪些卡片是要被翻开的。
大约有一半人选择翻开卡片A和8:一个元音字母向上的卡片来看它的背面是否是偶数,一个偶数向上的卡片来判断它的背面是否是元音字母。另外20%的人选择只翻开卡片A,另外20%的人选择翻开其他错误的组合。这意味着90%的人都给出了错误答案。
让我们来看看人们在哪里陷入了困境。对于字母卡片是没有问题的:大多数人正确地选择了卡片A。困难在于数字卡片:大多数人错误地选择了卡片8。为什么选卡片8是错误的呢?再读读规则:题目说,若字母面为元音,数字面是偶数。但它没有说如果数字面是偶数,那字母面就一定是元音;也没有说一个辅音字母的背面一定是什么样的数字。(因为没有规定关于辅音字母的情况,那么就没有必要去看K的背面是什么)?因此,如果看到卡片8的背面是一个辅音字母,这无法说明规则是真还是假。与此相反,大多数人都不会选择的卡片5是非常关键的。卡片5的背面可能是一个元音字母。如果是这样,那么规则就是假的,因为这意味着并不是所有元音字母的背面都是一个偶数。总之,为了验证该规则为真,卡片5是一定要翻过来的。
当被要求要去证明一件事情的真伪的时候,人们倾向于将注意力放在确认规则而不是证伪规则。这就是他们将卡片8翻过来的原因——通过观察背面是否是一个元音字母来确认规则;而卡片A,就观察背面是否是偶数。但是如果人们进行科学的思考,就会找到证伪规则的方法——这种思维模式会立刻提醒你卡片5与规则的相关性(在它背面可能是一个未经确认的元音字母)。寻找能够证伪的证据是科学思考的一个关键元素。但对于大多数人来说,这种智力构件要经过培训才能成为第二本能。
——减小“智力”的范畴——
将智力从理性中分离出来
IQ测试并不能测量人所有的关键能力,这一观点并不新鲜;这么多年以来,智力测试的批评者们一直在强调这个观点。康奈尔大学(Cornell University)的罗伯特J·斯腾伯格(Robert J. Sternberg)以及哈佛大学的霍华德·加德纳(Howard Gardner)讨论了实践性智力、创造性智力、人际关系智力、身体运动智力等等。然而,将“智力”附加到所有其他的精神、身体以及社交的领域中这一假定,正是批评家们想要攻击的点。如果你想要扩大智力的概念,那么你也要扩大与其密切相关的一些概念。然后在经历了100年的测试之后,出现这样一个简单的历史事实:与“智力”最为接近的就是“智力的IQ测试”。我的想法是减小“智力”这一概念的范畴,这也是我与其他IQ测试批评者们的不同所在。“智商包含了所有认知能力”的想法让我们遗漏了很多东西。
我提出“理性障碍”的目的是将智力从理性中分离出来,理性是IQ测试没有测量的一个特性。理性障碍的概念,以及不少可以表明情况的经验证据,能够帮助我们建立一个概念空间——我们要重视形成理性思维、采取理性行动所需的能力,这种能力至少与当下IQ测试测量的能力同样重要。
稿件来源:环球科学(《科学美国人》中文版),有删节
撰文:基思·E·斯坦诺维奇 Keith E. Stanovich
翻译:杨青 审稿:张哲 弥生