感谢 @芝士喵 的邀请。
其实很简单一点,智商测验是基于一定智力理论,用来测量智力的量表。所以,一个好的测验,可以反映智力。但是具体反映什么?该怎么看?我下面分析一下。
相信没有人不想知道自己的智力如何。摆在我们面前的方法其实并不是那么多,比如单纯看考试成绩肯定有大多数人是不满意的;那就只能寄希望于智力测验。智力测验的结果,也就是智商给了不少人以慰藉。但是智商究竟是什么?
智商测验,其实是一种衡量智力的量表;而它的结果就是智商,智力商数,也就是反映了智力的高低的一项数据。智力测验的原型,需要上述到法国心理学家比奈那里。为了用一种统一尺度鉴别学生,他创造了智力商数测验。这个测验,以及其迭代版本和后续版本决定了绝大多数人对于智力的理解。虽然说最早版本肯定不适合当今环境,但是其重要性不言而喻:它决定了后来所有测验的形态。简单说来:1. 智商测验需基于一定的智力理论;2. 智商测验的结果不是原始分,而是统计处理后的标准分。
对于任何受过科研训练的人都知道,研究或者讨论一个概念之前需要对一个概念做操作性定义。比如,智力从狭隘的角度说,可以是学习新知识的能力,也可以是做算术题的本事,甚至有时候可以是反应学校成绩的表现。倘若三个人分别抱着上述三种想法来看待智力,那么这三个人肯定不能好好谈论智商了。所以说,车同轨多么伟大!而智力理论和衍生的量表,让所有人可以在一定概念上分析/比较/测试/和讨论智力。
对于比奈而言,他本身就有关于智力的研究,其实他的智商测验也就是反应他对智力的理解。但是智力领域的研究飞速发展,比如卡特尔对于智力划分为流体和晶体智力等等,所以过去错误的/教条的/或者有时代性的了解必然是不合适的。也就是因此,他的原始测验被后学发展的斯坦福-比奈测验所替代。在斯坦福-比奈测验中,根据制作者所支持的观点,他们把测验限定在这几个智商的纬度上。
当然,针对不同的群体会有不要的量表,比如现在最常见的是韦氏量表(分成人和儿童)。其中涵盖了一些基础知识,算是能力,推理能力,记忆能力等等,反映了现在对于智力的理解。而假设只需要测推理和思维能力,没准瑞文测验更合适(其实聪明的人很容易全对)。因此,智力测验到底能反应什么,还得看其背后的原理。 这一点,专业人士/书籍/和论文都会涉及。
我们不得不强调一点,智力测验的结果不一定完全反应智力。首先,任何间接测量都容易出现失真,比如你状态不佳时候,短期记忆力肯定下降,分数会打折扣。其次,教育本身及其影响智力测验结果,比如你可能不是不会做,而是没法集中,或者不知道如何安排测试时间等等。更要命的就是所以的社会差距,比如美国版的韦氏量表的一些‘知识’问题对于美国人是很显而易见的(比如第3任总统是谁),但是对外国人就不是,反之亦然。再举一个例子,一个原始部落的孩子可能推理能力完全不占下风,但是由于没做过汽车,打不上关于汽车的问题;但是现有题目会把这种经验和教育影响失真地反馈在结果上。因此,本土化的/适合的量表是必须的。甚至,一些有针对性的训练可以让你‘答题’流畅,但是并不代表你聪明对不对。
但是,哪怕是好的量表,我们也得看下分是怎么得出的,否则我们不能理解智商。所以就让我们回到智商本身了:智力的商数。智力测验类似SAT,对原始分进行了Z转换:按照100分为均值,15为标准差。在原始版本里面,智商结果其实更简单:你的分数除以年龄常模的百分数。比如不愿意透露姓名的韩老师原始分为150,而他的年龄常模(比如40岁)是130,那么他的智商就是:150/130*100,115。当然,现在的Z转换更加合理,因为你的分数直接反应了你在人群中的位置。比如另一位不愿意透露姓名的韩老师韦氏量表分数为145,我们可以很轻松发现他的智力在三个标准差开外,战胜了超过99%的群众。方便简单。 但是这也是一些网上或者过时测验的问题原因:常模过时了。由于经济发展,教育水平发展,现代人的智力测验的测试结果(不一定智力本身)提高了:好比原来研究生的一些教材,对于顶尖的高中生而言不在话下。因此,常模过时会让大家高估自己的智力。
所以,总结一下,智商测验是基于一定智力理论,用来测量智力的量表。如果想要用好这些量表,首先得要根据需求选择对的量表,其次,结果解读也需要回到测验本身的“智力理论”上。毕竟,高智力只是学业成功的充分但不必要条件嘛。