当奥巴马说“我国经济 09 年以来增长 13%”的时候,他没有告诉你其实美国人只有最富的 1% 收入增长了——剩下 99% 的人收入反而比之前
略微下降。
会出现这种情况是因为收入不是正态,而是
幂律分布的(即大家常说的 “20% 拥有 80% 的财富”)。所以最富人群的收入变化对经济总量影响最大,而剩下大多数人的收入变化对总量几乎没有影响。
举个具体的例子。假设有两个人,一个人有 100 块钱,一个人有 2 块钱。如果前者财富增长 10%(来到 110 块),后者减少 50%(来到 1 块),整个经济还是增长了 8%。
美国现在的情况就是这样,“经济整体复苏”但“多数人可支配收入没涨”。奥巴马夸自己经济政策有效确实没错,但特朗普、桑德斯也靠“拯救经济”的口号吸引了大量选民。这两个看似矛盾的事实其实都是对的。
幂律分布的数据在很多地方都会误导人。比如一家“成功” VC 的业绩其实
完全由所投公司中表现最好的一家决定。基金整体增长,只是因为投对了一家有 100 倍回报率的公司,而这家明星公司比该 VC 投的其他所有公司加起来都值钱。
--
另一种常见的“数据说谎”是调查问卷设计不合理。
英国政府 2015 年开始同意让父亲和母亲共休产假。但一年后的统计数据却显示,只有 1% 的父亲选择了休假。BBC、《卫报》等各大媒体报道之后
引发强烈社会反响。
真的是这样吗?
原来,这个 “1%” 的分母不是“有资格休假的父亲”,
而是“所有男性”。有人指出,如果这么算,即使当年所有新生父亲都选择休假,
调查得到的数字也只不过是 5%。
可以从调查结果中获利的商业机构就更不可信了。
之前有新闻说,一项对 2,000 人的调查发现,16 到 25 岁女性每周花 5 小时自拍——这听起来挺科学吧?但看过真正的调查报告之后你会发现,这个“5 小时”的数据没有涵盖“从不自拍”的女性。再仔细看,你会发现
这份调查是由一家美妆电商发布的,其目的可想而知。
除了在“分母”上做手脚以外,改变调查结果的方法还有很多。例如,不给出“其他”或“不知道”这类选项,问题题干加入误导性语言,调查对象有针对性选择等等。
一个很有意思的例子是,如果在问题中提到“奥巴马”(民主党执政八年的总统),更少的民主党人会说贫富差距过去八年变大了,而更多的共和党人会说过去八年经济变差了。简单地在题干中加上一个人名就改变了调查的结果。
要说离我们更近的例子,可以参考
我之前写的这个回答——为什么一家民调说 59% 的台湾民众认为自己“只是台湾人,不是中国人”,而另一家却说 57% 有“泛中国认同”?
--
我想说的第三种“数据说谎”是暗示因果关系。
2015 年开始,英国卫生大臣亨特频繁引用
《英国医学会期刊》的一项研究,说周日住院的病人比周三住院的病人死亡率高 15%,每年英国有
6,000 到 11,000 人因为医院周末人手不足而死亡。
这听起来既科学、又可怕,对吧?
但问题在这里:虽然确有此研究,虽然这个 15% 的数字也是准确的,可这并不代表死亡率高就一定是因为医院周末人手不足。有没有可能周末住院的病人本身病情就比周中住院的重呢?(英国很多人平时可以请带薪病假。)在控制病人病情等其他因素之前,我们无法确定周日住院的死亡率高就一定是因为医院人手少。
卫生大臣亨特暗示这个因果关系也有他自己的原因——他所在的保守党竞选时承诺会增加公立医院周末员工数量,但因为保守党同时也削减了公共医疗开支(他们承诺会削减政府开支),所以必须要求年轻医生工作更长时间、照顾更多病人且不领加班费。由此一来年轻医生非常不满,亨特和他所在的保守党便希望通过这些数据来增加舆论对医生的压力。
另一个类似的问题是同工不同酬。你可以经常在奥巴马、希拉里的演讲中听到“做同样的工作,女性工资是男性 77%”这个数字。但是,“同工不同酬”引用的美国劳动统计部
报告第一页就写明他们“没有控制很多可能显著影响男女工资差异的因素”,比如工作时长,受教育程度,效率等。事实上,美国同种工作内的性别工资差异并不是因为雇主歧视,详细原因请看这里:
「男女同工不同酬」是事实,为什么公司不全部招聘女性,以获得同等的生产力并节约成本? - Yiqin Fu 的回答。
--
政治新闻看多了,各类“误导”方法很容易就积累一打:
GDP 数字漂亮的时候强调 GDP,通货膨胀数字好看的时候强调通货膨胀。夸自己就说“失业率低”,批评对手就说“失业率低只是因为很多人都不找工作了,所以没算在经济活动人口里面”。
绝对数字漂亮的时候强调绝对数字,百分比好看的时候强调百分比。希望增长的数字和去年相比有下降,那就和过去五年相比。希望下降的数字还在不停增长,那就说
“增长率下降”:
某地商品房连续四年的均价分别为 1 万、2 万、3.8 万、7 万。看到这组数据,你必定会大叫:天哪,房价真是涨得越来越厉害了!不过事实却恰恰相反:这四年的房价增长率竟在逐年降低。
不过也不仅是政客。只要是做 PPT 的行业,大家这种事都干过不少吧。
--
最后一类“数据说谎”我都不太好意思放在这里。如果前面只是误导的话,下面就是赤裸裸的谎言了。
例如特朗普转发的这张图片,信息来源“旧金山犯罪统计局”
根本不存在,数据也每个都是错的。(但居然在他转发九小时后就有 5,800 个赞和 7,700 次转发!)
所以再一次提醒大家:
不是只要带图带数字的就是真相!请仔细核查信息来源!不谈解读,很多数据本身就是错的。
最后送上一个饼图:
其他数据话题下的回答:
为什么有时候我们以为有很多人追的女生实际上不仅单身还没人追? 如果「男女同工不同酬」是事实,为什么公司不全部招聘女性,以获得同等的生产力并节约成本?有好事同志专门搞了一个网站来收集“八杆子打不着但看着贼拉靠谱的相关关系”,几乎就是专门让大家来扯淡装叉用的。
几个例子:
尼古拉斯凯奇在电影中的出镜次数和淹死在游泳池里的人数:
肯塔基州的结婚率和从渔船里掉出来淹死的人数:
全美滑雪场的总收入与被床单缠住致死的人数:
所有例子图片都来自
20 Insane Things That Correlate With Each Other截图说话——哗众取宠的美国Fox news经常用的一些招数。
这些招数更多的是从视觉上给人一种“错觉”。比如说,本来不大的差异,截掉Y轴的一部分,瞬间差异就会让看的人觉得——差得这么多!!!
想象你明天要跟你的经理作报告,手里有一堆结果,但是显然这些结果对于之前的方法只有边际的增长——好消息是,你几乎一定可以找到一个方法,在数据变化不大的时候却给人造成视觉的冲击。
例子:
1)在趋势图中,为了说明增长趋势多明显,把Y调成不从0开始。这样差距会看起来很大,增长很大,但是如果把Y轴从0开始看的话,会显得基本没有差距。
差距够大吧!!!巨量增长啊!我们公司的财务情况这样的话,公司明年就得IPO啊!!
可惜Y从0开始的话,这图应该看起来的样子是:
p.s.刚发现在用Excel画这图的时候,excel都自动把Y轴的起始值调成比最小值多一点!这样看起来差距真是巨明显有没有!看来M$真是很懂画图的真正需求啊:D
2) 另外一个例子,作两两比较的时候把Y的值从高位开始,造成俩差距巨大的错觉
看啊,右边比左边高了4倍不止!!!咦,等等,不是就39.6%跟35%的差别吗....这...
3) 分数加起来不等于一,放大差距。
图上的数据normalize一下的话那么佩林是36.2%,32.6%,31.0%,直观差距不大。但是在这个饼型图里瞬间变成了10%的差距!这个比较明显的话那看下面
这里
一扫的话没发现这里百分数加起来不等于1了吧。
4) 挑取x轴的数据以捏造趋势
假设数据的波动性很大,比如说如下
10, 1, 20, 3, 30, 4, 50
看起来应该是
擦勒,公司的财务状况这么不稳定!!!怎么办!
没关系——如果我只抽取奇数项的话(挑取x轴,虽然挑得好像是很有系统地——奇数,但是你总能想到一个看着挑得系统的方法)
就会看着像
TMD明年又可以上市了。。。
等等等等...
部分图片来源于
http:// simplystatistics.org/20 12/11/26/the-statisticians-at-fox-news-use-classic-and-novel-graphical-techniques-to-lead-with-data/这两个游戏都有自己的问题。但严重程度完全不一样。
赛博朋克最大的问题是人力不够,没有人手把愿景在限期内做出来,导致后期狂砍。但从已有的成品来看,CDPR是完全有人才有能力把东西做出来的,只不过没时间做。光影效果,已有的垂直城市设计,以及主线和很多支线任务的演出都有毫不输巫师3的气质,尤其是日本城浮空平台那关,无论是游戏流程还是画面还是音乐,都把类似银翼杀手2047的那种气氛和感受做到了极致。有人说CDPR的人才都跑了,或者CDPR傲娇了开始放水,这并不客观。2077确实是个半成品,主机优化的问题尤其严重,但你关注已经完成的部分,用高配置PC玩,其质量并未令人失望,依然是巫师3的水准。
2077就像是一个优等生忘了做背后的几题的考卷,开天窗导致不及格,但已经做了的题目还是正确率极高的。
谈到E3的demo,单从画面上讲你很难说它缩水了。只不过CDPR没告诉你想要E3画面,就得上3080+光线追踪。。。
我猜想没有光追的话,游戏在大多数情况下也是可以达到光追的效果的,只不过人工工作量会很大,有些地方需要离线烘培,而有些地方需要人工设置虚拟光源。CDPR可能发现项目后期工作量太大搂不住了,就上了光追这个大杀器。。。
至于无人深空,现在口碑很好,但我要不客气地讲,这个游戏到了今天依然是垃圾,只配卖$19.95,打折的时候卖2.95的那种。
Hello工作室自始自终都没有把初始愿景实现的技术能力。
你可以看无人深空进入大气层的技术实现。先是一段飞船进入大气层摩擦发红的特效,然后可以看见地形通过一种非常粗糙、视距很近的情况下刷新出来,并且刷出来的地貌和太空中看到的地貌完全不同。所以从头到尾,hello工作室都没有类似精英危险和星际公民的无缝行星登陆技术。
无人深空更新了十几次,并没有触动这个游戏除了机械刷就没有任何深度的本质。这是一个极其无聊的游戏。但它刷了两年的DLC,玩家也就给他点面子,没功劳有苦劳。它每次更新我都会进游戏看看,但玩不了半小时就会放弃。一是实在无聊,二是它美术设计和渲染水平有限,色彩及其刺眼。比如在母船机库里,到处都是亮瞎狗眼的点状光源,但这些光源不会照亮周围的任何东西,看的时间长了有种不带护目镜看焊接的流泪效果。你说更新了那么久,这么简单的问题都不解决,有什么用呢。游戏中随处可见低级设计的痕迹,比如说有很多行星上有一种可以卖钱的球,这种球没有任何贴图,只有亮瞎眼的纯白色材质,在HDR效果下极其刺眼,但它又不是个光源,放在地上不会照亮周围任何东西。这种打开Blender就存盘的建模初手垃圾素材居然也能放在游戏里,真是活久见。
所以无人深空就像是一个学渣冒充学霸,把期望提得无限高,却每题都答错结果接近0分,被骂,然后花了漫长的时间在那里订正,一题一题的改,最后终于接近30分了,然后获得了大家的赞赏,全然忘记了它改了那么久依然是不及格。
无人深空的贴图我就不贴了,首发的时候真是纯垃圾,基本上是2008年魔兽世界首发的那个水准。现在也依然是垃圾,开个HDR看着眼睛都疼。
这次舆论的重点在于警察到底是多久赶到的。
没拜码头,收保护费,打砸门面这种原因我们都知道,也不怕;
但是公权力私用或者黑白勾结这种事,就会让人非常害怕;
如果西安公权力真的黑白勾结,还睁眼说瞎话,那就需要处理整顿了。
我朝的治安也不是一直这么好的,人民也不是软弱无比的,60年代西安打的也很凶的。难不成西安各公司以后都要雇佣保安公司保护经营?
这次出警距离1公里,走路10分钟都到了,所以就坐等这次真实的出警时间是多少了。
声明一下,三个故事都是10年前发生的,我现在是一个非常成熟有技能有文化见过世面的IT民工。。。lol
第一个,没文化的故事。
在美国读书的第一个学期,忘记什么课了,小组讨论,10多个美国人,我1个中国人。
不知道讨论到什么话题,我突然很想表达中国文化博大精深这个概念,我就给大家说:
“英文太简单了,例如win这个字,就几笔,咱们汉语厉害太多倍啦!”(我也不知道当时为什么会有字的笔画多就代表更有文化这个逻辑在脑子里lol)
大家非常感兴趣地看着我,我走上讲台,在白板上写下一个大大的“Win”,然后开始写一个更大的“赢”。
……
赢字写到中间那个口的时候,我忘记这个字怎么写了。。。
太丢人了,忘记怎么下台的。。。
第二个,太自信的故事。
研究生二年级上商学院和建筑学院合开的绿色建筑课程,和一群同学讨论一个设计方案,方案涉及到一个三位数乘以两位数的算术。
在我们这个小组,我一直没有什么存在感,几位大哥大姐都是MBA在读,工作好几年,专业能力和工作经验比我强太多,一个哈佛本科毕业的大姐是富二代,每次开会都会给全组买咖啡和点心,连请客的机会都不留给我,一个建筑学的大姐基本包揽了项目的所有建筑设计方案。。。
所以这个时候,我一下就兴奋了!美国人心算肯定不如我们中国人啊!哈哈哈哈,终于可以刷存在感了!
我挥手示意大家安静,说,“不用拿计算器,三位数乘以两位数对于我们中国人来说是小case,我来心算。”
在我还想着我在很短时间心算出结果后大家瞠目结舌样子的时候,小组里一个美国帅哥笑了一笑,说,xxxxx,把心算结果说了出来,准确无误。
。。。依然忘记是怎么下台的了。。。
第三个,没见识的故事。
第一次实习发工资,付清了房租,留了伙食费,剩下240美元,我觉得应该给自己买一个礼物奖励自己一下。那时想买一个戒指。
然后我Google附近的戒指店,查到一家珠宝店,下班穿着西裤衬衣我就跑去了。
进了珠宝店,我一副很有底气的样子,毕竟240美元是一大笔钱啊对我当时来说。我叫了一个年纪50多的服务员阿姨,说,我要买戒指,好的那种!阿姨一看我胖胖的样子,高兴得不行,叫了一个很高的黑人保镖一起,把我往店里面带,打开一个一个柜子、箱子,让我看那些花花绿绿的戒指,我依稀记得有钻石的,宝石的,各种颜色,各种大小。这些戒指都没有标价,我当时也没有看到喜欢的,就没有问价格。
后来看了一圈,我想,还是不看了,一会回住处,隔壁中国超市4.75一盒的三菜一汤盒饭别卖完了,所以我给那个服务员阿姨礼貌地说,谢谢你们哈,戒指看了一圈,都不太喜欢,略显老气,我先走了。
服务员阿姨和保镖大哥把我送到店门口,我走到地铁站,坐车回住处买盒饭去了。
后来过了很多年,我带老婆重游曼哈顿的时候,特地绕开了这家曼哈顿中心的爱马仕店。。。
哈哈哈哈。