谢邀!
千万不要被排序所迷惑,这篇研究的重点并不是排序对比各个国家的诚信水平!
先说明:我反对任何形式的阴谋论解释,还有不看材料,不讲证据地批评。这与我们倡导的科学严谨,求真务实的治学态度都是相悖的。
任何一个研究都不是完美的,我们可以对研究提评,但是必须基于对原文的了解和对证据的评断,而不是信口开河,将情绪凌驾于理性之上。很多知友的质疑其实早就在作者的意料之内,除了正文的9页纸,还有93页的补充材料呢!
好了,我想先介绍一下“利他行为”——这个本研究涉及到的最重要的心理学概念,另外再说说我自己的看法。
利他行为。
利他行为和亲社会行为,助人行为基本类似。非常好理解,就是在社会生活中,我们表现出的帮助他人的行为。有一些区别的点在于,亲社会行为可能带有一些可见的报酬,而利他行为是没有的,纯为人民服务。我这里不作区分。
为什么我们会做出利他行为?
迄今为止,社会心理学家已经研究了许多因素可以让我们做出利他行为。
情绪。
积极情绪会让我们利他——所谓的助人为乐。除了快乐这个最典型的积极情绪,还有诸如感恩,敬畏等更加复杂的情绪也会让我们利他。
一些消极情绪也有这样的作用——最典型的就是内疚了。当我们产生内疚情绪的时候,总希望做一些好人好事可以弥补以缓解内疚。
动机。
作为回报的外部动机。我们每个人都不是孤零零地活在这个世界上,总会与世界上其他人建立某种联系。根据社会交换理论,今天我对你付出,也是为了给明天你对我付出进行一个铺垫。所以,未来可能发生的回报形成了一个外部动机。
担心自我形象贬损的内部动机。除了与外界交换,我们对自己是有一个自我形象认知的,希望自己保持一个积极正面良好的形象,给自己看,也给别人看。做好事也是我们维持良好的自我形象的重要手段。大家都会夸赞那些好人好事,而对假丑恶的事件进行抨击。
共情
共情可能是最主要的引发利他行为的因素了。当我们对别人的境遇产生共情,我们就希望帮助对放度过难关,这是高级动物拥有的互惠机制。
外部环境。
研究发现,当你身边有人伸出援手的时候,你也更愿意帮助他人。可要是谁都按兵不动,那大概率你也不会动了。
自身状况
达则兼济天下。中国研究者发现,下行的社会比较(与不如自己的人比较)会带来亲社会行为。
时间压力。另外有研究则指出,当被试者没有紧急事务的时候,更有可能伸出援手。当一个人要赶去做某个紧急事务的时候,ta就可能不太愿意帮忙了——比如ta可能着急着去看一场名为《帮助他人就是天使》的话剧。
另外,进化心理学家也对利他行为作出了一些解释,最著名的可能就是亲缘关系理论了。
研究发现,我们往往对那些和你具有相同属性的人更容易产生利他行为,而对其他外人则没有这种利他行为。也就是说,我们的利他可能是带有某种选择倾向性的。亲缘关系理论认为这是因为内群体和我们具有更高的亲缘关系——咱们一家亲,自然要多多帮助了。
总的来说,利他行为作为社会心理学研究的重要组成部分,真挺令人着迷的。更多有关利他行为的研究,大家可以参考任何一本《社会心理学》教科书。
下面来看这个研究
1 关于研究目的
这篇研究的重点其实并非对各个国家的公民诚信水平进行排序比较。作者在摘要当中介绍的很清楚。进行这样一个大规模的现场实验实际上是为了检验一个基本的模型——面对财富诱惑,我们到底是会抵制诱惑,诚实归还,还是据为己有。这其实也就是实验设计中的两个组,money vs. no money。根据古典经济学的假设,物质诱惑会让我们做出自私的行为;但是因为我们要维持自我概念,以及利他主义倾向等原因,面对物质诱惑,我们也会帮助别人。
以往的研究大多是在实验室进行的,而且被试者往往是WEIRD 也就是所谓的Western, educated, industrialized, rich and democratic societies。
因此,作者进行了这样一个大规模,跨地区,跨文化的现场实验。
实验的结果如图所示,当钱包里有钱的时候(对比没钱),大家都倾向于联系失主。这与物质诱惑导致自私行为的假设是相悖的。
因此,对各个国家进行排序并非作者的研究目的,同样,从结果也不能说明中国人不诚信。千万千万不能被带跑偏了,过度解读结果不是傻就是坏。
下面我会谈到关于排序的问题。
2 关于排序
尽管研究的主要目的不是排序对比,但让大家感到扎眼的是,中国居然倒数第一,所以难道中国人如此之不诚信?
2.1 关于邮件
这个可能是争议比较大的地方。
以我们自身的感觉,中国内地居民使用邮件的频率非常低。根据@Yan Yan提供数据(不知道为什么at不到ta),中国网民的电子邮箱使用率只有35%。那么是不是由于邮件的使用习惯导致的呢?
研究者在文章的补充材料中对这一问题其实已经做了分析。他们认为在五组选择地方种,酒店组应该是可以通过邮件去联系其他人的。因此,单独分析了酒店组发现结果如下:
中国排名上升了一位。
当然,正如 @ Yan Yan 所指出的,原文作者也认为邮件的使用可能是一个影响因素。
那么这里就有一个问题,如果是因为不习惯发邮件导致得分偏低,那么两组都应该偏低才对。总不能说没钱的时候大家不习惯发,有钱的时候就习惯发了……
如果要更加严谨地说明这个问题,我认为可以在中国深圳和香港两个地方做一个对比研究。两地距离较近,经济发展水平相当,但是邮件的使用习惯却非常不同。这个对比可能会比较有说服力。
还有知友说到,电话号码会更加符合国人习惯。这是自然。实际上,不难理解,发邮件肯定会比打电话麻烦一些,这个无论在世界的哪里基本都是如此。所以如果换成电话号码,可能大家的诚信指数都提升了。
2.2 关于钱包不逼真
要知道,钱包是否逼真这个条件是恒定的,在每个组都是一样的东西。恒定法也是心理学研究常用的控制额外变量的方法之一。
至于有知友提出,为了使钱包逼真,应当在里面放一张身份证。
还是一样的,要放必须每个地区都放,难道会出现中国人看到身份证更容易归还,而歪果仁看到身份证更不容易归还的局面吗?
2.3 关于诚信和多管闲事
有知友质疑这个研究本身是否能代表诚信行为。
这是一个很好的问题,这也是评价一个研究好坏的基本标准之一。这就好比,我本意是要测量被试者的身高,却用体重计测出一堆关于体重的数据,完全是答非所问,跑偏了。
如果你认为研究其实只测量了多管闲事,那么说明,中国人在没钱的时候就不会多管,而在有钱的时候才会愿意伸出援手。
这就引出了一个我个人觉得很有意思的问题——我们为什么要去做利他行为?
从数据结果来看,我觉得可以提出一个大胆的假设,我们的利他是以“有用”为目的的。也就是说,我们一定要看到联系归还这个动作是有用的——对方能拿到钱。同理,当钱包里什么都没有的时候,我们会认为这钱包是无用的,归还不归还,联系不联系都无所谓,反正无用。
当然,这只是我个人的一个假设,是否属实,需要研究。
看到 @支付宝 也来答题并且给了另外的研究证据(非常有意思的研究),我突然想到,移动支付的使用或许让我们淡化了对实体钱币的感知。这个说的有点远了,不过是挺有趣的。
最后,还是要再次强调,本研究的目的是对比有钱没钱组的行为差异,令人可喜的是,我们没有为了钱包里的钱就据为己有,而是选择了想办法归还。
2019.7.4 更新
在提出了初始质疑之后,这篇文章已经引发了舆论的广泛讨论。我非常荣幸的被哈佛大学的博士生袁博同学和牛津大学的李易扬同学联系,并同横跨中美欧不同国家的10位学生和八位教授完成了一封联名公开信,公开信的主要执笔人是剑桥大学的郑杰予,也包括了清华大学的张学工教授等多名学者的意见。在初始阶段,我的知乎回答里仅指出了邮件使用率的影响,在进一步分析以后,我们归纳总结了更多的该实验的许多缺陷,并陈述在公开信中,发给Science杂志主编Valda J. Vinson。公开信的中文翻译如下:
—————————————————————————————————————
6 月 20 日,美国科学促进会(AAAS)Science 杂志上发表了一篇以“全球城市诚实 度” (Civic honesty around the globe)为题的文章(Alain Cohn,Michel André Maréchal,David Tannenbaum 和 Christian Lukas Zünd 为此文作者)。作者声称根据 他们“全球范围内”的“大规模实地试验”,研究了公民在金钱刺激下的诚信表现。这 项研究以通过电子邮件上报丢失钱包的比例作为衡量诚实的指标,并以此评判了 40 个国家和地区的公民诚信度。作者在文中用一张对这些国家的降序排名图表展 示了实验的结果数据,并且声称“不同国家的城市公民诚信度有很大差异”。本文在 Science 杂志上的出版表明了美国科学促进会(AAAS)认可 Cohn 等人的实验结果 “(提供了用以评判)不同国家公民诚实度差异的一个客观的衡量标准。”
我们作为科研工作者和 Science 杂志的受众,对这项研究的结果和产生的影响深感关切。我们认为文章方法论和推证逻辑上存在根本的缺陷,使其不能成为一篇严谨 的学术论文。文章通过量化使用电子邮件通知失主的比率来衡量“诚实度”是一个缺乏逻辑基础的草率假设。首先,单一的量化指标无法衡量诚信度这样复杂多面的行为特征,有很多关键的混淆因素没有在文章中得到充分地讨论,包括邮件使用率, 文化差异和语言差别等。此外,文章使用的抽样方法对于不同地区并不平衡,并且 因此不具代表性。第三,作者在实验过程中,根据预实验和预期实验结果的不相符, 故意地排除了一些国家(如日本),使得研究产生了确认偏误(confirmation bias)的风险。综上,我们认为“全球城市诚实度” (Civic honesty around the globe)的文章既没有“提供一个诚实度的客观衡量”,也不符严谨的社会科学研究准则。
作为科研群体的一员,我们不仅对此类工作描述的科学结果产生质疑,也对公众的 潜在误读表示担忧,而这种公众的误读已经产生并且正在持续蔓延。很遗憾,作者 否认了他们(及他们所属的密西根大学和苏黎世大学)对公众的解读负有责任,但 尽管如此,关于这篇逻辑有缺陷,论证不严谨的文章的已经激起了对各国诚实度差 异和排序的讨论,客观上对公众产生了负面影响。我们质疑这篇讨论“全球诚实诚 信度”的文章是否有违 AAAS“维护科学及其应用严谨公正”的使命,并且未能达到 科学研究的标准。
基于 AAAS 作为“全球最大的科学共同体”的愿景,我们认为 Science 和 AAAS 应当 知悉这一问题。为了尽快中止不断产生并蔓延的对数据的混淆和误读,我们联名请 求对此次事件进行彻底的调研,并且重新评估刊发的可行性。具体来说, 1)学界应当对“全球城市诚实度” (Civic honesty around the globe)文章的准确性,特别是方法学和结论数据的展示方式进行充分讨论。 2)如果作者不能更多地对这一系列问题作出解释,文章应对全部有关“诚实性”的结论进行纠正,并在有限的时间内公开发表在 Science 杂志上。 3)如果认定文章存在若干不符合 COPE 标准的做法,应根据 COPE 的研究发 表准则对此事进行彻底的调查。Science 杂志应当尽快就此事发表编辑意见。
我们充分理解,对于文章的重新评估需要一定的时间,因此 AAAS 和 Science 及时 发布的编辑意见和进行调研,将会对尽快促进科研结果的规范使用产生积极的指导 作用,并且纠正公众对此文章内容的误读。涉及跨国家和地区的研究作为社会科学 的重要组成部分,承载着真实、可靠、公正的社会责任。我们衷心希望可以得到您 们的及时答复,也对您们对科学严谨和科学公正付出的努力表示感谢。
—————————————————————————————————————
在公开信附件中,我们总结了一份批驳在以下几个方面(限于篇幅,我只总结一下大纲):
[A]: 使用邮件报告比率量化诚实度有根本的逻辑谬误。
[B] 除却假设有误,文章中也没有对各种相关混淆变量进行充分的讨论。
[C] 实验样本量不具备代表性,在不同国家间不平衡
[D] 文章本身存在主观确认偏差
[E] 公众的潜在误读和相关的社会影响
截至目前,主编Vinson已经给予了我们非常正面的回复,他支持我们投稿Science杂志的Technical Comments,这样可以扩大影响力,并会要求文章作者官方回复,甚至审稿人介入。
现在大家还在紧锣密鼓地撰稿中…
感谢大家的collaborative efforts,我很荣幸作为其中一员。
—————————————————————————————————————
以下为6.22原回答:
我从新闻刚出的时候就关注了这个问题。办公室的美国小伙伴一脸坏笑的把这个新闻给我看的时候,我还以为是个小道消息恶作剧,但是当我意识到这是个science的文章以后我的笑容就凝固了…
——————————————————————————————————————
当我第一眼看到这项研究结果,我就报以非常怀疑的态度。因为我也在成都丢过钱包,但是被完好无损的还给了前台,而且工作人员非常负责的态度让我觉得他们根本不可能是文章中描述的那样私吞财物的人。同时,成都也是这项调查的试点城市之一,所以我觉得作者的实验数据根本说不通。
在简单的浏览了这项调查以后,我一下子就注意到了一个非常大的逻辑漏洞。作者为了方便统计,只在遗失钱包里放了唯一的联系方式,就是一个电子邮箱。根据常识,不同国家使用电邮的频率完全不一样,这位作者为了方便统计,使用了西方人熟悉,但是东方人不习惯的联系方式,直接导致了观测结果的错误。因此,我昨天给文章的第一作者Alain Cohn取得联系,并询问关于Email使用度对实验结果的影响。
Cohn教授今日很有礼貌的回答了我的疑惑,并且告诉我,他根据世界银行的跨国公司businesses use email to interact with their customers and suppliers当作控制变量作对比,还是发现中国的归还率最低,并且这项数据也包含在了补充资料中。随即,我指出,跨国公司使用电子邮箱的概率并不能代表正常市民和警察局,邮局。跨国公司使用电邮主要是为了和海外市场联系沟通。根据世界银行的数据,中国的跨国公司的电邮覆盖率根本不低,高达85%,可是根据中国互联网信息中心CNNIC的数据,中国网民的电子邮箱使用率只有35%。并且我向Cohn教授解释,中国人并不喜欢使用电子邮箱,甚至不会将电子邮箱视作一种日常联系方式,所以自然很难会给丢包的人发送邮件。Cohn教授对我的最后一封回信中,他表示明白了数据中客观问题的存在,但是因为各个国家电子邮箱使用率的数据很难获得,所以也没有办法,然后对文章引起的歧视表示遗憾。
其实我对这样的结果还挺失望的,因为作者哪怕了解了数据的巨大问题,却并不打算为他的数据负责,哪怕是在一个非常具有影响力的期刊上,并获得了多家新闻媒体的报道。
我的印度同学也对这个数据表示不满。他认为,这样的数据对于发展中国家和人口稠密地区非常不公平。银行,警察局,邮局都非常忙,每天的人流量和欧洲一些城市完全没办法比较,所以自然不会给丢钱包的人发邮件联系。他认为该作者统计的数据没有任何学术意义。
我认为这项研究充满了欧洲人自满自大的心态(作者以及研究经费都来自瑞士,第一作者现在在密歇根安娜堡任教)并且对其他国家根本没有基本的尊重和理解,做出的实验结果更是相当荒唐,明显一种自卖自夸的宣传种族自豪的软文。Science杂志作为最顶级的期刊,在重重的审阅之中竟然没有发现数据的问题,也体现审稿人的无知。
我真的希望有能力的人能尽快和Science杂志主编联系,尽早将这种biased research进行修改。
————————————————————————————————————————
我再贴一下Cohn教授发给我的最后一封回信:
Thanks a lot for the clarification, this is really helpful. I still think that email usage is a possibility for the low return rates in China, we just don't have good international data to test this reliably.
I'm saddened to hear that some people are abusing our study to spread hatred. While this is beyond our control, I'd like to apologize for it. It was never our intention to hurt people with our study.
Best,
Alain
————————————————————————————————————————
我觉得有能力的人真的不能remain silent,一定要向science杂志提出意见。这种充满偏见的研究,却拥有了非常大的影响力和话语权,真的很可怕。
从社会学角度看,这个实验完全忽视了不同国家的公民由于文化习俗差异形成的和机构和工作人员不同的互动模式。
在中国,一个人丢钱包后合理地寻找逻辑是三步走:
1.主动回到可能的丢失地点寻找。
2.寻找无果后咨询所在地点的管理人员。
3.再次寻找无果后咨询当地公安机构。
按照这个寻找逻辑,寻找的主体是丢失者个人,寻找的方式是从地点到人再到机构。由于这个寻找路径基本上可以被视为一个社会默认的普遍行为模式,因此相关的工作人员和机构大多也默认了这样一个逻辑:只要丢失者真心想要找回钱包,那么他或她一定会沿着这个路径和自己相遇,如此自己便不需要花费额外的精力去主动联系丢失者。
事实上,这也恰恰是这个实验设计中暴露出的问题:实验者在假装捡到钱包交还时没有要求这些机构和工作人员主动联系丢失者。
After walking into the building, one of our research assistants (from a pool of eleven male and two female assistants) approached an employee at the counter and said, “Hi, I found this [pointing to the wallet] on the street around the corner.” The wallet was then placed on the counter and pushed over to the employee. “Somebody must have lost it. I’m in a hurry and have to go. Can you please take care of it?” The research assistant then left the building without leaving contact details or asking for a receipt.
这里,我不确定在中国参与实验的研究人员是否是中国人,倘若是,那么实验人员假装捡到钱包交给机构和工作人员时应该说的是:“你能帮我处理它吗?”之类的话。我想实验者可能故意不去暗示这些机构和工作人员要主动联系丢失者,但这种故意恰恰也在同时在中文语境下的构成一个默认的暗示,即请按照你们一般处理丢失钱包的方式处理这个钱包。而如前所述,在中国这些机构和工作人员我们社会默认的处理钱包的方式就是守株待兔,等待失主主动前来问询。
倘若实验人员是老外,那情况可能就更加复杂了,比如老外的措辞(无论中文还是英文)是否清楚?工作人员能否听懂和理解?他们看到这个只留有邮箱地址的充满违和感的透明钱包会不会觉得是老外的恶作剧?等等。甚至反过来看这个问题,会不会有一些工作人员和机构正因为是老外捡的钱包,所以就“违背”他们默认的行为模式,积极主动发邮件给失主?那这样一来,这种发邮件的行为就更加复杂化了,脱离了实验设计的初衷。这也是因为实验者没有考虑所在国家和地区的工作人员和机构在文化和习俗上和老外沟通和互动的差异性。这种差异性会不会形成一个影响人们行为的变量也是很难说清楚的。
退一步,我们大可以诟病说这样的守株待兔是有些不积极为人民服务,但文化和习俗铸就的互动模式的确就是这样根深蒂固。一个简单的证据是,倘若我们自己丢失钱包,我们中会有任何人去期待这些机构和工作人员主动发邮件联系我们吗?恐怕绝大多数国人下意识地反应都是遵循上文中三步走的模式去主动寻找。
但这里需要特别指出的是,不积极和不诚实绝非一个概念,且严格意义上讲这些机构和工作人员对钱包的保管本身和实验人员所要求的“处理”并不冲突,只不过双方对于处理这个词的理解存在文化习俗上的偏差。然而这样的偏差在实验中就会形成一个具有误导性的结论,这就是做跨国社会行为比较实验时最容易出现的问题——对于变量严格控制的需求和对所在国家和地区文化习俗的适应往往是冲突的,忽视了文化习俗的变量控制也往往会得出一个似是而非的,充满争议性的结论。
研究方法有问题。如果失主的信息不是email,而是微信二维码,我估计中国可能冲到榜首。
各个国家的文化、社会环境不同,使用的电子通讯工具也很不一样。电子邮件是相对老式的交流方式,都9102年了,中国人没有那么高的email使用率,很多人就一个QQ邮箱,还常年不登录一次的那种。微信却可以不离手,扫二维码更是举手之劳。像我,平时工作沟通也都是使用微信。
青蛙在井底,使用错误的研究方法,自然就能得出“天空只有井口大”这种可笑的结论。它并不知道,井外面的人绝对不会使用“从井底向上观察”这种研究方法去估算天空的大小。
更新一下,主要是找到这样的Science论文太不容易,得珍惜。另外就是又看了一眼论文,吐槽能量要溢出了。下面的图片来自论文的google翻译。
作者毫不怀疑这个与常识相悖,也与文献相反的结果,真是迷之自信。审稿人居然也相信,真让我觉得自己碾压了N多大牛。有人在自己的实验结果与现有理论、逻辑、常识都不符,自己也解释不了的时候拿去投Science吗?
要说利他主义,那些物品必须对失主很重要才行。可是,那几样东西价值何在?透明塑料“钱包”,小学生都不好意思用;三张同样的名片(可以说明是失主本人的,排除了收的别人名片,这个细节还是挺用心的),谁丢了自己的名片到处找的?再说,有人在名片上只印个邮箱吗?没有QQ、微信,连电话都没有?还有那个shopping list,缺了它不知道吃什么吗?唯一也许有用的是钥匙,或许能打开一个宝盒,换锁会爆炸那种。所以,没有那49块钱,就是垃圾。
找个德国大学生,优雅地送给宾馆前台,“嗨,我发现这个[指着钱包]在拐角处的街道上“然后把钱包放在柜台上,推到了员工面前。“有人肯定已经失去了它。我赶时间,不得不离开。你可以请好好照顾吗?”(原文google翻译)
前台怎么想?是帅哥搭讪?假装拾金不昧?还是恶作剧?不是精神有问题吧?要不要报警?
能有几十个人发邮件已经很多了,我想其中有不少人发邮件时在后悔,不该没事找事跟上司汇报的。上司肯定说,“外国人送来的?还是联系一下吧,别让人说我们不诚信”
话说公民诚信不是应该考察个人行为吗,这文章考察的是机关和企业处理拾物的流程是否友善,员工是否热心,跟公民诚信没多大关系。谁丢了东西不是到处去找,哪有人在家刷邮箱的。
其实即使联系失主,也未必表明是利他主义,也可能只是制度要求。害怕不去联系可能被领导批评,客人投诉之类,而不是拿了49块钱有做贼的感觉。
以下原文----------------------------------------------------------------------------
显然这个实验设计不合理。
想必多数人对于这个实验中“不诚信”的理解是贪图钱财而不交还失主,而实验结果中钱包中是否有钱的结果与此完全相反。如果贪图钱财的话,应该是有钱的钱包联系失主的少。但是图中所有国家都是有钱的联系比例更高。这说明实验设计的错误,得到的不是“诚信排名”而是“对实验道具重视程度”排名。大家认为有钱的“钱包”更重要,所以联系失主的更多。
钱包之所以加引号,是因为它太简陋了:
如果没有钱,大多数人会认为是乱丢的垃圾。
另外,大城市的宾馆、银行等前台忙的飞起,谁有闲工夫为了几十块钱发邮件。公司对拾物会有规定,基本上应该是放在某处待领。所以统计结果是较为悠闲的欧洲国家排名靠前。
要想得到有效结论,必须提高物品的重要性。比如加一些文件、证件之类的。
这么明显的设计漏洞,还能发Science。。。
难道这样的文章也可以上Science吗?
我不觉得“捡到钱包联系失主的品质”可以被称为“诚信”,因为没有“许诺”谈何“诚信”?,我也不觉得这种“捡到钱包联系失主”的品质有任何意义,失主如果真的觉得钱包重要,肯定会主动去找,而且失主主动找钱包几乎肯定会比捡到钱包后去找失主快。
一个对社会几乎毫无影响的鸡毛蒜皮的“道德品质”也可以上Science,而如此多的兢兢业业的回归猿这辈子能上个econometrica就已经谢天谢地了,只能说我们受到了严重不公平的对待。
我常去一些欠发达国家和地区,我最大的感悟就是,我们认为许多和道德相关行为,它还真与经济发展水平没什么关联。譬如全世界都视为敏感国家的阿富汗,真去那里行走,感受到的其实都是关怀和帮助,至少普通民众是这样的。我也很好奇,为什么全世界各国环境,信仰,种族,习惯差异这么大,但道德水平却这么一致相似呢?后来我想想,其实也不难解释,不管你在全球哪个角落生活,其实大家都是希望生活的更容易,而不是更难;如何能更容易,就要培养道德情操,让推力大过阻力,所以在这点上,全世界没什么不同,除非你不是人,不是群居动物。
下面说这篇文章,这篇文章实验设计是测试诚信,但我觉得,它大概率测试出来的是国家繁忙程度排行表。举个例子,我最近在国内旅行,我这人有洁癖,每天都要洗衣服,我就发现在大城市例如宁波,你问工作人员附近哪有洗衣机,你下意识就会对付你,那我就只能自己找;到了规模小点的地方,例如温州的洞头区,你问他,他就会比较认真的告诉你;等到了永嘉的岩头镇,你问他,他就会带你去。这其中影响的因素或许很多,但最显著的可能就是地域的繁忙程度,而与他们的素质没什么关系。到了福建我又问了一遍,我发现福州就切合宁波,泉州就切合温州,漳州附近就类似永嘉;当然这只是大体类似,如果要得书面验证结论,可能需要把样本量扩充很大很大。
最后,说两点我个人观点。首先,多年来在世界各地生活学习,我不敢说这个世界没有幕后黑手,但至少我没观察到,我的感觉反而是白人间的矛盾,其实一样激烈。所以有时习惯性的先入为主,可能需要再考虑考虑。其次,社会科学,并不是真正意义上的科学,不是A存在,B就必然发生。它的意义就是一种启发和丰富,看完之后感叹一下,“哦,因吹斯听”,就可以了,不太适合当真理读。因为我们永远无法证明,是不是存在一个更明显的影响因素,没被我们观察到。况且,牵扯到个人行为的宏观数据真的没意思。做研究是为了解决问题,排一个表,它究竟解决了什么问题?
有千日做贼无千日防贼,当然是打对攻了。
根据中西文化差异,设计一个实验黑西方,然后把结果投到Science,看他们是发还是不发(滑稽)。
这样一来,Science就是两难。发了的话,自己打自己脸。不发的话,不发这一行为本身,炒作价值可比一篇论文要大多了。
强调!这种事,辩护没有意义!你越辩护,新闻本身传播的就越广!你反而越吃亏!当年河南越辩越黑的教训,不可不查!
真正应该被注意到的是,破坏Science公信力的一个重大战机出现了。
很多回答在这个问题上集中于讨论「中国人用不用邮件」,我觉得这没什么意义。
首先,你只知道中国人用邮件用得少,但你并不知道其他39个国家的邮件使用情况如何,他们使用邮件的密度如果比中国还少呢,怎么去解释?
其次,作者在他的补充材料里专门写到了对于邮件使用的讨论:
Differences in Email Usage Since our measure of civic honesty relied on recipients contacting the owner by email, one concern is that differences in exposure to email communication could be responsible for cross-country differences in reporting rates. Yet, we focused on drop-off locations in urban places and included institutions where email communication is common. In particular, hotel staff should be able to communicate via email in all parts of the world. Consequently, if email experience is a key driver of differences in reporting rates, we should see substantially less heterogeneity when we restrict our sample to hotels. However, Fig. S13 shows that this is not the case. We still observe large differences in reporting rates across countries when focusing on hotels only. As a further robustness check, we included the share of firms that use email to interact with their customers and suppliers in a country (from the World Bank Global Enterprise Survey) as an additional control variable to construct the regression-adjusted measure of civic honesty.25 Fig. S14 shows that the differences between countries remain large, and the regressionadjusted ranking is almost identical to the unconditional ranking (Spearman’s ρ = 0.950, P < 0.001 for the NoMoney condition, and ρ = 0.932, P < 0.001 for the Money condition). This suggests that experience with email communication was not a major driver of cross-country differences in reporting rates.
结合上下文,大致的意思是,作者一共选了五种上交钱包的地点,银行、剧院、酒店、警察局、邮局,这里面的银行、剧院、警察局和邮局的工作人员确实可能会因为邮件的使用而造成国别差异。
但酒店不是,作者选择的基本上都是每个国家最大的城市,这些地方的酒店工作人员是必定会使用邮件与全球旅客进行沟通的,因此作者只看了那些上交给酒店工作人员的钱包的报告率,这应该能很大程度上缩小因为邮件使用而造成的影响,结果是这样的:
看起来和原图没啥区别,次序变化也不太大。
然后作者又使用了另一个来源,来自World Bank Global Enterprise Survey的邮件使用率来控制报告率,去掉邮件影响后再排序,结果是这样的:
次序上还是没有什么差别。
因此,从邮件这点对论文发起质疑,不会有什么效果。
不仅仅是邮件,很多答案提到的「忙碌」,在作者的论文里也有控制。他控制了每一个收到钱包的工作人员的如下特征:
性别、年龄、忙碌程度、是否是本地人、是否会说英语、是否听明白了需要做什么、是否友善、桌上是否有电脑、在场是否有其他工作人员、在场是否有其他顾客、是否有监控、是否有保安。
所以,在发起质疑前,我建议还是先通读一遍整个论文的补充材料,毕竟是发表在Science上的论文,他把绝大多数漏洞还是堵上了的,
但这并不是说明这篇论文的解释就没有问题了。
真正的问题是——把钱包上交到工作人员处,然后工作人员去写邮件通知,这个过程,和诚信有多大关系?他到底和什么东西有关系?
假设我们去采访这些工作人员:什么时候你愿意去为了一个这样的「名片夹」给陌生人发送邮件?什么时候不愿意?
我脑补了一下这两个问题回答:
当我难得看见有人来上交钱包的时候,我会很重视这个事情,发送邮件。
当我对失物上交见怪不怪时,我可能不回去写这个邮件
换句话说,人们做任何事,背后的刺激都是要超过一个阈值才会去动手做,这个刺激的阈值可以理解为每天这些工作人员所经历的「背景噪声」。
那么如何来对这些工作人员每天的「背景噪声」做一个度量呢?我没有想到特别棒的指标,但是这个城市的「人口密度」应该是一个相关的变量。
人口密度越大的地区,人们之间的接触和交流越密集,这类事件的噪声阈值就越高,写邮件联系钱包失主的概率就越低。
举一个不太恰当的例子,独生子女政策刚刚实行时,总有人觉得独生子女比较脆弱敏感又「事儿逼」,理由就是没有和兄弟姐妹相处交流,总把人与人之间的小事儿当成大事情处理。那么在那些人烟稀疏的地区和人口密集的地区,可能也会存在类似的现象。
但现在这还只是一个猜测,为了验证是否正确,我从https://science.sciencemag.org/highwire/filestream/727955/field_highwire_adjunct_files/0/aau8712_Cohn_SM.pdf 的18页开始,再去各个国家统计局逐个国家收集最大两个城市的人口密度,并与最后的分数交互(分数是按照图大致估算的):
该图和我们的判断相吻合,这个关系是显著存在的,左上角的高联系率地区,人口密度相对来说都比较低,右下角的低联系城市都位于高人口密度地区。我以截距为80画了一条拟合线,他的拟合程度为0.2946(图中excel对指定截距的拟合计算了错误的r2)
那么,如果这个联系率确实因为「背景噪声」高度相关因而和人口密度相关的话,那些距离拟合线比较远的国家,才是真正需要关注的国家。
比如在线的左边,距离最远的依次是哈萨克斯坦、马来西亚、阿联酋、肯尼亚、加纳、南非,这些国家为什么在同样的人口密度下,联系率低了那么多?
比如在线的右边,印度为啥又以如此高的人口密度获得了那么高的联系率?
作者在补充材料里面使用邮件使用率和人均GDP做了两个调整,大意是使用这两个变量对排名进行调整后,和原始排名的相关程度分别高达0.9和0.75,即作者想说明的这个「诚信程度」是和邮件使用和经济发达程度关系不大的。
但如果使用地区人口密度进行调整,则会出现另一番景象:
调整后的排名和调整前的相关程度立刻下降到0.19了,印度和中国排名变成了第一和第二名。
也就是说,这些设施所在地区的人口密度所导致的「背景噪声」,一定是一个需要考虑的alternative explanation,在对失主联系率的影响上,他比邮件的使用和地区经济发展程度更为重要。
用与钱包失主的联系概率来衡量诚信程度,我觉得是一个挺好的主意,作者也控制了很多变量,堵上了很多漏洞。但是我认为还是可以有很多可以改进的地方,现在的结果,距离真正的「诚信」的度量还有一段距离,可能还有一些被遗漏的变量,希望作者有机会能够继续对其加以修改。
许多人没有真正读过文章凭借几张图片和问题本身主观臆断作者的想法,这种做法是抱有偏见的。抱着这样的心情写答案就好像王劲松说的演员不背台词就上热搜一样。
首先归还钱包是有一定的时间成本的,文章当中也提到,这种“义务偿还”的利他动机,很大程度上取决于“白拿所带来的内疚感“(也就是自己把自己看成是小偷)。所以文章的主要目的是想看,公民的诚信程度是不是随着金钱激励的上升而提高。
要知道这样的研究其实是很有意义的,因为我们甚至很难说出一个定论,一方面来说归还钱包本身是有时间成本的,比如说联系失主,比如说保存钱包本身。另一方面来说归还也意味着“失去”。所以说钱包内金钱的上升很显然有着双向的作用,一方面是金钱所带来的“诱惑”,另一方面是白拿所带来的“内疚感”。不通过实证研究很难证明那一方面因素会在人的最终决定中起到主要的作用。
所以这不是一个在比较哪个国家的人更诚信的研究。大家也没必要因为中国的归还率低而感到任何不爽。
研究的主要结果是无论是什么国家,在钱包里面包含钱的时候,大家的归还率都会显著提高。这意味着道德约束战胜了金钱本身的诱惑。这样的结果本身就应该被更积极地看待,而中国的加总除了在第一张表中出现过以外,后面的结果和中国人是否诚信更是完全没有任何关联。
至于中国人为什么会在所有国家中归还率较低,作者本身也有解释,比如说归还钱包的时间成本,归还钱包本身是需要花费时间的。可能时间对于中国人来说本身就比其他人来得更重要,如果钱包里面涉及的金额不够高(13.45美金也就是100块钱人民币不到),并且抽样的城市是上海这样的城市,或许很多人都懒得去联系失主并且归还。
其他的一些文中没有原因也可能是许多机构有规定,只负责寄存不负责主动联系归还,比如说如果丢失的人真的觉得这个钱包很重要可能会主动去跟相关机构联系获取钱包。如果丢失的人自己都不愿意主动联系那可能说明丢失者本身也不在意,甚至不愿意花时间去取回,这样对于这些机构而言自然也没有太强的动力去主动归还。
另外 @chenqin 说到的人口密度本身也是一种很好的说法,人口密度和流动性较高也会导致“寻人归还“本身的成本升高,这些因素都会对最终的“归还”的绝对值的统计结果产生重要的影响,而这些影响又恰好在观察“金钱激励”效果的时候被完美消除,因为无论钱包里面有钱还是没钱还是有多少钱,归还钱包的成本这类“搜索时间“成本是不随着钱包内金钱所改变的。
总得来说这是一篇“求仁得仁”的文章,文章的结果甚至对于中国是一种称赞(在发现钱包里有钱的时候,中国人甚至比许多其他国家的人更愿意交还钱包)。作为读者而言,更加不应该因为中国仅仅只是出现在了全文图表中的一处就“特殊看待”。
以上