谢邀, @Zampeli Diana 。
这个问题当中可能凝结着许多读者一生中的四大主题:“戒烟、攒钱、看书、减肥”。
我们姑且把这个问题讲成这样一个故事:
数学系大学生陈茁因为智商低跟不上一周四十多节的数学课,心灰意冷自暴自弃,沉迷扫雷不可自拔,一度将扫雷高级提升到40s,也终于在保研率99%的学校里奇迹般地没有研究生可上。痛定思痛,他决心参加国考,当上公务员,走上人生巅峰。
但人算不如天算,在国考前一周,微软非常贱地开发出了一个100×100的超高难度扫雷游戏。
星期一,“就玩这一局,再玩剁手!”
星期二,“就玩这一局,再玩剁手!”
……
星期六晚上八点,“就玩这一局,再玩剁手!”
星期六晚上九点,“就玩这一局,再玩剁手!”
……
星期天早上六点,“就玩这一局,再玩剁手!”
最终,陈茁错过了这场考试,毕业后沦为无业游民。
显然,这里需要对所谓“有益”下一个定义,不过这就有点儿抬杠了,题主的本意我猜大概是隐含着为“有益”一词下了一个有客观价值论以为的判断。因此姑且认为,因为这位大学生的前途非常成问题,最后一周努力复习找到工作以图东山再起,显然是“对自己有益的”行为。
但这孙子拒绝了这项行动。为什么?
首先说结论,人为什么会拒绝对自己有益的行为呢?因为这些行为往往需要我们持续的投入时间和经历,而在这个过程中:
首先上一个decision tree,图来自Hammond (1988),“期望效用的结果主义基础”(这个图首先见于Hammond (1976),不过那篇文章里面图太难看……):
这张图作者把它称作“potential addict”,不过正好可以拿来说明我们的剁手问题。这里的空心节点叫做“决策节点”,每个节点对应着一个决策,实心节点叫做“结果节点”。可以看到,这个tree里面有两个决策节点,和三个结果节点。这里,每个节点代表的含义如下:
:周一的陈茁,向左走表示先玩一局,向右走表示直接卸载扫雷;
:周六的陈茁,向左走表示继续玩下去,向右走表示不玩了;
:由于没玩到新版扫雷复习过程心不在焉以致于考试只考60分;
:玩到了扫雷心满意足复习火力全开考100分;
:过度沉迷扫雷导致错过考试。
从这些结果来看,是最好的结果,也就是“对自己最有益的事情”,但是不幸的是,陈茁最后一步一步地走到了这个最差的结果。
为什么呢?因为他要实现这个最好的结果,需要做两次选择:一次是“要不要开始玩”,一次是“要不要停止玩”。而且,为了实现这个结果,决策者必然要先放弃掉这个不是最好也不是最差的选择,把自己置于一个“best or never”的选择题当中。
在周一,决策者对这个游戏还没有“上瘾”,他对考试结果还是在意的,否则也不会选择放弃掉。也就是说,如果不是他无比相信自己一定能在周六选择,就不会提前放弃。但是到了周六,面对已经上瘾了这个结局,他的偏好改变了,而且这种改变是没有被预料到的,他只能选择接着玩儿下去直到错过考试。
行为经济学有一篇很经典的文章:
里面的Projection Bias,说的就是人们有低估自己偏好改变的倾向。决策理论家将这类决策者叫做"naive decision maker",他们的特点是喜欢制定一些自己完不成的计划,马三立先生的《明天开始》说的就是这类人。这种谬误也被称作“planning fallacy”,笔者就是一个深度患者。
有人会问,是不是偏好的改变被预见到了就完事大吉了呢?不是。在上面的potential addict中,如果决策者预见到了自己一旦开始玩就根本停不下来,也就是说,他知道一旦放弃,他将在未来选择。应用backward induction的思想,他会直接选择卸载扫雷,而这个结果也不是最优的。这样的决策者被称作sophisticated decision maker。
行为经济学的另一篇经典文献讨论了两类“非理性”的决策者的福利问题,
他们研究了两类子情境,一类是“现在痛苦将来幸福”,另一类是“现在幸福将来痛苦”,作者证明,对于每一类决策者,分别有一个情境使他们的福利更低。
如果陈茁可以在决策节点处,直接从选择,那么这种事情不会出现。因为我们已经假设了。可能很多读者已经反应过来了,这其实就是博弈论嘛,而且是简单的完全信息静态博弈,解是子博弈完美纳什均衡。事实上,这个结论早在1973年就被证明了:利用泽莫罗公理,任何有限博弈树存在SPNE,所以,Sophisticated decision maker一定有均衡策略。Potential addict 与一个博弈的区别在于,这是现在的自己和未来的自己之间的博弈,是一个自我控制问题,然而因为在两个决策节点上偏好不同,我们无法把“他们”看作同一个人。Hammond (1988):
Rather,the potential addict is really two (potential) persons,before and after addiction,and the decision problem has to be analysed as a “game” between two “rational players”.
陈茁首先向左走,先玩儿了一局,然后成功上瘾,错过考试,走到人生低谷。而爸妈口中的“别人家的孩子”们,那些不会犯错的神(jian)人们,究竟怎么做呢?第一步,他们从容不迫地选择向左走,大胆地玩儿了一局,然后意识到需要学习了,他们就不玩儿了。
换言之,他们从一开始就有一个走到的计划,并且在后续过程中靠着完美的执行力从容地执行了这项计划。这些人代表了所谓的完美意志,无论偏好怎么改变都有严格的纪律性来实现之前订立的目标。
就此,Hammond 提出了“结果主义”的概念。结果主义,顾名思义,就是所有行为都对着一个结果去的。在博弈论里面,为什么normal form game不能分析动态博弈呢?因为无法剔除empty threat,妈妈对孩子说,你敢调皮我就打你,孩子预见到了妈妈其实舍不得打他,于是还是调皮。在normal form game中,威胁打小孩儿就不调皮是一个纳什均衡,但是在extensive game中就不是一个SPNE。
那么,在我们的例子里面,empty threat对应着什么呢?很明显,“剁手”就是对自己的,或者说现在的自己对未来的自己的空威胁。如果这个一人博弈树通过backward induction找到的均衡行为,与简单的静态选择一致,那么行为就是结果主义的。
显然,potential addict不满足结果主义,为什么呢,看这个decision tree,
和上面那个相比,这里多了一个,假设,和表示同样的结果,小玩儿辄止,不同之处在于给予了决策者事先规范自己行为的方式(比如把剁手的权力交给一个跟你有仇的人,再比如给信用卡设置一个上限等等)。我们可以看到,在这个tree当中,决策者会毫不犹豫地选择,既不是naive情况下的,也不是sophisticated情况下的。但是,上面两个decision tree,如果我们把它们拍扁成normal form game,它们是完全一样的。
对于别人家的孩子来说,结果主义一定是满足的,他们不受情绪的影响,不为诱惑所动,持续投入,最后做成了我们看来有益的事情。而对于我们一般人,上面的例子告诉我们,我们必须通过缩小自己未来的选择集来控制自己。Gul & Pesendorfer 2001年发表在Econometrica上的文章中举例说,人在早上励志要减肥,并且预见到了自己中午饿了的时候会狂吃,那么早上订餐的时候,就不要给自己留下吃肉的自由。所以,戒烟的人把打火机交给值得信任的朋友,存钱的人把信用卡交给值得信任的朋友,减肥的人把钱包交给值得信任的朋友,才是现实的。这种倾向,在决策理论中叫做preference for commitment。
扯远了,就酱。
--------------------------------------------------------------------------------------------------------------------------------------------
11.4 更新:
看评论大家好像有点儿云里雾里的,值此双十一即将到来之际,我突然找到了一个更好的例子,再跟诸位解释一下。
假如您是一个没有支付宝的人,面对即将到来的双十一,您要考虑的是,我要注册一个支付宝账号吗?这时候您在,往左走是注册,往右走是不注册。注册或不注册都有显而易见的坏处,不注册的话支付不方便(),注册的话容易管不住自己()。所以,如果您能保证有了支付宝之后还能管住自己不乱买东西乱花钱,那肯定是最好的()。但是如果您发现自己一旦有了支付宝就根本停不下来(您是sophisticated decision maker),那您最好是一开始就不要注册(选)。
这么简单的道理被我说成这么复杂……切腹去了。