20210706 Update: 修改了一个符号错误。
首先你只会出石头和剪刀,因为出布没有任何收益,出剪刀总是比出布好。
然后,这就是一个博弈问题。如果只有一局就比较好办,三局就复杂了,因为三局之间不是互不相关的。比如,如果你第一局赢了,那剩下两局求稳出剪刀就必胜了。
我们先假设前两局双方战平,那么第三局你就必须得赢。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。那么赢的概率就是 。这个博弈如果要达成纳什均衡,就是双方随机出。这种情况下获胜的概率是 。
然后,假设第一局战平。再设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 (这里和上面的xy没关系了,我懒得换变量了)。单局平局的概率是 ,获胜的概率是 。我们已经知道前两局平局,最后获胜的概率是 ;第二局获胜,第三局出剪子即可获胜。因此最后整体获胜的概率是 ,这个博弈想达到纳什均衡,就求一下偏导,均衡点应该是 ,获胜概率是 。
最后,终于回推到第一局了。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。单局平局的概率是 ,获胜的概率是 。(这些和上面都没区别)最后获胜的概率是 ,纳什均衡点是 ,获胜概率是 。
由此,大概有推广的结论,n局这样的游戏,获胜概率是 。
没学过博弈论,不保证对(逃)
欢迎指正。
@silverxz 的回答是完全正确的,不过似乎答主也没有太确信自己求解纳什均衡的做法是否正确。我的回答算是做一个小小的补充:
对于“零和博弈”,我们有如下定理(Minimax Theorem,最小最大定理):
双方均采用使得对方最大收益最小化的策略,即构成纳什均衡。
(由于是零和博弈,“使得对方最大收益最小化”等价于“使得自己最小收益最大化”)
在@silverxz 的回答中,x和y恰好概括了双方所能采取的任意策略,而“我”的“获胜概率”,恰好为假设胜方收益为1、负方收益为0时“我”的期望收益(尽管此时不再是“零和”,但由于(1,0)可以由(1,-1)经线性变换y=2x-1得到,因此结论仍然成立)。
于是,根据最小最大定理,对方所选择的y,应当使“我”任意选择x所能获得的最大收益最小化。以1-1/2*x-y+3/2*xy为例,若对方选择y>1/3,则“我”应选择x=1并获得1/2+1/2*y,若对方选择y<1/3,则“我”应选择x=0并获得1-y,若对方选择y=1/3,则“我”总是获得2/3。为了使“我”的最大收益最小化,对方应当选择y=1/3作为“最小最大策略”。注意到“我”的期望收益的相反数即为对方的期望收益,我们可以类似地计算出“我”应当选择x=2/3作为“我”的“最小最大策略”。
但上述讨论仍然过于复杂,进一步地,我们注意到,其实最小最大策略恰好对应双方期望收益函数的一个鞍点(saddle point)(注意到,若(x,y)是“我”的期望收益的一个鞍点,则必然也是对方的期望收益的一个鞍点),而求鞍点只需要先对期望收益求偏导得到驻点(stationary points),然后检验驻点的性质。在这里,可以求出“我”的期望收益的唯一驻点为x=2/3, y=1/3,进一步检验Hessian矩阵可知该驻点确实为鞍点,于是可得唯一的最小最大策略也即唯一的纳什均衡。
刚学的博弈论,来个科班的专业解析。
这个问题是extensive game,也就是序贯博弈,每个subgame都是非完美信息博弈,因为石头剪刀布是两个决策者同时出的。
整体需要需要画game tree分析,在每个可能得决策点的双方的纳什均衡点。
有趣的是,单局是显然的零和博弈,但是放在整个game tree上每个决策点仍然是零和博弈,但每个节点都因为除在的博弈位置不同而有不同的均衡点,要依次倒过来进行backward introduction。
当然因为零和,我们可以用maxmin算法求纳什均衡点,但那得是在纯策略下才有优势,不然还要求导,直接用混合策略列纯策略线性方程香多了。哎,其实他们都是等价的,后者还不要求零和!
还提醒一下,咱们的结论是最低胜率是3/4,如果对手不按这个来,我们是可以被动地获得更高收益的。如果你觉得你对对手很了解,并且对手不会因为你的了解而改变策略的话,那么你还可以用最大剥削解去玩这个游戏。
数学之美,美在其精确定义,严谨推导后,那无懈可击,安全舒适的结果。