百科问答小站 logo
百科问答小站 font logo



石头剪刀布,已知对手只会出剪刀和布,三连平算我输,请问我的胜率有多少? 第1页

  

user avatar   silverxz 网友的相关建议: 
      

20210706 Update: 修改了一个符号错误。


首先你只会出石头和剪刀,因为出布没有任何收益,出剪刀总是比出布好。

然后,这就是一个博弈问题。如果只有一局就比较好办,三局就复杂了,因为三局之间不是互不相关的。比如,如果你第一局赢了,那剩下两局求稳出剪刀就必胜了。

我们先假设前两局双方战平,那么第三局你就必须得赢。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。那么赢的概率就是 。这个博弈如果要达成纳什均衡,就是双方随机出。这种情况下获胜的概率是 。

然后,假设第一局战平。再设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 (这里和上面的xy没关系了,我懒得换变量了)。单局平局的概率是 ,获胜的概率是 。我们已经知道前两局平局,最后获胜的概率是 ;第二局获胜,第三局出剪子即可获胜。因此最后整体获胜的概率是 ,这个博弈想达到纳什均衡,就求一下偏导,均衡点应该是 ,获胜概率是 。

最后,终于回推到第一局了。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。单局平局的概率是 ,获胜的概率是 。(这些和上面都没区别)最后获胜的概率是 ,纳什均衡点是 ,获胜概率是 。

由此,大概有推广的结论,n局这样的游戏,获胜概率是 。


没学过博弈论,不保证对(逃)

欢迎指正。


user avatar   richard-xu-25 网友的相关建议: 
      

@silverxz 的回答是完全正确的,不过似乎答主也没有太确信自己求解纳什均衡的做法是否正确。我的回答算是做一个小小的补充:

对于“零和博弈”,我们有如下定理(Minimax Theorem,最小最大定理):

双方均采用使得对方最大收益最小化的策略,即构成纳什均衡。

(由于是零和博弈,“使得对方最大收益最小化”等价于“使得自己最小收益最大化”)

@silverxz 的回答中,x和y恰好概括了双方所能采取的任意策略,而“我”的“获胜概率”,恰好为假设胜方收益为1、负方收益为0时“我”的期望收益(尽管此时不再是“零和”,但由于(1,0)可以由(1,-1)经线性变换y=2x-1得到,因此结论仍然成立)。

于是,根据最小最大定理,对方所选择的y,应当使“我”任意选择x所能获得的最大收益最小化。以1-1/2*x-y+3/2*xy为例,若对方选择y>1/3,则“我”应选择x=1并获得1/2+1/2*y,若对方选择y<1/3,则“我”应选择x=0并获得1-y,若对方选择y=1/3,则“我”总是获得2/3。为了使“我”的最大收益最小化,对方应当选择y=1/3作为“最小最大策略”。注意到“我”的期望收益的相反数即为对方的期望收益,我们可以类似地计算出“我”应当选择x=2/3作为“我”的“最小最大策略”。

但上述讨论仍然过于复杂,进一步地,我们注意到,其实最小最大策略恰好对应双方期望收益函数的一个鞍点(saddle point)(注意到,若(x,y)是“我”的期望收益的一个鞍点,则必然也是对方的期望收益的一个鞍点),而求鞍点只需要先对期望收益求偏导得到驻点(stationary points),然后检验驻点的性质。在这里,可以求出“我”的期望收益的唯一驻点为x=2/3, y=1/3,进一步检验Hessian矩阵可知该驻点确实为鞍点,于是可得唯一的最小最大策略也即唯一的纳什均衡。


user avatar   magic2728 网友的相关建议: 
      

刚学的博弈论,来个科班的专业解析。

这个问题是extensive game,也就是序贯博弈,每个subgame都是非完美信息博弈,因为石头剪刀布是两个决策者同时出的。

整体需要需要画game tree分析,在每个可能得决策点的双方的纳什均衡点。

有趣的是,单局是显然的零和博弈,但是放在整个game tree上每个决策点仍然是零和博弈,但每个节点都因为除在的博弈位置不同而有不同的均衡点,要依次倒过来进行backward introduction。

当然因为零和,我们可以用maxmin算法求纳什均衡点,但那得是在纯策略下才有优势,不然还要求导,直接用混合策略列纯策略线性方程香多了。哎,其实他们都是等价的,后者还不要求零和!

还提醒一下,咱们的结论是最低胜率是3/4,如果对手不按这个来,我们是可以被动地获得更高收益的。如果你觉得你对对手很了解,并且对手不会因为你的了解而改变策略的话,那么你还可以用最大剥削解去玩这个游戏。

数学之美,美在其精确定义,严谨推导后,那无懈可击,安全舒适的结果。




  

相关话题

  在一段高速公路上,30分钟之内见到汽车经过的概率是95%,那么,在10分钟内见到汽车经过的概率是多少? 
  所有数学表达式都有几何含义吗? 
  为什么不把高中的正余弦定理和直线与圆的方程知识放到初中学? 
  如何证明以下恒等式? 
  这道复变函数的证明题怎么做? 
  统计学中「矩」这个概念是怎么引入的?它为什么被称为矩?它与物理意义上的矩有什么相同与不同? 
  如何证明圆上若干点构成的多边形最大面积在正多边形时取到? 
  一把左轮能装六颗子弹,对着脑袋打,是装五发子弹开一枪死亡几率大,还是装一发子弹开五枪死亡几率大? 
  世界是个方程吗? 
  如何通俗易懂地解释外微分? 

前一个讨论
奔驰分别有哪些车系?历代都包括哪些车型?
下一个讨论
全新奔驰 E300L 和宝马 530Li 选哪个更好?





© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利