看到很多回答50%的,也看到很多用各种概率论公式拿上来套的,我意识到这是一个较为普遍的大众思维误区!而这么一个简单的道理,其实会对一个人做出生活工作中的各种判断起到极大的作用!因此详细回答一下
记得大学时教马哲的老师曾在课上说了一个看起来似乎他每年都会跟新一届学生讲的用于展现他个人魅力和思想深度的引以为傲的段子:“有一次我在飞机场,前面起飞的一架飞机掉下来了,这时候周围的人都内心很惶恐不敢登机,而我则泰然自若,并告诉他们一个道理,一架飞机掉下来的概率是一千万分之一,那么连续两架飞机掉下来的概率就是一千万分之一乘以一千万分之一,相当于比你平时随便坐飞机出事的概率又小了一千万倍,你们怕什么,这时反而应该更加确信自己安全才对!”
讲完这个段子,大阶梯教室全场200多名学生都会心的点头笑着爆发出热烈掌声,马哲老师也得意洋洋的享受着大家对他智慧的认可,而我则默默离开了教室,从此再没来上过课。。。
我高中的数学老师(我省数一数二竞赛获奖无数)曾说过一句让我印象极为深刻的话,记得那是在下午第一节课讲概率论大家昏昏欲睡的时候,张老师猛地提高嗓音,用一种近乎于危言耸听的语气说:“小概率事件发生,说明很可能出大问题了!!!”
这话迄今为止仍让我印象深刻,并且在我今后人生中做出一些判断时起到至关重要作用。《三体》里的大史说过类似的一句话“我多年的刑侦经验让我明白一个道理,邪乎到家必有鬼!”
好吧,我知道foreplay太长了,下面我要进去了
那位马哲老师的思维误区,以及对这个投硬币问题不假思索回答50%的人的思维误区都是一种
就是:“用理想物理模型来思考复杂现实问题”
假设飞机起飞飞行不受任何外界因素影响,连续两架掉下的概率的确是一千万分之一乘以一千万分之一,或者说,你去乘坐第二架飞机时掉下来的概率仍是很小的一千万分之一。然而,这是理想物理模型,现实中会有各种情况影响,比如:1,那天天气有某种不易察觉的致命问题;2,那天候鸟群飞过这里;3,那天太阳耀斑活跃异常导致机场附近通讯故障;4,那天中午机场食堂饭菜有问题导致飞行员食物中毒。。。这些我都是瞎编的,但此时请记住高中数学张老师的那句话“小概率事件发生,说明很可能出大问题了!!!”。在那个时段那个地点,极有可能出现了一个未知的致命问题才导致千万分之一的极小概率事件发生了。此时,在不明真相的情况下,如果仍然去立即起飞下一趟飞机,那么发生事故的概率是很大的!
再举一个生活中你有机会体会到的例子,你站在路边看一辆辆经过你的车的尾号,通常情况下,应该是单号和双号各50%,而你却连续看到100辆单号,那么如此小概率的事件发生,说明很可能有一个外界强干扰因素出现,你站在北京的路边,今天限单号出行。
同理回到这个投一亿次硬币的问题,一般情况下正反面出现概率各为50%,而连续一亿次正面是一个极小概率事件,那么很有可能出现了一个未知的巨大干扰因素导致每次都是正面,所以下一次依然是正面的概率是极高的!
其实真正有趣的问题是,在一亿零一次的时候,投出了反面,那么请问一亿零2次投出哪一面的概率较大?这个问题先不展开了
借这个问题向我的高中老师致敬,他那莫名其妙的危言耸听的语气让我铭记了:
“小概率事件发生,说明很可能出大问题了!!!”
先给出结论(结论因人而异,看你的标准是严格还是宽松!):在相对严格的标准下,如果连续抛硬币16次及以上都是正面朝上,则估计再抛一次反面朝上的概率是0%;如果小于16次连续正面朝上,则估计下一次反面朝上的概率是50%。
这是一个颇有嚼劲的问题,看似简单,实则牵涉到很多统计学知识。下面来深度剖析。
首先要问——这枚硬币是不是普通硬币?
仅凭肉眼,我们不容易判断硬币的真假。如果你没说它是不是普通的,我就根本不知道。如果你说它是普通的,你也可能在说谎,我也可以选择不相信。如果你说它是普通的并且没说谎,我依然可以质疑这枚硬币或者桌子、地面可能存在一些不为人知的小秘密(在赌博情境里这叫出老千)。
所以,现实中这枚硬币是不是普通的,还真不好说,我们只好做假设:
如果H0成立,则估计下一次反面朝上的概率是50%;如果H1成立,则估计下一次仍然是正面朝上。
其实这里还暗含一个关于抽样分布的大前提:在H0成立的条件下,把连续抛n次硬币记作为一次抽样行为,则多次抽样服从一个伯努利分布/二项分布,该分布的平均值是0.5n次正面朝上、标准差是0.5根号n次正面朝上。所以正常情况下,我们应该期望抛n次硬币有一半是正面朝上的,可以稍微多一点也可以稍微少一点,即使某次抽样发现正面朝上的次数“有点多”,我们依然需要承认抛硬币事件具有试次间的相互独立性,认为下一次正反面朝上的概率都还是50%。但是,如果连续正面或反面朝上的次数过多,我们就有一定的理由去怀疑这次抛硬币抽样行为是不是真的服从这个二项分布,从而做出接受或拒绝H0的判断。
OK,接下来要做的就是假设检验——H0到底正不正确?我们有频率学派和贝叶斯学派两大思路。(关于这两大学派的知乎专栏介绍可参见:Frequentist vs Bayesian 1 之 为什么心理学可以是科学:p<0.005?;Frequentist vs Bayesian 2 之 不,是你的贝叶斯;Frequentist vs Bayesian 3: p 值的9个认识误区)
根据频率学派(Frequentist)的零假设显著性检验(NHST)思路,我们需要计算在H0成立的条件下,得到目前结果(data, D)或更极端结果的概率,记做p(D|H0)。这个p就是所谓的统计显著性,如果p值小于某个临界点,比如行为科学(就是心理学)研究里惯用的经验值0.05(现在也有研究者建议需要缩小到0.005才行,可参见:什么?以后p < .005才是统计上显著!),那么我们就大喊一声“小概率事件发生了耶!”,十分开心地得到一个显著的结果,然后在论文里标上一颗小星星:* p < .05。
一言以蔽之,频率学派所谓的p值就是——
(参考资料:贝叶斯因子及其在JASP中的实现;p与CI使用情况调研问卷情境及相关选项的具体说明)
对于抛硬币问题,如果H0成立,那么每一次正反面朝上的概率都是50%,可以得到连续i次正面朝上的概率是0.5^i,这是一个单尾概率。
我们借助R语言来呈现连续1~20次正面朝上的情况:
for(i in 1:20) cat("i =",i,", p(D|H0) =",0.5^i,"
")
输出结果如下:
i = 1 , p(D|H0) = 0.5 i = 2 , p(D|H0) = 0.25 i = 3 , p(D|H0) = 0.125 i = 4 , p(D|H0) = 0.0625 i = 5 , p(D|H0) = 0.03125 i = 6 , p(D|H0) = 0.015625 i = 7 , p(D|H0) = 0.0078125 i = 8 , p(D|H0) = 0.00390625 i = 9 , p(D|H0) = 0.001953125 i = 10 , p(D|H0) = 0.0009765625 i = 11 , p(D|H0) = 0.0004882812 i = 12 , p(D|H0) = 0.0002441406 i = 13 , p(D|H0) = 0.0001220703 i = 14 , p(D|H0) = 6.103516e-05 i = 15 , p(D|H0) = 3.051758e-05 i = 16 , p(D|H0) = 1.525879e-05 i = 17 , p(D|H0) = 7.629395e-06 i = 18 , p(D|H0) = 3.814697e-06 i = 19 , p(D|H0) = 1.907349e-06 i = 20 , p(D|H0) = 9.536743e-07
可以看到,如果只抛1次,p = 0.5,我们根本没有理由拒绝H0。但是,如果采用0.05的显著性标准,当连续5次正面朝上的时候,p = 0.03125 < 0.05,我们就有理由拒绝H0,认为这不是一枚普通硬币。当然,显著性水平还可以再严格一点,比如要求p < 0.005才行,那么当连续8次正面朝上的时候,我们就有理由拒绝H0。
与频率学派的思路不同,贝叶斯学派(Bayesian)认为H0成立与否,不仅与p(D|H0)有关,还与其他因素有关:
在贝叶斯公式里,分子中的p(D|H0)是我们之前求的p值,p(H0)是我们对H0成立与否的主观估计(先验概率),分母中的p(D|H1)是H1成立的条件下出现目前结果的概率,p(H1) = 1 - p(H0)。最后得到的p(H0|D)就是在已经得到目前数据的条件下,H0成立的后验概率。
这里我们需要事先估计两个概率:
好,这样一来我们就能计算出后验概率p(H0|D)是多少了。同样借助R语言来呈现这个模拟过程,我们把频率学派的结果也加上,便于对比:
for(i in 1:20) { pH=0.99 # p(H0), 对普通硬币概率的主观估计 p0=0.5^i # p(D|H0), 如果是普通硬币(H0), 连续正面朝上的概率(单尾) p1=0.5 # p(D|H1), 如果是特殊硬币(H1), 连续正面朝上的概率(单尾) Bayes_P=p0*pH/(p0*pH+p1*(1-pH)) cat("i =",i,", p(D|H0) =",p0,", Bayes p(H0|D) =",Bayes_P,"
") }
输出结果如下:
i = 1 , p(D|H0) = 0.5 , Bayes p(H0|D) = 0.99 i = 2 , p(D|H0) = 0.25 , Bayes p(H0|D) = 0.980198 i = 3 , p(D|H0) = 0.125 , Bayes p(H0|D) = 0.961165 i = 4 , p(D|H0) = 0.0625 , Bayes p(H0|D) = 0.9252336 i = 5 , p(D|H0) = 0.03125 , Bayes p(H0|D) = 0.8608696 i = 6 , p(D|H0) = 0.015625 , Bayes p(H0|D) = 0.7557252 i = 7 , p(D|H0) = 0.0078125 , Bayes p(H0|D) = 0.607362 i = 8 , p(D|H0) = 0.00390625 , Bayes p(H0|D) = 0.4361233 i = 9 , p(D|H0) = 0.001953125 , Bayes p(H0|D) = 0.2788732 i = 10 , p(D|H0) = 0.0009765625 , Bayes p(H0|D) = 0.1620295 i = 11 , p(D|H0) = 0.0004882812 , Bayes p(H0|D) = 0.08815672 i = 12 , p(D|H0) = 0.0002441406 , Bayes p(H0|D) = 0.04611085 i = 13 , p(D|H0) = 0.0001220703 , Bayes p(H0|D) = 0.02359952 i = 14 , p(D|H0) = 6.103516e-05 , Bayes p(H0|D) = 0.01194066 i = 15 , p(D|H0) = 3.051758e-05 , Bayes p(H0|D) = 0.006006188 i = 16 , p(D|H0) = 1.525879e-05 , Bayes p(H0|D) = 0.00301214 i = 17 , p(D|H0) = 7.629395e-06 , Bayes p(H0|D) = 0.001508342 i = 18 , p(D|H0) = 3.814697e-06 , Bayes p(H0|D) = 0.00075474 i = 19 , p(D|H0) = 1.907349e-06 , Bayes p(H0|D) = 0.0003775125 i = 20 , p(D|H0) = 9.536743e-07 , Bayes p(H0|D) = 0.0001887919
可以看到,如果采用0.05的概率标准,当连续12次正面朝上的时候,p = 0.046 < 0.05,我们才有理由拒绝H0。如果标准严格一点,要求p < 0.005,那么只有当连续16次正面朝上的时候,我们才有充分的理由拒绝H0。
借助统计学里最基础的假设检验思想,并结合频率学派和贝叶斯学派的不同思路,我们终于解决了这个“世纪难题”。总的来看,当出现连续10次左右正面朝上的情况,我们就有一定的理由去怀疑这枚硬币的真假,或者怀疑抛硬币的环境中有什么不寻常的地方。保守估计的话,连续16次正面朝上,基本就能肯定这枚硬币将会一直正面朝上了。
不过,这只是抛硬币的问题。我们还可以延伸开去:
心理学研究者经常期望不同实验组的被试能表现出“显著差异”。也就是说,研究者期望被试是有反应倾向的“特殊硬币”,而不是随机反应的“普通硬币”,或者期望环境变量(如实验操纵)能影响被试这枚“硬币”的表现,然后才能愉快地获得显著结果,发表一篇更有影响力的文章——这种“硬币的特殊性”其实就是被试特质性的(dispositional)个体差异/人格因素;而这种“环境的影响力”其实就是情境性的(situational)条件差异/社会因素——加在一起,就构成了心理学的一个最有意思的分支:人格与社会心理学。
我尽量用日常简单的事例和逻辑来回答这道题,而不会牵涉到太多太复杂的数学公式和符号。
站在马路边,下一辆经过的汽车,车牌尾号是双号的概率是多少?
在没有附加其它任何信息的情况下,我们有理由认为这个概率最接近50%
但是如果已经经过了1000辆车,车牌尾号全部是单号,那么我们有理由相信,今天一定是双号限行了。
坐在校道旁,下一个走过的学生,是男生的概率是多少?
在没有附加其它任何信息的情况下,我们有理由认为这个概率最接近50%
但是如果已经走过了1000名学生,全部都是女生,那么我们有理由相信,这一定是个女子学校。
扔一枚硬币,反面朝上的概率是多少?
在没有附加其它任何信息的情况下,我们有理由认为这个概率最接近50%
但是如果投了1亿次,全部都是正面朝上,那么我们有理由相信,这个硬币是一个特殊的硬币,或者这个硬币两面都是正面。
所以再扔一次,反面朝上的概率应该是非常非常接近于零。为什么不是等于零?因为即使是正常的硬币,扔一亿次全部正面朝上也不能说完完全全不可能,扔的次数再多,我们也不能完完全全排除这个可能,只能无限减小这个可能。
以上分析都是基于复杂的真实环境这个前提。如果是纯理论数学,比如说是题主的数学考试试卷里出了这么一道题所以才来知乎上问的,那么,按照经典概率的思路是认为事件之间是彼此独立的,因此即使一亿次正面,下一次正和反的概率也是严格的50:50,那么标准答案应该是50%。不过如果是纯理论数学题,严格的说题目的描述应该更严谨一点,应该如下面所述:
“一枚普通的标准硬币,一面是正面,另一面是反面。地面是普通的水平地面。不考虑任何影响扔硬币结果的其它因素。如果扔了一亿次都是正面朝上,再扔一次反面朝上的概率是多少?”
--------------------------------------------------
大家好,我是邢可,05年省高考状元、国家一级注册建筑师。
建筑师朋友可以关注我的公众号:“清培一注”。
清培一注训练营,是由一群清华大学毕业的一注建筑师和结构师组成的一注考试研究和指导团队。关注我们,快速通过一注!
不会超过亿分之一。很明显这枚硬币就是被设计成只能正面朝上。想要让它背面朝上怕是只能期待量子效应。
他们留在国外,消极怠工,浑水摸鱼,挖帝国主义的墙角,不回来和同龄人一起竞争,减轻内卷压力,有什么不好?
大部分欧洲国家和美国,不但给你孩子冠姓,还给你冠姓,还有首歌形容结婚:以我之姓 冠你之名。
你作为物理研究工作者起码应该给这个哲学思潮泛滥做下说明或者定义