个人觉得抛硬币并不是真正的随机事件,和抛硬币时候的各种状态参量有关系,那么到底什么是真正的随机?

======================更新============================

补充了迭代的模拟实验

=====================================================

概率的主观意义(贝叶斯诠释)、概率和信息的关系其他回答都说的不错了,我补充一点:为什么概率这么有用?或者就是题主问的,为什么硬币的朝上和朝下概率都接近0.5?

如果说掷硬币时候的环境因素和掷硬币的力度唯一确定了抛硬币的结果,那我们不应该都掷出一半对一半的结果,而应该有的人有很多正面,有的人有很多反面才对,不应该有这么好的独立性。如果是这样,那概率可能就并不那么好用了,因为适用条件难以控制。

我们这里规定,掷硬币的方法是:将硬币竖直上抛足够的高度(旋转或不旋转均和),落在硬质地面上,弹跳数次直到停止。弹跳次数不能太少,也不能像另一种常见的抛法一样抛起来用手接住,这种情况下理论上来说,经过训练的人是可以让正反面的概率不一致的。

考虑硬币落地的瞬间,与地面的撞击是集中在一个点上的,这个力作用时间很短,产生的冲量与角冲量成一个固定比例,这个比例与硬币撞击时的角度密切相关,由此决定了总能量分配到平动动能和转动动能的比例,从而决定了下一次弹跳的高度和转动的速度,也就决定了下一次落地时的角度,但是我们知道转动速度是非常快的,所以下一次落地时的角度与这一次碰撞的角度的关系很敏感,而且是周期性的,随着本地碰撞的角度增加,下一次碰撞的角度会周期变化,虽然是一个连续函数,但是是高度非线性的,也就是说初始值的一点小变化会被放大。在某些角度时,还可能出现在弹起前多次碰撞地面,导致更复杂的变化。

随后这个过程会迭代若干次,直到最终停止,每次碰撞都会放大初始值的差异,最终按照周期性汇总到正面和反面两个结果上。这就导致最初的初值分布极其不均匀的情况下,只要分布在一定程度上是平滑的,经过放大,每个比较平缓的小区域都会分布到正面和反面上,于是初值的影响减弱,而对称性的影响急剧增加,在正面和反面对称的时候,每个小区域分布到正面和反面的比例相当,整体上就是1/2的概率。如果正面和反面不对称,迭代过程受到不对称性的影响,就会明显偏向其中一方,产生非1/2的概率。

总结来说:

  1. 非线性的迭代过程导致过程对初值极其敏感(也叫混沌效应)
  2. 过程的结果被限定在了一个有限的空间内,初值的微小变动都会导致结果变化
  3. 初值的影响性减弱,而过程本身对称性的影响急剧增加,结果出现稳定的概率分布

这样的过程非常普遍,导致对于很多问题来说,我们无需研究每一个结果出现的原因,而只需要研究结果的稳定的分布,而且不同的结果在多种不确定因素的影响下,表现出独立性。这样就很容易用概率模型来研究了。这种随机过程一般是我们最喜欢的叫做时不变系统,它的参数不随时间变化。如果没有这样的混沌效应,那么可能实验结果与某一个随机因素密切相关,而这个因素本身也会随着时间变化,那么得到的结果分布就会与时间密切相关,那就没法研究了。

我们可以用一个简单的函数迭代在一定程度上模拟抛硬币的过程:

f(x) = \sin(1000\pi x + 1)

抛硬币的迭代与这个不同,但有类似的性质,都会放大初值差异,同时都有一定周期性

考虑f(x)迭代的结果,即 f(x),f(f(x)),f(f(f(x))),...

我们 1 + 10^{-10} n 对每组函数的函数值,注意这里步进的大小仅仅是一个非常小的值

一次迭代f(x)

几乎是直线,而且值的变化很小

两次迭代

直线

三次

显示出正弦的特性了

四次

已经比较杂乱(随机)了,不过疏密程度上还有些间隔,我们把数据点标出来

五次

直接跳到十次

可以看出已经很符合我们对“随机”的认识了,然而它其实有个确定的、甚至很简单的公式。注意到高度上在两头的要比在中间的略多,这是sin函数的特性,不过正负的分布是对称的

我们可以计算下5次迭代时前100000个数中,正负的比例,是50490 : 49510,可见分布是很接近1/2的。还可以计算相邻数的乘积的期望值 E(a_na_{n+1}) ,按照前100000个数估计,为0.0014,可见独立性很强。

如果初值的分布不是均匀的呢?我们继续计算以下数列:

1 + 10^{-10} \ln (n + 1)

它是不均匀的,随着n的变化间隔会变小

三次迭代:

四次迭代

五次迭代

前100000个数正负比例是50289比49711,五次迭代相应的协方差是0.0015,仍然很接近抛硬币的结果,可见初值的不均匀性也没有什么影响了。

另外:实验中发现这个迭代的结果不管在什么条件下,似乎正的略微比负的多一点点(大约101比99),也许是Python中sin本身实现的缺陷?不管怎么样,原理应该是说明了。

来源:知乎 www.zhihu.com

作者:灵剑

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 110 个回答,查看全部。
延伸阅读:
如何用简单易懂的例子解释隐马尔可夫模型?
在进行线性回归时,为什么最小二乘法是最优方法?