首先,这是一个非常有趣的问题!
先说答案,有理数的概率不只是比1/2小,实际上是0.
也许你会感到意外,但仔细读下来你会欣然接受。
摘要
0. 确定问题-从逻辑角度
1. 严格证明
2. 概率公理化的动机
3. 直观解释-心理障碍
4. 不用概率公理化的常规解释-编后语
0. 确定问题-从逻辑角度
首先,我觉得你应该是逻辑层面的意思(而不是从操作层面,即物理角度),即从数学角度考虑这个问题。
如果是这样,为了不发生歧义,我将问题重新组织一下。
在单位区间 中,随机选取一个实数,则其为有理数的概率是多大?
构造区间 上的函数:
其实这就是狄利克雷(Dirichlet)函数。
假设区间 上有均匀概率分布P, 即 .
(此时概率P就类似区间 上长度的概念。)于是上述狄利克雷(Dirichlet)函数成为此区间上的一个随机变量。
因此,你的问题可以描述为:求概率 ,即该随机变量取值为1时的概率.
先说答案,不只是比 小,实际上是0.
下面,我先给你一个相对严格和理性的证明,然后再来直观的解释一下。
1. 严格证明
首先,有理数集是可数的,即跟正整数集一样多。
这里简短讲下。
通过构造从有理数集到正整数集的双射(一一对应)。
令映射射 ,其中
很容易验证,这是个双射。
这个构造看上去很复杂,其实是很直观的。
令 .则正有理数集 . 把集合 的元素放在第i行,从小到大左右排列。
如此就把正有理数集排成了一个 的无穷大的矩阵了。
沿着从西南往东北的方向从上到下数,给正有理数标号就是上述双射。
更多关于“个数”的精彩数学详见专栏文章:
其次,概率的可数可加性。
对两两不交的区间 的子集序列 ,我们有
这是概率公理条件中最重要的一条。
另外,单点集的概率是0。
你可以简单理解为,一个点的长度是0.
严格证明的思路就是:
对任意充分小的
由于 的任意性,很快得到
上述三条加起来,就得到了:
其实,从这个例子中就可以看出一些概率公理化的动机和思路。
通常我们讲的概率是离散类型的。
比如给你一个6面均匀的骰子,那么转出1的概率是1/6。
这个之所以简单以及能从直观上很容易理解是,因为总共就只有有限种(6种)情况。
而本问题,显然有无限种可能,而且还不仅仅是可数,它是连续的,稠密的,有实数个数那么多种情况,这被称为连续型概率问题。
2. 概率公理化的动机
对于连续型的情况,要怎么严格定义概率呢?
这就是概率公理化的重要动机之一!
严格定义一个数学概念,在人类史或者数学史上出现过多次,每次都有大事发生。
比如无理数,古希腊的时候毕达哥拉斯的一个学生因为利用毕达哥拉斯定理(我们叫勾股定理)发现 后,
证明了它不是当前知道的任何一个数(就是我们后来称为有理数的东西), 被老师的一大帮追随者扔到海里喂鱼了。
就现在,很多人的认识都只停留在了毕达哥拉斯时代。
后来大家发现这种奇怪的数,到处都是。
经过数学家的努力,后来就利用有理数列的极限严格定义了实数,也就是大家学习的实数的(无穷)小数表示。
牛顿,莱布尼茨他们发现了微积分,用导函数来求速度,切线等物理,几何问题,用积分来求位移,面积等物理,几何问题。
但是他们没有严格定义,于是就有了后来的包括柯西等数学家的极限的严格定义。
有了极限的概念,微积分就容易定义了。
这两个故事,其实就是数学历史上的所谓的三次危机的前两次。
回到正题,我们来讲下要如何严格定义概率?
有几点是我们很自然就会想到的。
首先,它应该是从一个大集合(比如这里的[0,1])的一些子集构成的集合到实数集的一个映射。
其次,其概率值应该是非负的。这就是公理化的第一条,非负性。
另外,大集合的概率值应该是1,因为它包含了所有的可能。这就是公理化的第二条,归一性。
最后,有限可加性。即两个无交集的事件之并的概率值应该是两个事件的概率值之和。这就是公理化第三条(可数可加性)的前身。
以上三条就是概率公理化的三条。
其实,本题就可以很好的解释从有限可加性到可数可加性的过渡。
本题中我们的概率其实就是区间 上长度的概念。
我们通常求的是里面一个更短的区间
[a, b]的长度(概率)是多少?
很直观,应该是b-a.
但是,万一问到,这里的区间 上的所有有理数的长度(概率)是多少呢?
这时,我们就傻了,我们发现有限可加性已经不够用了。
于是就想到了可数可加性。
3. 直观解释-心理障碍
a. 虽然我们的有理数在实数中是稠密的。
比如任何两个不同的实数中间都必然存在一个有理数,实际上存在无限个有理数。
又比如,对任何一个实数都可找到一个有理数列收敛于它。
b. 无理数的个数跟实数一样多,都比有理数的个数大很多很多,虽然有理数有无限个。
c. 还有今天的,在一段实数,比如[0,1]上随机挑一个数出来, 挑到有理数的可能性是0.
以上三个问题实际上分别对应数学的三个不同分支的基本知识。
他们分别是:
- 实数的拓扑结构
高数,数学分析,点集拓扑,分析类的课程都会讲。
- 集合论的势
在集合论,实变函数等会讲到。
- 测度的可数可加性
在实变函数,测度论,数学系的概率论等课程会讲。
之所以大家在面对以上三个方面的事实时会感到困惑,或者说有不少心理障碍。
比如说:
有人会问有理数跟无理数你中有我,我中有你,凭什么说无理数比有理数多?也有人会问明明[0,1]上有无限个有理数,你却告诉我,在[0,1]上随机挑一个数出来, 挑到有理数的可能性是0?
这其中的原因是:
当你会问这些问题时,基本上你不是学霸就是好奇心很强。
从自然语言(比如汉语)表面上看,这些问题似乎很简单。
实际上是很复杂的。
这些复杂问题用逻辑语言表达成数学模型时,有些你原先直观上的感受可能会出现偏差。
比如在用严格的数学逻辑解决之前,你的直观是整数比自然数多了很多,而用了集合的势的这种严格的数学概念后,你会发现整数和自然数集的势相等(即一样多)。
这个与你想象中的感觉是否完全一致呢?
不知道,每个人感受都不太一样,但是感觉和直观是不那么靠谱的,它可以辅助你获得灵感,但是不像逻辑,数学这么硬(solid),这么可靠。
再比如本题中概率的可数可加性,你觉得有无限个相加还是有点不靠谱。
假设你只接受有限可加性。
如果是这样的话,那本题中的挑中有理数的概率就算不出来了。
事情就卡在那,停滞不前。
但是采用可数可加性呢,
一是可以解决问题继续前行,
二是由此得到的解答,除了这一点不符合您的感受,你有关概率的其它感受或者直观几乎都照顾到了。
那么我们的数学或者自然科学的发展,应该怎么取舍呢?
就是你怎么知道要放弃或者推广有限可加性这个感受,而不去放弃其它的呢?
比如你也可以让概率取个负数值啊之类的。
这个问题是真的问到点子上了。
这只有那些走在最前面的开创者们,比如概率论公理化的创建者,前苏联数学家柯尔莫果洛夫Kolmogorov,他们才真正知道。
顺便安利一下,概率论公理化的创建者,前苏联数学家柯尔莫果洛夫Kolmogorov:
我们的世界就是由他们这些少数人极大地推动向前的。
讲到这里,你还有心理上的不舒服吗?
4. 不用概率公理化的常规解释-编后语
从评论中的反馈来看,主要的困惑焦点集中在如下两个问题, 我这里从舒缓大家心理的角度来解释一下,因为严谨的方法我已经在文中写过了。
Q1: 单位区间[0,1]中明明包含某个点,比如0, 为何取到它的概率为0呢?
A1: 有这种「能取到某个样本就认为取到它的概率大于0」根深蒂固的观点,主要原因还是停留在有限样本空间太久的缘故。
即使按照有限样本的做法,假设取到一个点的权重是1,那整个单位区间的权重肯定是无穷大,而且还是比可数大很多的那种无穷大。
此时,取到「0」的概率为:
Q2: 单位区间[0,1]中包含无数个有理数,为何取到有理数的概率为0呢?
A2: 同样用按照有限样本的做法,分子分母都是无穷大,但是分母是更高阶的无穷大。
此时,取到「有理数」的概率为:
有人又要问了,为什么把有理数看成 ,而实数就成了 .
好,我再满足一下你的好奇心。
采用二进制,我们依然有实数的小数表示,而且有理数的定义依然等价于有限位或者无限循环小数。
由于是二进制,每一个位上不是0,就是1,因此一个实数只要选定哪些位放1,那剩下的都自然是0了。
于是只要选定正整数集的一个子集即可,在那些位上放1。
有理数集和正整数集有相同的个数,记为可数。
于是实数的个数等同于正整数集的所有子集的个数,即正整数集的幂集的个数。
如此实数的个数就是 .
这里再解释一下一个命题:
若集合A为有限集,假设个数为n, 则其幂集的个数为2的n次方。
只要看如下的二项式展开就可得到这个问题的两个证明方法:
因为A的幂集就是A的所有子集构成的集合。
因此看右边就是对A的子集个数进行分类,子集个数为k的子集一共有 个,加起来就是所有的子集个数。
看左边的话,要确定一个A的子集,只需要对A的每个元素确定它是不是在此子集中即可。
因此对于A中的n个元素,每个元素都有两种情况,在或者不在此子集中。
利用乘法原理,我们便得到一共有2的n次方种情况,即有2的n次方个子集。
正是由于以上事实,当集合A是无限集时,假设势为a(a非有限), 我们采用记号 来表示A的幂集的势。
多谢关注和点赞,支持原创高质量文章!
更多精彩数学详见专栏–
来源:知乎 www.zhihu.com
作者:知乎用户(登录查看详情)
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 166 个回答,查看全部。
延伸阅读:
两个有理数之间必然存在一个无理数,两个无理数之间必然存在一个有理数,但是为何无理数多于有理数?