概率论:数学分支-中文百科频道

发展过程

起源

概率论是研究随机现象数量规律的数学分支，是一门研究事情发生的可能性的学问。但是最初概率论的起源与赌博问题有关。16世纪，意大利的学者吉罗拉莫·卡尔达诺（Girolamo Cardano）开始研究掷骰子等赌博中的一些简单问题。

概率与统计的一些概念和简单的方法，早期主要用于赌博和人口统计模型。随着人类的社会实践，人们需要了解各种不确定现象中隐含的必然规律性，并用数学方法研究各种结果出现的可能性大小，从而产生了概率论，并使之逐步发展成一门严谨的学科。概率与统计的方法日益渗透到各个领域，并广泛应用于自然科学、经济学、医学、金融保险甚至人文科学中。

发展

随着18、19世纪科学的发展，人们注意到在某些生物、物理和社会现象与机会游戏之间有某种相似性，从而由机会游戏起源的概率论被应用到这些领域中；同时这也大大推动了概率论本身的发展。使概率论成为数学的一个分支的奠基人是瑞士数学家伯努利，他建立了概率论中第一个极限定理，即伯努利大数定律，阐明了事件的频率稳定于它的概率。随后棣莫弗和拉普拉斯又导出了第二个基本极限定理（中心极限定理）的原始形式。

拉普拉斯在系统总结前人工作的基础上写出了《分析的概率理论》，明确给出了概率的古典定义，并在概率论中引入了更有力的分析工具，将概率论推向一个新的发展阶段。

19世纪末，俄国数学家切比雪夫、马尔可夫、李亚普诺夫等人用分析方法建立了大数定律及中心极限定理的一般形式，科学地解释了为什么实际中遇到的许多随机变量近似服从正态分布。20世纪初受物理学的刺激，人们开始研究随机过程。这方面柯尔莫哥洛夫、维纳、马尔可夫、辛钦、莱维及费勒等人作了杰出的贡献。

定义

传统概率

传统概率又称为拉普拉斯概率，因为其定义是由法国数学家拉普拉斯提出的。如果一个随机试验所包含的单位事件是有限的，且每个单位事件发生的可能性均相等，则这个随机试验叫做拉普拉斯试验。在拉普拉斯试验中，事件A在事件空间S中的概率P(A)为：

例如，在一次同时掷一个硬币和一个骰子的随机试验中，假设事件A为获得国徽面且点数大于4，那么事件A的概率应该有如下计算方法：S={(国徽，1点)，(数字，1点)，(国徽，2点)，(数字，2点)，(国徽，3点)，(数字，3点)，(国徽，4点)，(数字，4点)，(国徽，5点)，(数字，5点)，(国徽，6点)，(数字，6点)}，A={(国徽，5点)，(国徽，6点)}，按照拉普拉斯定义，A的概率为2/12=1/6，注意到在拉普拉斯试验中存在着若干的疑问，在现实中是否存在着这样一个试验，其单位事件的概率具有精确的相同的概率值，因为人们不知道，硬币以及骰子是否"完美"，即骰子制造的是否均匀，其重心是否位于正中心，以及轮盘是否倾向于某一个数字等等。

尽管如此，传统概率在实践中被广泛应用于确定事件的概率值，其理论根据是：如果没有足够的论据来证明一个事件的概率大于另一个事件的概率，那么可以认为这两个事件的概率值相等。如果仔细观察这个定义会发现拉普拉斯用概率解释了概率，定义中用了"相同的可能性"（原文是égalementpossible）一词，其实指的就是"相同的概率"。这个定义也并没有说出，到底什么是概率，以及如何用数字来确定概率。在现实生活中也有一系列问题，无论如何不能用传统概率定义来解释，比如，人寿保险公司无法确定一个50岁的人在下一年将死去的概率等。

公理化定义

如何定义概率，如何把概率论建立在严格的逻辑基础上，是概率理论发展的困难所在，对这一问题的探索一直持续了3个世纪。20世纪初完成的勒贝格测度与积分理论及随后发展的抽象测度和积分理论，为概率公理体系的建立奠定了基础。

在这种背景下，苏联数学家柯尔莫哥洛夫1933年在他的《概率论基础》一书中第一次给出了概率的测度论的定义和一套严密的公理体系。他的公理化方法成为现代概率论的基础，使概率论成为严谨的数学分支，对概率论的迅速发展起了积极的作用。

以下是公理化定义：

设随机实验E的样本空间为Ω。若按照某种方法，对E的每一事件A赋于一个实数P(A)，且满足以下公理：

（1）非负性：P(A)≥0；

（2）规范性：P(Ω)=1；

（3）可列（完全）可加性：对于两两互不相容的可列无穷多个事件A1，A2，……，An，……，有

，则称实数P(A)为事件A的概率。

统计定义

设随机事件A在n次重复试验中发生的次数为nA，若当试验次数n很大时，频率nA/n稳定地在某一数值p的附近摆动，且随着试验次数n的增加，其摆动的幅度越来越小，则称数p为随机事件A的概率，记为P(A)=p。

事件

事件包括单位事件、事件空间、随机事件等。

在一次随机试验中可能发生的唯一的，且相互之间独立的结果被称为单位事件，用e表示。在随机试验中可能发生的所有单位事件的集合称为事件空间，用S来表示。例如在一次掷骰子的随机试验中，如果用获得的点数来表示单位事件，那么一共可能出现6个单位事件，则事件空间可以表示为S={1，2，3，4，5，6}。上面的事件空间是由可数有限单位事件组成，事实上还存在着由可数无限以及不可数单位事件组成的事件空间，比如在一次直到获得国徽面朝上的随机掷硬币试验中，其事件空间由可数无限单位事件组成，表示为：S={国，数国，数数国，数数数国，数数数数国，···}，注意到在这个例子中"数数数国"是单位事件。将两根筷子随意扔向桌面，其静止后所形成的交角假设为α，这个随机试验的事件空间的组成可以表示为

随机事件是事件空间S的子集，它由事件空间S中的单位元素构成，用大写字母A，B，C...表示。例如在掷两个骰子的随机试验中，设随机事件A="获得的点数和大于10"，则A可以由下面3个单位事件组成：A={(5，6)，(6，5)，(6，6)}。如果在随机试验中事件空间中的所有可能的单位事件都发生，这个事件被称为必然事件，表示为；相应的如果事件空间里不包含任何一个单位事件，则称之为不可能事件，表示为。

事件的计算

因为事件在一定程度上是以集合的含义定义的，因此可以把集合计算方法直接应用于事件的计算，也就是说，在计算过程中，可以把事件当作集合来对待。

A的补集

不属于A的事件发生

并集A∪B

或者A或者B或者A，B同时发生

交集A∩B

事件A，B同时发生

差集AB

不属于B的A事件发生）

空集A∩B=∅A，B事件不同时发生

子集B⊆A

如A发生，则B也一定发生

在轮盘游戏中假设A代表事件“球落在红色区域”，B代表事件"球落在黑色区域"，C代表事件"球落在绿色区域"，因为事件A和B没有共同的单位事件，因此可表示为概率P(AB)=0。

注意到事件A和B并不是互补的关系，因为在整个事件空间S中还有一个单位事件C，其即不是红色也不是黑色，而是绿色，因此A，B的补集应该分别表示如下：以及

条件概率

一事件A在一事件B确定发生后会发生的概率称为B给之A的条件概率；其数值为（当时）。若B给之A的条件概率和A的概率相同时，则称A和B为独立事件。且A和B的此一关系为对称的，这可以由一同价叙述：“当A和B为独立事件时，P(A∩B)=P(A)P(B)”看出。

计算

需要提及的是下面将要介绍的9个计算概率的定理与上面已经提及的事件的计算没有关系，所有关于概率的定理均由概率的3个公理得来，同时适用于包括拉普拉斯概率和统计概率在内的所有概率理论。

定理1

又称互补法则。

与A互补事件的概率始终是1-P(A)。

第一次旋转红色不出现的概率是19/37，按照乘法法则，第二次也不出现红色的概率是，因此在这里互补概率就是指在两次连续旋转中至少有一次是红色的概率，为

定理2

不可能事件的概率为零。

证明： Q和S是互补事件，按照公理2有P(S)=1，再根据上面的定理1得到P(Q)=0

定理3

如果A1...An事件不能同时发生（为互斥事件），而且若干事件A1，A2，...An∈S每两两之间是空集关系，那么这些所有事件集合的概率等于单个事件的概率的和。

例如，在一次掷骰子中，得到5点或者6点的概率是：

定理4

如果事件A，B是差集关系，则有

定理5

任意事件加法法则：

对于事件空间S中的任意两个事件A和B，有如下定理：概率

定理6

乘法法则：

事件A，B同时发生的概率是：，前提为事件A,B有一定关联。

定理7

无关事件乘法法则：

两个不相关联的事件A，B同时发生的概率是：注意到这个定理实际上是定理6(乘法法则)的特殊情况，如果事件A，B没有联系，则有P(A|B)=P(A)，以及P(B|A)=P(B)。观察一下轮盘游戏中两次连续的旋转过程，P(A)代表第一次出现红色的概率，P(B)代表第二次出现红色的概率，可以看出，A与B没有关联，利用上面提到的公式，连续两次出现红色的概率为：

忽视这一定理是造成许多玩家失败的根源，普遍认为，经过连续出现若干次红色后，黑色出现的概率会越来越大，事实上两种颜色每次出现的概率是相等的，之前出现的红色与之后出现的黑色之间没有任何联系，因为球本身并没有"记忆"，它并不"知道"以前都发生了什么。

所以，连续10次至少有1次出现红色的概率为

统计概率

统计概率是建立在频率理论基础上的，分别由英国逻辑学家约翰(John Venn,1834-1923)和奥地利数学家理查德(Richard VonMises,1883-1953)提出，他们认为，获得一个事件的概率值的唯一方法是通过对该事件进行100次，1000次或者甚至10000次的前后相互独立的n次随机试验，针对每次试验均记录下绝对频率值和相对频率值hn(A)，随着试验次数n的增加，会出现如下事实，即相对频率值会趋于稳定，它在一个特定的值上下浮动，也即是说存在着一个极限值P(A)，相对频率值趋向于这个极限值。

这个极限值被称为统计概率，表示为：

例如，若想知道在一次掷骰子的随机试验中获得6点的概率值可以对其进行3000次前后独立的扔掷试验，在每一次试验后记录下出现6点的次数，然后通过计算相对频率值可以得到趋向于某一个数的统计概率值。

扔掷数

获得6点的绝对频率

获得6点的相对频率

1.00000

0.50000

0.33333

0.25000

0.40000

0.20000

0.25000

100

0.12000

200

0.19500

300

0.15333

400

0.18000

500

0.15200

600

102

0.17000

700

120

0.17143

1000

170

0.17000

2000

343

0.17150

3000

560

0.16867

上面提到的这个有关相对频率的经验值又被称为大数定律，是频率理论学家定义概率论的基础。然而没有人可以将骰子无限的扔下去，因此在实践中也就无法有力的证明大数定律，许多来自数学理论的论证至今也没有取得成功。尽管如此，统计概率在今天的实践中具有重要意义，它是数理统计的基础。

完全概率

n个事件H1，H2，...Hn互相间独立，且共同组成整个事件空间S，即，而且。这时A的概率可以表示为

例如，一个随机试验工具由一个骰子和一个柜子中的三个抽屉组成，抽屉1里有14个白球和6个黑球，抽屉2里有2个白球和8个黑球，抽屉3里有3个白球和7个黑球，试验规则是首先掷骰子，如果获得小于4点，则抽屉1被选择，如果获得4点或者5点，则抽屉2被选择，其他情况选择抽屉3。然后在选择的抽屉里随机抽出一个球，最后抽出的这个球是白球的概率是：

P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)

=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)

=28/60=0.4667

从例子中可看出，完全概率特别适合于分析具有多层结构的随机试验的情况。