發展過程
起源
概率論是研究随機現象數量規律的數學分支,是一門研究事情發生的可能性的學問。但是最初概率論的起源與賭博問題有關。16世紀,意大利的學者吉羅拉莫·卡爾達諾(Girolamo Cardano)開始研究擲骰子等賭博中的一些簡單問題。
概率與統計的一些概念和簡單的方法,早期主要用于賭博和人口統計模型。随着人類的社會實踐,人們需要了解各種不确定現象中隐含的必然規律性,并用數學方法研究各種結果出現的可能性大小,從而産生了概率論,并使之逐步發展成一門嚴謹的學科。概率與統計的方法日益滲透到各個領域,并廣泛應用于自然科學、經濟學、醫學、金融保險甚至人文科學中。
發展
随着18、19世紀科學的發展,人們注意到在某些生物、物理和社會現象與機會遊戲之間有某種相似性,從而由機會遊戲起源的概率論被應用到這些領域中;同時這也大大推動了概率論本身的發展。使概率論成為數學的一個分支的奠基人是瑞士數學家伯努利,他建立了概率論中第一個極限定理,即伯努利大數定律,闡明了事件的頻率穩定于它的概率。随後棣莫弗和拉普拉斯又導出了第 二個基本極限定理(中心極限定理)的原始形式。
拉普拉斯在系統總結前人工作的基礎上寫出了《分析的概率理論》,明确給出了概率的古典定義,并在概率論中引入了更有力的分析工具,将概率論推向一個新的發展階段。
19世紀末,俄國數學家切比雪夫、馬爾可夫、李亞普諾夫等人用分析方法建立了大數定律及中心極限定理的一般形式,科學地解釋了為什麼實際中遇到的許多随機變量近似服從正态分布。20世紀初受物理學的刺激,人們開始研究随機過程。這方面柯爾莫哥洛夫、維納、馬爾可夫、辛欽、萊維及費勒等人作了傑出的貢獻。
定義
傳統概率
傳統概率又稱為拉普拉斯概率,因為其定義是由法國數學家拉普拉斯提出的。如果一個随機試驗所包含的單位事件是有限的,且每個單位事件發生的可能性均相等,則這個随機試驗叫做拉普拉斯試驗。在拉普拉斯試驗中,事件A在事件空間S中的概率P(A)為:
例如,在一次同時擲一個硬币和一個骰子的随機試驗中,假設事件A為獲得國徽面且點數大于4,那麼事件A的概率應該有如下計算方法:S={(國徽,1點),(數字,1點),(國徽,2點),(數字,2點),(國徽,3點),(數字,3點),(國徽,4點),(數字,4點),(國徽,5點),(數字,5點),(國徽,6點),(數字,6點)},A={(國徽,5點),(國徽,6點)},按照拉普拉斯定義,A的概率為2/12=1/6,注意到在拉普拉斯試驗中存在着若幹的疑問,在現實中是否存在着這樣一個試驗,其單位事件的概率具有精确的相同的概率值,因為人們不知道,硬币以及骰子是否"完美",即骰子制造的是否均勻,其重心是否位于正中心,以及輪盤是否傾向于某一個數字等等。
盡管如此,傳統概率在實踐中被廣泛應用于确定事件的概率值,其理論根據是:如果沒有足夠的論據來證明一個事件的概率大于另一個事件的概率,那麼可以認為這兩個事件的概率值相等。 如果仔細觀察這個定義會發現拉普拉斯用概率解釋了概率,定義中用了"相同的可能性"(原文是égalementpossible)一詞,其實指的就是"相同的概率"。這個定義也并沒有說出,到底什麼是概率,以及如何用數字來确定概率。在現實生活中也有一系列問題,無論如何不能用傳統概率定義來解釋,比如,人壽保險公司無法确定一個50歲的人在下一年将死去的概率等。
公理化定義
如何定義概率,如何把概率論建立在嚴格的邏輯基礎上,是概率理論發展的困難所在,對這一問題的探索一直持續了3個世紀。20世紀初完成的勒貝格測度與積分理論及随後發展的抽象測度和積分理論,為概率公理體系的建立奠定了基礎。
在這種背景下,蘇聯數學家柯爾莫哥洛夫1933年在他的《概率論基礎》一書中第一次給出了概率的測度論的定義和一套嚴密的公理體系。他的公理化方法成為現代概率論的基礎,使概率論成為嚴謹的數學分支,對概率論的迅速發展起了積極的作用。
以下是公理化定義:
設随機實驗E的樣本空間為Ω。若按照某種方法,對E的每一事件A賦于一個實數P(A),且滿足以下公理:
(1)非負性:P(A)≥0;
(2)規範性:P(Ω)=1;
(3)可列(完全)可加性:對于兩兩互不相容的可列無窮多個事件A1,A2,……,An,……,有
,則稱實數P(A)為事件A的概率。
統計定義
設随機事件A在n次重複試驗中發生的次數為nA,若當試驗次數n很大時,頻率nA/n穩定地在某一數值p的附近擺動,且随着試驗次數n的增加,其擺動的幅度越來越小,則稱數p為随機事件A的概率,記為P(A)=p。
事件
事件包括單位事件、事件空間、随機事件等。
在一次随機試驗中可能發生的唯一的,且相互之間獨立的結果被稱為單位事件,用e表示。在随機試驗中可能發生的所有單位事件的集合稱為事件空間,用S來表示。例如在一次擲骰子的随機試驗中,如果用獲得的點數來表示單位事件,那麼一共可能出現6個單位事件,則事件空間可以表示為S={1,2,3,4,5,6}。 上面的事件空間是由可數有限單位事件組成,事實上還存在着由可數無限以及不可數單位事件組成的事件空間,比如在一次直到獲得國徽面朝上的随機擲硬币試驗中,其事件空間由可數無限單位事件組成,表示為:S={國,數國,數數國,數數數國,數數數數國,···},注意到在這個例子中"數數數國"是單位事件。将兩根筷子随意扔向桌面,其靜止後所形成的交角假設為α,這個随機試驗的事件空間的組成可以表示為
随機事件是事件空間S的子集,它由事件空間S中的單位元素構成,用大寫字母A,B,C...表示。例如在擲兩個骰子的随機試驗中,設随機事件A="獲得的點數和大于10",則A可以由下面3個單位事件組成:A={(5,6),(6,5),(6,6)}。 如果在随機試驗中事件空間中的所有可能的單位事件都發生,這個事件被稱為必然事件,表示為;相應的如果事件空間裡不包含任何一個單位事件,則稱之為不可能事件,表示為。
事件的計算
因為事件在一定程度上是以集合的含義定義的,因此可以把集合計算方法直接應用于事件的計算,也就是說,在計算過程中,可以把事件當作集合來對待。
在輪盤遊戲中假設A代表事件“球落在紅色區域”,B代表事件"球落在黑色區域",C代表事件"球落在綠色區域",因為事件A和B沒有共同的單位事件,因此可表示為概率P(AB)=0。
注意到事件A和B并不是互補的關系,因為在整個事件空間S中還有一個單位事件C,其即不是紅色也不是黑色,而是綠色,因此A,B的補集應該分别表示如下:以及
條件概率
一事件A在一事件B确定發生後會發生的概率稱為B給之A的條件概率;其數值為(當時)。若B給之A的條件概率和A的概率相同時,則稱A和B為獨立事件。且A和B的此一關系為對稱的,這可以由一同價叙述:“當A和B為獨立事件時,P(A∩B)=P(A)P(B)”看出。
相關事例
人們普遍認為,對将要發生的機率的一種不好的感覺,或者說不安全感(俗稱“點背”)是實際存在的。下面列出的幾個例子可以形象闡述人們有時對機率存在的錯誤的認識:
(1)六合彩:在六合彩(49選6)中,一共有13983816種可能性,普遍認為,如果每周都買一個不相同的号,最晚可以在13983816/52(周)=268919年後獲得頭等獎。事實上這種理解是錯誤的,因為每次中獎的機率是相等的,中獎的可能性并不會因為時間的推移而變大。
(2)生日悖論:在一個足球場上有23個人(2×11個運動員和1個裁判員),不可思議的是,在這23人當中至少有兩個人的生日是在同一天的機率要大于50%。
(3)輪盤遊戲:在遊戲中玩家普遍認為,在連續出現多次紅色後,出現黑色的機率會越來越大。這種判斷也是錯誤的,即出現黑色的機率每次是相等的,因為球本身并沒有“記憶”,它不會意識到以前都發生了什麼,其機率始終是18/37。
(4)三門問題:在電視台舉辦的猜隐藏在門後面的汽車的遊戲節目中,在參賽者的對面有三扇關閉的門,其中隻有一扇門的後面有一輛汽車,其它兩扇門後是山羊。遊戲規則是,參賽者先選擇一扇他認為其後面有汽車的門,但是這扇門仍保持關閉狀态,緊接着主持人打開沒有被參賽者選擇的另外兩扇門中後面有山羊的一扇門,這時主持人問參賽者,要不要改變主意,選擇另一扇門,以使得赢得汽車的機率更大一些?
正确結果是,如果參賽者改變初衷,他的中獎概率将變成2/3。因為打開山羊門的那一刹那,本來的選擇結果已經從1/3幾率變到了1/2幾率,如果改變初衷此時将是1/2中獎的幾率。
有三種可能的情況,全部都有相等的可能性(1/3)︰參賽者挑山羊一号,主持人挑山羊二号。轉換将赢得汽車。參賽者挑山羊二号,主持人挑山羊一号。轉換将赢得汽車。參賽者挑汽車,主持人挑兩頭山羊的任何一頭。轉換将失敗。在頭兩種情況,參賽者可以通過轉換選擇而赢得汽車。第三種情況是唯一一種參賽者通過保持原來選擇而赢的情況。因為三種情況中有兩種是通過轉換選擇而赢的,所以通過轉換選擇而赢的概率是2/3。
計算
需要提及的是下面将要介紹的9個計算概率的定理與上面已經提及的事件的計算沒有關系,所有關于概率的定理均由概率的3個公理得來,同時适用于包括拉普拉斯概率和統計概率在内的所有概率理論。
定理1
又稱互補法則。
與A互補事件的概率始終是1-P(A)。
第一次旋轉紅色不出現的概率是19/37,按照乘法法則,第二次也不出現紅色的概率是,因此在這裡互補概率就是指在兩次連續旋轉中至少有一次是紅色的概率,為
定理2
不可能事件的概率為零。
證明: Q和S是互補事件,按照公理2有P(S)=1,再根據上面的定理1得到P(Q)=0
定理3
如果A1...An事件不能同時發生(為互斥事件),而且若幹事件A1,A2,...An∈S每兩兩之間是空集關系,那麼這些所有事件集合的概率等于單個事件的概率的和。
例如,在一次擲骰子中,得到5點或者6點的概率是:
定理4
如果事件A,B是差集關系,則有
定理5
任意事件加法法則:
對于事件空間S中的任意兩個事件A和B,有如下定理: 概率
定理6
乘法法則:
事件A,B同時發生的概率是:,前提為事件A,B有一定關聯。
定理7
無關事件乘法法則:
兩個不相關聯的事件A,B同時發生的概率是:注意到這個定理實際上是定理6(乘法法則)的特殊情況,如果事件A,B沒有聯系,則有P(A|B)=P(A),以及P(B|A)=P(B)。觀察一下輪盤遊戲中兩次連續的旋轉過程,P(A)代表第一次出現紅色的概率,P(B)代表第二次出現紅色的概率,可以看出,A與B沒有關聯,利用上面提到的公式,連續兩次出現紅色的概率為:
忽視這一定理是造成許多玩家失敗的根源,普遍認為,經過連續出現若幹次紅色後,黑色出現的概率會越來越大,事實上兩種顔色每次出現的概率是相等的,之前出現的紅色與之後出現的黑色之間沒有任何聯系,因為球本身并沒有"記憶",它并不"知道"以前都發生了什麼。
所以,連續10次至少有1次出現紅色的概率為
統計概率
統計概率是建立在頻率理論基礎上的,分别由英國邏輯學家約翰(John Venn,1834-1923)和奧地利數學家理查德(Richard VonMises,1883-1953)提出,他們認為,獲得一個事件的概率值的唯一方法是通過對該事件進行100次,1000次或者甚至10000次的前後相互獨立的n次随機試驗,針對每次試驗均記錄下絕對頻率值和相對頻率值hn(A),随着試驗次數n的增加,會出現如下事實,即相對頻率值會趨于穩定,它在一個特定的值上下浮動,也即是說存在着一個極限值P(A),相對頻率值趨向于這個極限值。
這個極限值被稱為統計概率,表示為:
例如,若想知道在一次擲骰子的随機試驗中獲得6點的概率值可以對其進行3000次前後獨立的扔擲試驗,在每一次試驗後記錄下出現6點的次數,然後通過計算相對頻率值可以得到趨向于某一個數的統計概率值。
上面提到的這個有關相對頻率的經驗值又被稱為大數定律,是頻率理論學家定義概率論的基礎。然而沒有人可以将骰子無限的扔下去,因此在實踐中也就無法有力的證明大數定律,許多來自數學理論的論證至今也沒有取得成功。盡管如此,統計概率在今天的實踐中具有重要意義,它是數理統計的基礎。
完全概率
n個事件H1,H2,...Hn互相間獨立,且共同組成整個事件空間S,即,而且。這時A的概率可以表示為
例如,一個随機試驗工具由一個骰子和一個櫃子中的三個抽屜組成,抽屜1裡有14個白球和6個黑球,抽屜2裡有2個白球和8個黑球,抽屜3裡有3個白球和7個黑球,試驗規則是首先擲骰子,如果獲得小于4點,則抽屜1被選擇,如果獲得4點或者5點,則抽屜2被選擇,其他情況選擇抽屜3。然後在選擇的抽屜裡随機抽出一個球,最後抽出的這個球是白球的概率是:
P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)
=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)
=28/60=0.4667
從例子中可看出,完全概率特别适合于分析具有多層結構的随機試驗的情況。
貝葉斯定理
貝葉斯定理由英國數學家貝葉斯(Thomas Bayes,1702-1761)發展,用來描述兩個條件概率之間的關系,比如P(A|B)和P(B|A)。按照定理6的乘法法則,,可以立刻導出貝葉斯定理:如上公式也可變形為例如:。
一座别墅在過去的20年裡一共發生過2次被盜,别墅的主人有一條狗,狗平均每周晚上叫3次,在盜賊入侵時狗叫的概率被估計為0.9,問題是:在狗叫的時候發生入侵的概率是多少?
人們假設A事件為狗在晚上叫,B為盜賊入侵,則,,,按照公式很容易得出結果:。
另一個例子,現分别有A,B兩個容器,在容器A分别有7個紅球和3個白球,在容器B裡有1個紅球和9個白球,現已知從這兩個容器裡任意抽出了一個球,且是紅球,問這個紅球是來自容器A的概率是多少?
假設已經抽出紅球為事件B,從容器A裡抽出球為事件A,則有:,,按照公式,則有:。
雖然概率論最早産生于17世紀,然而其公理體系卻在20世紀的20至30年代才建立起來并得到迅速發展,在過去的半個世紀裡概率論在越來越多的新興領域顯示了它的應用性和實用性,例如:物理、化學、生物、醫學、心理學、社會學、政治學、教育學,經濟學以及幾乎所有的工程學等領域。
特别值得一提的是,概率論是今天數理統計的基礎,其結果常被用做問卷調查的分析資料,而且也用于對經濟前景進行預測。