負二項分布

負二項分布

統計學術語
負二項分布是統計學上一種離散概率分布。滿足以下條件的稱為負二項分布:實驗包含一系列獨立的實驗每個實驗都有成功、失敗兩種結果,成功的概率是恒定的,實驗持續到r次成功,r為正整數。
  • 中文名:負二項分布
  • 外文名:
  • 适用領域:
  • 所屬學科:
  • 英文名:Negative binomial distribution
  • 科目:統計學
  • 條件:實驗包含一系列獨立的實驗等
  • 應用:當r是整數時,又稱帕斯卡分布

名詞定義

昆蟲種群内個體有明顯的集聚現象,呈疏密相間的空間分布型,其數學表達式與指數為負的二項分布類似,故名之。

簡介

滿足以下條件的稱為負二項分布

1.實驗包含一系列獨立的實驗。

2.每個實驗都有成功、失敗兩種結果。

3.成功的概率是恒定的。

4.實驗持續到r次成功,r可以為任意正數。

當r是整數時,負二項分布又稱帕斯卡分布(巴斯卡分布),其概率密度函數為(其中一種形式,兩種形式對比看下文):

它表示,已知一個事件在伯努利試驗中每次的出現概率是p,在一連串伯努利試驗中,一件事件剛好在第r+k次試驗出現第r次的概率。

定義

假設有一組獨立的伯努利數列,每次實驗有兩種結果“成功”和“失敗”。每次實驗的成功概率是p,失敗的概率是1-p。我們得到一組數列,直到預定的失敗數發生r次。那麼結果為“成功”的随機數X會服從負二項分布(或帕斯卡)分布:

X~NB(r;P)

我們在現實生活中也常有應用,成功和失敗的結果可能或者可能不是我們平時所認認為的“好”與“壞”。假設我們把負二項分布用在一台設備在故障前正常運行的天數的模型,這種情況下,設備一天運行正常,記為結果“成功”,反之故障的話結果為“失敗”。如果我們把負二項分析用在動作員嘗試射門得分前的嘗試次數模型,這種情況下,每次不成功的嘗試在模型裡為“成功”,并且得分記為“失敗”。如果我們抛硬币,負二項分布可以把頭像一面作為“成功”來記數,在我們提到失敗的結果之前。在下面的概率密度函數裡,P是成功的概率,1-p是失敗的概率。

舉例

舉例說,若我們擲骰子,擲到一即視為成功。則每次擲骰的成功率是1/6。要擲出三次一,所需的擲骰次數屬于集合{3,4,5,6,...}。擲到三次一的擲骰次數是負二項分布的随機變量。要在第三次擲骰時,擲到第三次一,則之前兩次都要擲到一,其概率為(1/6)。注意擲骰是伯努利試驗,之前的結果不影響随後的結果,即每次實驗為獨立随機實驗。若要在第四次擲骰時,擲到第三次一,則之前三次之中要有剛好兩次擲到一,在三次擲骰中擲到2次1的概率為:

第四次擲骰要擲到一,所以要将前面的概率再乘(1/6)。

期望

參數為(r,p)的負二項分布的數列k+r的期望是r/(1-p)。為了更直觀的觀察,想象上面的實驗進行了許多次,也就是說,進行特定的實驗直到r個失敗出現,然後另外的一個特定的實驗,然後是另外的實驗,等等。寫下每次實驗的這些嘗試的次數:a,b,c…并且把a+b+c+…=N。現在我們對失敗的預期為N(1-p)。我們說實驗重複了n次,并且總共有有nr個失敗。所以我們估計nr=N(1-p),所以N/n=r/(1-p)。注意N/n僅僅是平均每個實驗的嘗試次數。這就是我們所說的“期望”。每次實驗的平均成功的嘗試次數為N/n-r,期望值等于r/(1-p)-r=rp/(1-p)。

實數r的延伸

把負二項分布的定義延伸到到的參數r。盡管很難想象一個非整數的失敗次數,我們仍然可以通過概率密度函數在形式上定義這個分布。

就像之前,我們說X服從負二項分布(或者波利亞分布),如果它有一個如下所示的概率密度函數:

這裡r是一個正實數。通過乘法公式,二項分布系數可以重新定義,并且可以重新寫成gamma分布的公式。

注意二項分布序列和上面的内容裡,0≤p≤1.

因此,概率密度函數的項實際上可以合并成一項。

替代公式

有一些書裡的負二項分布的公式定義可能和這裡的有一些小區别。最常見的變化就是:

X是實驗總次數,得到r個失敗的嘗試。不僅僅是成功的次數。因此,實驗總次數等于失敗數加成功數,這個不同于這裡定義的X。

為了把公式換這種定義進行轉換,把k用k-r代替,并且從均值、中位數,或者衆數中減去r。為了将按本節定義的負二項分布的公式轉換成本文裡的公式,需要用k+r代替k,并且在均值,中位數,衆數中加上r。

這個可能比上面的版本看起來更像二項分布,注意二項分布的參數是按順序減少的:最後一個失敗必然在最後發生,所以其它的事件有更少的可利用的位置,在計算順序可能性時。

注意這裡的負二項分布的定義沒有推廣到正實數r。

P表示失敗的概率,不是成功的。為了把公式進行轉換,每個地方用1-p代替p。X定義為失敗次數,而不是成功的,這裡的定義X為失敗的,但P是成功的,和前面X表示成功但P表示失敗概率的情況用同樣的公式。但是失敗和成功的描述是一緻的,并且和前面的進行替換。

這兩個替代公式可能會同時使用,比如X表示總次數,P表示失敗次數。

負二項回歸,分布是在均值m項裡就定義了,并且和線性回歸或者其它的一般線性回歸的解釋變量相關。概率密度函數變為

方差可以寫成m+m/r,參數r參考離散參數,形狀參數,集中系數,或者非均勻或者集中參數。集中參數特别常用于生态學用來描述獨立微生物。減少聚集參數r到0,與增加微生物聚集相一緻。0到正無窮的增加相當于沒有聚合,可以被描述成泊松分布。一些負二項回歸使用r的倒數并且當作分散度參數。

有時候分布使用均值u和方差σ來參數化分布,這種情況下:

事件

在r為整數的特定情況下,負二項分布也可以稱作帕斯卡分布。它是在獨立重複的伯努利實驗中成功和失敗的數目的概率分布。因為k+r次概率為p的成功的伯努利實驗可以得到最後一次為失敗的k次成功和r次失敗的概率。換句話說,負二項分布為成功概率為p的伯努利過程中第r次失敗前的成功次數的概率分布。一個伯努利過程是離散的過程。因此,實驗次數,失敗、成功次數都是整數。

上一篇:規劃綠線

下一篇:山東濱化集團

相關詞條

相關搜索

其它詞條