抽樣分布

抽樣分布

統計學方法
從一個給定的總體中抽取(不論是否有放回)容量(或大小)為n的所有可能的樣本,對于每一個樣本,計算出某個統計量(如樣本均值或标準差)的值,不同的樣本得到的該統計量的值是不一樣的,由此得到這個統計量的分布,稱之為抽樣分布。
  • 中文名:抽樣分布
  • 外文名:Sampling Distribution
  • 别名:
  • 表達式:
  • 提出者:
  • 适用領域:
  • 學科:統計學
  • 目的:統計量的分布
  • 特點:抽樣分布是統計推斷的理論基礎

定義

在數理統計中,統計估計與推斷需要我們進行抽樣來估計,而樣本是統計估計和推斷的依據,所以在處理具體理論與應用問題時,我們很少直接利用樣本,而是利用它們經過适當處理導出來的量,這個量也就是統計量,統計量的分布也就是抽樣分布。

以樣本平均數為例,它是總體平均數的一個估計量,如果按照相同的樣本容量,相同的抽樣方式,反複地抽取樣本,每次可以計算一個平均數,所有可能樣本的平均數所形成的分布,就是樣本平均數的抽樣分布。

類型n

單一樣本統計量

當我們要對某一總體的參數進行估計時,就要研究來自該總體的所有可能的樣本統計量的分布問題,比如樣本均值的分布、樣本比例的分布,從而概括有關統計量抽樣分布的一般規律。n

樣本均值

1.形成

樣本均值的抽樣分布即所有樣本均值的可能取值形成的概率分布。例如,某高校大一年級參加英語四級考試的人數為6000人,為了研究這6000人的平均考分,欲從中随機抽取500人組成樣本進行觀察。若逐一抽取全部可能樣本,并計算出每個樣本的平均考分,将會得出很多不完全相同的樣本均值,全部可能的樣本均值有一個相應的概率分布,即為樣本均值的抽樣分布。n

2.特征

從抽樣分布的角度看,我們所關心的分布的特征主要是數學期望和方差。這兩個特征一方面與總體分布的均值和方差有關,另一方面也與抽樣的方法是重複抽樣還是不重複抽樣有關。

3.形式

樣本均值抽樣分布的形式與原有總體的分布和樣本容量n的大小有關。n如果原有總體是正态分布,那麼,無論樣本容量的大小,樣本均值的抽樣分布都服從正态分布。n如果原有總體的分布是非正态分布,就要看樣本容量的大小。随着樣本容量n的增大(通常要求n≥30),不論原來的總體是否服從正态分布,樣本均值的抽樣分布都将趨于正态分布,即統計上著名的中心極限定理。n雖然總體成績的分布形态未知,但σ已知,且n=150為大樣本,依據中心極限定理可知:樣本均值的抽樣分布近似服從正态分布。n

樣本比例

樣本比例即指樣本中具有某種特征的單位所占的比例。樣本比例的抽樣分布就是所有樣本比例的可能取值形成的概率分布。例如,某高校大一年級學生參加英語四級考試的人數有6000人,為了估計這6000人中男生所占的比例,從中抽取500人組成樣本進行觀察,若逐一抽取全部可能樣本,并計算出每個樣本的男生比例,則全部可能的樣本比例的概率分布,即為樣本比例的抽樣分布。可見,樣本比例也是一個随機變量。n

1.特征n

在大樣本情況下,樣本比例的抽樣分布特征可概括如下:n

無論是重複抽樣還是不重複抽樣,樣本比例p的數學期望總是等于總體比例Pn

2.形式n

樣本比例的分布屬于二項分布問題,當樣本容量n足夠大時,即當nP與n(1-P)都不小于5時,樣本比例的抽樣分布近似為正态分布。n

兩個樣本統計量n

如果要對兩個總體有關參數的差異進行估計,就要研究來自這兩個總體的所有可能樣本相應統計量差異的抽樣分布。n

兩個樣本均值差異

若從總體X1和總體X2中分别獨立地抽取容量為n1和n2的樣本,則由兩個樣本均值之差X1-X2的所有可能取值形成的概率分布稱為兩個樣本均值差異的抽樣分布。n

設總體X1和總體X2的均值分别為μ1和μ2,标準差分别為σ1和σ2,則兩個樣本均值之差X1-X2的抽樣分布可概括為以下兩種情況:n

(1)若總體X1-N(μ1,),總體X2-N(μ2,),則

X1-X2-N(μ12,)n

(2)若兩個總體都是非正态總體,當兩個樣本容量n1和n2都足夠大時,依據中心極限定理,X1-X2分别近似服從正态分布,則

X1-X2-N(μ12,)n兩個樣本比例差異

若從總體X1和總體X2中分别獨立地抽取容量為n1和n2的樣本,則由兩個樣本比例之差p1 − p2的所有可能取值形成的概率分布,稱為兩個樣本比例差異的抽樣分布。n

設兩個總體的比例分别為P1和P2,當兩個樣本容量n1和n2都足夠大時,根據中心極限定理,p1和p2分别近似服從正态分布,則有n

 p1-p2-N(P1-P2)

定理

    從總體中随機抽取容量為n的一切可能個樣本的平均數之平均數,等于總體的平均數,即E(x) = μ,(E為平均的符号,x為樣本的平均數,μ為總體的平均數)。n容量為n的樣本平均數在抽樣分布上的标準差,等于總體标準差除以n的方根,即σx = σ/,(σx為平均數抽樣分布的标準差,σ為總體标準差,n為樣本容量。)n從正态總體中,随機抽取的容量為n的一切可能樣本平均數的分布也呈正态分布。n雖然總體不是正态分布,如果樣本容量較大,反映總體μ和σ的樣本平均數的抽樣分布,也接近于正态分布。

與樣本分布和總體分布的區别n

統計中用随機變量X的取值範圍及其取值概率的序列來描述這個随機變量,稱之為随機變量X的概率分布。如果我們知道随機變量X的取值範圍及其取值概率的序列,就可以用某種函數來表述X取值小于某個值的概率,即為分布函數:F(X)=P(X≤z)。

抽樣分布指樣本統計量的概率分布。采用同樣的抽樣方法和同等的樣本量,從同一個總體中可以抽取出許許多多不同的樣本,每個樣本計算出的樣本統計量的值也是不同的。樣本統計量也是随機變量,抽樣分布則是樣本統計量的取值範圍及其概率。仍以工業企業為例,我們設計了一個抽樣方案并确定了樣本量,這時可能抽取的樣本是衆多的,每抽取一個樣本就可以計算出一個企業平均銷售收入Xi,所有可能Xi形成的分布就是抽樣分布。例中,樣本統計量Xi為随機變量,抽樣分布是Xi的概率分布。n

例如,一個由N家工業企業組成的總體,X為銷售收入。将總體所有企業的銷售收入按大小順序排隊,累計出總體中銷售收入小于某值x的企業數量并除以總體企業總數N,就可得到總體中銷售收入小于x的企業的頻率,也即抽取一個銷售收入小于x的企業的概率。此頻率或概率随着x值不同而變化形成一個序列,形成了銷售收入X的概率分布。n

總體分布

在總體中X的取值範圍及其概率。n

樣本分布

在樣本中X的取值範圍及其概率。上例中,如果抽取n個企業作為樣本,我們同樣可以用這n個銷售收入的取值範圍及其概率描述其分布,也即樣本分布。樣本分布也稱為經驗分布,随着樣本容量n的逐漸增大,樣本分布逐漸接近總體分布。nn

研究概率分布對于抽樣調查是十分重要的,因為隻有知道概率分布,才能夠利用抽樣技術推斷抽樣誤差。現實中,總體的分布狀況通常是未知的,但我們也無需知道總體分布,而隻需知道抽樣分布。

相關詞條

相關搜索

其它詞條