區間估計

區間估計

總體參數估計的區間範圍
區間估計是把抽樣指标與抽樣平均誤差結合起來去推斷總體指标所在的可能範圍。也就是根據給定的估計可靠程度的要求,利用實際樣本資料,指出包含總體被估計值的區間範圍,這個區間範圍又稱為置信區間,其區間的上、下限稱為置信上、下限。
    中文名:區間估計 外文名:Interval estimation 适用領域: 所屬學科:統計學 創立人:J.奈曼 相關概念:相關系數 計算方法:信任推斷法

基本定義

區間估計,是參數估計的一種形式。1934年,由統計學家J.奈曼所創立的一種嚴格的區間估計理論。區間估計又稱為置信區間估計。置信系數是這個理論中最為基本的概念。通過從總體中抽取的樣本,根據一定的正确度與精确度的要求,構造出适當的區間,以作為總體的分布參數(或參數的函數)的真值所在範圍的估計。

用數軸上的一段距離或一個數據區間,表示總體參數的可能範圍.這一段距離或數據區間稱為區間估計的置信區間。

出發點

區間估計(intervalestimation)是從點估計值和抽樣标準誤差出發,按給定的概率值建立包含待估計參數的區間.其中這個給定的概率值稱為置信度或置信水平(confidencelevel),這個建立起來的包含待估計參數的區間稱為置信區間(confidenceinterval),指總體參數值落在樣本統計值某一區内的概率;而置信區間是指在某一置信水平下,樣本統計值與總體參數值間誤差範圍。置信區間越大,置信水平越高。劃定置信區間的兩個數值分别稱為置信下限(lowerconfidencelimit,lcl)和置信上限(upperconfidencelimit,ucl)

常見形式

簡介

區間估計,區間估計的區間上、下界通常形式為:“點估計±誤差”

“總體均值”的區間估計

符号假設

總體均值:μ

總體方差:σ

樣本均值:x*=(1/n)×Σ(Xi)

樣本方差:s*=(1/(n-1))×Σ(Xi-x*)^2

置信水平:1-α

顯著水平:α

問題

已知n個樣本數據Xi(i=1,2,...,n),如何估計總體的均值?

首先,引入記号:

σ'=σ/sqrt(n)

s'=s*/sqrt(n)

然後,分情況讨論:

情況1小樣本(n<30),σ已知,此時區間位于x*±z(α/2)×σ'

情況2小樣本(n<30),σ未知,此時區間位于x*±t(α/2)×s'

情況3大樣本(n≥30),σ已知,此時區間位于x*±z(α/2)×σ'

情況4大樣本(n≥30),σ未知,此時區間位x±z(α/2)×s'

其中,z(α/2)表示:正态分布的水平α的分位數

t(α/2)表示:T分布的水平α的分位數

正文

形式

參數估計的一種形式。通過從總體中抽取的樣本,根據一定的正确度與精确度的要求,構造出适當的區間,以作為總體的分布參數(或參數的函數)的真值所在範圍的估計。例如,估計一種藥品所含雜質的比率在1~2%之間;估計一種合金的斷裂強度在1000~1200千克之間,等等。在有的問題中,隻需要對未知量取值的上限或下限作出估計。如前例中,一般隻對上限感興趣,而在第二例中,則隻對下限感興趣。

構造

區間估計是數理統計中的一個重點和難點。在數理統計學中,待估計的未知量是總體分布的參數θ或θ的某個函數g(θ)。區間估計問題可一般地表述為:要求構造一個僅依賴于樣本X=(x1,x2,…,xn)的适當的區間【A(X),B(X)】,一旦得到了樣本X的觀測值尣,就把區間【A(尣),B(尣)】作為θ或g(θ)的估計。至于怎樣的區間才算是“适當”,如何去構造它,則與所依據的原理和準則有關。這些原理、準則及構造區間估計的方法,便是區間估計理論的研究對象。

區間理論

這是1934年,由統計學家J.奈曼所創立的一種嚴格的區間估計理論。置信系數是這個理論中最為基本的概念。

置信系數奈曼以概率的頻率解釋為出發點,認為被估計的θ是一未知但确定的量,而樣本X是随機的。區間【A(X),B(X)】是否真包含待估計的θ,取決于所抽得的樣本X。因此,區間【A(X),B(X)】隻能以一定的概率包含未知的θ。對于不同的θ,π(θ)之值可以不同,π(θ)對不同的θ取的最小值1-α(0<;α<1)稱為區間【A(X),B(X)】的置信系數。與此相應,區間【A(X),B(X)】稱為θ的一個置信區間。這個名詞在直觀上可以理解為:對于“區間【A(X),B(X)】包含θ”這個推斷,可以給予一定程度的相信,其程度則由置信系數表示。

對θ的上、下限估計有類似的概念,以下限為例,稱A(X)為θ的一個置信下限,若一旦有了樣本X,就認為θ不小于A(X),或者說,把θ估計在無窮區間【A(X),∞)内。"θ不小于A(X)"這論斷正确的概率為θ)。π1(θ)對不同的θ取的最小值1-α(0<;α<1)稱為置信下限A(X)的置信系數。

在數理統計中,常稱不超過置信系數的任何非負數為置信水平。

優良準則

置信系數1-α反映了置信區間【A(X),B(X)】的可靠程度,1-α愈大,【A(X),B(X)】用以估計θ時,犯錯誤(即θ并不在【A(X),B(X)】之内)的可能性愈小。但這隻是問題的一個方面。為了使置信區間【A(X),B(X)】在實際問題中有用,它除了足夠可靠外,還應當足夠精确。比如說,估計某個人的年齡在5至95歲之間,雖十分可靠,但太不精确,因而無用。通常指定一個很小的正數α(一般,α取0.10,0.05,0.01等值),要求置信區間【A(X),B(X)】的置信系數不小于1-α,在這個前提下使它盡可能地精确。對于“精确”的不同的解釋,可以導緻種種優良性标準。比較重要的有兩個:一是考慮區間的長度B(X)-A(X)愈小愈好。這個值與X有關,一般用其數學期望Eθ(B(X)-A(X))作為衡量置信區間【A(X),B(X)】精确程度的指标。這個指标愈小,置信區間的精确程度就愈大。另一個是考慮置信區間【A(X),B(X)】包含假值(指任何不等于被估計的θ的值)θ┡的概率,它愈小,【A(X),B(X)】作為θ的估計的精度就愈高。

如果A(X)是θ的置信下限,則在保證A(X)的置信系數不小于1-α的前提下,A(X)愈大,精确程度愈高。這也可以用【A(X),∞)包含假值θ┡(θ┡<;θ)的概率來衡量,此概率愈小,置信下限A(X)的精确程度愈高。對置信上限有類似的結果,若在某個準則下,一個置信區間(或上、下限)比其他置信區間都好,則稱它為在這個準則下是一緻最優的。例如,在上述準則下,置信系數1-α的一緻最優置信下限A(X)定義為:A(X)有置信系數1-α,且對任何有置信系數1-α的置信下限A1(X),當θ┡<;θ時,成立

置信區間

有時,對所考慮的置信區間(或上、下限)加上某種一般性限制,在這個前提下尋找最優者。無偏性是經常用的限制之一,如果一個置信區間(上、下限)包含真值θ的概率,總不小于包含任何假值θ┡的概率,則稱該置信區間(上、下限)是無偏的。同變性(見統計決策理論)也是一個常用的限制。

求置信區間的方法最常用的求置信區間及置信上、下限的方法有以下幾種。

一種是利用已知的抽樣分布(見統計量)。例如,設x1,x2,…,xn為正态總體N(μ,σ2)(見正态分布)中抽出的樣本,要作μ的區間估計,記,·則服從自由度為n-1的t分布。指定α>0,找這個分布的上α/2分位數tα/2(n-1),則有

由此得到μ的一個置信系數為1-α的置信區間。類似地可以定出μ的置信系數為1-α的置信上、下限分别為。

假設檢驗

另一種是利用區間估計與假設檢驗的聯系,設要作θ的置信系數為1-α的區間估計,對于任意的θ0,考慮原假設H:θ=θ0,備擇假設為K:θ≠θ0。設有一水平為α的檢驗,它當樣本X屬于集合A(θ0)時接受H。若集合{θ0∶X∈A(θ0)}是一個區間,則它就是θ的一個置信區間,其置信系數為1-α。就上例而言,對假設H:μ=μ0的檢驗常用t檢驗:當時接受μ=μ0,集合即為區間這正是前面定出的μ的置信區間。若要求θ的置信下限(或上限),則取原假設為θ≤θ0(或θ≥θ0),備擇假設為θ>;θ0(或θ<;θ0),按照同樣的方法可得到所要求的置信下(上)限。

還有一種方法是利用大樣本理論(見大樣本統計)。例如,設x1,x2,…,xn為抽自參數為p的二點分布(見概率分布)的樣本,當n→∞時,依分布收斂(見概率論中的收斂)于标準正态分布N(0,1),以uα/2記N(0,1)的上α/2分位數,則有。所以,可作為p的一個區間估計,上面的極限值1-α就定義為它的漸近置信系數。

推斷法

20世紀30年代初期,統計學家R.A.費希爾提出了一種構造區間估計的方法,他稱之為信任推斷法。其基本觀點是:設要作θ的區間估計,在抽樣得到樣本X以前,對θ一無所知,樣本X透露了θ的一些信息,據此可以對θ取各種值給予各種不同的“信任程度”,而這可用于對θ作區間估計。例如,設X是從正态總體N(θ,1)中抽出的樣本,則服從标準正态分布N(0,1),由此可知,對任何α

費希爾把這個等式解釋為:在抽樣以前,對于θ落在區間内的可能性本來一無所知,通過抽樣,獲得了上述數值,它表達了統計工作者對這個區間的"信任程度",若取b)=-α=uα/2,則得到區間,其信任程度為1-α。即當用上述區間作為θ的區間估計時,對于“它能包含被估計的θ”這一點可給予信任的程度為1-α。

在本例以及其他某些簡單問題中,用費希爾的方法與用奈曼的方法得出一緻的結果。但是,這兩個方法不僅在基本觀點上不一緻,而且在較複雜的問題中,所得出的結果也不同。一個著名的例子是所謂的費希爾-貝倫斯問題:設兩個正态分布μ1,μ2,σ娝,σ娤都未知,要求μ1-μ2的區間估計。費希爾用他的方法提供了一個與奈曼理論不一緻的解法,奈曼在1941年曾對此進行了詳盡的讨論。

方法

(見貝葉斯統計)也是一個重要的構造區間估計的方法。統計決策理論中引進的一些概念和優良性準則,也可用于區間估計。此外序貫方法(見序貫分析)在區間估計中也有了相當的發展。

區域估有時要對兩個或更多的參數θ=(θ1,θ2,…,θk)(k>1),例如正态分布N(μ,σ2)中的μ與σ2,同時進行估計;這時,每當有樣本X,就由X在θ的取值的k維空間Rk内定出一個區域Q(X),而把θ估計在Q(X)内。這種估計叫做區域估計。所用區域一般為比較簡單的幾何形狀,如長方體、球或橢球等。關于區域估計的置信系數、優良性準則及其求法等,與區間估計情況相似。

容忍限與容忍區間這是一個與區間估計有密切聯系的概念,但處理的問題不同。給定β,у,0<;β<1,0<;у<1,以F記總體分布。若T(X)為一統計量,滿足條件,則T(X)為總體分布F的上(β,у)容忍限。類似地可定義下(β,у)容忍限。若T1(X)和T2(X)為兩個統計量,T1(X)≤T2(X),且,則稱【T1(X),T2(X)】為總體分布的一個(β,у)容忍區間。例如,X是某産品的質量指标,而F為其分布,則(β,у)容忍區間【T1(X),T2(X)】的意義是:至少有1-β的把握斷言“至少有100(1-у)%的産品,其質量指标落在區間【T1(X),T2(X)】之内”。可以說,容忍區間估計的是總體分布的概率集中在何處,而非總體分布參數。

相關詞條

相關搜索

其它詞條