抽樣調查

抽樣調查

數學概念
抽樣調查是根據部分實際調查結果來推斷總體标志總量的一種統計調查方法,屬于非全面調查的範疇。它是按照科學的原理和計算,從若幹單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查标志的數據以代表總體,推斷總體。[1]
  • 中文名:抽樣調查
  • 外文名:sampling survey
  • 别名:一種非全面調查
  • 表達式:
  • 提出者:
  • 适用領域:
  • 定 義:概率抽樣
  • 所屬範圍:數字特征
  • 應用學科:數學、統計學

抽樣調查簡述

抽樣調查是一種非全面調查,抽樣調查是根據随機的原則從總體中抽取部分實際數據進行調查,并運用概率估計方法,根據樣本數據推算總體相應的數量指标的一種統計分析方法。抽樣調查雖然是非全面調查,但它的目的卻在于取得反映總體情況的信息資料,因而,也可起到全面調查的作用。

根據抽選樣本的方法,抽樣調查可以分為概率抽樣和非概率抽樣兩類。概率抽樣是按照概率論和數理統計的原理從調查研究的總體中,根據随機原則來抽選樣本,并從數量上對總體的某些特征作出估計推斷,對推斷出可能出現的誤差可以從概率意義上加以控制。在我國,習慣上将概率抽樣稱為抽樣調查。

特點

抽樣調查從研究對象的總體中抽取一部分個體作為樣本進行調查,據此推斷有關總體的數字特征,經濟性好,實效性強,适應面廣,準确性高。

抽樣調查是根據部分實際調查結果來推斷總體标志總量的一種統計調查方法,屬于非全面調查的範疇。它是按照科學的原理和計算,從若幹單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查标志的數據以代表總體,推斷總體。

與其它調查一樣,抽樣調查也會遇到調查的誤差和偏誤問題。通常抽樣調查的誤差有兩種:一種是工作誤差(也稱登記誤差或調查誤差),一種是代表性誤差(也稱抽樣誤差)。但是,抽樣調查可以通過抽樣設計,通過計算并采用一系列科學的方法,把代表性誤差控制在允許的範圍之内;另外,由于調查單位少,代表性強,所需調查人員少,工作誤差比全面調查要小。特别是在總體包括的調查單位較多的情況下,抽樣調查結果的準确性一般高于全面調查。因此,抽樣調查的結果是非常可靠的。

抽樣調查數據之所以能用來代表和推算總體,主要是因為抽樣調查本身具有其它非全面調查所不具備的特點,主要是:

(1)調查樣本是按随機的原則抽取的,在總體中每一個單位被抽取的機會是均等的,因此,能夠保證被抽中的單位在總體中的均勻分布,不緻出現傾向性誤差,代表性強。

(2)是以抽取的全部樣本單位作為一個“代表團”,用整個“代表團”來代表總體。而不是用随意挑選的個别單位代表總體。

(3)所抽選的調查樣本數量,是根據調查誤差的要求,經過科學的計算确定的,在調查樣本的數量上有可靠的保證。

(4)抽樣調查的誤差,是在調查前就可以根據調查樣本數量和總體中各單位之間的差異程度進行計算,并控制在允許範圍以内,調查結果的準确程度較高。

基于以上特點,抽樣調查被公認為是非全面調查方法中用來推算和代表總體的最完善、最有科學根據的調查方法。

步驟

抽樣調查的一般步驟如下:

(1)界定總體

(2)制定抽樣框

(3)實施抽樣調查并推測總體

(4)分割總體

(5)決定樣本規模

(6)決定抽樣方式

(7)确定調查的信度和效度

适用範圍

第一、不能進行全面調查的事物。有些事物在測量或試驗時有破壞性,不可能進行全面調查。如,電視的抗震能力試驗,燈泡的耐用時間試驗等。

第二、有些總體從理論上講可以進行全面調查,但實際上不能進行全面調查的事物。如,了解某個森林有多少棵樹,職工家庭生活狀況如何等。

第三、抽樣調查方法可以用于工業生産過程中的質量控制。

第四、利用抽樣推斷的方法,可以對于某種總體的假設進行檢驗,來判斷這種假設的真僞,以決定取舍。

分類

概率抽樣

1.随機抽樣——簡單随機抽樣法

這是一種最簡單的一步抽樣法,它是從總體中選擇出抽樣單位,從總體中抽取的每個可能樣本均有同等被抽中的概率。抽樣時,處于抽樣總體中的抽樣單位被編排成1~n編碼,然後利用随機數碼表或專用的計算機程序确定處于1~n間的随機數碼,那些在總體中與随機數碼吻合的單位便成為随機抽樣的樣本。

這種抽樣方法簡單,誤差分析較容易,但是需要樣本容量較多,适用于各個體之間差異較小的情況。

2.随機抽樣——系統抽樣法

這種方法又稱順序抽樣法,是從随機點開始在總體中按照一定的間隔(即“每隔第幾”的方式)抽取樣本。此法的優點是抽樣樣本分布比較好,有好的理論,總體估計值容易計算。

3.随機抽樣——分層抽樣法

它是根據某些特定的特征,将總體分為同質、不相互重疊的若幹層,再從各層中獨立抽取樣本,是一種不等概率抽樣。分層抽樣利用輔助信息分層,各層内應該同質,各層間差異盡可能大。這樣的分層抽樣能夠提高樣本的代表性、總體估計值的精度和抽樣方案的效率,抽樣的操作、管理比較方便。但是抽樣框較複雜,費用較高,誤差分析也較為複雜。此法适用于母體複雜、個體之間差異較大、數量較多的情況。

4.随機抽樣——整群抽樣法

整群抽樣是先将總體單元分群,可以按照自然分群或按照需要分群,在交通調查中可以按照地理特征進行分群,随機選擇群體作為抽樣樣本,調查樣本群中的所有單元。整群抽樣樣本比較集中,可以降低調查費用。例如,在進行居民出行調查中,可以采用這種方法,以住宅區的不同将住戶分群,然後随機選擇群體為抽取的樣本。此法優點是組織簡單,缺點是樣本代表性差。

5.随機抽樣——多階段抽樣法

多階段抽樣是采取兩個或多個連續階段抽取樣本的一種不等概率抽樣。對階段抽樣的單元是分級的,每個階段的抽樣單元在結構上也不同,多階段抽樣的樣本分布集中,能夠節省時間和經費。調查的組織複雜,總體估計值的計算複雜。

6.随機抽樣——等距抽樣

等距抽樣也稱為系統抽樣、或機械抽樣,它是首先将總體中各單位按一定順序排列,根據樣本容量要求确定抽選間隔,然後随機确定起點,每隔一定的間隔抽取一個單位的一種抽樣方式。

根據總體單位排列方法,等距抽樣的單位排列可分為三類:按有關标志排隊、按無關标志排隊以及介于按有關标志排隊和按無關标志排隊之間的按自然狀态排列。

按照具體實施等距抽樣的作法,等距抽樣可分為:直線等距抽樣、對稱等距抽樣和循環等距抽樣三種。

等距抽樣的最主要優點是簡便易行,且當對總體結構有一定了解時,充分利用已有信息對總體單位進行排隊後再抽樣,則可提高抽樣效率。

7.随機抽樣——雙重抽樣

雙重抽樣,又稱二重抽樣、複式抽樣,是指在抽樣時分兩次抽取樣本的一種抽樣方式,其具體為:首先抽取一個初步樣本,并搜取一些簡單項目以獲得有關總體的信息;然後,在此基礎上再進行深入抽樣。在實際運用中,雙重抽樣可以推廣為多重抽樣。

8.随機抽樣——按規模大小成比例的概率抽樣

按規模大小成比例的概率抽樣,簡稱為PPS抽樣,它是一種使用輔助信息,從而使每個單位均有按其規模大小成比例的被抽中概率的一種抽樣方式。其抽選樣本的方法有漢森-赫維茨方法、拉希裡方法等。

PPS抽樣的主要優點是:使用了輔助信息,減少抽樣誤差;主要缺點是:對輔助信息要求較高,方差的估計較複雜等。

9.随機抽樣——任意抽樣

随意抽取調查單位進行調查(與随機抽樣不同,不保證每個單位相等的入選機會)如:櫃台訪客調查,街頭路邊攔人調查。

10.非随機抽樣——重點抽樣

隻對總體中為數不多但影響頗大(标志值在總體中所占比重頗大)的重點單位調查。

11.非随機抽樣——典型抽樣

挑選若幹有代表性的單位進行研究。

12.非随機抽樣——配額抽樣

對總體作若幹分類和樣本容量既定情況下,按照配額從總體各部分進行抽取調查單位。

非概率抽樣

非概率抽樣就是調查者根據自己的方便或主觀判斷抽取樣本的方法。

它不是嚴格按随機抽樣原則來抽取樣本,所以失去了大數定律的存在基礎,也就無法确定抽樣誤差,無法正确地說明樣本的統計值在多大程度上适合于總體。雖然根據樣本調查的結果也可在一定程度上說明總體的性質、特征,但不能從數量上推斷總體。

常用的名詞

在抽樣調查中,常用的名詞主要有:

1、總體

總體是指所要研究對象的全體。它是根據一定研究目的而規定的所要調查對象的全體所組成的集合,組成總體的各研究對象稱之為總體單位。

2、個體

個體是指總體中的每一個考察對象。

3、樣本

樣本是總體的一部分,它是由從總體中按一定程序抽選出來的那部分總體單位所組成的集合。

4、樣本的容量

樣本中個體的數量叫做樣本的容量。

5、抽樣框

抽樣框是指用以代表總體,并從中抽選樣本的一個框架,其具體表現形式主要有包括總體全部單位的名冊、地圖等。

抽樣框在抽樣調查中處于基礎地位,是抽樣調查必不可少的部分,其對于推斷總體具有相當大的影響。

6、抽樣比

抽樣比是指在抽選樣本時,所抽取的樣本單位數與總體單位數之比。

對于抽樣調查來說,樣本的代表性如何,抽樣調查最終推算的估計值真實性如何,首先取決于抽樣框的質量。

7、置信度

置信度也稱為可靠度,或置信水平、置信系數,即在抽樣對總體參數作出估計時,由于樣本的随機性,其結論總是不确定的。因此,采用一種概率的陳述方法,也就是數理統計中的區間估計法,即估計值與總體參數在一定允許的誤差範圍以内,其相應的概率有多大,這個相應的概率稱作置信度。

8、抽樣誤差

在抽樣調查中,通常以樣本作出估計值對總體的某個特征進行估計,當二者不一緻時,就會産生誤差。因為由樣本作出的估計值是随着抽選的樣本不同而變化,即使觀察完全正确,它和總體指标之間也往往存在差異,這種差異純粹是抽樣引起的,故稱之為抽樣誤差。

9、偏差

所謂偏差,也稱為偏誤,通常是指在抽樣調查中除抽樣誤差以外,由于各種原因而引起的一些偏差。

10、均方差

在抽樣調查估計總體的某個指标時,需要采用一定的抽樣方式和選擇合适的估計量,當抽樣方式與估計量确定後,所有可能樣本的估計值與總體指标之間離差平方的均值即為均方差。

相關詞條

相關搜索

其它詞條