2019-03-22 15:05:32
浏覽:
在市場研究中(zhōng),常常有客戶和研究者詢問:“要掌握市場總體(tǐ)情況,到底需要多少樣本量?”,或者說“我(wǒ)(wǒ)要求調查精度達到95%,需要多少樣本量?”。對此,我(wǒ)(wǒ)往往感到難以回答,因爲要解決這個問題,需要考慮的因素是多方面的:研究的對象,研究的主要目的,抽樣方法,調查經費(fèi)…。本文将根據自己的經驗,探讨在市場研究中(zhōng)确定調查所需樣本量的一(yī)些基本方法,相信這些方法對于其他的社會調查研究也有一(yī)定的借鑒意義。
确定樣本量的基本公式
在簡單随機抽樣的條件下(xià),我(wǒ)(wǒ)們在統計教材中(zhōng)可以很容易找到确定調查樣本量的公式:
Z2 S2
n = ------------ (1)
d2
其中(zhōng):
n代表所需要樣本量
Z:置信水平的Z統計量,如95%置信水平的Z統計量爲1.96,99%的Z爲2.68。
S:總體(tǐ)的标準差;
d :置信區間的1/2,在實際應用中(zhōng)就是容許誤差,或者調查誤差。
對于比例型變量,确定樣本量的公式爲:
Z2 ( p ( 1-p)) 1
n = -----------------(2) 置信區間半寬大(dà)緻估計d = ------------
d2 n ^ 0.5
其中(zhōng):
n :所需樣本量
z:置信水平的z統計量,如95%置信水平的Z統計量爲1.96,99%的爲2.68
p:目标總體(tǐ)的比例期望值
d:置信區間的半寬
關于調查精度
通常我(wǒ)(wǒ)們所說的調查精度可能有兩種表述方法:絕對誤差數與相對誤差數。如對某市的居民進行收入調查,要求調查的人均收入誤差上下(xià)不超過50元,這是絕對數表示法,這個絕對誤差也就是公式(1)中(zhōng)置信區間半寬d。
而相對誤差則是絕對誤差與樣本平均值的比值。例如我(wǒ)(wǒ)們可能要求調查收入與真實情況的誤差不超過1%。假定調查城市的真實人均收入爲10000元,則相對誤差的絕對數是100元。
公式的應用方法
對于公式的應用,一(yī)些參數是我(wǒ)(wǒ)們可以事先确定的:Z值取決于置信水平,通常我(wǒ)(wǒ)們可以考慮95%的置信水平,那麽Z=1.96;或者99%,Z=2.68。然後可以确定容許誤差d(或者說精度),即我(wǒ)(wǒ)們可以根據實際情況指定置信區間的半寬度d。因此,公式應用的關鍵是如何确定總體(tǐ)的标準差S。如果我(wǒ)(wǒ)們可以估計出總體(tǐ)的方差(标準差),那麽我(wǒ)(wǒ)們可以根據公式計算出樣本量:
例如:要了解該城市的居民收入,假定我(wǒ)(wǒ)們知(zhī)道該市居民收入的标準差爲1500,要求的調查誤差不超過100元,則在95%的置信水平下(xià),所需的樣本量爲n=1.962*15002/1002=8,643,600/10,000=864
即需要調查的樣本量爲864個。
最大(dà)樣本量
以上公式隻是理論上的,在實際調查中(zhōng)确定合理的樣本量,必須考慮多方面的因素。
首先,由于人們通常缺乏對标準差的感性認識,因此對标準差的估計往往是最難的。總體(tǐ)的标準差是123, 還是765?如果沒有一(yī)點對樣本的先驗知(zhī)識,那麽對标準差的估計是不可能的。好在我(wǒ)(wǒ)們通常能對變量的平均值進行估計,如我(wǒ)(wǒ)們通過曆史資(zī)料估計該地區目前的年人均收入大(dà)緻爲10,000元,那麽根據統計學知(zhī)識,我(wǒ)(wǒ)們引入變異系數的概念:
變異系數V=标準差S/平均值X<= 1
因此,我(wǒ)(wǒ)們知(zhī)道人均收入的标準差應該小(xiǎo)于平均值,就是說标準差應該在10000以下(xià)。當然,這對于我(wǒ)(wǒ)們确定樣本量還不能起太大(dà)的作用。然而如果我(wǒ)(wǒ)們采用相對誤差表述的精度,對公式(1)變形,我(wǒ)(wǒ)們有:
Z2(S2/X2) Z2V2 Z2
n = --------------------= -------------<= ----------
d2/X2 P2 P2
其中(zhōng)P表示相對誤差
根據上述公式,我(wǒ)(wǒ)們可以計算在相對誤差一(yī)定的情況下(xià),所需的最大(dà)樣本量。以下(xià)是在置信程度95%的水平下(xià),在不同相對誤差下(xià)的最高樣本量:
相對誤差 1% 2% 3% 4% 5% 10% 20%
樣本量 38416 9604 4268 2401 1537 384 104
通常,變異系數爲1的情況是很少見的,根據本人對市場研究中(zhōng)經常遇到的情況,變異系數多在50%以下(xià),因此,實際所需要的樣本量可以進一(yī)步縮小(xiǎo)。
對于比例型變量,在事先缺乏對比例的估計時,我(wǒ)(wǒ)們可以采用最保守的估計法,即p=0.5,以下(xià)是比例p在不同絕對誤差程度下(xià),所需的最大(dà)樣本量(95%置信水平):
p的絕對誤差 0.01 0.02 0.03 0.04 0.05 0.10
所需最大(dà)樣本量 9604 2401 1067 600 384 96
雖然我(wǒ)(wǒ)們根據公式可以從理論上确定樣本量的上限,但是由于實際工(gōng)作的經費(fèi)和時間限制,使用最大(dà)樣本量的可能性很小(xiǎo);而且,實際研究的情況通常要複雜(zá)得多,因爲一(yī)個研究往往都要考慮多個目标的,即要求對多個指标的誤差進行控制,而不是簡單地考慮一(yī)個指标。因此我(wǒ)(wǒ)們在實際的市場研究中(zhōng),我(wǒ)(wǒ)們要綜合考慮,采用多種方式來确定樣本量。
實際調查樣本量的确定原則
1、調查的主要目标
一(yī)個現實的市場調查往往有多個目标,對于一(yī)些目标單一(yī)的調查,調查的樣本量往往可以很少:100個,甚至50個就足夠了。而對于具有多個目标的研究,必須考慮這些目标中(zhōng)變異程度最大(dà),要求精度最高的目标。
2、分(fēn)類比較的程度
分(fēn)類是市場研究中(zhōng)一(yī)個最基本的方法,研究者往往是通過分(fēn)類來發現細分(fēn)市場,确定産品的市場定位等。假定對同一(yī)變量(研究目标),在一(yī)定精度與置信程度下(xià),隻要100個樣本量就足夠了,如果我(wǒ)(wǒ)們僅僅希望了解不同性别的消費(fèi)者市場,則确定樣本量時隻需要考慮兩類消費(fèi)者的樣本量,這樣調查的總樣本量可能需要200個以上,如果希望了解不同年齡層的消費(fèi)者,則可能要将消費(fèi)者分(fēn)爲多類,如分(fēn)爲:20歲以下(xià),20-35,35-50,50歲以上等四類,這樣的樣本量需要400個以上。也就是說,确定樣本量時必須考慮到每一(yī)類别的樣本量。
3、調查區域的大(dà)小(xiǎo)
根據常識,調查區域越大(dà),所需要的樣本量可能越大(dà),因爲大(dà)區域内的樣本變異程度我(wǒ)(wǒ)們通常較難掌握。此外(wài),在實際研究中(zhōng),我(wǒ)(wǒ)們還往往需要對大(dà)區域進行進一(yī)步分(fēn)類,以尋求更加準确的市場細分(fēn)。因此,對于同一(yī)調查目标,在上海進行調查所需要的樣本量通常是要大(dà)于蘇州的。
實際研究中(zhōng)的一(yī)些經驗
根據一(yī)些學者的研究,以及個人在市場研究中(zhōng)的經驗,市場調查中(zhōng)确定樣本量通常的做法是:
1、通過對方差的估計,采用公式計算所需樣本量,主要做法有:
(1)用兩步抽樣,在調查前先抽取少量的樣本,得到标準差S的估計,然後代入公式中(zhōng),得到下(xià)一(yī)步抽樣所需樣本量n;
(2)如果有以前類似調查的數據,可以使用以前調查的方差作爲總體(tǐ)方差的估計。
2、根據經驗,确定樣本量,主要方法有:
(1)如果以前有人做過類似的研究,初學者可以參照前人的樣本。
(2)如果是大(dà)型城市、省市一(yī)級的地區性研究,樣本數在500-1000之間可能比較适合;而對于中(zhōng)小(xiǎo)城市,樣本量在200-300之間可能比較适合;如果是多省市或者全國性的研究,則樣本量可能在1000-3000之間比較适合。
(3)作爲一(yī)個常識(主要是爲了顯著性檢驗),要進行分(fēn)組研究的每組樣本量應該不少于30個。
(4)通過試驗設計所作的研究,可以采用較小(xiǎo)的樣本量。如産品試用(留置)調查,在經費(fèi)有限的情況下(xià),可以将每組的樣本量降低至15個左右,最好每組在30以上。此外(wài),我(wǒ)(wǒ)們在多次的實際研究中(zhōng)發現,每組超過50個可能是一(yī)種資(zī)源浪費(fèi)。