市場研究中(zhōng)樣本量的确定方法與原則=

在市場研究中(zhōng)，常常有客戶和研究者詢問：“要掌握市場總體(tǐ)情況，到底需要多少樣本量？”，或者說“我(wǒ)(wǒ)要求調查精度達到95%，需要多少樣本量？”。對此，我(wǒ)(wǒ)往往感到難以回答，因爲要解決這個問題，需要考慮的因素是多方面的：研究的對象，研究的主要目的，抽樣方法，調查經費(fèi)…。本文将根據自己的經驗，探讨在市場研究中(zhōng)确定調查所需樣本量的一(yī)些基本方法，相信這些方法對于其他的社會調查研究也有一(yī)定的借鑒意義。

确定樣本量的基本公式

在簡單随機抽樣的條件下(xià)，我(wǒ)(wǒ)們在統計教材中(zhōng)可以很容易找到确定調查樣本量的公式：

Z2 S2
n = ------------ (1)
d2

其中(zhōng)：
n代表所需要樣本量
Z：置信水平的Z統計量，如95%置信水平的Z統計量爲1.96，99%的Z爲2.68。
S：總體(tǐ)的标準差；
d ：置信區間的1/2，在實際應用中(zhōng)就是容許誤差，或者調查誤差。

對于比例型變量，确定樣本量的公式爲:

Z2 ( p ( 1-p))   1
n = -----------------（2）   置信區間半寬大(dà)緻估計d = ------------
  d2   n ^ 0.5

其中(zhōng)：
n ：所需樣本量
z：置信水平的z統計量，如95%置信水平的Z統計量爲1.96,99%的爲2.68
p：目标總體(tǐ)的比例期望值
d：置信區間的半寬

關于調查精度

通常我(wǒ)(wǒ)們所說的調查精度可能有兩種表述方法：絕對誤差數與相對誤差數。如對某市的居民進行收入調查，要求調查的人均收入誤差上下(xià)不超過50元，這是絕對數表示法，這個絕對誤差也就是公式(1)中(zhōng)置信區間半寬d。

而相對誤差則是絕對誤差與樣本平均值的比值。例如我(wǒ)(wǒ)們可能要求調查收入與真實情況的誤差不超過1%。假定調查城市的真實人均收入爲10000元，則相對誤差的絕對數是100元。

公式的應用方法

對于公式的應用，一(yī)些參數是我(wǒ)(wǒ)們可以事先确定的：Z值取決于置信水平，通常我(wǒ)(wǒ)們可以考慮95%的置信水平，那麽Z=1.96；或者99%，Z=2.68。然後可以确定容許誤差d（或者說精度），即我(wǒ)(wǒ)們可以根據實際情況指定置信區間的半寬度d。因此，公式應用的關鍵是如何确定總體(tǐ)的标準差S。如果我(wǒ)(wǒ)們可以估計出總體(tǐ)的方差（标準差），那麽我(wǒ)(wǒ)們可以根據公式計算出樣本量：

例如：要了解該城市的居民收入，假定我(wǒ)(wǒ)們知(zhī)道該市居民收入的标準差爲1500，要求的調查誤差不超過100元，則在95%的置信水平下(xià)，所需的樣本量爲n=1.962*15002/1002=8,643,600/10,000=864
即需要調查的樣本量爲864個。

最大(dà)樣本量

以上公式隻是理論上的，在實際調查中(zhōng)确定合理的樣本量，必須考慮多方面的因素。

首先，由于人們通常缺乏對标準差的感性認識，因此對标準差的估計往往是最難的。總體(tǐ)的标準差是123，還是765？如果沒有一(yī)點對樣本的先驗知(zhī)識，那麽對标準差的估計是不可能的。好在我(wǒ)(wǒ)們通常能對變量的平均值進行估計，如我(wǒ)(wǒ)們通過曆史資(zī)料估計該地區目前的年人均收入大(dà)緻爲10,000元，那麽根據統計學知(zhī)識，我(wǒ)(wǒ)們引入變異系數的概念：

變異系數V=标準差S/平均值X<= 1

因此，我(wǒ)(wǒ)們知(zhī)道人均收入的标準差應該小(xiǎo)于平均值，就是說标準差應該在10000以下(xià)。當然，這對于我(wǒ)(wǒ)們确定樣本量還不能起太大(dà)的作用。然而如果我(wǒ)(wǒ)們采用相對誤差表述的精度，對公式（1）變形，我(wǒ)(wǒ)們有：

Z2(S2/X2) Z2V2 Z2
n = --------------------= -------------<= ----------
d2/X2 P2 P2

其中(zhōng)P表示相對誤差

根據上述公式，我(wǒ)(wǒ)們可以計算在相對誤差一(yī)定的情況下(xià)，所需的最大(dà)樣本量。以下(xià)是在置信程度95%的水平下(xià)，在不同相對誤差下(xià)的最高樣本量：

相對誤差 1% 2% 3% 4% 5% 10% 20%

樣本量 38416 9604 4268 2401 1537 384 104
通常，變異系數爲1的情況是很少見的，根據本人對市場研究中(zhōng)經常遇到的情況，變異系數多在50%以下(xià)，因此，實際所需要的樣本量可以進一(yī)步縮小(xiǎo)。

對于比例型變量，在事先缺乏對比例的估計時，我(wǒ)(wǒ)們可以采用最保守的估計法，即p=0.5，以下(xià)是比例p在不同絕對誤差程度下(xià)，所需的最大(dà)樣本量（95%置信水平）：

p的絕對誤差 0.01 0.02 0.03 0.04 0.05 0.10
所需最大(dà)樣本量 9604 2401 1067 600 384 96

雖然我(wǒ)(wǒ)們根據公式可以從理論上确定樣本量的上限，但是由于實際工(gōng)作的經費(fèi)和時間限制，使用最大(dà)樣本量的可能性很小(xiǎo)；而且，實際研究的情況通常要複雜(zá)得多，因爲一(yī)個研究往往都要考慮多個目标的，即要求對多個指标的誤差進行控制，而不是簡單地考慮一(yī)個指标。因此我(wǒ)(wǒ)們在實際的市場研究中(zhōng)，我(wǒ)(wǒ)們要綜合考慮，采用多種方式來确定樣本量。

實際調查樣本量的确定原則

1、調查的主要目标

一(yī)個現實的市場調查往往有多個目标，對于一(yī)些目标單一(yī)的調查，調查的樣本量往往可以很少：100個，甚至50個就足夠了。而對于具有多個目标的研究，必須考慮這些目标中(zhōng)變異程度最大(dà)，要求精度最高的目标。

2、分(fēn)類比較的程度

分(fēn)類是市場研究中(zhōng)一(yī)個最基本的方法，研究者往往是通過分(fēn)類來發現細分(fēn)市場，确定産品的市場定位等。假定對同一(yī)變量（研究目标），在一(yī)定精度與置信程度下(xià)，隻要100個樣本量就足夠了，如果我(wǒ)(wǒ)們僅僅希望了解不同性别的消費(fèi)者市場，則确定樣本量時隻需要考慮兩類消費(fèi)者的樣本量，這樣調查的總樣本量可能需要200個以上，如果希望了解不同年齡層的消費(fèi)者，則可能要将消費(fèi)者分(fēn)爲多類，如分(fēn)爲：20歲以下(xià)，20-35，35-50，50歲以上等四類，這樣的樣本量需要400個以上。也就是說，确定樣本量時必須考慮到每一(yī)類别的樣本量。

3、調查區域的大(dà)小(xiǎo)

根據常識，調查區域越大(dà)，所需要的樣本量可能越大(dà)，因爲大(dà)區域内的樣本變異程度我(wǒ)(wǒ)們通常較難掌握。此外(wài)，在實際研究中(zhōng)，我(wǒ)(wǒ)們還往往需要對大(dà)區域進行進一(yī)步分(fēn)類，以尋求更加準确的市場細分(fēn)。因此，對于同一(yī)調查目标，在上海進行調查所需要的樣本量通常是要大(dà)于蘇州的。

實際研究中(zhōng)的一(yī)些經驗

根據一(yī)些學者的研究，以及個人在市場研究中(zhōng)的經驗，市場調查中(zhōng)确定樣本量通常的做法是：

1、通過對方差的估計，采用公式計算所需樣本量，主要做法有：

（1）用兩步抽樣，在調查前先抽取少量的樣本，得到标準差S的估計，然後代入公式中(zhōng)，得到下(xià)一(yī)步抽樣所需樣本量n；

（2）如果有以前類似調查的數據，可以使用以前調查的方差作爲總體(tǐ)方差的估計。

2、根據經驗，确定樣本量，主要方法有：

（1）如果以前有人做過類似的研究，初學者可以參照前人的樣本。

（2）如果是大(dà)型城市、省市一(yī)級的地區性研究，樣本數在500-1000之間可能比較适合；而對于中(zhōng)小(xiǎo)城市，樣本量在200-300之間可能比較适合；如果是多省市或者全國性的研究，則樣本量可能在1000-3000之間比較适合。

（3）作爲一(yī)個常識（主要是爲了顯著性檢驗），要進行分(fēn)組研究的每組樣本量應該不少于30個。

（4）通過試驗設計所作的研究，可以采用較小(xiǎo)的樣本量。如産品試用（留置）調查，在經費(fèi)有限的情況下(xià)，可以将每組的樣本量降低至15個左右，最好每組在30以上。此外(wài)，我(wǒ)(wǒ)們在多次的實際研究中(zhōng)發現，每組超過50個可能是一(yī)種資(zī)源浪費(fèi)。

市場研究中(zhōng)樣本量的确定方法與原則=

分(fēn)享至微信分(fēn)享