サンプルサイズの決め方

1 サンプリング誤差
2 サンプルサイズを算出する方法
3 数式
4 サンプルサイズの早見表

サンプリング誤差

アンケートの調査結果の精度をどの程度にするかを基準にサンプルサイズを決める方法があります。たとえば、ある通リを歩いている人１００人の性別をカウントしたところ４０人（４０％）が女性だったとします。しかし、次の１００人をカウントしても必ずしも４０人ピッタリが女性とはかぎりません。３４人かもしれないし４５人かもしれません。この誤差をサンプリング誤差と呼び、この値が小さければ小さいほど調査結果の精度が高いといえます。

サンプルサイズを算出する方法

実際に調査を行う際に、どの程度までサンプリング誤差を許すのか誤差の範囲を事前に決めて、その誤差範囲に収めるのに必要なサンプルサイズを算出する方法があります。ここでは、この許せる誤差範囲のことを最大許容範囲と呼びます。この最大許容範囲を２で割った値を精度といいます。また、この最大許容範囲がどの程度の確率で信頼できるものであるか計る物差しを信頼度と呼びます。例えば、「信頼度９５％」とは、１００回調査を繰り返すと５回は間違った結果（結果が最大許容範囲からはずれる）になる可能性がある」という意味になります。「信頼度９５％で最大許容範囲は、±４％以内」とは、「９５％の的中率でサンプリング誤差は、±４％以内に収まる」ということになります。

数式

サンプリング誤差は以下の式で算出されます。

サンプルサイズの早見表

下の表は、この式をもとに信頼度９５％のときのサンプリング誤差と母集団比率、サンプルサイズの関係を表した早見表です。（画像クリックで拡大）

入力例を例にとると、ネットユーザー６００人のうちオンラインショッピング経験という特性をもつ人が４００人いたわけですから、母集団比率は４００／６００≒６７％≒７０％になります。下の表では７０％の行がありませんが、５０％を超えるときは１００からその割合を引いた値で考えます。１００－７０で３０％の行を見ます。サンプリング誤差が４．０％ではサンプルサイズ５００人、２．８％では１，０００人必要になることがわかると思います。

この早見表のデータをグラフにするとサンプリング誤差（調査結果の精度）とサンプルサイズの関係がよくわかります。サンプリング誤差を小さくするにはサンプルサイズを大きくする必要があることがよくわかります。また、単に誤差を半分にするにはサイズを倍にすればよいというものでもないことがわかります。

例）母集団比率１５％のとき
サンプリング誤差７．０％→４．０％にするにはサンプルサイズ１００→３００ですが、
サンプリング誤差１．０％→０．３％にするのにサンプルサイズ５，０００→１０，０００必要になります。サンプリング誤差が小さくなるからといった理由だけでサンプルサイズを５，０００から１０，０００にするのはあまり現実的なことではありません。

関連記事：
サンプルサイズを決定するプログラム