ウェイトバック集計

ウェイトバック集計とは回収された調査データを母集団の実際の構成比に合わせてデータに重み付けして集計することをいいます。例えばインターネットユーザーに対して行った調査についてウェイトバック集計を行いたいと思います。

各年代層の回収数は以下の通りそれぞれ150名でした。
20代以下: 150名(25%)
30代: 150名(25%)
40代: 150名(25%)
50代以上: 150名(25%)
合計:600名

国内のインターネットユーザーの構成比を調べてみると、
20代以下: 34%
30代: 28%
40代: 23%
50代以上: 15%
だったとします。(注)正確ではありません(が、だいたいこのくらいです)
この構成比に合わせてウェイトバック集計するには、

次のように算出されたウェイト値をそれぞれのデータに掛け合わせます。
20代以下: 600名×X34%÷150名=1.36
30代: 600名×X28%÷150名=1.12
40代: 600名×X23%÷150名=0.92
50代以上: 600名×X15%÷150名=0.6

すなわち、20代以下、30代は実際の構成比より少ないので割り増し、40代、50代以上は逆に多いので目減りさせるわけです。
例えばある設問で「はい」と回答した人が次のような内訳だったとします。

20代以下: 40名
30代: 60名
40代: 80名
50代以上: 120名
合計:300名⇒50%が「はい」と回答。

これをウェイトバック集計すると、
20代以下: 40名×1.36=54.4
30代: 60名×1.12=67.2
40代: 80名×0.92=73.6
50代以上: 120名×0.6=72

合計:267名⇒44.5%が「はい」と回答となるわけです。

実際の集計ソフトでは効率よくウェイトバック集計できるようになっているはずです。例えば弊社が使用しているソフトではTarget percentageと称して、ウェイトバックしたい構成比を入力するだけで、生データに「ウェイト値」という変数が自動的に生成されます。集計時にはこのウェイト値を使ってウェイトバック集計しますよと指示すれば後は自動的にウェイトバック集計してくれます。