クロス集計表の見方(1)
クロス集計表には縦型と横型がある
表側に質問の回答が来る%表を縦%表、対象者の分類が来るものを横%表と言います。%ではなく実数(Actual number)の表はそれぞれ縦実数表、横実数表になります。日本ではクロス集計のアウトプットとして横%表が多く使われますが、海外では縦%表が主流です。なぜ日本だけ横%表なのか。。。 (画像クリックで拡大)理由はよくわかりませんが、個人的には縦型が見やすいと思っています。なぜならその方が目線の動きが少なくて楽だからです。その解説はまた別の機会にして、弊社ではクロス集計に縦%表を使うことが多い為、
こちらのイメージを例にします。
表側
スタブ(Stub)とも言います。ここでは質問の回答が表側になります。
表頭
バナー、ヘッダーとも言います。バナー広告のバナー(banner)です。
ここでは対象者の分類が表頭になっています。全体とはこのアンケートの全回答者200人、そのうち男女が各100人ということになります。この性別によって分類された、男性、女性を「カテゴリ、軸」と呼んでいます。
各カテゴリの人数があまり少ないと、統計的に%を各カテゴリ間で比較してもあまり意味がありません。統計学的には各カテゴリが30人以上になるのが望ましいとも言われています。
ベース
その集計の元になる標本数のこと、各人数を母数と呼んでいます。
ここでは調査の対象になった全ての人(全対象者)がベース(Total base)になっています。
この問1に「はい」、もしくは「いいえ」と回答した人だけをベースにする場合は回答者ベース(Total answer base)と言ったりします。
また、回答総件数(Sigma:総和の意)をベースにする場合もあります。例えば質問の回答が複数選択可能な場合は、回答件数は200件を超えます。質問の内容、分析目的によっては回答件数をベースにします。
有意差検定
統計的な解説は別の機会にして、ここではクロス集計表の中にアウトプットされる有意差検定の見方を説明します。と言っても、集計ソフトによってアウトプットされるイメージは様々ですが、弊社のアウトプット例で見て頂きたいと思います。
ここでは各軸に(A)、(B)、(C)という記号を便宜上与えます。Comparison Groups: BCとは(B)と(C)の間で有意な差があるかどうか調べましょうの意です。
調べる方法はIndependent Z-Test for Percentages(異なるサンプル間の比率検定)です。信頼度は90%(significance at the 90% level)です。
例では女性で「はい」と回答した人が55%おりその右横にBの文字があります。これは男性43%に対して信頼度90%で有意差があるということを指しています。