「クロス集計」の意味の解説から、アンケート分析でよく使われるExcelのピボットテーブルを使ったクロス集計表・グラフの作り方、さらに、分析に役立つアンケート分析ツールとその使い方を解説します。
アンケート分析におけるクロス集計とは、分析対象とする設問の回答を、回答者の属性や他の設問などの分析軸と掛け合わせて集計する手法のことです。回答者の属性と掛け合わせるものを「属性クロス集計」、他の設問と掛け合わせるものを「設問間クロス集計」と呼びます。
大規模な回答データを属性や設問を掛け合わせることで、様々な分析軸に合わせて回答データを集計することができ、単純集計の結果からだけでは読み取ることのできないような、属性などのグループごとの回答傾向などの可視化に役立ちます。
分析対象とする設問に十分な回答数がない場合、掛け合わせた項目の度数が小さくなりすぎ、有効な分析を行えない可能性があります。このような事態が発生しないことを前もって単純集計等で確認しておくことが望ましいです。
クロス集計を行う際には、アンケートを設計する時点から注意する必要があります。1つの設問に複数の質問内容を組み込むと、それらを分割してそれぞれクロス集計の分析対象・分析軸とすることができないといった問題が発生することがあります。
アンケートなどで集めたデータについて、回答者の属性ごとに回答の傾向を分析することができます。回答者の属性の例としては、年代・性別・居住地・職業・家族構成などや、これらの要素を合わせたもの(例:年代×性別)があります。
アンケートなどで集めたデータについて、回答者の回答内容(属性設問以外)ごとにその傾向を分析することができます。例えば、ある商品についてのアンケートで、「その商品の品質への評価(良い/普通/悪い)」の回答を分析対象とし、「その商品を購入する頻度(毎日/隔日/...)」の回答を分析軸として掛け合わせることで、品質への評価を購入頻度別に集計することができます。
クロス集計における分析軸は1つでなくともよく、必要であれば、2つ以上にすることもできます。これらはそれぞれ「n重クロス集計(n=2,3...)」と呼ばれます。上記の属性間クロス集計における、「年代×性別×他の設問のデータ」を分析軸としたものは、3重クロス集計の一つと言えます。
クロス集計表では、各クロス項目は、表側と表頭の各要素の交差点です。つまり、それらの要素の部分集合が各クロス項目となります。多くの場合、クロス項目ごとの度数や行に対する割合が記載されています。
表の縦軸のこと。表における最も左の列を表しており、通常分析軸が記載されている。
表の横軸のこと。表における最も上の行を表しており、クロス集計表では通常分析対象が記載されている。
アンケートの結果得られた各クロス項目に当てはまる回答者数のこと。
各セグメントの度数を全セグメントの度数の合計値で割ったもの。行の合計に対する割合であるか、列の合計に対する割合であるかによって、「横%表」「縦%表」と呼ばれ、クロス集計表では一般に「横%表」が用いられる。
ただし、各セグメントの割合の行/列における合計が100%になるのは、設問が単一選択(SA)形式であるときのみであることに注意する必要がある。
あるアンケート調査の結果をもとに説明します。(男性495ss, 女性511ss, 合計1,006ss)
以下では、わかりやすくするために、2設問のみのデータを例として記載しています。
A列に性別、B列にスポーツジム・フィットネスクラブに通った経験が記載されている場合、
A・B列のデータについて先程の手順でExcelのピボットテーブルを使ってクロス集計すると、以下のような集計表が作成されます。
さらに、ピボットテーブルを選択した状態で「挿入」→「ピボットグラフ」を選択すると、自動的にクロス集計の結果がグラフ化されます。
このようにアンケートをクロス集計してグラフ化すると、スポーツジム・フィットネスクラブに「以前通っていたが今は通っていない」人の割合は男性より女性で大きいことが一目でわかります。