アンケート調査を行うときに最も大切なのは正当な調査を行うことですが、実際には性別や年齢などの回答者属性が偏り、正当な調査ができないことがあります。そのような場合に利用できるのが「ウェイトバック集計」です。 本記事では、ウェイトバック集計を一般的に知られている煩雑な計算を用いる計算方法ではなく、独自の直感的で簡単な計算方法を用いて分かりやすくご紹介します。
ここでは具体的な例を用いてウェイトバック集計の意味をご説明します。
例えば、とある会社が自社の月額制有料アプリの顧客満足度を調査することを考えます。母集団であるアプリ利用者全体は男性3000人女性2000人の計5000人、アンケートにより男性1500人女性500人の回答が集まり、アンケートの結果を下の表に示します。
顧客満足度をアンケート回答者のうちアプリに満足しているユーザーとすると、顧客満足度は男性が66.7%と高く、女性は40.0%と低いことが分かります。そしてユーザー全体の顧客満足度は60.0%という結果になりました。ところが、このユーザー全体の顧客満足度が60.0%という結果は正当な結果とは言えません。なぜなら、母集団とアンケートの男女構成比が大きく異なっているからです。本例では母集団と比較し女性のアンケート回答者比率が小さく、これは顧客満足度の低い女性の声が小さくなっていることを意味します。このようなときに母集団と比べて小さくなってしまった女性の声をウェイトを付けることで修正した集計を「ウェイトバック集計」と呼びます。
ウェイトバック集計ではある属性の母集団の人数をそれと同じ属性のアンケート回答者数で割った値を使います。これをウェイトバック値と呼び、算出されたウェイトバック値をアンケート回答に掛け合わせることでウェイト付けをします。ここでは先程の顧客満足度調査の例を用いて一般的に知られている煩雑な計算を伴う方法でなく独自の直感的で簡単なウェイトバック集計の計算方法をご紹介します。
顧客満足度調査の例で考えるとウェイトバック値は以下の表のようになります。
上の表から男性のウェイトバック値は2、女性のウェイトバック値は4と計算されます。その後、計算されたウェイトバック値をアンケート結果に掛け合わせることでウェイトバックするのですが、ウェイトバック後のアンケート回答結果を以下の表に示します。
このように、それぞれのアンケート結果にウェイトバック値を掛け合わせることで男女構成比が母集団とアンケートで一致しており、アンケートが母集団を再現していることがわかります。これにより母集団と比べて小さくなってしまっていた女性の声を修正でき、ユーザー全体の顧客満足度はウェイトバック前の60.0%から56.0%と母集団を反映させた値となったことがわかります。このようにある属性の母集団の人数をそれと同じ属性のアンケート回答者数で割ったウェイトバック値をアンケート結果に掛け合わせることで母集団の構成を反映させた数値を得ることができます。
ウェイトバック前後では各属性ごとの比率に変化は起きず、複数の属性を合わせた比率や全体の比率に変化が生じます。顧客満足度調査の例では、ウェイトバック前後で男性/女性という1つの属性の顧客満足度は男性が66.7%、女性が40.0%と変化がありません。一方で、男女を合計し全体として考えた場合の顧客満足度では60.0%から56.0%と変化が見られます。このように、ウェイトバック集計は複数の属性を跨いで結果を見たいときや母集団全体で議論したいときに有効です。但し、母集団の属性比が分からない限りウェイトバック集計はできないため注意が必要です。
当然、母集団とアンケート回答者の属性比率に大きな偏りがあればあるほどウェイトバック集計を行う必要性は高まるでしょう。中でも、調査したい値が属性に強く関係するほどウェイトバック集計の必要性は高まると言えます。例えば日本全国の男女を対象とし認知度調査をしたときに男性の回答者比率が母集団より大きかったとします。このとき、仮に男女関係なく認知されているとある食品ブランドの認知度調査だった場合はウェイトバックをする必要性は低くなります。一方で、仮にとある化粧品ブランドだった場合は男性より女性の方が認知度が高いことが予想され、その女性の声が小さくなっていることは大きな問題でありウェイトバック集計をする必要性が高まるということです。このように、母集団とアンケート回答者の属性比率に同じような偏りがある場合でも、調査したい値が属性に強く関係するほどウェイトバック集計の必要性は高まると言えます。
一見するとウェイトバック集計をすることで母集団を再現した正当な調査をすることができるので必ずウェイトバック集計した方が良いように感じます。しかしながら、極端にウェイトバック値が大きい場合はウェイトバック集計をしない方が適切なことがあります。なぜなら、ウェイトバック値とは「1人の回答者が母集団の何人を代表しているか」を意味する値だからです。顧客満足度調査の例では男性のウェイトバック値が2でしたが、これは1人の男性回答者は母集団で考えたときにその人を含め2人の男性を代表しており、もう1人の男性も自分と同じ回答をすると仮定しています。つまりウェイトバック値が大きいとそれだけ代表している人数も多いということで、代表している人たちが同じ回答をするというウェイトバック集計の前提条件が成立しなくなる可能性が高いことを意味します。
弊社ではそもそも調査設計の段階でウェイトバック集計をする必要がないようにアンケートの回答者割付を母集団属性比に一致させたり、またそれができない場合はウェイトバック集計の是非からお客様の調査をサポートさせて頂いております。
ここでは、ウェイトバック集計を行うにあたり弊社で実施しているより正当な調査を実現するための工夫をいくつかご紹介します。
まず1つ目が、ウェイトバック値が大きくなりすぎないように可能な限り母集団の属性比率とアンケートの回答者比率を揃える調査設計を行っていることです。これにより、ある属性のウェイトバック値のみ極端に大きくなってしまうことを防いでいます。
次に2つ目が、回答時間や自由記述設問の回答内容などを材料にアンケート回答を分析し、信憑性の低い回答を排除していることです。これはウェイトバック集計では属性によって当然信憑性の低い回答にもウェイトが付いてしまうことがあり、信憑性の低い回答がアンケート結果に及ぼす影響が大きくなるためです。
最後に3つ目が、可能な限り計算を自動化し、ヒューマンエラーを未然に防いでいることです。顧客満足度調査の例では属性セグメントは男女の2つのみでしたが、実際の調査では都道府県別・年代別・男女別などより細かく属性を分けることが多くそれだけ計算が複雑になります。そこで下の図のようにウェイトバック計算フォーマットを用いてヒューマンエラーを未然に防いでおります。
ウェイトバック集計とは母集団の属性比に応じてアンケートの回答にウェイトを付けた集計を指し、母集団を再現した調査をすることができます。一方で、ウェイトバック値が極端に大きい場合はウェイトバック集計をしない方が良い場合もあり、ウェイトバック集計する際にも可能な限り正当な調査になるように工夫を凝らす必要があります。
また、ウェイトバック計算フォーマットも公開しておりますので、シェアをご希望の方はお気軽にこちらにご連絡ください。
※ご共有については、調査発注をご検討中の方に限定させて頂いており、予めご了承ください。