サンプリングの基準が変更された場合のサンプル構成の変化について。


標本調査の基本中の基本として、標本をサンプリングする基準が調査目的に照らして合理的かつ一貫しなければならないのだが、巷に溢れる統計資料の中には、ここに問題があるケースもあるようだ。また、調査自体に問題がなくとも、調査主体や報道機関等が調査結果を用いる際に、適切ではない解釈をする場合もある。

ここでは、サンプリングの基準が変更された場合のサンプル構成の変化について、「遊園地へ行く頻度」を基準として採用した場合を例に考えてみる。

推計の元になる「遊園地へ行く頻度」のデータは、インターワイヤード㈱運営のネットリサーチDIMSDRIVEによる公開テーマ別調査「『遊園地』に関するアンケート」の結果の一部を参考にした。この調査は、2010年5月に実施され、全国の男女8,164人を対象としている。

■サンプリング基準変更の影響を推計
「遊園地へ行く頻度」が、

①直近1年に2回以上行った
②直近1年に1回以上かつ直近2年に2回以上行った

の間で、どの程度違うのかを検討する。

まず、最初の表では、「遊園地へ行く頻度」の問いに対する答えのグループごとに、①と②、それぞれの条件をクリアする確率を、大雑把にではあるものの妥当と思われる水準に設定した場合に、サンプル(計300人)の構成がどう変化するのかをまとめた。

半年に一度程度以上遊園地に行くグループをA、一年に一度程度以下しか遊園地に行かないグループをBとすると、①のサンプリング基準では、標本内でのAとBの比率は 3:1程度である一方、②のサンプリング基準では、AとBの比率は 1:1程度である。


二つ目の表では、「遊園地へ行く頻度」の問いに対する答えのグループごとに、①と②、それぞれの条件をクリアする確率を、初めに推計している。推計のベースは、グループごとに設定した「任意の一週間に遊園地に行く確率」の仮定である。

先ほどと同様、半年に一度程度以上遊園地に行くグループをA、一年に一度程度以下しか遊園地に行かないグループをBとすると、①のサンプリング基準では、標本内でのAとBの比率は 2:1程度である一方、②のサンプリング基準では、AとBの比率は 1:1程度となった。

■結論
「遊園地へ行く頻度」を「①直近1年に2回以上行った」から「②直近1年に1回以上かつ直近2年に2回以上行った」に変更することで、標本内におけるグループAのグループBに対する重要度は、1/2程度から1/3程度に低下すると考えるのが妥当であろう。

統計データを時系列で眺めたりクロスセクショナルに比較する場合に、こうしたサンプリングの違いによる偏りを十分に考慮すべきことが極めて重要であるのは、言うまでもない。