標本調査をちゃんと知ろう

 確かに、日本中全ての住居に対して調査すれば、正確なひきこもりの実態が分かります。こうした方法を「全数調査」と言います。5年に1回行われる国勢調査や経済構造統計(経済センサス)が該当します。

 全数調査は間違いなく正確ではあるのですが、大変な手間と膨大な費用がかかります。ちなみに10年に行われた国勢調査の費用は約650億円でした。そこで、全体から一部の人を抽出する「標本調査」という方法が選ばれます。今回の「生活状況に関する調査(平成30年度)」も4235万人から5000人を抽出している標本調査です。

 標本調査は、全数調査のデメリットである「手間と費用」を軽くしてくれる代わりに、メリットである「正確さ」の精度が落ちます。全数調査を行えば得られたはずの結果に対し、標本調査で得られた結果との差分は間違いなく発生します。その差を「標本誤差」と言います。標本誤差の幅は、以下の表で示したように抽出した人数(表中の「n」)が大きいほど狭まります。

標本数などによって標本誤差の幅は変わる
標本数などによって標本誤差の幅は変わる
出典:内閣府「生活状況に関する調査」
[画像のクリックで拡大表示]

 上の表は、標本数によって95%の確率で生じる標本誤差の幅を示したものです。これを見れば分かるように、n=3000人に聞いた場合、ある質問に対してAと答えた割合が10%なら、全数調査をすれば得られたはずの結果に対して95%の確率で±1.1%の誤差が生じるのです。

 計算式は単純です。1.96×√{p×(1-p)÷n}で求まります(1.96は定数)。今回は3248人に聞いてひきこもりの比率が1.45%なのですから、1.96×√(0.0145×(1-0.0145)÷3248)=±0.41%の誤差が生じます。

 つまり4235万人のうち約1.45%(±0.41%)が広義のひきこもりなら、実態の数は44.0万~78.8万人程度だと考えられます。

 ただし、標本誤差は「全数に聞いたのと同じぐらい、抽出した標本に特徴がよく表れている」という前提条件があります。例えば渋谷の街角で20代100人に聞いたからといって、それが20代全員を代表する意見とは限りません。そこで全数から標本を抽出するには、最初に紹介した「層化2段無作為抽出法」をはじめとする様々な手段が用いられます。

 全数と標本の話は、よく味噌汁に例えられます。味噌汁の味を知るのに、全てを飲むのは大変です。だから、おたまで少しだけすくって味見をします。これが標本調査です。ただし、全体をよくかき混ぜないと、すくう場所で味が変わってしまいますよね? 「よくかき混ぜる」ことが前提条件です。

 標本調査についてもっと詳しく知りたいと思われた方は、総務省統計局「統計学習の指導のために(先生向け)」の標本調査に関するWEBページをご覧ください。

次ページ 内閣府は何もするつもりがない? それとも…