公的統計データなどを基に語られる“事実”は、うのみにしてよいのか? 一般に“常識”と思われていることは、本当に正しいのか? 気鋭のデータサイエンティストがそうした視点で統計データを分析・検証する。結論として示される数字だけではなく、その数字がどのように算出されたかに目を向けて、真実を明らかにしていく。
*文中にある各種資料へのリンクは外部のサイトへ移動します
連載バックナンバーはこちら
2020年11月24日、新型コロナウイルス感染の拡大が深刻な地域を目的地とした「GoToトラベル」の旅行を割引対象外にすると発表しました。札幌市と大阪市に適用され、国内旅行需要拡大のアクセルが緩まることになりました。
また12月1日、東京都の小池百合子都知事が菅義偉首相と会談。重症化リスクが高い65歳以上の高齢者や基礎疾患のある人を対象に、GoToトラベルの利用自粛を呼び掛けることで合意しました。
GOからSTOPへ。政策が目まぐるしく変化する理由として、11月以降、新規感染者数が急増した点が挙げられます。新規感染者数が最も多かったのは8月7日の1604人でしたが、11月12日にはそれを上回り、約2週間後の11月28日には過去最も多い2678人を記録しています(JX通信社「新型コロナウイルス 日本国内の最新感染状況マップ・感染者数」、12月9日発表時点)。
今回の第3波は、若者の感染者数が多かった第2波と異なり、40代以上の中高年の割合が高いという特徴があります。その分、基礎疾患を抱えている人が多く、結果的に重症患者数が増えていると考えられます。
JX通信社「新型コロナウイルス 日本国内の最新感染状況マップ・感染者数」
GoToトラベルと感染に因果関係はない?
なぜ新規感染者数は急増したのか。「GoToトラベル」がやり玉に挙げられる中、厚生労働省の「第14回新型コロナウイルス感染症対策アドバイザリーボード」で「航空旅客数と感染者数の増加には統計的な因果関係は確認できない」と題した参考資料が発表され話題となりました。
因果関係の確認には、「グレンジャー因果検定」が用いられています。のちにノーベル経済学賞を受賞するクライブ・グレンジャーが考案した、2種類(XとY)の時系列データ間の因果関係の検証方法です。超ざっくり言えば、ある時系列Xの過去の値が別の時系列Yの将来の値を予測できるなら、経済学における因果関係を検証できるとしました。グレンジャー因果検定は、時系列データ分析でかなり早い時期に学ぶ手法の1つです。「よう分からんわ」という方は、ある過去の出来事から、確からしい未来が描けるか否かを検証する手法だ……とご理解ください。
ただ「因果」と銘打っているものの、実際にはグレンジャー自身が「一時的な関連」と述べているように、「真の因果関係」を検証するものではありません。XがYを引き起こすかどうかではなく、XによってYを予測できるかどうかということです。したがって「グレンジャー因果性は確認できなかった」としても、「因果関係がない」と証明できているわけではないのです。
ましてや、新型コロナウイルスは、たった1人から何十人にも感染したり、湿度が低いと感染しやすくなったりすることなどから、新規感染者数は様々な事象から影響を受けます。Xではなく違う指標のAやBやCの影響を受けているのに、XによってYが予測できると誤解してしまうかもしれません。しかし、上記の参考資料では、そうした丁寧な問題の切り分けをした形跡はうかがえません。これでは分析として適切とは、とても思えません。
それほどまでに「GoTo」との無関係性を強調したかったのも、経済を止めたくないからでしょう。そのことには筆者も共感します。特定の企業に偏った中間マージンが発生するのを避けつつ、なるべく感染を抑えながら、多くの民間企業にお金が落ちるような仕組みを考えなければいけません。
視点を変えれば見えるものが違ってくる
事態が逼迫しているのは、直近1週間の10万人当たりの感染者の増加数が10を超えている都道府県です。12月4日の発表時点で、北海道(27.31)、茨城県(10.35)、群馬県(10.04)、埼玉県(11.24)、東京都(23.45)、神奈川県(13.42)、静岡県(11.28)、愛知県(17.55)、奈良県(12.63)、大阪府(29.74)、兵庫県(15.17)、沖縄県(21.75)の12都道府県です。
7月に掲載した「新型コロナ 隠れたもう1つの感染源『オフィス』は大丈夫か」でも紹介しましたが、JX通信社では国や自治体、企業が自主的に発表した情報を基に、新規感染者がどこで発生したかを、公益の観点から集約・整理して「NewsDigestアプリ」で公開しています。その対象となった発表件数は約1万3000件を数えます。「ネット上の噂」や「先行報道」はカウントせず、公式の発表のみを集計しているので、かなり信頼性は高いと感じています。
下のグラフは、感染が拡大する少し前の10月1日以降、複数人の感染者が確認された施設数を10万人当たりの感染者数の多い都道府県(12月4日発表時点)について「積み上げ100%棒グラフ」で表したものです。
感染者が発生した施設数割合(都道府県別)
JX通信社「新型コロナウイルス 日本国内の最新感染状況マップ・感染者数」
あくまで感染経路が明確で、かつ国や自治体、企業からの自主的な発表情報に依存しているので、家庭内感染など「見えていない数字」は数えられていませんが、おおよその傾向はつかめます。これを見ると感染者が出た施設としては、事業所(緑)、店舗(黄色)の割合が高い都道府県が多いと分かります。
一方、施設数ではなく、施設の種類ごとに何人の感染者が出たかを見ると、結果は大きく異なってきます。
施設ごとの感染者数の割合(都道府県別)
JX通信社「新型コロナウイルス 日本国内の最新感染状況マップ・感染者数」
都道府県によって濃淡はありますが、福祉施設(紫)や医療施設(オレンジ)の割合が高くなります。視点を変えると異なる気づきが生まれるのです。また、施設ごとに平均感染者数に違いがあることがよく分かります。実際、以下のような結果になりました。
施設ごとの平均的な感染者数(人)
福祉施設 |
14.14 |
医療施設 |
14.04 |
その他 |
9.89 |
教育施設 |
7.86 |
店舗 |
5.76 |
事業所 |
5.03 |
公共施設 |
4.75 |
巨大クラスターの大半は医療施設や福祉施設で占められています。その施設の感染者のうち、どのくらいの人に基礎疾患があるかは不明ですが、高齢者が多くを占めると推察できます。当然、重症化する感染者の比率は高くなります。こうした施設での感染を防ぐことの重要性が分かります。
ですので、自らの不摂生や不注意が医療施設や福祉施設への感染源につながることは避けたいものです。一人ひとりが心身の健康を保つことも、感染の拡大を防ぐためには大事なのです。
このように、視点を変えると見えるものが違って来ます。では、第3次感染拡大では何に注意すべきでしょう。テレビでは新規感染者数の多さに絞った報道が多いようですが、本来見るべきはその中身です。闇雲に感染者数の増加の数字だけを恐れるのではなく、注目すべきデータを定め、その推移に注意を払うことが大事でしょう。
感染経路不明者の割合を減らし、詳細なクラスター情報の共有を
それでは、具体的にどんなことに注目すべきでしょう。まず、感染経路不明者の割合です。不明者が増えると、何が原因で感染が広がっているか分かりません。ほうっておくと「見えない(気づけていない)クラスター」の存在を見逃す可能性も高まります。対策をとろうにも、データがない、感染状況が見えないのでは適切に対応できません。ですから、感染経路不明者の割合はできるだけ減らさなければいけないのです。
また、どのくらいの規模のクラスターがどこでどのように発生しているかといった詳細なデータの把握も大事です。例えば、クラスター1カ所から新規感染者が50人出た場合と、20カ所から合計50人の感染者が出た場合、筆者は後者の方を注意すべきだと考えます。なぜなら1カ所であれば、丁寧に足取りを追うことで、濃厚接触者を洗い出せる可能性がありますが、クラスターの数が多ければ、追跡調査の負荷は高まります。こうした実態を細かく把握することは、適切な対策をとるには必要です。
地域によって特性や傾向が違うので、情報を地域ごとに把握し、広く公開することも大事です。個人による感染対策の一助にもなるように、地域のニュースでどのような場所、どのようなシーンで感染が発生したかなど、今までとは異なる伝え方が求められると筆者は考えます。
12月3日、大阪府は対策会議を開き、いわゆる大阪モデルの「レッドステージ1(非常事態)」に移行しました。12月2日に427人もの新規感染者が確認された上、重症病床の使用率が63.6%に上昇したためです。
筆者は今年の年末、大阪の実家への帰省を断念しました。いつもならゴルフをして、心斎橋でわなかのたこ焼きを食べて、難波のアルションでガレットを食べるのが定番だったのですが残念です。
ちなみに直近1週間の人口10万人当たり新規感染者増加数は12月4日の発表時点で過去最高の29.87を記録しています。11月7日に10を超えてからわずか1カ月、本当にあっという間の出来事でした。
JX通信社「新型コロナウイルス 日本国内の最新感染状況マップ・感染者数」
だからと言って、自主的に出歩かないことを自らに課す“1人ロックダウン”をすると、経済が回りません。大阪の場合、医療施設に感染者数が偏っています。これはこれで問題ですが、さらに気になるのは新規感染者のうち感染経路不明の割合が40%超えを続けていることです。
ただし、感染経路不明割合について、筆者は少し眉唾な部分もあるなとも思っています。感染経路不明者が増えるのは、保健所のリソース不足もあって「追いきれない」という理由も考えられるからです。テレビ朝日の報道によれば、厚労省はそうした状況を受けて、クラスターの追跡を、高齢者施設など重症化リスクのある人が多い場所や、3密など感染しやすい環境で起きたものを優先することにしたようです。
そうせざるを得ない状況に追い込まれていることは理解はするものの、それでは結局、感染対策としては不十分なのです。少しでも感染経路を明らかにして、感染経路不明者の割合を減らさなければなりません。そうして明らかにした感染経路の情報を徹底して公開することが大事なのです。
どういう場所、どういうシーンで感染が起きているのかといった正確な情報が提供されなければ、人々は適切な行動がとれず、不必要な「閉じこもり」もなくなりません。ひいては経済も疲弊するばかりです。「正しく恐れる」ことが大事であって、そのためにはファクトが欠かせないのです。ただし、感染経路を明らかにするには、莫大なリソースが必要でしょう。保健所の力だけでは無理です。そのためにも国が果たすべき役割は大きいはずです。
……と、今回の連載を締めようと思ったら、厚労省が新型コロナウイルスによって10代女性が死亡としたのは、誤りだったとのニュースが飛び込んできました。データを扱う作業にミスがあったようです。「1」と「7」を見間違えたのか、エクセルでデータをいじったときにミスが起きたのか、その理由は分かりませんが、正確な情報の取り扱いに努めてほしいと切に願うばかりです。
この記事はシリーズ「データから“真実”を読み解くスキル」に収容されています。WATCHすると、トップページやマイページで新たな記事の配信が確認できるほか、スマートフォン向けアプリでも記事更新の通知を受け取ることができます。
Powered by リゾーム?