全4759文字

公的統計データなどを基に語られる“事実”は、うのみにしてよいのか? 一般に“常識“と思われていることは、本当に正しいのか? 気鋭のデータサイエンティストがそうした視点で統計データを分析・検証する。結論として示される数字だけではなく、その数字がどのように算出されたかに目を向けて、真実を明らかにしていく。

※文中にある各種資料へのリンクは外部のサイトへ移動します

連載バックナンバーはこちら

 2020年7月16日(くしくも筆者の誕生日)に、東京の新型コロナウイルスの新規感染者数は286人と過去最多を記録しました。全国では622人を記録しましたが、この数は4月11日の720人、4月10日の644人に次ぐ人数です。東京都ではその後、17日には293人と過去最多を更新し、18日も290人となりました。

 この1~2週間、気がついたら「緊急事態宣言解除後過去最多」が繰り返され、あれよあれよという間に新規感染者が増加。新型コロナウイルスの恐ろしさを感じます。

 ちなみに7月1日時点の累計感染者数は1万8840人ですが、その後15日間で感染者は4763人増えています。逆に7月1日を起点に過去に遡ると、新規感染者が4763人分増えるのに60日余りを要しています(累計感染者数が1万3982人となった4月28日まで遡ります)。7月に入ってからの感染者増の速さがよく分かります。

 これが第2波と言えるのか、そうでないのかは新型コロナウイルス感染症対策分科会が判断を下すとして、日本では収束したかと思われた新型コロナウイルスの感染が再び拡大しているのは間違いないでしょう。改めて事実関係を整理し、4月と7月で何が違って、何が同じなのかを見比べてみたいと思います。

 ただし、新型コロナウイルスの情報を網羅的に整理、把握できているのは、個人はもちろん、報道機関でもかなり少ないのが現状です。その理由は2つあります。

 1つ目。初期から、厚生労働省の発表は岩手県を除く全国46都道府県が発表するデータに対してタイムラグが発生しており、正確性を担保するには各都道府県のWEBサイトを1つ1つ確認しないといけないからです。しかも感染者が初めて確認された20年1月15日から既に半年以上が経過し、チェックすべき情報は膨大で、かなりのリソースを投入しなければ「正確」なデータは手に入りません。

 2つ目。新型コロナウイルスは、陰性になった後に再び陽性と診断される患者の数が一定数います。いわゆる「再陽性」を新規感染者としてカウントするのと、カウントしないのとではデータがぶれてきます。前者は「延べ感染者数」となります。問題は、この再陽性者を別々にカウントするか、同一の感染者とするかは各自治体によって異なることです。このため、実態を把握するには、相当の手間がかかります。場合によっては自治体に電話しなければ詳細が分からない場合もあります。

 私の所属するJX通信社では、かなり早い時期から正確な都道府県単位の感染者数と、感染が報告された場所の情報を収集してきました(情報はWebのNewsDigestや、アプリ版NewsDigestで確認できます)。そこで今回は、この情報を基に事実関係を整理したいと思います。