全5171文字

データの可視化で理解を深めるインフォグラフィック

 データジャーナリズムと聞いて、インフォグラフィックの印象が強い方もおられるかもしれません。15年に日本経済新聞が買収した英紙フィナンシャル・タイムズは「データ可視化」で非常に有名です。17年7月に朝日新聞がWeb上で公開した「ナガサキノート」も、被爆者の証言を基に、人々の足取りを地図上に再現した点において「データ可視化」の良い事例です。データジャーナリズムの賞である「The Asian Digital Media Awards」のデータ可視化の部門で賞を得ています。

The Best of Digital Design」「The Malofiej Award」「The Asian Digital Media Awards」「SOPA Awards」など海外におけるデータジャーナリズムのアワードを調べても、インフォグラフィック系の受賞が目立ちます。

 そんな中、統計学や機械学習を使った報道に対しても賞を贈る「KOREA DATA JOURNALISM AWARDS」は特徴的な存在とも言えます。ちなみにキーノートには、Google News Labでデータエディターを務めるサイモン・ロジャース氏も登壇したようです。もしかしたらアジア圏で最も熱いデータジャーナリズムイベントの1つかもしれません。

グラフィックで北朝鮮の状況を可視化した「Getting to grips with North Korea in 15 graphics」。「The Asian Digital Media Awards」のデータ可視化の部門で賞を得た

「データドリブン・ジャーナリズム」とは?

 一方、データを深堀りしながら真実へとたどり着こうとするアプローチを、インフォグラフィック系との違いを強調するため「データドリブン・ジャーナリズム」と表現する人もいるようです。最初にご紹介した韓国の2つの報道はその典型でしょう。

 もし私に潤沢なリソースと資金があれば、挑んでみたいのは、国会を騒がせてきた「桜を見る会」の来訪者の可視化です。「桜を見る会」というコメントを付けている画像をTwitterやブログなどから収集し、CNN(画像認識で使われるディープラーニングの代表的手法の1つ)を使って顔画像を分類すれば、訪問者リストが完成します。YOLO(リアルタイムオブジェクト検出アルゴリズム)などの技術を使えば、動画の認識も比較的スムーズにできるでしょう。

 他にも、総務省が公開している「政治資金収支報告書及び政党交付金使途等報告書」のデジタル化も、データドリブン・ジャーナリズムとして挑戦してみたいものの1つです。現状では報告書は、検索ができないPDFでしか公開されていないので、文面の検索すらできません。しかし、Googleが提供する機械学習による画像認識API「Cloud Vision API」を使えば、一瞬で検索可能なデータ化ができるでしょう。

 領収書を発行している限りにおいて、どんな人がどの政治家の勉強会に呼ばれたのかも分かります。「普段、政権を擁護(批判)しているあの人は、この政党・政治家の勉強会によく呼ばれているな~」ということもすぐに分かるでしょう。こうした人やお金の動きは、情報公開するだけでなく、皆が検索などを使って、活用できてこそ利用でき、有意義に使えるはずです。