学術論文での画像の重要さが年々増す一方で、不正防止の必要性も高まっている。簡単に画像解析ができるソフトにより、研究者の本分に没頭してもらえる環境を提供する。
画像の不正処理がすぐ分かる
論文にあるDNAの画像の不正加工を再現したもの。解析ソフトで分析すると、肉眼では見抜けない不自然な処理跡やムラのようなものが見受けられる
2014年2月、世の中は理化学研究所(当時)の小保方晴子氏によるSTAP細胞論文の問題に沸いていた。報道を横目に、島原佑基氏は開発中のソフトウエアで論文にあるDNAの画像を分析してみた。「ああ、これは…」。思わずため息がこぼれた。
上の写真のように、はっきりと画像を合成した痕跡が見られたのだ。「分析結果を見れば、画像処理の不正は否定しようがなかったはず」と島原氏。急きょ、学術論文上の画像に不正がないかを確認できるソフトウエアをオンラインで無料公開した。すぐに世界中からアクセスがあり、今なお多い日で1日数十枚の画像がチェックされている。
画像分析を不正検出にも応用
当時、島原氏は生命科学分野向けの画像解析ソフトを開発するエルピクセル(東京都文京区)の設立を控えていた。
同社のソフトを使えば、例えば植物の画像から日々の成長率や面積、形状などの変化を自動的に算出し、適切なグラフを出力することができる。研究者は得られた分析画像やグラフを、論文掲載やその後の品種改良に役立てる。
もともとはこうした画像分析のソフトウエアを開発していたが、分析手法を変えれば、冒頭のような不正画像検出にも使えるというわけだ。
論文の約9割で画像を使う時代に
●世界の論文における画像の出現頻度
注:過去1年の「Cell」「Nature」「Science」誌の生命科学系論文を対象としたエルピクセルによる独自調査の結果
文部科学省は2015年6月に公表した「平成27年版科学技術白書」でSTAP論文問題に言及し、不正防止への取り組みを強く求めている。「論文に掲載されている画像の1割が不適切なものとも言われている。小保方さんの件は氷山の一角。不正が少しでもなくなるようにしたい」と島原氏は言う。
生命科学分野では、研究室で実験対象を撮影したデジタルカメラの画像から、医薬品開発などにおける顕微鏡画像、医療施設のMRI(磁気共鳴画像装置)まで、あらゆるシーンで画像が利用される。
2次元画像のみならず、3次元画像、動画と扱う画像の種類も多様化している。2次元で「丸」と認識していた細胞が、3次元だと「チューブ状」であることが分かることもある。扱うデータ量が増えればそれだけ作業量も増える。
28歳の島原佑基・代表取締役が目指すのは「生命科学分野におけるPhotoshop(アドビシステムズの画像ソフト)」(写真=竹井 俊晴)
画像の“重み”も増している。数枚の画像から読み取った優位な差だけでは、論拠に乏しいと見なされることが増えた。大量の画像から統計的に優位を証明する必要に迫られている。
その一方、STAP論文問題の影響などもあり「論文に画像を掲載する際にビクビクする研究者は少なくない」(島原氏)。扱う量と比例して、研究者や科学者の画像分析レベルが上がるわけではない。このままでは研究者が画像データの処理や分析をする“作業者”になってしまいかねない──。島原氏がそんな危機感を持ったのは、自らも研究者だったからだ。
現在28歳の島原氏は大学学部時代に遺伝子工学を専攻。多いときで40ものプロジェクトに関わっていた。「1日で30ギガビット(ギガは10億)もの画像を撮影して、それを1週間かけて解析することが普通だった」(島原氏)。
ある製薬メーカーでは、信じられない光景を見た。画像内の細胞の生死を、3人のパートタイマーの女性が目視で判断していたのだ。増え続ける画像の量に比べ、処理能力が追いついていないことを実感した。
大学院修了後、経営や海外事業を学ぶため、インターネットベンチャーのグリーやKLabといった企業で経験を積み、2014年3月に起業した。
人工知能でがん細胞を解析
エルピクセルのソフトの価格帯は20万~500万円。大学や研究機関などへの販売に加え、企業や団体との提携プロジェクトを事業の中心に据える。創業2年目ながら、2016年3月期では単月での売上高が1000万円を超える月も出ており、2017年3月期は2億円の売上高を目指す。
企業や団体との提携プロジェクトや画像解析の受託の数は、40件以上。そのうちの一つ、国立がん研究センターとの共同事業では、がん細胞の診断支援にまで踏み込む。
従来は専門医が画像を目視で確認していたがんの有無や、どのような治療が適切かの判断を支援するソフトを開発中だ。例えば、肺がんが、肺由来なのかほかの臓器からの転移なのかを画像で分析する。どの臓器由来かを見分けられれば、より正しい治療法の選択につながる。
画像の分析には人工知能を利用。機械学習のほかに、自ら学習し精度を上げていく「ディープラーニング」と呼ぶ新しい技術も活用する。細胞の形や生死などを自動で判定でき、利用ごとに精度が上がる独自の人工知能プログラムは特許を取得済みだ。
世界的に見れば生命科学分野の画像解析の分野では後発となる。一方、現時点で競合となるソフトウエアは世界で10もなく、対応するOS(基本ソフト)がウィンドウズのみだったり、クラウド上では利用できなかったりする。エルピクセルは複数のOSやクラウド上でも利用できるようにすることで優位性を打ち出せると見ている。
「データ解析に利用できる何百何千の特徴をどう見極め、解析するかが腕の見せどころ。“IT屋さん”には難しい」と島原氏。研究者として養った知見をシェア拡大に生かせるとの自信を持つ。来期は企業や研究機関との共同事業を10件程度増やす予定。画像という世界共通の“言語”を解析し、日本発のソフトで世界市場を目指す。
(日経ビジネス2016年2月15日号より転載)
Powered by リゾーム?