AIの効果的な教育こそが最重要課題

現在のAIやロボットは、医療と患者を直接つなぐことができるまでに成熟しているのでしょうか。

沖山氏:医療のすべてが自動化されるべきではありませんし、前提としてまだ、いくつかのブレークスルーが必要です。医療をタクシーになぞらえて考えてみると、いまのAIというのは乗客(患者)ではなく、運転手(医師)のためのカーナビのような位置付けです。直接患者が利用するものではなく、医師の診療をサポートするツールなのです。

 医療と患者が医師を介さず直接つながるというのは、運転手不在の自動運転車になるということです。安全な分野から始めるか、極めて高い信頼性・安全性を実現する必要があります。そのためには、より適切な判断を下すAIを育てるための膨大な学習データが欠かせません。現状では、この学習データが質、量の両面から足りないことが課題になっています。

医療分野で、学習データを収集するというのは難しいことなのでしょうか。素人目では、病院で扱う情報は電子化されており、病院同士を結べば大きなデータベースができ上がると思えるのですが。

沖山氏:学習データの収集は、戦略的に進めないと効果が得られません。レントゲンの写真など検査データはたくさん集められますが、これを学習データにするためにはどのような病気につながるデータなのかラベル付けする必要があります。病院の中では検査と診断それぞれのデータが生み出されているわけですが、双方のデータが分断されてしまっているため、学習データとして有効活用できないのです。

 また、精度の高いAIを訓練するために必要な学習データの数は膨大です。グーグルは、AIに写真を見せて猫を判別できるようにするために、1000万枚もの写真を学習に用いたといいます。一方で人間は、初めて見た動物でも、名前を一度教えられれば、次からはきっちりと判別できます。このように、分別のついた大人の人間と、レントゲン写真の見方どころか「写真とはどのようなものか」「ものを見る・区別するとはどういうことか」から学習しなければならないAIとでは、学習効率に大きな差があります。

 病院同士をつないでデータを効率よく蓄積するしくみはもちろん重要です。しかし、それによって学習データの数が1000倍や1万倍になることはありません。このため、少ない学習データで効率よく学習できる転移学習などのような、AIアルゴリズムの発展があわせて重要になります。

 高精度で診断できるAIを育てることができれば、その価値は極めて高いと思います。既に、骨折と肺がんを対象にして、高精度の画像診断サービスを事業化しているエンライテック社のような企業も登場しています。同社のAIは、診断的中率と見逃しの少なさの両方で、トップレベルの医師を上回っています。しかも、診断を下す速さは5万倍速く、24時間働き続けてくれます。