まずは、深層学習が持つ“3つの力”について説明したいと思います。1つ目が「認識」。深層学習を用いて何かを認識する精度がどんどん上がっている現状を、画像などをご覧いただきながら理解していただければと思います。

 皆さん、この写真をご覧ください。

[画像のクリックで拡大表示]
[画像のクリックで拡大表示]

 ここに写っている物体が何なのかを認識することを「物体認識」といいます。深層学習の登場以前は、あらゆる物体が識別できる汎用的な物体認識は非現実的でした。しかし、深層学習を使うことで、上の写真のように、初めて見せられた品物でもカテゴリーや位置がある程度認識できるようになったのです。ただ、これだと、いくつかの物体は認識できていますが、例えば食品の缶を「本」と誤って認識しており、正しく認識できているものでも形は分かっていません。 

 一方、19年ごろの事例なので少し古いですが、下の写真が、PFNの手法によって1000以上のカテゴリー分類や形状の推定を高い精度で認識した結果です。今では、深層学習によって、下の写真よりもさらに高速で高精度に物体が認識できるようになっています。

 認識はいわば人間の目の部分に当たるわけなので、その目が進化することによって、これまでは人間にしかできなかったようなタスクに対して深層学習が適応できるようになるという非常に印象的な出来事だったわけです。

深層学習の大きな強みは「汎化性能」

 我々は機械学習に10年以上取り組んできましたが、認識精度はずっと大きな壁でした。というのも、深層学習が出てくる前までは、照明条件や環境が変わってしまうと、精度が簡単に落ちてしまっていたのです。

 それに対して深層学習は、のちほど説明しますが、非常に高い「汎化(一般化する)性能」を持っています。

 汎化性能とは何かというと、人間は照明が明るくても暗くても物体を正確に認識できますし、光を反射しているガラス容器の中にある物体でも認識できます。つまり、環境が変わっても物体を正確に認識できるという、これまで人間しか持ち得なかった高い柔軟性をコンピューターという機械が持つようになったのです。それが深層学習の非常に大きな特長です。

 これまでの手法では、環境が変わるとその環境ごとにチューニングしないと使い物にならなかったのに対して、深層学習でたくさんのデータを学習させることで、未知の環境の中でも物体を正確に認識できるようになりました。この汎化性能が実用化においては非常に大きな影響を与えています。

 認識できるものは物体だけではありません。例えば、人の動きを認識することもできます。下の写真は、左の人の動きを認識して映し出しているものです。

 これまでは人の動きの認識はモーションキャプチャーなど、人にセンサーを付けて行っていましたが、動画を撮影するだけでどういう動きをしているかを認識できるようになったのです。

 それを3D(3次元)空間上にマッピングし、人がどのような振る舞いをしているのかも認識できるようになっています。

 こうした3Dでの認識も深層学習でできるようになりつつあり、昨今盛り上がっているVTuberなど、バーチャルの世界にリアルの世界を投影する分野でも非常に重要になってきます。また、店舗などで人の動きをトラッキングして予測するといったところにもつながっていく重要な要素技術になっていくと考えています。

 専門性の高い分野でも、この深層学習による認識の技術は活用され始めています。例えば、下の写真は胸部のレントゲン画像に対して病変の疑いが高い部位を自動でマーキングしているのですが、こういった医療分野でも活用がすでに始まっています。我々も研究開発をしていますが、この医用画像診断は深層学習の中でも非常に重要な分野の一つになっています。

写真:Xiaosong Wang, Yifan Peng, Le Lu, Zhiyong Lu, Mohammadhadi Bagheri, Ronald Summers, ChestXray8:Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases, IEEE CVPR, pp. 3462-3471, 2017 (https://nihcc.app.box.com/v/ChestXray-NIHCC)
写真:Xiaosong Wang, Yifan Peng, Le Lu, Zhiyong Lu, Mohammadhadi Bagheri, Ronald Summers, ChestXray8:Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases, IEEE CVPR, pp. 3462-3471, 2017 (https://nihcc.app.box.com/v/ChestXray-NIHCC)

 深層学習は体の中の異変を見つけるだけではなく、製造物に対しても使われています。工作機械で加工した製品に傷が付いていないか、異物が混入していないかなどの異常の検知も、高い精度かつ少ないデータで学習できるようになっています。

 医用画像診断や傷検査などは、人手がかなりかかっていた分野で、そういった領域でも人に匹敵するような精度を出せるようになってきているのが非常に重要なポイント。こうした専門人材による作業が多い現場では、過酷な労働環境と人手不足が課題となっていることが多いからです。

 機械だけで100%の精度を出すことができなくても、機械と人の両方の視点から病変部位をしっかり観察してミスを減らし、機械の手を借りることで人がフォーカスすべきところにより集中できるようにするといった使われ方も、深層学習で今起こりつつある重要な潮流だと考えています。

 本書はさまざまな事業分野で深層学習(ディープラーニング)を課題解決に役立てるための、本質的で応用可能な思考法を身に付けるためのものです。第1章では、AI技術で本質的に何ができるかという“WHAT”について、「3つの力」に分けて説明します。第2章では、機械学習・深層学習がどのような仕組みで動いているのかという“HOW”について、プログラミング言語や数式を使わず、例を挙げながら解説。

 第3章では、PFNが実際に手掛けた事業現場への応用例を、第4章では「AIの未来」について紹介します。そして最終章では、そもそもなぜビジネスに「AI」と呼ばれる技術が必要なのか、という根本的な“WHY”について、インタビュー形式で明らかにしています。

 本書をお読みいただければ、機械学習・深層学習・強化学習や、それらの機能である認識や生成、制御などを「AI」と一緒くたにして議論することがビジネスの現場ではあまり意味をなさないことがお分かりいただけるでしょう。

 ビジネスパーソンの皆さんにとって、本書が「AI」の本質的な原理やメリット、限界を知り、ビジネスの現場でいち早く役立てるための一助となれば幸いです。

まずは会員登録(無料)

有料会員限定記事を月3本まで閲覧できるなど、
有料会員の一部サービスを利用できます。

※こちらのページで日経ビジネス電子版の「有料会員」と「登録会員(無料)」の違いも紹介しています。

※有料登録手続きをしない限り、無料で一部サービスを利用し続けられます。

この記事はシリーズ「AIってそういうことか」に収容されています。WATCHすると、トップページやマイページで新たな記事の配信が確認できるほか、スマートフォン向けアプリでも記事更新の通知を受け取ることができます。