深層学習が持つ「3つの力」のうち、「認識」と「生成」については、前回までにお話ししてきました。最終回では3つ目として、ものをコントロールする力、「制御」について説明します。

 これまでに何回か、深層学習の強みとして「汎化」する性能が高いことを説明してきました。未知なる状況に対して柔軟に対応できる。実際、現実世界のものを制御していく上では、あらかじめルールで決められたことだけをやればいいというものではありません。

 自動運転でも、ロボティクスでも、プラントの制御でも、必ず未知の状況に出合います。これまでの機械による自動化は、そういった未知の状況に対応するのが極めて難しかった。ロボットにしても、決められたことは人間よりも正確にできる一方で、ルール化できないことや学んでいないことに関しては非常に脆弱でした。

 そのため、現実世界のものを制御することに対しては、機械で全自動化することがなかなか難しかったというのが実情です。しかし、深層学習の持つ高い汎化性能を活用していくことによって、「制御」の世界に大きな進展をもたらすのではないかと我々は考えています。

ドローンから化学プラントまで

 例えば、ドローンのコントロールにも、我々はこういった深層学習の技術を用いています。

人間がモーターの回し方すら教えていないにもかかわらず、コンピューターがドローンの制御の仕方を自ら獲得している
人間がモーターの回し方すら教えていないにもかかわらず、コンピューターがドローンの制御の仕方を自ら獲得している

 上の写真は、人間がモーターの回し方すら教えていませんが、ドローンの制御の仕方をコンピューターが自ら獲得している事例になります。この技術はクルマなど、さまざまなデバイスにも対応できます。

ロボットがテニスボールを段ボールの壁から遠ざけるように少し動かし、取りやすい位置に移動させてからつかむことを自ら習得
ロボットがテニスボールを段ボールの壁から遠ざけるように少し動かし、取りやすい位置に移動させてからつかむことを自ら習得

 次も非常に興味深い事例です。この写真は、ロボットに物のつかみ方をゼロから教え込んだ例です。こちらも深層学習を用いています。このロボットは、画面左下で指示された物体を箱から取り出すように訓練されています。テニスボールを取りにいきますが、そのままだと段ボールの壁にぶつかって取りにくい。

 そこで、テニスボールを壁から遠ざけるようにちょっと動かし、取りやすい位置に移動させてからつかむことを、人間が教えることなく習得しました。非常に柔軟性の高いアルゴリズムですので、突然物を動かされても、動かされた場所を認識して取りにいくこともできます。

周りの物体をよける行為は人間が一切教えていないにもかかわらず、ロボットが自ら学習。赤や青の物体をよけて緑の物体をつかんだ
周りの物体をよける行為は人間が一切教えていないにもかかわらず、ロボットが自ら学習。赤や青の物体をよけて緑の物体をつかんだ

 そして上の写真はさらに重要な事例になりますが、周りの物体をよけなければ取ることができない緑のパズルのような物体を取りにいきます。

 周りの物体をよける行為は人間が一切教えていないにもかかわらず、周りの物体をよければこの緑の物体を取れると自ら学習し、ロボットが周りの赤や青の物体をよけて見事に緑の物体をつかむことができました。これは、非常に高い汎化性能を持つことを示している大きな事例の一つになると思います。

次ページ 不測の事態にも対応できる