翻訳AI(人工知能)に大きなパラダイムシフトが起きた。昨秋以降、米グーグルや米マイクロソフトが相次いで、ヒトの脳神経細胞の学習機能をモデルにしたディープラーニング(深層学習)をAIに導入したのだ。深層学習に適した高性能半導体の開発が進み、翻訳のような複雑な課題にも応用できるようになったためだ。これにより翻訳AIの実力はどう変わっていくのだろうか。
マイクロソフトは通話ソフト「スカイプ」などに搭載されている翻訳AIに深層学習を導入した

 初期の翻訳AIはルールベースという手法を用いていた。一般的な英語の構文から、単語が動詞なのか名詞なのか、目的語なのか述語なのかを判断するルールを多数AIに書き込み、そのルール通りにAIは翻訳する。

 ルールベースが進化したのが、直近まで利用されていた統計ベースと呼ばれる手法だ。例えば「Time flies like an arrow」の日本語訳は「光陰矢の如し」だが、「時のハエは矢を好む」でも文法上の間違いはない。ルールベースではどちらも正解になってしまう。そこで、大量の対訳例文から各単語が統計上どのように訳される可能性が高いかをAIは判断して、前者の訳が正しいと判断する。

 では、最新の深層学習による翻訳AIとはどんなものだろうか。現在のAIブームを巻き起こすきっかけをつくった深層学習の特徴は、正解を見出すためのヒントをAIが自ら見つけてくるという点にある。

  深層学習が最初に注目されたのは、猫の画像を見せて正しく猫と判断できるかという課題に挑んだAIだった。ルールベースのAIでは、「ヒゲがある」「三角の耳」といった猫の特徴をAIに覚えこませる。一方、深層学習AIは事前に大量の猫の画像を「例題」として読み込んでおくことで、ヒゲや耳などが猫と判断できるヒントであると自ら判断する。初めて見る猫の画像でも、そのヒントと照らし合わせて「応用問題」として解けるようになる。

訳のヒントをAIが発見

 先ほどの例文「Time flies like an arrow」の場合、fliesの正しい訳を判断するためのわかりやすいヒントはtimeだろう。時は「飛ぶ」ように過ぎるが、時の「ハエ」という種は存在しない。統計ベース手法で調べれば、timeとfliesが一緒に使われる文では、「飛ぶ」と訳す頻度が多いはずだ。つまりヒントは同じ文中にある。この手順なら深層学習を必ずしも使う必要はない。

 では「Your desktop is messy」はどうだろうか。「あなたの机の上は散らかっている」と「あなたのパソコンのトップ画面が散らかっている」。どちらが正しいのか。

 ヒントはこの一文の中にはない。前後の文章から探さなければならない。前語の文にpenやnoteといった単語が入っていればdesktopは机の上を意味するだろうし、iconが入っていればパソコンの画面を指すだろう。しかし、ヒントになる単語が前後の文章のどこに現れるか予測はできない。それならば、猫の画像でやったように、深層学習を利用し、ヒントを見つけて来るところからAIにすべて任せてしまう。つまり、深層学習による翻訳AIは、前後の文章まで自ら読み込み、正しい訳を考察できる。「文脈を読む」力を備えることができるのだ。

 日本マイクロソフトの榊原彰CTO(最高技術責任者)は「深層学習の導入でサチュレーション(成熟による成長の鈍化)を突破した」と語る。ただし、残念ながら現在の翻訳AIは実際に長文を正確に読み下せるレベルにはまだない。深層学習は猫の画像のように、事前に大量の「例題」を読み込んでおく必要がある。この例題は、ヒトが正しい対訳を作って準備しておかなければならない。現在はまだ深層学習AIという枠組みができたに過ぎない。これから各社は大量の長文の例題のデータを準備して、文脈を読みとるAIを成長させていくのだ。