米グーグルが変えた自動翻訳の競争環境

NICTは「VoiceTra(ボイストラ)」という自動翻訳のスマートフォンのアプリを提供している。

NICTではニューラルの研究はいつ頃から取り組んできたのですか。

隅田:2013年からずっとやっていたんですが、先ほど申し上げていなかった欠点が実はもう1つありまして、本格的に移行できていませんでした。それは、非常に大きな計算量が必要だということです。

 その計算をするには、GPU(画像処理半導体)という計算機を使うわけですが、非常に値段が高い。システムを作るのに大きなコストがかかるだけではなく、それを一般の人に使ってもらうときにも高いサービスになりかねません。そのため、タイミングを迷っていました。

 それなのになぜ、我々もニューラルに移行したかというと、昨年秋に米グーグルがニューラルを使ったサービスを出し、米マイクロソフトもその動きに即座に追随して、我々も負けてはいられないと判断したのです。

 実は、中国の検索大手バイドゥは数年前からニューラルを使った翻訳サービスを出していたんですよ。しかし、日本人の我々にはほとんどインパクトがないので、誰も気にしていませんでした。ところが、グーグルが出すと、みんなその精度の高さにショックを受けたというわけです。

「グーグル翻訳(Google Translate)」ですね。

隅田:はい。それまでグーグルの翻訳は、必ずしも精度の高いものではありませんでした。機械翻訳に典型的な誤訳も多いという印象でした。ところが、ニューラルでやると、これほど翻訳精度が向上するのかと、翻訳関係の人たちはびっくりしたわけです。そこで我々も、最新の技術に取り組んでいるということを皆様にも理解してもらうために、今年6月にニューラルを使った翻訳を出しました。

 我々が独自に技術を開発する意義は、誰もがグーグルのようなクラウドサービスを使うわけにはいかないからです。情報の秘匿性を考えると、ビジネスではグーグルの翻訳サービスを使えないという企業もあるはずです。日本の国立研究所としては、そうしたニーズにもしっかりと対応する必要があります。

日本独自に自動翻訳の技術を向上しておかないと、情報を海外企業に持っていかれるリスクもあるということですね。

隅田:絶対に情報を外に出せないというケースもあります。個人情報の塊である病院のカルテのような情報とか、防衛関連の情報とかはその典型でしょう。特許やIRに関連する情報も、企業の外には出しにくい。秘密を守りながら翻訳しなければならない分野は、数多くあります。

隅田:日本では、自動翻訳の研究を何十年も前からやってきた歴史があります。2014年には、当時の新藤総務大臣が我々の自動翻訳のシステムをご覧になって、これを2020年の東京オリンピックに向けてぜひ多言語化して、海外から来る人たちに使ってもらおうということになりました。それから総務省の予算を集中的に投下してきています。

 NICTの中に先進的音声翻訳研究開発推進センター(ASTREC)を作り、日本の企業から出向で研究員に来ていただいて、40人くらいのチームを作りました。出向元の企業はパナソニックやNEC、富士通、日立製作所、東芝、ソニー、NTT、KDDIなど多岐にわたります。翻訳エンジンはNICTで作り、そのエンジンを企業にいろいろな形で使ってもらうというものです。

 技術の進歩はここに来て急速に速くなっています。自動翻訳は、人間の通訳や翻訳に比べて圧倒的に低コストですし、24時間365日休まず働いてくれます。しかも、多言語対応が容易です。既に、日本人の平均的な語学力は完全に超えているレベルに達しています。