同時通訳アプリも夢じゃない

聞きたい人に「耳を傾ける」研究も進む
●日立製作所の音声処理技術の活用イメージ
<span>聞きたい人に「耳を傾ける」研究も進む<br />●日立製作所の音声処理技術の活用イメージ</span>
[画像のクリックで拡大表示]

 観光分野への応用も進む。日立製作所が開発を進めるのが、商業施設や空港など雑音の多い環境でも聞きたい人の発言だけに「耳を傾けられる」音声処理技術だ。独自開発のロボット「エミュー3」は頭部など14カ所にマイクを装備。それぞれに音声が届くまでの時間の差から、どの方向から周りの音声が発せられているのか把握する。ロボットの正面にいる人の声だけを聞き、館内放送は無視するといった使い方が可能になるという。

 15年11月には、通常のスマートフォンやタブレットを組み合わせ、音声を聞き分けられる技術も開発した。専用端末でなくても使えるので、利用シーンが広がる。それぞれのマイクに音声が届く時間の差を分析するほか、音量差も参考に雑音を除去するようにした。16年4月には成田空港のターミナル連絡バスで実証実験を実施。英語、中国語、韓国語との同時通訳を実現した。

 音声認識ではこれまで、「聞いた言葉を文字にする」点が重視されてきた。

 ただ「人間のコミュニケーションの半分は、言語以外の情報が占めている」。そう語るのは東京大学発ベンチャー、フェアリーデバイセズ(東京・文京)の藤野真人代表。人間なら、話す相手の体調や機嫌を声色から推察して応対を変えることもある。「いつもと違って元気がない」と判断すれば、上着を1枚多く着るように勧めたり、仕事を早めに切り上げるよう声をかけたりすることもある。フェアリーデバイセズは人間的なコミュニケーションの実現には非言語情報の理解が欠かせないとして、同分野の研究を進める。

 そばにいる人になにかを頼むとき、最も簡単で確実な手法は声をかけることだろう。そんなコミュニケーションが機械との間でも実現すれば、人間のパートナーとして、IT機器の活躍の場が広がりそうだ。

(日経ビジネス2017年5月29日号より転載)