音声は「クリック」「タッチ」に続く新世代の操作方法として脚光を浴びる。深層学習技術を活用することで、過去5年ほどで精度が高まった。家庭、商業施設、コールセンター……。利用場面を問わず実用化が進む。

注:波形や数値はイメージ(写真=人物:アフロ、背景:enjoynz/Getty Images)

 「モーツァルトを流してくれないかな」「エベレストって何mあるんだっけ?」「牛乳と小麦粉をショッピングリストに加えておいて」

 家族に話しかけるように声をかけると、自然な答えが音声で返ってくるのが「音声認識」を活用したサービスだ。iPhoneに搭載されている「Siri」やGoogleの検索アプリなど、ここ数年でぐんと身近な存在になってきた。

米アマゾンの「エコー」は、海外で既に1100万台超が売れたという

 なかでも注目を浴びるのが、キーボードもタッチ画面もついていないのに、人間の言葉を聞き取り、理解し、返事をする音声アシスタント端末。米アマゾン・ドット・コムが米国などで販売しているIT(情報技術)端末の「エコー」は、世界販売台数が2016年末までに1100万台を超えたと推計されている。日本でもLINEが同様の端末を開発し、初夏に日韓で発売する。