2021年初頭、Twitter(ツイッター)の音声版ともいわれる「Clubhouse(クラブハウス)」が日本市場を席巻したのは記憶に新しい。その後、クラブハウスの勢いは急激に失速したものの、多くの人が改めて「音声」が秘める力に気づいた。

 テクノロジーはメディアが一方的に情報を発信する環境を一変させた。ツイッターは文字、YouTubeは動画という手段で、個人による情報発信を可能にした。もちろん、音声もまた、比較的古くからポッドキャストなどの情報発信手段はあったものの、利用は一部にとどまっていた。

 だが、2019年には音楽ストリーミングサービスを手がけるスウェーデンのSpotify(スポティファイ)がポッドキャスト関連企業の米Gimlet Media(ギムレット・メディア)と米Anchor(アンカー)を買収。今年に入ってからは米ツイッターが、同じくソーシャルポッドキャストサービスを手がける米Breaker(ブレーカー)を買収するなど、音声市場でのM&A(合併・買収)が話題だ。

 GAFAと呼ばれる米IT大手もまた音声への投資を続ける。米グーグルや米アマゾン・ドット・コム、米アップルはテクノロジーとのインターフェースに音声を採用したスマートスピーカー市場をつくりあげた。

 なぜこれだけ「音声」に世界の先端企業が注目しているのか。音声メディア「Voicy(ボイシー)」を運営するVoicy代表取締役最高経営責任者の緒方憲太郎氏による著書『ボイステック革命 ~GAFAも狙う新市場争奪戦~』から一部抜粋・再編集して掲載する。

 2011年、米アップルが音声アシスタント「Siri(シリ)」を搭載したiPhoneを発売した。これまでキーボード、マウス、タッチパネルと進化・拡大してきたコンピューターへの入力インターフェースが、いよいよ音声になる。SFの近未来の世界のように、「話しかける」ことでコンピューターを操作できる時代がやってきた、と大きな注目を集めた。

 2014年には米アマゾン・ドット・コムが、自社の音声アシスタント「Alexa(アレクサ)」を搭載したスマートスピーカー「Amazon Echo」を発売。続いて2016年には米グーグルが、「Googleアシスタント」を搭載した「Google Home」を市場に投入。スマートスピーカーのブームが始まった。

 しかし、スマートスピーカーが当時「AI(人工知能)スピーカー」とも呼ばれたように、こうした動きは、ディープラーニング(深層学習)の技術やAI、音声「入力」の発達という文脈でしか捉えられておらず、「ボイステック時代の幕開けだ」という期待を抱いた人は、ごく一部だっただろう。

 だが、音声アシスタントやスマートスピーカーは、単に音声による入力を可能にするだけのものではない。

 Siriは、「今日の天気は?」と話しかけると「現在晴れていて、気温は16度です」と“音声で”返事をしてくれるし、Amazon Echoに「お薦めの曲をかけて」と言うと、Amazon Musicやスポティファイなどから音楽を聞かせてくれる。「〇〇について調べて」と言えば、インターネットから必要な情報やコンテンツを探し出し、“音声で”情報提供してくれる。

 人類は「情報を入力したり表示したりする『画面』に縛られた生活」から解き放たれるかもしれない。私にとっては「音声」と「テクノロジー」による「ボイステックの時代」の萌芽(ほうが)を予感させるものだった。

 その後も各社は、音声アシスタントの品質を磨き続け、スマートスピーカーの商品も次々に市場に投入。日本ではようやく2017年に、Amazon EchoやGoogle Homeが発売され、少し遅れてスマートスピーカーブームがやってきた。2018年にはアップルもHomePodでスマートスピーカーに参入した(日本では2019年に発売)。

 特にアメリカではスマートスピーカーが急速に普及した。アメリカのスマートスピーカー専門ニュースサイト、Voicebot.aiによると、2018年には同国で4730万人がスマートスピーカーを所有。2020年には8770万人に達し、アメリカの成人人口の34%を占めるほどになっている。

次ページ 急成長するポッドキャスト市場