はじめに

音声入力が中心の世界へ

なぜスマートスピーカーがスマホを不要にしてしまうのか? それは、みなさんがスマホを使うときのことを考えてみるとわかるかもしれません。

スマホが登場して以降、「あ・い・う・え・お」と親指で5回タップするようなトグル方式から、指先を4方向にすべらせるフリック方式に多くの人の文字入力法が変わりました。iモード世代が高速で親指を叩きながらメールを打っていたのに対して、スマホ世代は基本的にこの方法で文章を入力しています。

ところが最近はスマホに向かって話しかけたほうが入力が早いですよね。

「こんにちは すずきです おせわになります」

スマホに向かって話しかけると、「こんにちは。鈴木です。お世話になります。」とかなりの高精度で正しい文章が表示されます。

誤字や誤変換が少しあっても、その部分を修正すればメール完成です。

これはAIの音声認識の能力が格段に向上してきたから。グーグルによると音声認識のAIにディープラーニングを取り入れた結果、AIが言葉を聞き間違える確率が一年間で8.5%から4.9%に下がったそうです。

おそらくこの数字はこれからの1年でさらに下がるでしょう。人間の話す言葉をAIがきちんと受け取ってくれる時代が来たのです。

近い将来、スマートスピーカーでできるようになること

そこでスマートスピーカーです。人間の言葉を99%の確率で理解してくれれば、これまで理論的に言われてきた未来がすべて実現します。

「音楽をつけて」「電気を少し暗めに」「テレビのスイッチも入れてくれる?」

このように簡単なリモコン操作からはじめ、もっと高度なことができるようになります。

たとえば、こんな感じに。

「星野源の『恋』を聴きたいな」

「ライブラリには入っていない曲ですね。iTunes storeで200円だけど買いますか?」

「明日は晴れる?」

「雨の確率は20%ですが、Googleカレンダーによると午後3時に幕張に行くことになっていますよね。あっちの降水確率は50%ですから、傘を持っていったほうがいいですよ」

複雑な設定をしなくても、これくらい返事が高度化してくる。そんな未来もそれほど遠くないと言われています。

ほかにも、LINEのメッセージのやりとりも音声でやりとりすることが当たり前になるかもしれません。

「今日はありがと。いまどこ?」

「まだ帰宅中。吉祥寺のスタバで読書してるとこ」

「ああ、そう。オレはもうソファでぐったりだ」

お互いにスピーカーに向けた音声で入力することで、文字で読むことも音声で聞くこともできるようになる。

朝起きたときに、40件ぐらい仲間内のやりとりがあったとしても、優雅にコーヒーを飲みながらスピーカーで聴くことができるわけです。

こうして入出力が音声中心になってくると、「はたして5.5インチのディスプレイのスマホを持ち歩く必要があるのか」という話が出てきます。スマートスピーカーがデバイスの主役となり、大きなディスプレイが脇役に追いやられる時代が10年後には来ているかもしれません。

「スマホがすべての中心だ」という現在の常識。未来を考える際には少し疑ったほうがいいかもしれませんね。

この記事の感想を教えてください。