音声検索は今後普及するには精度が重要

最近はスマホで音声検索をしている人が増えました。お店や施設の名前をスマホで検索するときに、自分の声を使うのです。どこどこのお店に行きたい。道の名前や住所などもやったりしています。

僕も音声検索を使っていました。過去形なのは今では使っていないからです。

最初は物珍しいのもあり何でもかんでも音声検索をしていました。でもしばらくしてめんどうになって使わなくなりました。その理由が精度です。

確実に認識してくれればなぁと思ってたらこんな記事を見つけたので紹介します。

中国百度のチーフサイエンティスト・Andrew Ng(2014年当時、現在はLanding.ai を経営)の音声検索に関する発言は、音声検索の未来を語るうえで最も頻繁に引用される発言の1つです。彼は音声検索が広く一般に普及するための指標として、音声認識精度が99%に達することが1つのカギだと説明しています。

301

文字入力の検索は確実性がありますけど、音声検索は100%の検索ではありません。たとえば「みかん」と発言したら「みっつのかん」とか「美香」などずれたりします。その頻度が多ければ多いほどユーザーエクスペリエンスを損ねるのです。

文字を入力して検索するときは、検索語を確認してからサーチボタンを押しますよね。でも音声はアシスタントがどのように認識しているかは検索結果を見ないとわからないのです。その点が不便です。

音声で検索している友人を見ていると自分が検索したい語をうまく認識できずにモヤモヤしていることがあります。そんなときは音声検索もまだまだだなぁと思っていますね。

精度がよくなり音声で返してくれるようになれば音声検索はとても使いやすくなると思っています。たとえば辞書は「りんごってなに?」と問いかければりんごの概要を音声で返してくれると楽です。さらに追記情報を知りたいなら専門のサイトに行って詳細情報を読めばいいのです。

地図ならお店の名前を音声検索すれば開店情報や経路案内を音声で返してくれるといいですね。メニューや商品情報を知りたいならサイトに飛べばいいのです。

こうして考えてみると音声検索とスクリーンで知る情報は棲み分けができそうです。画像と写真を見たい、税金や詳細な情報を参照したいなどの視覚的に確認したいならスクリーン。辞書の意味や簡単な情報なら音声。そんな使い分けが出てくるかもしれません。

コメント