音声インターフェイスの基礎知識
音声インターフェイスとはiPhoneに搭載された『Siri』に代表されるような、自分の声で検索したり音楽をかけたりといった機器の操作ができるインターフェイスのことです。近年ではカーナビにも利用されている他、Google検索も同様に音声で指示ができます。
家電でも音声インターフェイスに対応したものが増えてきており、電気を付ける、音楽をかける、お風呂を沸かすなどの指示が自分の声でできるようになりました。様々な技術進歩によって実現化し、以前に比べると精度もあがってきています。
音声インターフェイスの現状
ただし、音声インターフェイスはまだ完全な精度とは言えず、AIが認識できない言葉があったり、環境音の影響で認識できなかったりといった不具合も多々あります。一方で、テレビや他人の声を認識してしまい、指示していないのに機器が動作するという問題も起こっています。
また、機械に向かって話すのに抵抗がある人も多く、認識してくれないから使わなくなった、従来のインターフェイスの方が使いやすいといった不満があるのも音声インターフェイスの現状と言えるでしょう。
音声インターフェイスのメリット
音声インターフェイスがよく利用されているのは、時刻や天気、検索といった何かを知りたい時です。これらの行動は繰り返しが多く、何か別の作業をしながら確認したいこともあります。手が離せない時は特に、音声インターフェイスを便利に感じる場面です。
また音声インターフェイスは画面を見ることができない時や、視覚障害のある人にとっても非常に心強いパートナーになり得ます。声で指示ができる、声で答えが返ってくるという音声インターフェイスは、視覚的要素を使えない人にとっては助かる存在です。
音声インターフェイスデザインの基本
音声インターフェイスは、生活の質を向上させ、人々に革新的な未来を想像させてくれます。音声インターフェイスはどのようにデザインされているのでしょうか。
ユーザーの質問や回答を予想する
質問に対する答えは、すべて『はい』『いいえ』で答えられるものとは限りません。そこで、音声インターフェイスのデザインには、文法をデザインすることが必要になります。
これはつまり、相手がどう質問するか、質問に対してどう答えるかを予想することです。想定した回答を音声インターフェイスに組み込み、ユーザーが答えやすい質問を作ることができるようにします。
しかしながら日本語における質疑応答は多様で、敬語ひとつとっても複雑で高度な文法です。これをユーザーのストレスなく音声インターフェイスで実装するために、文法のデザインが必要不可欠になります。
予想外の質問や返答に対応する
質問や命令をする際に、表現の方法はさまざまです。ユーザーの予想外の質問や返答に対して、音声インターフェイスでは答えられない、実行できないという場合が出てきます。
そのような場合に、音声インターフェイスにどのように回答させればよいのでしょうか。多くの場合、『わかりません』『よく聞き取れませんでした』『○○をすることはできません』といった回答をするでしょう。また、一歩進んで『○○のように話してください』と提案型の返事をかえす場合もあります。
言葉のやりとりは複雑でバラエティに富んでいますから、常に一歩先の回答まで想定することが必要です。
これからのデザインのポイント
音声による機械とのやりとりは、バリエーションが際限なく考えられます。そこで音声インターフェイスをデザインする場合はポイントを押さえていかなければなりません。
意図をくみ取る機能
ユーザーはどのような言葉で音声インターフェイスに指示を出すのでしょうか。人の数だけ指示の言葉もあり、そこには無限の選択肢があります。そのため、音声インターフェイスがユーザーの意図をくみ取るような機能を持つことが重要になってくるでしょう。
会話の流れを正しく理解し、ユーザーがどうしたいのか、意図を理解できるようになると、適切な対応ができるようになるのです。
選択肢の提示と順位付け
視覚的なインターフェイスでは、選択できる項目の一覧を一目で確認できます。しかしながら、音声インターフェイスではそれができません。ユーザーにストレスを感じさせないためには、選択肢を適切に提示していくことが必要です。
また、音声インターフェイスは情報の一覧性がないため、同時に示すことができません。ユーザーの混乱を招かず、負担を与えないよう優先順位を付け、できるだけ簡潔で短い提示ができるようデザインしましょう。
まとめ
音声インターフェイスは多くの可能性を秘めた革新的な技術です。視覚的な手で触れるインターフェイスとは違い、デメリットもありますが、音声インターフェイスならではの機能を活かしたデザインをすることで、人々の生活をより充足したものにできる可能性があります。
言葉は多様なだけに、デザインする際には文法から理解していく必要がありますが、ユーザーが使って楽しい、便利と思う音声インターフェイスを目指しましょう。