next up previous
Next: 3 実験 Up: 2 音声ウェブブラウザの設計 Previous: 2.3 画面タイプの分類

2.4 音声入力候補の動的な構成

音声入力候補の決定においては、 ユーザが各状況で発話しやすい語彙を 多く候補に含めることでユーザの操作効率や使いやすさを 改善することができる。

また、印象発話についても、次のような理由から、 ユーザが発話する可能性が高い場合は音声入力候補に 含めることが望ましい。

  1. 音声入力候補を操作発話に限定してしまうと、 ユーザが自発的に行った発話の多くが誤認識されたり 未知語として棄却されてしまうため、このような 反応を恐れてユーザが音声コマンドを使わなくなる 可能性がある。 印象発話に対して適切な相づちなどを行うことで、 ユーザが機械に向かって話しかける場合の 精神的負担を軽減できると思われる。

  2. 印象発話によってユーザは 興味を持ったり驚いたりした項目を システムに知らせていると考えられるため、 ユーザの主観的な要求を推測したり、 指示語などの照応関係を解決する目的で これらの発話を利用することが期待できる。

一方で、音声認識部が実用的な認識率や認識性能で 動作するためには、語彙数などの制約を受ける。 そこで我々は、 表1のように ユーザ発話を分類し、 音声認識部の応答速度を落さない範囲で、 これらの語彙を対話状況ごとに適切な比率で含める ことを検討している。

  
Table 1: ネットサーフィンにおけるユーザ発話の分類



Nishimoto Takuya
1998年03月01日 18時24分10秒