あらまし インターネット上の情報をユーザがより有効に活用するためには、 既存の WWW サーバやウェブ検索システムとユーザの仲介者として 音声入力を用いてネットサーフィン支援を行うシステムが有用であ ると考える。 このような機能を実現するにあたって、ウェブブラウザが持つ操作 体系に音声コマンド操作を付加する場合に配慮すべき事項を整理し、 音声ネットサーフィンシステムの設計方針を示した。 さらに、検討した仕様において音声の利点がどの程度もたらされる かを検証するために模擬対話実験を行った。 その結果、 先読みしたページに含まれる語彙をユーザが連想して発話すること が容易とは限らないこと、 ユーザの発話は表示されている画面が選択画面であるか 情報提示画面であるかに依存し、操作発話だけでなく 多くの印象発話を含むこと、などが明らかになった。
キーワード WWW,音声認識,マルチモーダル・インタフェース, 操作発話,印象発話
Abstract
To utilize the information resources on Internet more effectively, we need some assistant systems between the user and the WWW servers or search engines. We have pointed out what to consider in building such net-surfing assistant systems, which add the voice command interface to the existing web browsers, and indicated our design for the voice net-surfing system. In this paper, we examined the benefit of the speech input at our design. As the result of the experiments using simulation dialogs, it seems not very easy for the users to remind the words that are included in the pages which are linked to the pages already displayed. It also turned out that the utterances of the users depend on the type of the displayed page, and contain many non-command words which show user's impressions about the displayed information, as well as the command utterances.
Key words WWW, Speech recognition, Multi-modal interface, Command utterance, Impression utterance