西本 卓也 新美 康永

京都工芸繊維大学 工芸学部 電子情報工学科
〒606-0962 京都市左京区松ヶ崎御所海道町

あらまし  インターネット上の情報をユーザがより有効に活用するためには、 既存の WWW サーバやウェブ検索システムとユーザの仲介者として 音声入力を用いてネットサーフィン支援を行うシステムが有用であ ると考える。 このような機能を実現するにあたって、ウェブブラウザが持つ操作 体系に音声コマンド操作を付加する場合に配慮すべき事項を整理し、 音声ネットサーフィンシステムの設計方針を示した。 さらに、検討した仕様において音声の利点がどの程度もたらされる かを検証するために模擬対話実験を行った。 その結果、 先読みしたページに含まれる語彙をユーザが連想して発話すること が容易とは限らないこと、 ユーザの発話は表示されている画面が選択画面であるか 情報提示画面であるかに依存し、操作発話だけでなく 多くの印象発話を含むこと、などが明らかになった。

キーワード  WWW,音声認識,マルチモーダル・インタフェース, 操作発話,印象発話

Analysis of User's Utterances to a Speech Input System for Net-Surfing

Takuya NISHIMOTO and Yasuhisa NIIMI

Department of Electronics and Information Science, Kyoto Institute of Technology
Matsugasaki, Sakyo-ku, Kyoto, 606-8585 Japan


To utilize the information resources on Internet more effectively, we need some assistant systems between the user and the WWW servers or search engines. We have pointed out what to consider in building such net-surfing assistant systems, which add the voice command interface to the existing web browsers, and indicated our design for the voice net-surfing system. In this paper, we examined the benefit of the speech input at our design. As the result of the experiments using simulation dialogs, it seems not very easy for the users to remind the words that are included in the pages which are linked to the pages already displayed. It also turned out that the utterances of the users depend on the type of the displayed page, and contain many non-command words which show user's impressions about the displayed information, as well as the command utterances.

Key words  WWW, Speech recognition, Multi-modal interface, Command utterance, Impression utterance

Nishimoto Takuya
1998年03月01日 18時24分10秒