ウェブブラウザが持つ操作体系に 音声コマンド操作を付加するにあたっては、 現在多くのユーザを獲得している各種のウェブブラウザが、 すでにマウスとキーボードによる優れた操作体系を有している ことを重視するべきだと考える。 例えば、マウスで可能な操作を音声入力で行うことは、 マウス操作と比較して繁雑になったり、 ユーザが操作方法を連想することが困難になるおそれがある。
そこで本研究では 音声ウェブブラウザをマルチモーダルな対話システムと考え、 既存のウェブ操作方法をなるべく生かしたまま、 「画面表示されていない項目にも対応できるショートカット操作」 として音声入力を用いることとする。 これにより、 すでに既存のブラウザに熟練しているユーザは、 音声操作が不要な場合も同じシステムを使い続けることができ、 必要に応じて操作回数を軽減するためのショートカットとして 音声操作を用いることができる。
一方で、このようなシステムは、 初心者ユーザにとっても特別な訓練なしに使用でき、 特に音声入力に不慣れなユーザに対しても直観的な操作を 実現することが望ましい。
ユーザに支持されるための 音声コマンド体系の設計方針としては、 インタフェースの原則からトップダウンに操作体系を 導く方法[4]がある。 しかし、ネットサーフィンにおいては画面構成もタスクも 動的に変化するため、 試作システムや模擬対話実験を用いて ユーザの発話や行為を検証した上で、 利用者にとって最適な音声コマンド体系を 段階的に実現していく必要があると考える。