JP2005524122A

JP2005524122A - 聴覚ユーザーインターフェイスにおける高速ナビゲーション方法及びシステム

Info

Publication number: JP2005524122A
Application number: JP2004502598A
Authority: JP
Inventors: サルメンカイタ，ユッカ−ペッカ
Original assignee: Nokia Oyj
Current assignee: Nokia Oyj
Priority date: 2002-04-29
Filing date: 2002-04-29
Publication date: 2005-08-11
Also published as: WO2003094489A1; AU2002251113A1

Abstract

本発明によれば、経験豊富なユーザーは、デジタル装置及びサービスにアクセスするための聴覚ユーザーインターフェイスにおいて、オーディオ又は多モードメニュー構造を高速でナビゲートすることができる。聴覚ユーザーインターフェイスは、メニュー構造をナビゲートするための２つのモードを具備し、この中の１つが、通常使用のための標準モード（１１８）であり、もう１つが、ナビゲーションプロセスをスピードアップする高速モード（１１２）である。このモードは、ユーザーによるナビゲーションプロセスにおいて、いつでも変更可能である（１０４、１０６）。

Description

本発明は、デジタル装置及びサービスにアクセスするためのユーザーインターフェイスに関するものである。更に詳しくは、本発明は、音声及び多モードユーザーインターフェイスの有用性を向上させる方法である。ユーザーは、メニュー構造をナビゲートする２つのモードを選択可能であり、この１つは、通常使用のための標準モードであり、もう１つは、経験豊富なユーザー用の高速モードである。

デジタル装置及びサービス用のユーザーインターフェイスにおいては、（ａ）ユーザーに対して代替選択オプションを通知すると共に、（ｂ）ユーザーが所望の選択オプションに向かってメニューレイヤをナビゲートするための手段を提供するべく、通常、メニュー階層が使用されており、このようなメニュー階層は、通常、視覚的な形態で提示されている。しかしながら、このメニュー階層の視覚的な提示は、例えば、デジタル装置及びサービスのハンズフリー（手を使わないで済む）又はアイズフリー（目を使わないで済む）な使用法が望ましい状況においては、実現不可能である。このような状況は、例えば、自動車やその他の車両内において、或いは視覚障害を有する人たちの場合に発生する。

このような状況においては、例えば、ＴＴＳ（Ｔｅｘｔ−Ｔｏ−Ｓｐｅｅｃｈ：テキスト音声読み上げ）合成や事前定義された音声プロンプトを使用してユーザーに代替選択オプションを通知する聴覚的な形態でメニュー階層を提示可能である。但し、ユーザーに代替選択オプションを通知するのに、この聴覚又は音声ユーザーインターフェイスは適しているが、ユーザーに対する情報の提示が相対的に低速であるという欠点を具備している。即ち、ユーザーが初めてメニュー構造をナビゲートする際には、ユーザーに対して代替選択オプションを通知すると共に、メニュー構造に関する知識をユーザーに提供する必要があるため、この遅さを正当化することができる。しかしながら、何回かメニューを繰り返してナビゲートした段階で、ユーザーは、既にメニュー構造に関する学習を完了し、この遅さをひどく不便なものと感じるようになるのである。そして、それにも拘らず、依然として、メニューレイヤをナビゲートすることが必要とされ、この結果、ユーザーは、メニューを迅速に通過する手段を要求することになろう。

ユーザーインターフェイスにおけるナビゲーションプロセスをスピードアップする既存の方法としては、いくつかのものが存在している。第１の方法は、ＴＴＳ合成又は音声プロンプト提示全体の速度を加速化する方法である。これは、メニューの聴覚的な提示の形態は元のままで、より高速で発音が発せられるということを意味しており、この結果、メニューアイテムに関する理解度が低下する可能性がある。ナビゲーションプロセスを高速化する別の既存の方法は、手動のショートカットの生成によってユーザーインターフェイスをカスタマイズする選択肢をエンドユーザーに対して提供する方法である。この方法は、周知であり、ウェブブラウジングの分野において広く使用されている。そして、ナビゲーションプロセスをスピードアップする更に別の方法は、エンドユーザーに対して、デジタルサービスに対する自動的なショートカットを提供する方法である。後者の２つの方法は、視覚的なユーザーインターフェイスにおいて主に使用されているものであり、メニュー構造をショートカットと適合させるべく、かなり多数の手順をユーザーに強いることが予想される。又、ユーザーの以前の使用法に基づいて最も望ましい推奨メニューアイテムを生成することも可能ではあるが、この場合には、オリジナルのメニュー構造が混乱し、使用頻度の低いメニューアイテムのナビゲーションが複雑化することになる。但し、これらの代替選択肢は、いずれも、本発明の「課題を解決するための手段」の節に記載されている本発明を補完するべく使用可能である。

ＴＴＳクライアントアプリケーションを加速化する既存の方法の１つが、「ＭｅｔｈｏｄｆｏｒＤｙｎａｍｉｃａｌｌｙＡｌｔｅｒｉｎｇＴｅｘｔ−ｔｏ−Ｓｐｅｅｃｈ（ＴＴＳ）ＡｔｔｒｉｂｕｔｅｓｏｆａＴＴＳＥｎｇｉｎｅｎｏｔＩｎｈｅｒｅｎｔｌｙＣａｐａｂｌｅｏｆＤｙｎａｍｉｃＡｔｔｒｉｂｕｔｅＡｌｔｅｒａｔｉｏｎ」という名称の米国特許第６１８８９８３号明細書（ＵＳ６１８８９８３）（文献［１］）に記載されている。この文献には、再生の進行中に、ＴＴＳクライアントアプリケーションによって、例えば、ピッチと速度を変更できるようにする方法が開示されている。この機能は、このような変更の動的な実行がＴＴＳエンジンにおいて許容されていない場合に使用可能である。但し、この方法は、再生を停止させることなしに、ユーザーによるＴＴＳ再生のピッチや速度などのＴＴＳパラメータを調節することに限定されている。そして、この方法は、ＴＴＳ再生との関連における汎用的な使用法を目的としており、ユーザー要求に応じて、テキストを高速又は低速で読み取り可能ではあるが、テキストの内容は、元の形態のままに留まることになる。要すれば、これは、ユーザーがメニューアイテムをナビゲートする際には、毎回、何度でも音声プロンプト（及びテキスト）の同一の繰り返しを聞かなければならないことを意味している。これは、音声プロンプト（及びテキスト）の内容に習熟したユーザーには不便である。

「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｏｆＶｏｉｃｅＢｒｏｗｓｉｎｇｆｏｒＭｏｂｉｌｅＴｅｒｍｉｎａｌｓＵｓｉｎｇＤｕａｌ−ＭｏｄｅＷｉｒｅｌｅｓｓＣｏｎｎｅｃｔｉｏｎ」という名称の国際特許第０１／４５０８６号明細書（WO ０１／４５０８６）（文献［２］）には、ユーザーインターフェイスにおいてＴＴＳ又は事前に定義されたオーディオプロンプトを使用する別の既存の方法が記載されている。この場合には、モバイル端末とサーバーアプリケーション間で音声及びデータを交互に送信するべく、音声モード及びデータモードで対話型音声応答サービスを使用している。そして、１回の通話の中で、スピーチとデータをスワップする機能を有している。スピーチの内容、ユーザー入力、及びコマンドが、特定の音声アプリケーションに応じて変化するのである。この方法における主な考え方は、限定的なサイズの文法を使用して端末側におけるスピーチ認識を総合的に改善することにあり、これは、ナビゲーション特性（例：聴覚ユーザーインターフェイス自体の速度）には影響を及ぼさない。この場合にも、これは、ユーザーが、毎回、同じスピーチを聞かなければならないことを意味しており、スピーチの内容に習熟したユーザーにとって、これは不便である。

従って、特に経験豊富なユーザーがデジタル装置及びサービスにアクセスするための聴覚ユーザーインターフェイスにおけるナビゲーション特性を改善するというニーズが存在している。ユーザーインターフェイスのユーザーフレンドリーでハンズフリー及びアイズフリーな動作を確保するべく、柔軟で高速なナビゲーションプロセスが不可欠なニーズなのである。

本発明の目的は、聴覚ユーザーインターフェイスにおいてメニューアイテムの高速な音声スクローリングを可能にする方法及びシステムをユーザーに提供することである。本発明のこの目的は、メニューアイテムに対応する音声プロンプトを大幅に短縮し、これにより、従来技術によるものよりもユーザーインターフェイスが高速な高速モードを起動することにより、実現される。尚、この高速モードを解除した場合の標準モードにおいては、完全な長さの音声プロンプトが使用される。

本発明の利点は、メニュー構造に習熟したユーザーが、高速モードを容易に起動して使用することにより、標準モードのユーザーインターフェイスの遅さを自分で回避できることにある。一方、まだ使用法に習熟していない場合には、ユーザーは、標準モードによるメニューアイテムのナビゲートを選択可能である。本発明は、聴覚及び多モードユーザーインターフェイスの有用性を向上させ、必要に応じて、経験豊富なユーザーに対してメニューオプションを高速で提示する方法を提供する。そして、それ以外の場合には、ユーザーは、通常の順序で、標準モードにおいて継続可能である。又、本発明の更なる利点は、その他の方法及びシステムとの関連において使用することにより、ナビゲーションプロセスをスピードアップできる点である。

本発明の方法は、デジタル装置及びサービスにアクセスするためのユーザーインターフィエスにおいてナビゲートする方法に関するものであり（この装置は、少なくとも聴覚又は多モードユーザーインターフェイスと、ネットワーク装置への接続を有している）、この方法は、聴覚ユーザーインターフェイスの第２モードを起動する段階であって、この第２モードは、第１モードとは異なる短いコンテンツを有している、前記段階を有することを特徴としている。

本発明のシステムは、デジタル装置及びサービスにアクセスするための聴覚ユーザーインターフェイスにおいてナビゲートするシステムに関するものであり（この装置は、少なくとも聴覚又は多モードユーザーインターフェイス用の手段と、ネットワーク装置への接続の手段を有している）、このシステムは、聴覚ユーザーインターフェイスの第２モードを起動及び解除する手段を有することを特徴としている。

本発明によれば、ネットワーク装置は、ネットワーク内のサーバーであるか、或いは、ピアツーピア接続を使用するネットワーク内のコンピュータ装置である。

本発明の好適な一実施例においては、端末装置内に組み込まれているＴＴＳエンジンを使用している。実施例の中には、ＴＴＳエンジンをネットワーク内に配置可能なものも存在し、この結果、ＴＴＳエンジンは、端末装置に対して、標準及び高速プロンプトの両方を（或いは、この代わりに、端末装置の現在のモードに応じて、標準又は高速モードのいずれかを）提供する。本発明の一実施例においては、標準及び高速モードの両方において、事前定義された音声プロンプトを使用している。本発明の単純化された一実施例においては、高速モードにおける音声プロンプトは、単なる短いオーディオ信号（例：ビープ音）である。本発明の実施例の中には、特殊キー又はメニューアップ及びメニューダウンキーの長い押下によって高速モードが起動するものが存在する。本発明の実施例の中には、高速早送り／巻戻し動作のためのメニューアップ／ダウンファンクションキーの長い押下によって高速モードが起動し、標準早送り／巻戻し動作のためのメニューアップ／ダウンキーの解放により、高速モードが解除されるものが存在する。

従属請求項には、本発明のいくつかの実施例が記載されている。

本発明の以上の及びその他の目的、特徴、及び利点は、添付の図面に示されている本発明の好適な実施例に関する以下の詳細な説明を参照することにより、明らかとなろう。

本発明によれば、聴覚又は音声ユーザーインターフェイスは、メニュー構造をナビゲートするための２つのモードを具備しており、この２つのモードは、標準（又は、通常）モードと、高速モードである。尚、本明細書においては、標準モードを「第１モード」と呼び、高速モードを「第２モード」と呼ぶことにする。ユーザーインターフェイスにおいて、例えば、ＴＴＳ（Ｔｅｘｔ−Ｔｏ−Ｓｐｅｅｃｈ：テキストの音声読み上げ）合成によって生成された音声プロンプト又は事前定義された音声プロンプトを使用し、聴覚的な形態でメニューオプション（メニューアイテム）を提示可能である。第２モードが起動すると、例えば、それぞれの音声プロンプトの第１音節のみを提示することにより、メニューアイテムに対応する音声プロンプトが大幅に短縮される。そして、第２モードが解除されると、第１モードが使用され、メニューアイテムに対応する音声プロンプトが、完全な長さの音声プロンプトとして提示されることになる。

図１は、本発明による聴覚ユーザーインターフェイスにおけるナビゲーション用の２つのモードのフローチャートを示している。第１モードは、ブロック１１によって示されており、第２モードは、ブロック１２によって示されている。これら２つのブロック間の切り換えは、例えば、別個のキーの押下、メニューアップ／ダウンキーの長い押下、特殊音声キー、又は音声コマンドの付与などによるユーザーによるサイン（合図）の付与によって実行される。尚、このモードの選択は、ナビゲーションプロセスにおける実際の位置とは無関係である（即ち、ユーザーは、所望するときに、いつでもモードを変更可能である）。例えば、オペレーションが大きくブロックされることによってネットワーク接続が固定された期間の後に自動的に切断される際に発生するような、タイムアウト状態においては、モードは、第１（通常）モードに自動的に変化する。従って、タイムアウト後の既定のモードは、第１モードである。

図２は、本発明の一実施例による聴覚ユーザーインターフェイスにおけるナビゲーション方法のフローチャートを示している。ユーザーは、段階１００において、端末装置内におけるナビゲーションプロセスを開始すると、段階１０２に示されているように、所望のメニューを選択するためのメインメニューが提供される。ここでは、このメニューが、完全に音声対応になっており、アイズフリー状態（例：自動車の運転中）において、ＴＴＳエンジンを使用して、ユーザーに対して提示されるものとしよう。端末装置が携帯電話機の場合には、メインメニューのトップレベルのメニュー構造は、書面の形態において、次のようなものであってよい（但し、実際には、これは、聴覚的な形態になっている）。

（１）メッセージ
（２）着信履歴
（３）プロファイル
（４）設定
（５）ゲーム
（６）計算機
（７）タスクリスト
（８）カレンダ
（９）赤外線
（１０）ラジオ
（１１）付加機能
（１２）サービス

ユーザーは、アイテム（７）「タスクリスト」にメモを追加したい。しかしながら、彼は、このアイテムが、「タスクリスト」、「ノートブック」、「ポストイットステッカ」、「Ｔｏ−ｄｏリスト」、又はその他のこれらに類似の表現のいずれで呼ばれているのかを記憶していない。但し、経験豊富なユーザーである彼は、所望のアイテムが、メニュー構造内の中間付近に存在していることを記憶している。

本発明によれば、このユーザーには、手順を進めるための複数の代替方法が提供される。即ち、図２の段階１０４において、彼は、標準（第１）又は高速（第２）モードにおけるナビゲートを選択することができる。そして、彼が、既定のモード（これは、通常、第１モードである）からのモード変更を所望する場合には、段階１０６において、彼は、例えば、別個のキーの押下又は解放（押下の停止）、メニューアップ／ダウンキーの長い押下又はメニューアップ／ダウンキーの解放、特殊音声キー、或いは音声コマンドの付与などによるサインの付与によって第２モードを選択することができる。彼は、従来同様に、メニューを上方又は下方にブラウズする方法を選択可能である。この段階１０６におけるユーザーの選択が、メニューダウンキーの長い押下であったと仮定しよう。段階１０８において、次のアイテムが、メニューからフェッチされる。次いで、段階１１０において、２つのモードの中のいずれが選択されたのかをチェックする。そして、これが第２モードである場合には、段階１１２により、メニューアイテムが、短縮された形態で発せられることになる（例：「メッセージ」というテキストの第１音節である「メ」）。そして、これが所望の選択内容である場合には、ユーザーは、段階１１４において、キーの押下、又は「ＹＥＳ」に対応する音声コマンドの付与によってサインを与え、段階１１６に進んで、正しいアイテムが選択されることになる。但し、この例においては、「メ」は、正しい選択内容ではなく、ユーザーは、段階１１４において、キーの押下、又は「ＮＯ」に対応する音声コマンドの付与によってサインを与え、次の新しいメニューアイテムを取得するべく、段階１２４に進むことになる。そして、その同一のメニュー内に、まだ残りのアイテムが存在する場合には、ユーザーは、段階１２４〜段階１２６を経由して段階１０６に再度戻る。一方、ユーザーが、ナビゲーションプロセスの停止を所望するか、或いは新しいメニュー又はサブメニューの選択を所望する場合には、彼は、段階１２４から段階１２８に移行することになる。又、メニューのすべてのアイテムのナビゲーションを完了した場合にも、彼は、新しいメニューを選択するべく、段階１２６から段階１２８に移行する。

この例においては、ユーザーは、「タスクリスト」というアイテムがメニュー構造内の中間付近に存在することを知っている。これは、段階１０４においてモードを変更する必要がないことを意味しており、本発明によれば、ユーザーは、第２モードにおいてメニューアイテム１〜５を続けることになり、正しい選択オプションが彼に提示される前に、これらのアイテムが、「メッセージ−着信履歴−プロファイル−設定−ゲーム」としてではなく、例えば、「メ−チャ−プ−セ−ゲ」と発せられることになる。即ち、本発明によれば、ユーザーは、最初の５つのアイテムを高速早送りし、正しいメニューアイテムの選択肢が存在すると自分が合理的な自信を有するメニュー領域のみを詳細に聞くことができるのである。

所望のアイテムが存在する可能性が最も高いメニュー領域に位置した際に、ユーザーは、段階１０４において、第２モードから第１モードへのモード変更を決定することができる。この選択は、段階１０６において実行され、例えば、別個のキーの押下、メニューアップ／ダウンキーの長い押下又はこのキーの解放、特殊音声キー、又は音声コマンドの付与などによるサインの付与により、第２モードが解除される。尚、このサインは、前述のものの中のいずれであってもよく、複数のサインがモード変更に使用されている場合には、モードの変更に使用された以前のサインと無関係のものであってもよい。又、この目的に、端末装置内において１つのサインのみが使用されている場合には、ユーザーは、モードを変更するべく同一のサインを再度付与することになる。段階１０６において第２モードを解除した後に、段階１１０に表示されている条件が満足されないため、選択結果は、標準モードとなる（即ち、段階１１８による第１モード）。この段階１０４〜段階１０６によるモード変更の後に、次のメニューアイテムが第６番の「計算機」であるとしよう。この場合には、次のメニューアイテムは、段階１１８において、第１モードで、完全な長さの形態の「計算機」として提示されることになる。しかし、この場合には、これは、正しい選択肢ではなく、段階１２０に従って、ユーザーは、段階１２４及び段階１２６を経由してメニュー構造を前進する。そして、段階１０４において、再度、モード変更の可能性があるが、この場合には、ユーザーは、これを実行せず、現在のモードを続ける。次いで、段階１１８において、次のアイテムが、「タスクリスト」と発せられ、これは、ユーザーにとって正しい選択内容であるため、彼は、段階１２２において、このアイテムを選択し、メモをタスクリストである「タスクリスト」に追加する。従って、この例においては、この段階までに、本発明により、トップレベルメニューの上昇方向において、「メ−コ−プ−セ−ゲ−計算機−タスクリスト」という形態で、最初の７つのメニューアイテムが提示されている。この後に、ユーザーは、段階１２４（及び段階１２６）を経て、段階１２８において、新しいメニューの選択の実行を所望するか、或いは、段階１２９において、ナビゲーションの終了を所望するかを選択可能である。

尚、図２において、段階１０４及び段階１０６を有するループは、フローチャート内のどこにでも配置可能である（即ち、モード変更は、ユーザーが実行したいときに、いつでも実行可能である）ことに留意されたい。この同一のループは、図１にも示されている。

本発明の好適な一実施例においては、図２の段階１０４及び段階１０６において、メニューアップ／ダウンキーの長い押下によって第２モードを起動している。即ち、メニューアップ／ダウンキーを押下した状態を期間ｔだけ維持する間に、段階１０８、１１０、１１２、１１４、（１１６）、１２４、及び１２６からなるループにより、第２モードにおいて、高速音声スクロールが実行される。そして、期間ｔの後に、メニューアップ／ダウンキーが解放され、これは、メニューアップ／ダウンキーの長い押下を停止すること（即ち、キーの解放）によって、段階１０４及び１０６のサインが付与されることを意味するものであり、この結果、モードは、第１モードに変化する。次いで、ユーザーの所望に従ってモードが段階１０４及び１０６において再度変更されるまで、段階１０８、１１０、１１８、１２０、（１２２）、１２４、及び１２６のループにより、第１モードにおいて、標準音声スクロールが実行されることになる。

本発明の一実施例によれば、第２モードにおいて、それぞれのアイテムの第１音節をビープ音「ピッ」などの単純なオーディオ信号によって置換することができる。この場合には、本発明により、最初の７つのメニューアイテムは、トップレベルメニューの上昇方向において、「ピッ−ピッ−ピッ−ピッ−ピッ−カレンダ−タスクリスト」という形態で提示されることになる。本発明のいくつかの実施例によれば、ビープ音の代わりに、ＴＴＳエンジンによって生成されるその他のオーディオ信号や聴覚特性、又は、例えば、トーン、ピッチ、又これらの組み合わせなどの事前定義された音声プロンプトをそれぞれのメニューアイテム又はメニューアイテムのそれぞれのグループにリンクすることができる。

要約すれば、本発明の一実施例は、携帯電話機のユーザーインターフェイスにおけるメニューアイテムの高速音声スクロールである。本発明による高速（第２）モードナビゲーションを使用することにより、選択されたメニューアイテムの高速早送り又は高速巻き戻しが可能であり、次いで、正しい選択オプションを標準（第１）モードにおいて提示することができる。これにより、特に、ハンズフリー及アイズフリーな使用状況において、メニューナビゲーションが円滑に実行される。

本発明の別の実施例においては、ユーザーの過去の装置及びサービスの使用法に関する情報を正しい選択オプションを推奨するための基礎として使用している。即ち、最も可能性の高いオプションを、異なるトーン、ピッチ、又はその他の音声特性によって提示し、オプションの選択を円滑に実行可能である。尚、この種の機能拡張は、例えば、モバイルサービス（ｍサービス）などのサービスを推奨する「推奨エンジン」を実装した端末装置において可能である。

本発明の更なる一実施例は、携帯電話機内に１つのアプリケーションとして組み込まれているか、或いは別個のアクセサリ装置である音声対応ＭＰ３プレーヤの音楽アイテムのメニューである。ユーザーは、例えば、音楽作品名などの音楽アイテムのメニューから選択することにより、様々な音楽作品間で選択を実行することができる。しかしながら、すべての名前をＴＴＳ合成によってユーザーインターフェイスに提供すると、プロセスが非常に低速になる。又、特に経験豊富なユーザーの場合には、彼は、作品の大まかな順序を記憶しているであろう。この場合には、本発明によれば、所望の音楽アイテムが存在する可能性が低いメニュー領域を高速早送り又は高速巻戻しすることが可能である。

本発明のいくつかのその他の実施例について更に説明する。メニューアイテムが、端末内のインターネットブラウザ又はこれと類似したアプリケーションのユーザーインターフェイス内におけるニュースヘッドラインである場合には、類似のトピックが並ぶように、ヘッドラインを配列することができる。この結果、本発明により、ユーザーは、第１モードにおいて、ヘッドラインを聞いたり、第２モードにおいて、彼には関心のないトピックを高速で音声スクロールすることができる。電子メールの場合には、メニューアイテムは、送信者の名前が前に付加された電子メールヘッダであってよい。この結果、ユーザーは、その時点で彼には関心のない送信者からのメッセージを高速音声スクロールすることができる。パーソナルオーガナイザ、携帯電話機、ＰＤＡ、又はその他の類似の装置の場合には、メニューアイテムは、締切日付／時刻の順番に配列されたカレンダ又はタスクリストのエントリであってよい。この結果、本発明により、ユーザーは、彼が関心のある大まかな時点に対応するエントリーに高速で音声スクロールすることができる（例：今日のメモから明日のメモ／来月のメモへ）。

図３ａは、本発明の別の実施例のフローチャートを示している。図２に示されている本発明の実施例に加え、段階１１１において、第２モードの聴覚ユーザーインターフェイスにおけるメニューアイテム又はメニューアイテムのグループに対応する属性を設定可能になっている。この属性は、例えば、キーの押下又は解放、又はキーの組み合わせ、或いは、属性に対応する音声コマンドの付与による事前定義されたサインにより、ユーザーによって選択される。この属性は、連番又はアルファベット順のアイテム、特定タイプのニュースヘッドライン又は音楽アイテム、名前、電子メールアドレス又は送信者の名前が前に付加されたヘッダ、時間又は日付、或いはその他の種類の類似の属性選択基準によって定義されるメニュー内におけるその位置に対応するメニュー構造内の特定のメニューアイテム又はアイテムのグループであってよい。又、属性は、ユーザーの以前の使用法に関する情報に対応するものであってもよい。段階１１１において、属性オプションを設定すると、その属性によって選択されるアイテム又はアイテムのグループが、ユーザーがなんらの手順を講ずることなしに、その属性が有効でなくなるまで（即ち、その属性基準を満足しないアイテムにメニューがスクロールダウンされるまで）、第２モードにおいて自動的に実行されることになる。段階１１３において、第２モードのナビゲーションにおいて、その属性がアイテム又はアイテムのグループについて有効である場合には、段階１１２を経て、第２モードにおいて「属性ループ」が繰り返される。一方、その属性が無効の場合には、ユーザーは、図２に示されている本発明の実施例に従い、段階１０４及び１０６において、新しいモード（この場合には、第１モードのナビゲーションである）を選択するかどうかを問われることになる。尚、図３ａの実施例において破線で示されているすべてのその他の段階は、図２に示されているものと同一である。属性は、様々な方法により、メニューアイテム内において定義可能であり、例えば、同一の文字から始まるアイテムのグループ、同一のオーディオ信号（ビープ音）によって提示されるアイテムのグループ、或いは、その他の類似の方法によるアイテムのグループなどであってよい。尚、図２に関連して説明した本発明のその他のすべての実施例を、この属性機能と共に実現することも可能である。従って、図３ａのこの属性オプションは、本発明による図２の標準モードループにも適用可能である。

図３ｂは、本発明の任意選択による実施例のフローチャートを示している。図２において説明した本発明の実施例に加え、段階１１１において、第２モードループの聴覚ユーザーインターフェイスにおけるメニューアイテム又はメニューアイテムのグループに対応する属性を設定可能になっている。この属性は、例えば、キーの押下又は解放、又はキーの組み合わせ、又は属性に対応する音声コマンドの付与などによる事前定義されたサインにより、ユーザーによって選択される。この実施例においては、属性は、類似の内容を具備する連続したプロンプトに対応するメニュー構造内における特定のメニューアイテム又はアイテムのグループである。例えば、電子メールメッセージの場合には、メニューアイテムは、送信者の名前が前に付加された電子メールヘッダであってよい。図３ｂに示されている本発明の実施例によれば、この高速（第２）モードの属性の選択は、段階１１１において行われる。この例の場合には、この属性の選択内容が、電子メールメッセージの送信者の名前であるとしよう。ユーザーは、図３ａに示されているように、彼には関心のない送信者からのメッセージを高速で音声スクロールすることができる。同一の送信者からのメッセージは、多数存在する可能性があり、それらのメッセージは、第２モードにおいて、送信者の名前によって表現される（例えば、年代順に表現され、最新のメッセージが最初に提示される）。「ジョン・スミス」という名前の場合には、第２モードにおける音声プロンプトは「ジョン」であってよい。そして、彼が５件の電子メールメッセージを送信している場合には、図３ａに示されている高速モードナビゲーションによれば、「ジョン−ジョン−ジョン−ジョン−ジョン」という形態で提示されることになる。図３ｂに示されている任意選択の実施例によれば、この場合にも、高速モードの属性は、音声プロンプト「ジョン」である。ジョンからの最新のメッセージは、図３ｂにおける段階１１３、１１５、及び１１２により、音声プロンプト「ジョン」として第２モードにおいて提示される。しかし、この任意選択の実施例によれば、この第２モードプロンプト「ジョン」は、類似の連続したプロンプトが続くために、「仮想的」な第１モードプロンプトのように振る舞うことになる。即ち、この場合には、連続して類似のコンテンツを有するプロンプトは、段階１１７により、例えば、オーディオ信号「ピッ」などの「仮想的」な第２モードプロンプトによって置換され、この結果、最新のメッセージについて、音声プロンプト「ジョン」がメニューアイテムとして提示された後に、「超高速モード」が自動的に起動することになるのである。この結果、この例においては、名前を５回反復する代わりに、「ジョン−ピッ−ピッ−ピッ−ピッ」というプロンプトの繰り返しが、高速モードナビゲーションにおいて提示されることになる。超高速モードにおけるこのプロンプトは、ＴＴＳエンジン又は事前定義された音声プロンプトによって生成される好ましい類似の又は異なるオーディオ信号又は聴覚特性であってよく、例えば、トーン、ピッチ、又はこれらの組み合わせをそれぞれのメニューアイテム又はメニューアイテムのそれぞれのグループにリンクすることができる。尚、図２に関連して説明した本発明のすべてのその他の実施例も、この属性機能と共に実現可能である。従って、図３ａによるこの属性オプションは、本発明による図２の標準モードループにも適用可能である。

図４には、本発明の一実施例による聴覚ユーザーインターフェイスにおける高速ナビゲーションシステムのブロックダイアグラムが示されている。この実施例においては、ＴＴＳエンジン３０２は、端末装置３０内に組み込まれており、この端末装置は、少なくとも聴覚又は多モード入力及び出力用のユーザーインターフェイス３００、メモリ３０７と関連付けられたプロセッサユニット３０４、信号処理用のＤＳＰユニット３０５、及びネットワーク３３を通じてアプリケーションサーバー３５から送信された高周波信号を受信（及び送信）する受信機又はトランシーバユニット３３８をも有している。プロセッサユニット３０４は、ユーザーインターフェイスを介してユーザーに対してメニューアイテムを提示するべく動作し、メモリユニット３０７は、メニューアイテム及び任意選択の属性を保存する。メニューアイテムをユーザーに提示するのに必要なその他の手段は、ボックス３０１によって示されている適切なドライバと関連付けられたラウドスピーカ、マイクロフォン、及びディスプレイである。端末装置には、任意選択により、推奨エンジン（図示されてはいない）をＴＴＳエンジンとの関連で組み込むことができる。ボックス３０６は、例えば、別個のキーの押下又は解放、メニューアップ／ダウンキーの長い押下又はこのキーの解放、又は音声コマンドの付与による音声キーの使用などによって第２モードを起動／解除する入力手段を示している。ＴＴＳエンジン３０２は、第１モードナビゲーション３１０と第２モードナビゲーション３１２用の別個の「パイプライン」と、ボックス３０６内において実行された選択の内容に従って正しいモード３１４及び３１６を選択する手段を有するように構成されている。ボックス３１４及び３１６によって示されているこれらの手段は、例えば、スイッチであってよい。ネットワーク側における構成は、アプリケーションプログラム３５０と、サーバーと関連付けられた送信機３５１を少なくとも有している。ネットワーク内におけるこれら端末装置３０及びアプリケーションサーバー３５、又はピアツーピア接続を使用するネットワーク内のコンピューター間における通信は、ＴＣＰ／ＩＰ、ＣＤＭＡ、ＨＳＣＳＤ、ＧＰＲＳ、ＷＣＤＭＡ、ＥＤＧＥ、ＵＭＴＳ、Ｂｌｕｅｔｏｏｔｈ、Ｔｅｌｓｅｄｉｃ、Ｉｒｉｄｉｕｍ、Ｉｎｍａｒｓａｔ、ＷＬＡＮ、ＤＩＧＩ−ＴＶ、及びｉモードの中の少なくとも１つに準拠した既存の通信システムによって実行される（但し、これらに限定されない）。

図５は、本発明の別の実施例による聴覚ユーザーインターフェイスにおける高速ナビゲーションシステムのブロックダイアグラムを示している。この実施例においては、ＴＴＳエンジン４５４は、ネットワーク側４３（アプリケーションサーバー４５）内に組み込まれており、このサーバーは、アプリケーションプログラム４５０、信号処理用のプロセッサユニット４５５及び関連するメモリ４５１、及び端末装置４０にネットワーク４３を介して高周波信号を送信（及び受信）する送信機又はトランシーバユニット４５２をも有している。又、任意選択により、推奨エンジン（図示されてはいない）ＴＴＳエンジンとの関連で組み込むことも可能である。ＴＴＳエンジン４５４は、第１モードナビゲーション４５６と第２モードナビゲーション４５８用の別個の「パイプライン」と、正しいモードを選択する手段（ボックス４５７及び４５９）を有するように構成されている。尚、これらの手段は、例えば、スイッチであってよい。端末装置４０は、少なくとも聴覚又は多モード入力及び出力用のユーザーインターフェイス４００、ユーザーに対してメニューアイテムを提示するプロセッサユニット４０４、メニューアイテムを保存するメモリ４０７、信号処理用のＤＳＰユニット４０５、及びネットワーク４３を通じてアプリケーションサーバー４５から高周波信号を受信（及び送信）する受信機又はトランシーバユニット４０２を有している。ボックス４０６は、例えば、別個のキーの押下又は解放、メニューアップ／ダウンキーの長い押下又はこのメニューアップ／ダウンキーの解放、或いは音声キーの使用又は音声コマンドの付与などによって第２モードを起動及び解除する入力手段を示している。信号処理は、第１モード及び第２モードプロンプトの両方を（或いは、この代わりに、端末装置の現在のモードに応じて、第１モード又は第２モードプロンプトのいずれかを）端末装置４０のボックス４０５に供給するべく、ボックス４５４内において構成されている。ナビゲーションの現在のモードは、ボックス４０６内において実行された選択の結果に基づいている。ユーザーにメニューアイテムを提示するのに必要なその他の手段は、ボックス４０１によって示されている適切なドライバと関連付けられたラウドスピーカ、マイクロフォン、及びディスプレイである。端末装置４０とアプリケーションサーバー４５、又はピアツーピア接続を使用するネットワーク内のコンピュータ装置間における通信は、ＴＣＰ／ＩＰ、ＣＤＭＡ、ＨＳＣＳＤ、ＧＰＲＳ、ＷＣＤＭＡ、ＥＤＧＥ、ＵＭＴＳ、Ｂｌｕｅｔｏｏｔｈ、Ｔｅｌｓｅｄｉｃ、Ｉｒｉｄｉｕｍ、Ｉｎｍａｒｓａｔ、ＷＬＡＮ、ＤＩＧＩ−ＴＶ、及びｉモードの中の少なくとも１つに準拠した既存の通信システムによって実行される（但し、これらに限定されない）。

本発明は、いくつかのその他の既存の方法と共に使用することにより、ユーザーインターフェイスにおけるナビゲーションプロセスをスピードアップ可能なエンドユーザー用の任意選択のユーザーインターフェイスの機能拡張である。本明細書においては、これらの方法の例として、その中の３つについて説明した。即ち、第１の方法は、ＴＴＳ合成又は音声プロンプト提示全体の速度を加速化するものであった。ナビゲーションプロセスを高速化する第２の既存の方法は、ウェブブラウジングの分野において周知のように、手動によるショートカットの生成によってユーザーインターフェイスをカスタマイズするオプションをエンドユーザーに提供するものであった。そして、ナビゲーションプロセスをスピードアップする第３の方法は、デジタルサービスに対する自動的なショートカットをエンドユーザーに対して提供するものであった。少なくともこれらのすべての選択肢を、本発明の実施例を補完するべく使用可能である。

以上、本発明の現時点における好適な実施例について詳細に図示及び説明したが、当業者であれば、本発明が、本明細書において説明したこれらの実施例に限定されるものではないことを認識するであろう。本発明は、添付の請求項に規定された概念の精神と範囲を逸脱することなしに、その他の方法によって実施可能である。

（参照文献）
［１］米国特許第６１８８９８３号明細書（ＵＳ６１８８９８３）「ＭｅｔｈｏｄｆｏｒＤｙｎａｍｉｃａｌｌｙＡｌｔｅｒｉｎｇＴｅｘｔ−ｔｏ−Ｓｐｅｅｃｈ（ＴＴＳ）ＡｔｔｒｉｂｕｔｅｓｏｆａＴＴＳＥｎｇｉｎｅｎｏｔＩｎｈｅｒｅｎｔｌｙＣａｐａｂｌｅｏｆＤｙｎａｍｉｃＡｔｔｒｉｂｕｔｅＡｌｔｅｒａｔｉｏｎ」
［２］国際特許第０１／４５０８６号明細書（ＷＯ０１／４５０８６）「ＳｙｓｔｅｍａｎｄＭｅｔｈｏｄｏｆＶｏｉｃｅＢｒｏｗｓｉｎｇｆｏｒＭｏｂｉｌｅＴｅｒｍｉｎａｌｓＵｓｉｎｇＤｕａｌ−ＭｏｄｅＷｉｒｅｌｅｓｓＣｏｎｎｅｃｔｉｏｎ」

本発明によるモードの選択方法のフローチャート。本発明の一実施例による聴覚ユーザーインターフェイスにおける高速ナビゲーション方法のフローチャート。本発明の別の実施例による聴覚ユーザーインターフェイスにおける高速ナビゲーション方法のフローチャート。本発明の任意選択の実施例による聴覚ユーザーインターフェイスにおける高速ナビゲーション方法のフローチャート。本発明の一実施例による聴覚ユーザーインターフェイスにおける高速ナビゲーションシステムのブロックダイアグラム。本発明の別の実施例による聴覚ユーザーインターフェイスにおける高速ナビゲーションシステムのブロックダイアグラム。

Claims

デジタル装置及びサービスにアクセスするための聴覚ユーザーインターフェイスにおいてナビゲートする方法であって、
前記聴覚ユーザーインターフェイスのメニューアイテムを起動する段階（１００、１０２）と、
前記聴覚ユーザーインターフェイスの第１オーディオコンテンツを有する第１モード（１１、１１８）を提示する段階（１０２）と、
前記聴覚ユーザーインターフェイスの第２モードを起動（１０４、１０６）のために提示する段階（１２、１１２）であって、前記第２モードは、前記第１モードに対する代替選択肢であり、前記第２モードは、変更されたオーディオコンテンツからなり、前記変更は、前記第１モードのオーディオコンテンツに基づいている、段階と、
を有する方法。
前記第１モードは、前記第２モードが起動されない場合に自動的に選択される請求項１記載の方法。
前記第１モードは、タイムアウト状態の後に自動的に選択される請求項１記載の方法。
前記第１モード及び第２モードは、前記ナビゲーションプロセスにおける段階とは無関係に、前記ユーザーによって切り替えられる請求項１記載の方法。
前記第１モードにおけるメニューアイテムは、ＴＴＳ（Ｔｅｘｔ−Ｔｏ−Ｓｐｅｅｃｈ：テキスト音声読み上げ）合成、事前定義された音声プロンプト、又はその他の聴覚手段によって生成される完全な長さの形態で提示される請求項１記載の方法。
前記第２モードにおけるメニューアイテムは、前記第１モードと比較して、ＴＴＳ（Ｔｅｘｔ−Ｔｏ−Ｓｐｅｅｃｈ）合成、事前定義された音声プロンプト、又はその他の聴覚手段によって生成される短縮された形態で提示される請求項１記載の方法。
前記第２モードのオーディオコンテンツは、前記第１モードのオーディオコンテンツとは異なりかつそれよりも短い請求項１記載の方法。
前記第２モードは、短縮された形態のメニューアイテムを有し、前記短縮された形態は、プロンプトの１つの音節、発せられたアイテムの番号、トーン、ピッチ、ビープ、なんらかの聴覚特性、前記アイテムを参照するなんらかのオーディオ信号の中の１つである請求項１又は６記載の方法。
前記聴覚ユーザーインターフェイスの前記第２モードにリンクされた属性を選択する段階（１１１）と、
前記属性が有効な場合に、前記聴覚ユーザーインターフェイスの前記第２モードを選択する段階（１１２、１１３）と、
を更に有する請求項１記載の方法。
前記メニューアイテム又はアイテムのグループに対応する前記第２モードにリンクされた前記属性は、前記第２モードにおける類似のコンテンツ及び類似の音声プロンプトを有する連続するアイテムについて定義されており、この結果、複数の前記音声プロンプトは、前記元の選択（１０４、１０６）に応じて前記第２モード（１１２）において提示される類似のプロンプトの第１の音声プロンプトを除き、前記第２モードにおいて、更に短いオーディオ又は聴覚信号（１１７）によって置換される請求項１、８、又は９の中のいずれか一項記載の方法。
前記第２モードにおける前記更に短いオーディオ又は聴覚信号（１１７）は、同一であるか或いは異なっている請求項１０記載の方法。
前記メニューアイテム又はアイテムのグループに対応する前記属性は、前記メニュー内におけるその位置、前記ユーザーの以前の使用法に関する情報、アイテムの短縮された形態を参照するオーディオ信号のタイプ、又はなんらかの類似の属性基準に基づいており、前記属性は、前記第２モードにリンクされている請求項１記載の方法。
前記属性が前記ユーザーの前記以前の使用法に基づいている場合には、最も可能性の高い選択肢が、異なるトーン、ピッチ、又はなんらかの類似のタイプのオーディオ又は音声特性によって提示される請求項１２記載の方法。
前記メニューは、聴覚ユーザーインターフェイスのメニューアイテムを有し、前記アイテムは、携帯電話機メニューの聴覚ユーザーインターフェイス内のアイテム、ＭＰ３プレーヤメニューの音楽アイテム、電子メールメニューの電子メールヘッダ、インターネットサービスメニューのニュースヘッドライン、コミュニケータ又はＰＤＡメニューのカレンダ又はタスクリスト、デジタル装置又はサービスのメニューのその他のアイテムの中の１つである請求項１記載の方法。
デジタル装置及びサービスのハンズフリー及びアイズフリーな使用法において使用される請求項１記載の方法。
デジタル装置及びサービスにアセクスするための聴覚ユーザーインターフェイスにおいてナビゲートするためのシステムであって、端末（３０、４０）が、少なくとも前記聴覚ユーザーインターフェイス用の手段（３００、４００）と、ネットワーク装置（３５、４５）に対する接続用の手段（３３８、３５１、４０２、４５２）を有する、システムにおいて、
前記聴覚ユーザーインターフェイスのメニューアイテムを起動する手段（３０４、３０７、４０４、４０７）と、
前記聴覚ユーザーインターフェイスの第１オーディオコンテンツを有する第１モードを選択する手段（３１０、３１４、３１６、４５６、４５７、４５９）と、
前記聴覚ユーザーインターフェイスの第２モードを起動及び解除する手段（３０６、３１０、３１４、３１６、４０６、４５８、４５７、４５９）であって、前記第２モードは、前記第１モードに対する代替選択肢であり、前記第２モードは、変更されたオーディオコンテンツから構成されており、前記変更は、前記第１モードの前記オーディオコンテンツに基づいている、手段と、
を有するシステム。
前記第２モードが起動されない場合に、前記第１モードを自動的に選択する手段を有する請求項１６記載のシステム。
タイムアウト状態の後に、前記第１モードが自動的に選択される請求項１６記載のシステム。
前記第１モードにおいて、ＴＴＳ（Ｔｅｘｔ−Ｔｏ−Ｓｐｅｅｃｈ）合成、事前定義された音声プロンプト、又はその他の聴覚手段によって生成される完全な長さの形態で前記メニューアイテムを提示する手段（３００、３０１、３０４、３０５、４００、４０１、４０４、４０５）を有する請求項１６記載のシステム。
前記第２モードにおいて、ＴＴＳ（Ｔｅｘｔ−Ｔｏ−Ｓｐｅｅｃｈ）合成、事前定義された音声プロンプト、又はその他の聴覚手段によって生成される短縮された形態でメニューアイテムを提示する手段（３００、３０１、３０４、３０５、４００、４０１、４０４、４０５）を有する請求項１６記載のシステム。
前記第２モードのオーディオコンテンツは、前記第１モードのオーディオコンテンツとは異なり、更に短い請求項１６記載のシステム。
前記端末装置（３０）内に組み込まれたＴＴＳエンジン（３０２）を有する請求項１６記載のシステム。
前記ネットワーク側（４３、４５）にＴＴＳエンジン（４５４）を有し、前記ＴＴＳエンジンは、前記第１モード及び前記第２モードの両方あるいは前記端末装置（４０）の現在のモードに応じて前記第１モード又は前記第２モードのいずれかで、音声プロンプトを提供する手段（４５６、４５７、４５８、４５９）を有している請求項１６記載のシステム。
前記第２モードを自動的に起動する手段（３０６、４０６）を有することを特徴とする請求項１６記載のシステム。
前記第２モードを起動及び解除する手段（３０６、４０６）を有し、前記手段は、別個のキーの押下、別個のキーの解放、メニューアップ／ダウンキーの長い押下、メニューアップ／ダウンキーの解放、特殊音声キー、音声コマンドの中の１つである請求項１６記載のシステム。
前記メニューアップ／ダウンファンクションキーの長い押下（３０６、４０６）により、高速早送り／巻戻し動作が起動し、前記メニューアップ／ダウンキーの解放により、標準早送り／巻戻し動作が起動する請求項１６記載のシステム。
前記第２モードにリンクされた属性を選択し、正しい選択について前記属性を評価する手段（３０４、３０７、４０４、４０７）を更に有する請求項１６記載のシステム。
前記ユーザーの以前の使用法に関する情報に基づいた前記属性が、前記端末装置内に組み込まれた前記推奨エンジンによって生成される請求項１６記載のシステム。
前記聴覚ユーザーインターフェイスは、多モードユーザーインターフェイス用の手段（３００、４００）を有している請求項１６記載のシステム。
デジタル装置及びサービスのハンズフリー及アイズフリーな使用法において使用される請求項１６記載のシステム。