JP2002536917A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2002536917A5 JP2002536917A5 JP2000597937A JP2000597937A JP2002536917A5 JP 2002536917 A5 JP2002536917 A5 JP 2002536917A5 JP 2000597937 A JP2000597937 A JP 2000597937A JP 2000597937 A JP2000597937 A JP 2000597937A JP 2002536917 A5 JP2002536917 A5 JP 2002536917A5
- Authority
- JP
- Japan
- Prior art keywords
- user
- state
- function
- name
- call
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 description 63
- 230000000875 corresponding Effects 0.000 description 20
- 238000000034 method Methods 0.000 description 10
- 241001235128 Doto Species 0.000 description 7
- 238000003825 pressing Methods 0.000 description 7
- 230000001413 cellular Effects 0.000 description 4
- 241000214474 Doa Species 0.000 description 3
- 241000189662 Calla Species 0.000 description 2
- 241000568436 Namea Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 241000838698 Togo Species 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002104 routine Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Description
【書類名】明細書
【発明の名称】電話ハンドセットの音声認識ユーザインターフェース
【特許請求の範囲】
【請求項1】
電話機用の音声認識ユーザインターフェースを提供する方法において、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供することと、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供することと、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供することと、
対応するリスト機能コマンド語をユーザが言った場合、前記音声認識電話帳中のエントリを前記ユーザに対して読み返す前記音声ブック機能を提供することと、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供することとを含む方法。
【請求項2】
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供することをさらに含み、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項1記載の方法。
【請求項3】
前記音声ブック機能内に追加機能と削除機能とを提供することをさらに含み、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項1記載の方法。
【請求項4】
トレーニング機能を提供することをさらに含み、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項1記載の方法。
【請求項5】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに含む請求項1記載の方法。
【請求項6】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項5記載の方法。
【請求項7】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項6記載の方法。
【請求項8】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項7記載の方法。
【請求項9】
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供することをさらに含む請求項1記載の方法。
【請求項10】
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供することをさらに含む請求項1記載の方法。
【請求項11】
プロセッサにおける実行時に、前記プロセッサに、電話機用の音声認識ユーザインターフェースを提供させる命令を含むコンピュータ読取り可能な媒体において、
前記命令が、前記プロセッサに、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供させ、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供させ、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供させ、
対応するリスト機能コマンド語を前記ユーザが言った場合、前記音声認識電話帳中のエントリを前記ユーザに対して読み返す前記音声ブック機能を提供させ、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供させるコンピュータ読取り可能な媒体。
【請求項12】
前記命令は、実行時に前記プロセッサに、
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供させ、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項11記載のコンピュータ読取り可能な媒体。
【請求項13】
前記命令は、実行時に前記プロセッサに、
前記音声ブック機能内に追加機能と削除機能とを提供させ、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項11記載のコンピュータ読取り可能な媒体。
【請求項14】
前記命令は、実行時に前記プロセッサに、
トレーニング機能を提供させ、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項11記載のコンピュータ読取り可能な媒体。
【請求項15】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに含む請求項11記載のコンピュータ読取り可能な媒体。
【請求項16】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項15記載のコンピュータ読取り可能な媒体。
【請求項17】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項16記載のコンピュータ読取り可能な媒体。
【請求項18】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項17記載のコンピュータ読取り可能な媒体。
【請求項19】
前記命令は、実行時に前記プロセッサに
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供させることをさらに含む請求項11記載のコンピュータ読取り可能な媒体。
【請求項20】
前記命令は、実行時に前記プロセッサに、
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供させる請求項11記載のコンピュータ読取り可能な媒体。
【請求項21】
電話機用の音声認識ユーザインターフェースを提供する装置において、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供する手段と、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供する手段と、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供する手段と、
対応するリスト機能コマンド語をユーザが言った場合、前記音声認識電話帳中のエントリをユーザに対して読み返す前記音声ブック機能を提供する手段と、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供する手段とを具備する装置。
【請求項22】
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供する手段をさらに具備し、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項21記載の装置。
【請求項23】
前記音声ブック機能内に追加機能と削除機能とを提供する手段をさらに具備し、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項21記載の装置。
【請求項24】
トレーニング機能を提供する手段をさらに具備し、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項21記載の装置。
【請求項25】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに具備する請求項21記載の装置。
【請求項26】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項25記載の装置。
【請求項27】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項26記載の装置。
【請求項28】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項27記載の装置。
【請求項29】
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供する手段をさらに具備する請求項21記載の装置。
【請求項30】
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供する手段をさらに具備する請求項21記載の装置。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は通信および電気通信デバイスに関する。特に、本発明は新規かつ改良された音声認識ユーザインターフェース、および携帯電話機で使用する関連した方法、および関連したハンズフリー電話付属物に関する。
【0002】
【関連技術の説明】
ユーザインターフェースは前進する発展の分野を表わし続ける。技術革新は、セルラ電話機のような消費者操作デバイスが無数のメニューオプションを通してユーザにアクセス可能な非常に多くの機能を持つことを可能にする。セルラ電話機は一般的にLCDディスプレイを組み込んでおり、ユーザプロンプトおよびメニューオプションを示す。セルラ電話機はまた、その機能がアクティブメニューによって変化するソフトキーを組み込んでいる。ソフトキー機能は一般的にLCDディスプレイに表示される。セルラ電話機は一般的に、普通に呼び出す番号のユーザ定義電話帳を記憶する能力、単一ボタンの最後の番号のリダイヤル能力、前に呼び出した番号メモリ、および発呼者電話番号識別子を含む多くの特徴を組み合わせる。さらに、小さな手持ち型セルラ電話機は一般的に、ユーザがそれを手に持つ必要なく、ユーザの自動車で電話機を操作できるようにするハンズフリーカーキットアダプターのような付属物と結合することができる。
【0003】
電話機を保持する必要なく電話機を操作する能力はいくつかの欠点をもたらす。ユーザは依然として電話機ディスプレイでプロンプトを見ることを要求され、かつ番号をダイヤルすることを要求され、手動キーストロークで電話機の名簿を検索することを要求される。これは電話機で利用可能な種々のメニューを駆動すると同時にナビゲーションを試みているユーザに対して妨害を与えることになる。本発明は、完全なハンズフリーダイヤリングを可能にする音声認識ユーザインターフェースを電話ハンドセットまたはハンズフリーキット(HFK)に組み込むことによりこれらの問題を解決する。加えて、本発明の方法は、音声認識を利用する付加的な機能を提供する。音声認識ユーザインターフェースは、ユーザに要求される手動キーストロークの数を非常に最小化するため、標準電話ユーザインターフェースとともに使用される。
【0004】
【発明の概要】
本発明は、音声認識強化された電話ユーザインターフェースを実現する新規かつ改良された方法および装置である。方法は、音声認識を通して完全なダイヤリング機能アクセス可能性をユーザに許容するために開示される。これは、ユーザが真のハンズフリー電話インターフェースを持つことを可能にする。
【0005】
音声認識ユーザインターフェースはマイクロプロセッサで実行するソフトウエアコード、またはハードワイヤードデバイスとして実現されてもよい。音声認識装置(VR)は、ユーザと音声認識能力を持つ電話機との間のインターフェースを達成するプロセスおよび方法として記述する。音声認識プロセスそれ自体の詳細はこの出願の主題ではなく、議論しない。この出願は、ユーザと音声認識能力が提供された電話機との間のインターフェースのみを取り扱う。
【0006】
好ましい実施形態において、方法が開示され、「起きろ」のような起動用語を2回言うか、ハンドセットキーを押すかにより、ユーザが待機電話モードから音声認識モードに入ることができる。以下に詳述する好ましい実施形態では、方法はまず、初期音声トレーニングが前もって行われているかを見るためにチェックする。音声トレーニングが前もって行われていたのであれば、好ましい方法はトップレベルメニューに続く。しかし、音声トレーニングがまだ行われていないのであれば、方法はトレーニングメニューを開始する。
【0007】
好ましい方法は、トレーニングを要求する2つの語彙セット、基本セットおよび数字セットを含む。基本セットはユーザコマンド用語を含み、他方、数字セットはキーパッドおよびダイヤリング機能に関係する語を含む。好ましい方法において、ユーザはトレーニングされている語彙セット中の連続する語を言うように電話機により促される。ユーザは語を繰り返すように促され、そして音声認識装置が語の両発声の一致を決定すると、音声認識装置はその語を保存する。トレーニング方法は、現在の語彙セット中のすべての語がトレーニングされるまで続く。
【0008】
トップレベルメニューにおいて、好ましい方法は、ユーザが、4つの機能に対して音声コマンドアクセスすることを可能にし、および「スリープ」と言うことにより音声認識装置(VR)から抜け出す能力を可能にする。トップレベルメニューにおいて、方法はユーザがコマンド「リダイヤル」、「通話」、「音声ブック」を開始すること、または音声認識装置電話帳に以前に保存された名前を言うことを可能にする。トップレベルメニューでの可能な音声コマンドの各々、「リダイヤル」、「通話」、「音声ブック」または名前は、好ましい方法において、対応している機能を開始するであろう。
【0009】
好ましい方法のリダイヤル機能は、音声コマンドを通して、ダイヤルされた最後の番号に対してユーザが通話を発信できるようにする。
【0010】
通話機能は、音声認識装置電話帳内の名前を言うことにより、または音声コマンドを通して電話番号が入れられかつ発信できるようにする番号機能に入ることにより、ユーザが音声コマンドを使用して電話通話を発信することを可能にする。通話機能において、方法は最初に、数字セットトレーニングが完了されているかを見るためにチェックする。方法はそれから、音声認識装置(VR)電話帳に何らかのエントリがあるか見るためにチェックする。数字セットトレーニングが完了されていなくて、VR電話帳が空である場合には、方法はそのステータスをユーザに報告し、VRモード内のトップレベルメニューに戻るようにVRに指示する。VR電話帳が空でない限り、VRは名前を入力するようにユーザを促すであろう。ユーザが名前を話すと、VRは名前機能を開始する。数字セットトレーニングが完了されている場合には、ユーザは「番号」を言うことにより番号機能に付加的にアクセスできる。数字セットトレーニングが完了されていない場合には、好ましい方法では番号機能はアクセス可能ではない。逆に、番号機能は、数字セットトレーニングが完了されており、かつVR電話帳が空である場合に利用可能な唯一の機能である。
【0011】
番号機能において、方法は電話番号の数字を言うこと、または「通話」または「照合」を要求するようにユーザを促す。ユーザは、長さ32桁まで、一時に1つの数字で電話番号を入れることが許される。方法は、「クリア」と言うことにより、間違って入れられた数字を一時に1つユーザが削除することを可能にする。クリアコマンドは最後に入れられた数字が削除されるようにする。好ましい方法はまた、「照合」と言うことにより、入れられた電話番号をユーザが照合することを可能にする。ユーザが「照合」を命令する場合には、VRは入れられた数字を読み戻し、それからさらに数字を入れるように促すことが続く。これは、すべての電話番号の入力を完了する前に入れられた数字をユーザが照合することを可能にする。通話を発信する前に入れられた電話番号を照合するために、「照合」コマンドを同様に、使用することができる。数字が最初に入れられた後、ユーザは「通話」を言うことにより電話通話を発信できる。
【0012】
方法により組み込まれた名前機能は、ユーザが電話番号に関係する名前を言うことによりVR電話帳中の電話番号を再呼び出しできるようにする。トップレベルメニューまたは通話機能において、ユーザが名前を言うと、VRはVR電話帳中の複数の名前がその名前に一致するかを見るためにチェックする。VR電話帳中の複数の名前がユーザ要求名前と一致する場合には、VRはその一致した名前のリストを編集し、最も良く一致するものが要求されたものであったか否かをユーザに尋ねる。ユーザが同意しないのであれば、VRは次に最も良く一致するものが要求されたものであったか否かを尋ねることを続ける。ユーザが一致に同意するまで、または、VRが一致エントリのリストを使い尽くすまで、VRはこのループを続ける。VRが一致エントリのリストを使い尽した場合には、VRは名前機能を取り消し、トップレベルメニューに戻る。ユーザが一致したもののうちの1つに同意する場合には、VRはこれが一致した唯一の名前であるかのように続ける。ただ1つの名前が一致するのであれば、VRは通話するための名前の肯定を要求する。ユーザが肯定する場合には、VRから出て、通話が発信される。ユーザが肯定しない場合には、VRは名前機能を取り消し、トップレベルメニューに戻る。
【0013】
好ましい方法は音声ブック機能がトップレベルメニューでアクセスできるようにする。いくつかの機能は音声コマンドを通してアクセスできる一方、他の機能へのアクセスはハンドセットキーパッドによるユーザ入力を要求する。音声ブック機能に入るとき、VRは「追加」、「削除」、「リスト」を言うこと、またはキーパッドオプションから選択するようにユーザを促す。
【0014】
リスト機能はVR電話帳を通してユーザがブラウジングすることを可能にする。音声ブックメニューの「リスト」をユーザが言うことに応答して、VRはVR電話帳が空であるか否かを見るためにチェックする。VR電話帳が空である場合には、そのときブラウジングするエントリはない。VR電話帳が空でない場合には、VRはVR電話帳中の名前を読み、最後のエントリに到達するまで、またはVRがユーザにより中断されるまで続く。
【0015】
ユーザは「追加」と言って、VR電話帳に追加をする。VRの電話帳が一杯でない場合には、VRは追加する名前をユーザに尋ねる。ユーザが名前を言うと、VRはユーザにその名前を繰り返すように促す。ユーザが名前を繰り返した後に、VRは最初に新しい名前がコマンド語の1つに一致していないことを見るためにチェックする。名前がコマンド語に一致している場合には、ユーザは、この名前に近いコマンド語が伝えられるか、または別の名前を言うように命令される。次にVRは追加機能の名前入力ループの始めに向けられる。名前がコマンド語のうちの1つに一致していない場合には、VRは名前の両方の発声が一致しているかを見るためにチェックする。2つの語が一致していない場合には、VRはユーザに一致が不成功であり、再び試みるように伝える。一致が不成功であった後に、VRは追加機能の最初のプロンプトに戻る。一致の成功に続いて、VRは、(VRの電話帳ではなく)ハンドセットの電話帳が何らかのエントリを含んでいるか否かを見るためにチェックする。ハンドセットの電話帳が空である場合には、VRはユーザにキーパッドを使用して電話番号を入力するように命令する。ユーザが電話番号の入力を完了すると、VRはユーザに名前がVR電話帳に追加されたことを伝える。VRは名前を保存し、音声ブック機能に戻る。ハンドセットの電話帳が空でない場合には、VRは、ユーザがキーパッドを使用して電話番号を入力するか、ハンドセットの電話帳をスクロールして、番号を見付け、名前に割り当てる。ハンドセットの電話帳をスクロールするか、またはキーパッドで入力することによって電話番号を入力すると、ユーザは「追加」キーを押して、VR電話帳中にこの電話番号を保存する。次にVRはユーザに、名前がVR電話帳に追加されたことを伝える。VRは電話番号を保存し、音声ブック機能に戻る。
【0016】
ユーザは、音声ブック機能において「削除」と言うことによって、削除機能に入る。VRは最初に、VR電話帳にエントリがあるか見るためにチェックする。VR電話帳にエントリがある場合には、VRはユーザに削除する名前を尋ねる。さらに加えて、電話機上のソフトキーは「次へ」を示す。ユーザが名前で応答する場合には、VRは最初に、VR電話帳中の複数の名前が一致しているか否かを見るためにチェックする。複数の名前が一致している場合には、VRは一致している名前のリストを編集し、最も良く一致しているものを決定し、最も良く一致しているものがユーザによって発話されたものであるか否かをユーザに尋ねる。ユーザが「いいえ」と答えると、VRは、次に最も良く一致しているものを使用して要求を繰り返す。これは、一致している名前のリストをすべて使い尽くすまで、またはユーザがその一致に同意するまで繰り返される。一致している可能性のあるすべての名前を使い尽くしても、一致を見付けられなかった場合には、VRは削除機能のトップに戻る。ユーザが一致に同意すると、VRはメモリから名前および電話番号を削除し、名前が削除されたことをユーザに伝える。VR電話帳中の1つの名前のみが一致する場合には、VRはその名前が削除する名前であるか否かをユーザに尋ねる。ユーザが「はい」と答えると、VRは名前を削除することをユーザに伝え、トップレベルメニューに戻る。ユーザが「いいえ」と答えると、VRは削除機能のトップに戻る。
【0017】
電話機上の「次へ」のソフトキーが押されると、VRはVR電話帳から次の名前を検索し、それが削除する名前か否かをユーザに尋ねる。VRは、ユーザが最初に名前を言ったかのように同じやり方でプロセスを継続する。
【0018】
音声ブック機能のトップのキーパッドオプションは、ユーザがVRブックのエントリをクリアする選択をできるようにする。クリアブックオプションは頻繁に使用されないので、キーパッド機能としてのみ提供される。クリアブック機能はすべてのVR電話帳のエントリをクリアする。
【0019】
トレーニング機能は、基本セットのトレーニング、数字セットのトレーニング、または再トレーニングに対応する別のキーパッドオプションを提供する。基本セットのトレーニングおよび数字セットのトレーニングについては、上で概略的に記載したが、以下の詳細な説明でさらに説明する。再トレーニング機能は、基本セットまたは数字セットの部分のみを再トレーニング可能にする。ユーザは、基本セットまたは数字セットに関係するキーを選択するように促される。ユーザがこの選択を行うと、VRは対応する語彙セットから最初の語を検索し、これが再トレーニングすべき語であるか否かをユーザに尋ねる。ユーザが同意する場合には、VRは語を再トレーニングするようにユーザに命令し、再トレーニングに続いて、語彙セットから次の語を検索し、すべての語を使い尽くすまで、このプロセスを繰り返す。語が再トレーニングすべきものであるか否かを尋ねられた場合には、ユーザが「いいえ」と応答すると、VRは語彙セット中の次の語に進み、この新しい語で質問を繰り返す。ユーザはこれらの語を再トレーニングすることを実際に選択するかどうかにかかわらず、語彙セット中の語のすべてが質問されると、再トレーニングが完了し、トップレベルメニューに戻ることをVRはユーザに伝える。
【0020】
ハンズフリーモードで着信に応答する能力は、ハンズフリーモードで通話を開始する能力と同じくらい重要である。この方法は、音声で命令された通話応答を可能にする特徴を組み込むことによってこれを取り扱う。着信があるとき、VRは、着信があることをユーザに伝え、通話に応答するか否かをユーザに尋ねる。ユーザが「はい」と応答する場合には、通話は応答される。ユーザが「いいえ」と応答した場合には、この着信に対する別の通話音声アラートはない。
【0021】
本発明の特徴、目的、および利点は、同じ参照符号が全体を通して対応したものを識別している図面を考慮に入れると、以下の詳細な説明から、より明白になるであろう。
【0022】
【好ましい実施形態の詳細な説明】
さまざまな図中のブロックは、インターフェースの状態、プロセスのステップ、または、ブロックの対応する機能を実現するのに必要とされるハードウェアのブロックを表していると考えることができる。
【0023】
図1を参照すると、音声認識ユーザインターフェースの新規の特徴には、音声入力80のみを使用して電話機10に命令する、ユーザ70の能力が含まれている。好ましい実施形態において、電話機10は、ハンズフリーキット20内のセルラハンドセットである。電話機10がハンズフリーキット20内に受け入れられているとき、電話機とハンズフリーキット(示されていない)との間のインターフェースは、RF、制御、オーディオ信号がハンズフリーキットを通過できるようにする。典型的なセルラ電話機は、ディスプレイ152とともに、ディスプレイ152上に示された異なる機能を操作するソフトキー30も備えている。さらに、一般に参照されるような、電話機またはハンドセット10は、キーパッド50とともに、ユーザの音声入力80を受け取るマイクロホン60も有している。電話機の機能性は、プログラムコードを受け取りメモリ40に情報を記憶する、電話機内のマイクロプロセッサによって制御されている(電話機の外には表われていない)。
【0024】
図2Aを参照すると、移動電話機は、番号がない状態待機102にあるとき、典型的には、電話機のディスプレイ152は、見出し140、現行のシステムの日付と時間142、現行のソフトキーの選択144、146のような情報を示す。音声認識装置(VR)は、スリープモードにある。ユーザは、音声で命令される電話機の機能を可能にするために、音声認識装置を始めることができる。ユーザは、ステップ103において、エンドキーを押すか「起きろ」という用語を2回言うことによって、スリープモードから出て、VRアクティブモードに入ることができる。この時点で、ステップ104において、VRは、初期トレーニングが行われているか否かを見るためにチェックする。もし行われていなければ、VRは、完全トレーニング700に進む。もし多少の初期トレーニングが行われている場合には、VRは、隠れエキスパートメニュー600に進む。隠れエキスパートメニュー600は、ユーザにトップレベルメニューと同じ機能性を可能にするが、ユーザは、トップレベルメニューのプロンプトを待つ必要がない。1.5秒間のみアクティブである隠れエキスパートメニュー600は、後で詳しく説明する。隠れエキスパートメニュー600後の時点は、トップレベルメニューの状態110を表し、トップレベルメニューの状態110は、他のメニューおよび機能のプロセスの完了または取り消しに続いて、他のメニューおよび機能が戻るところである。トップレベルメニューの状態110において、VRは、ユーザに対して、ステップ108で、「通話、リダイヤル、音声ブック、またはスリープ」と言う。また、VRは、プロンプト音も鳴らす。ハンドセット上のディスプレイ152は、音声認識がオンになっていることを示す。さらに、ハンドセットは、900(図12Aおよび図12B)に示されるようなトレーニング機能にアクセスするために、トレーニングソフトキー150が利用可能であることを示す。
【0025】
図2Bを参照すると、プロンプト音106を鳴らした後に、VRは状態112に進み、タイムアウトまでユーザの音声入力を待つ。VRが状態112でタイムアウトした場合には、VRはトップレベルメニュー110に戻り、「通話、リダイヤル、音声ブック、またはスリープモード」と言うことによって、状態108において、再びユーザを促す。VRは再びプロンプト音を鳴らす。次に、VRはブロック112に戻り、再びユーザの音声入力を待つ。ユーザは、4つのコマンドのうち1つを言うか、または、VR電話帳のエントリ名を言うという選択肢を有する。利用可能なコマンドは、リダイヤル、通話、音声ブック、スリープである。ステップ122のリダイヤル、ステップ126の通話、ステップ128の音声ブックのコマンドが、VRに、対応する機能200、400、500を開始させる。これらの各々は、以下で詳述する。同様に、ユーザがVR電話帳にある名前を言う場合には、名前機能300が開始される。ステップ130において、ユーザが音声コマンド「スリープ」を言うか、または、任意のキーを押すと、VRは抜け出て、待機またはスリープモードに戻る。出口プロセスを開始する状態が、図1に、120のように示されている。VRは、状態132で、「音声認識装置はスリープ中です」と言い、出口音134を鳴らす。ハンドセットディスプレイ152は、「音声認識装置はスリープ中です」と表示する。次に、VRは、待機状態102に戻る。
【0026】
図3Aを参照すると、トップレベルメニュー110または隠れエキスパートメニュー600で、ユーザが「通話」コマンドを発声した後に、通話機能400に入る。通話機能400に入った直後、ユーザは、約1.5秒の間、隠れエキスパートウィンドウが開いている状態402にされる。この隠れエキスパートウィンドウ402は、トップレベル機能100において利用可能な隠れエキスパートメニュー600とは異なっている。この、状態402での隠れエキスパートウィンドウは、プロンプトを待つ必要なく、ユーザがすべての通話機能コマンドにアクセスできるようにする。ユーザが1.5秒ウィンドウ以内でコマンドを開始させない場合には、通話機能は状態404に進み、ここでVRは数字トレーニングが完了されているかどうかを調べる。次に、通話機能は、数字トレーニングが完了されているかどうかに応じて、状態406(図3B)または状態408に進む。状態406および408の両方において、VRは、VR電話帳に何らかのエントリがあるかどうかを調べる。
【0027】
VR電話帳にエントリがなく、数字セットトレーニングが完了されていない場合には、通話機能は状態434に進む。VRは、「音声ブックが空です」と言い、次に、通話機能を出て、トップレベルメニューの状態110に戻る。これは、数字セットトレーニングが実行されておらず、VR電話帳にエントリがない場合には、ユーザが通話機能のコマンドにアクセスできないために起こる。
【0028】
数字セットトレーニングは実行されていないが、VR電話帳が空でない場合には、「番号」コマンドは、ユーザにアクセスできないが、「名前」コマンドは、利用可能である。このような状況下で、通話機能の流れは、状態410に進む。VRは、「名前を話すか、または通話機能を出るためにはクリアと言って下さい」と言う。VRは、プロンプト音106を鳴らし、状態418に進んで、ユーザの入力を待つ。ユーザの入力前に状態418でタイムアウトが起こった場合には、VRは状態420に進み、ここでVRは前のプロンプトが繰り返されているかどうかを調べる。プロンプトが繰り返されていない場合には、VRは状態410に戻る。プロンプトが既に繰り返されていた場合には、VRは状態120に進み、機能をVRから出させる。
【0029】
図3Bを参照すると、VR電話帳にエントリがないが数字セットトレーニングは完了されている場合には、通話機能は状態430に進む。VRは、「音声ブックは空です」と言い、番号機能1400(図4A)の状態1420に進む。VR電話帳にエントリがないため、ユーザは、「名前」コマンドを使用できず、「番号」コマンドのみが使用可能である。したがって、機能の順序は、番号のプロンプトに直接流れる。
【0030】
数字セットトレーニングが完了されており、VR電話帳にエントリがある場合には、ユーザは、通話機能内のすべてのコマンドにアクセス可能である。通話機能の流れは状態412に進み、ここで、VRが「名前を話すか、言葉番号を言うか、通話機能を出るためにはクリアと言って下さい」と言う。VRは、プロンプト音106を鳴らし、状態414に進んで、ユーザの入力を待つ。ユーザが入力する前に状態414でタイムアウトが起こった場合には、VRは状態416に進み、ここでVRは前のプロンプトが繰り返されたかどうかを調べる。プロンプトが繰り返されていない場合には、VRは状態412に戻る。プロンプトが既に繰り返されていた場合には、VRは、状態120に進み、機能をVRから出させる。
【0031】
ユーザが状態414、418で提供される第1または第2の応答ウィンドウのいずれかで応答する場合には、通話機能の流れは、ユーザが状態426で「番号」、状態422で「クリア」と命令するか、状態424でVR電話帳にある名前を話すかのいずれかであるかに応じて、3つの方法のうち1つに進む。ユーザが状態424でVR電話帳にある名前を話す場合には、VRは名前機能300に進む。ユーザが状態422で「クリア」と言うかまたはクリアキーを押す場合には、VRは、通話機能をキャンセルし、トップレベルメニュー110に戻る。
【0032】
図4Aを参照すると、ユーザが状態426で「番号」と言う場合には、VRは番号機能1400に進む。番号機能1400において、最初にVRは状態1416を提供し、ここで、隠れエキスパートウィンドウが1.5秒間利用可能である。この隠れエキスパートウィンドウ1416は、隠れエキスパートメニュー600または他機能の任意の隠れエキスパートウィンドウとは別個であり、独立したものである。この隠れエキスパートウィンドウ1416において、ユーザは、状態1422のプロンプトを聞く前に、言葉で任意の番号機能コマンド入力を行うことが可能である。隠れエキスパートウィンドウ1416がタイムアウトした場合には、VRは番号のプロンプトの状態1422に進む。状態1422に至るポイント1420は、VR電話帳にエントリはないが数字セットトレーニングは完了されているときに、VRが通話機能から進むところである。状態1422において、VRは、「数字を一度に1つ言って下さい。終了したときは、通話または照合と言って下さい」と言うことによってユーザを促す。VRは、プロンプト音106を鳴らし、次に、ブロック1424に進んで、ユーザの入力を待つ。入力タイムアウト前にユーザが応答しない場合には、VRは状態1428に進み、前のプロンプトが5回繰り返されていたかどうかを調べる。プロンプトが既に5回繰り返されていた場合には、番号機能は状態120に進み、VRモードを出る。プロンプトが5回繰り返されていない場合には、VRは状態1422に戻る。ユーザが状態1424で入力タイムアウト前に応答する場合には、VRは、ユーザの入力がコマンド語または数字であるかどうかを調べる。
【0033】
コマンドが「照合」である場合(状態1454)には、状態1458においてVRは、ダイヤルされるべき番号を読み上げる。そして、VRは、隠れエキスパートウィンドウ1416に戻るポイント1410に進む。
【0034】
図4Aの下部および図4Bを参照すると、状態1430においてユーザが数字を言うと、状態1432においてVRは、数字の最大数がすでに入力されているかどうかを認識してチェックする。すでに入力された数字の数が数字の最大数と等しい場合には、1438の状態においてVRは、「最大数の長さになりました。終了したときは、通話または照合と言って下さい」と言う。そして、VRはポイント1410に進み、次のユーザ入力を待つために隠れエキスパートウィンドウ1416に戻る。数字の最大数が入力されていない場合には、状態1434においてVRは、ユーザによって言われた番号を繰り返す。そして、VRはポイント1410に進み、ここで、さらにユーザの入力を待つために、隠れエキスパートウィンドウ1416に戻る。
【0035】
状態1422のプロンプトに対するユーザ応答が「スリープ」である場合(状態1460)には、VRは、図4Bに示された状態1462に進み、「スリープと言いましたか?」と言う。ユーザが「はい」と応答すると(状態1464)、VRはポイント120に進み、VRを出る。ユーザが「いいえ」と応答すると(状態1466)、VRはポイント1410に進み、隠れエキスパートウィンドウ1416に戻る。ユーザ応答がSTSまたは拒否の場合(状態1490)には、VRは、状態1492に進み、「はいと言いましたか?」と言う。ユーザがこのプロンプトに対して「はい」と応答した場合(状態1496)には、VRはポイント120に進んで、VRを出る。ユーザ応答が「いいえ」、あるいは他のSTSまたは拒否である場合には、VRはポイント1410に進んで、隠れエキスパートウィンドウ1416に戻る。
【0036】
図4Aの下部および図4Cを参照すると、ユーザのコマンドが「クリア」であるか、またはユーザが「クリア」キーを押した場合(状態1440)には、VRは状態1444に進んで、入力された数字の数がゼロより大きいかどうかを見るためにチェックする。数字が入力されていない場合には、状態1454においてVRは「番号が入力されていません」と言って、ポイント1410に進み、隠れエキスパートウィンドウ1416に戻る(状態1422)。数字が前もって入力されている場合には、VRは状態1442に進んで、連続クリアコマンドが発行され、入力された数字の数が1よりも大きいかどうかをチェックする。連続「クリア」コマンドがあり、数字の数が1よりも大きい場合には、VRは連続クリア機能4400に進んで、望まれるのであれば、ユーザがエントリ全体をクリアできるようにする。連続「クリア」コマンドが発行されていないか、または、入力された数字が1つのみである場合には、VRは状態1446に進んで、入力された最後の番号を削除し、「クリアされました」と言う。そして、VRはポイント1410に戻り、次のユーザ入力を待つ。
【0037】
状態1450にあるようにユーザコマンドが「通話」である場合には、VRは、状態1452に進み、何らかの番号が入力されているかどうかを見るためにチェックする。何の番号も入力されていない場合には、VRは状態1454に進んで、「何の番号も入力されていません」と言い、次にポイント1420に戻って、ユーザ入力のためのプロンプトに戻る。番号が入力されている場合には、状態1470は、VRが「呼び出し中」と言うことを示し、入力された番号を繰り返す。ユーザがプロンプトに対して沈黙しているか、または、「はい」と答えると(状態1472)、VRは状態1494に進み、通話を開始する。ユーザが「いいえ」と言うと(状態1474)、VRはポイント1410に進んで、隠れエキスパートウィンドウ1416に戻る。ユーザ応答がSTSまたは拒否であることをVRが決定する場合(状態1480)には、VRは状態1482に進み、「通話したかったですか?」と尋ねる。ユーザが「はい」と答えるか、または、沈黙していると(状態1484)、VRは状態1488に進み、通話を開始する。ユーザ応答が「いいえ」または他の拒否の場合には(状態1486)、VRはポイント1410に進み、隠れエキスパートウィンドウ1416に戻る。
【0038】
上記のように、連続「クリア」コマンドは、すべての番号をクリアするオプションをユーザに可能にするように特に取り扱われる。連続クリア機能のフローチャートは、図5に示されている。いったん、連続「クリア」コマンドが入力されたとVRが決定すると、状態4410においてVRは、「電話番号全体をクリアしますか?」と言う。状態4420に示されているようにユーザが「はい」と答えると、「すべての数字がクリアされました」と言い(状態4422)、現在入力されているすべての数字をクリアする。次に、VRは、プロンプト音106を鳴らす。そして、VRはポイント1410に戻り、番号機能1400内の隠れエキスパートウィンドウ1416に進む。
【0039】
電話番号全体をクリアするかとのVRの問い合わせに対する応答において、ユーザが「いいえ」と答える場合(状態4430)には、状態4432においてVRは、「1つの数字がクリアされました」と言い、最後に入力された数字をクリアする。そして、VRは、プロンプト音106を鳴らす。「クリア」コマンドは、連続クリア機能が存在していない場合には、1つの数字のクリアになるので、連続クリア機能はデフォルトでこの結果になる。この時点において、フローは、肯定的な応答パスと同じパスをたどる。VRはポイント1410に戻り、番号機能1400内の隠れエキスパートウィンドウ1416に進む。
【0040】
図6を参照すると、隠れエキスパートメニュー600は、追加のコマンドまたは機能を提供しないので、正確には独立したメニューではない。むしろ、隠れエキスパートメニュー600は、ユーザが、VRのプロンプトを待つ必要なく、コマンドを入力するのを可能にする。最初のトレーニング判定(状態104)を通る、待機モードの状態102からのフロー図は、図1のトップレベル機能のフローチャートから来ることが図3から分かる。いったん、最初のトレーニングが実行されていることをVRが決定する(状態104)場合には、隠れエキスパートメニュー600が利用可能である。隠れエキスパートメニュー600の下で、ユーザはVRからのプロンプトを聞くよりも前にあらゆるトップレベルメニューコマンドにアクセスすることが可能である。VRは、1.5秒間だけ隠れエキスパートメニュー600を起動する。ユーザがプロンプトを待ちたい場合には、またはユーザが隠れエキスパートメニュー600の存在に気づいていない場合には、VRは、状態620に示された1.5秒間の応答ウィンドウの後、トップレベルメニュー110に進む。隠れエキスパートメニュー600は、さまざまな機能において利用可能である多くの隠れエキスパートウィンドウから区別すべきである。機能のそれぞれにおける隠れエキスパートウィンドウは、ユーザプロンプトを最初に聞く必要なく、それぞれの機能内で入力を可能にしている。
【0041】
図7Aを参照すると、名前機能300は、VRの電話帳中のエントリの名前を言うことによって、ユーザによりアクセスされる。トップレベル機能100、または通話機能400から、VR電話帳301中のエントリの名前を言った後に、ユーザが名前機能300に入る。状態310においてVRは、複数の名前が一致するかどうかを見るためにチェックする。
【0042】
図7Bを参照すると、複数の名前が一致すれば、VRは、最良の一致を確立するために名前を並べ替える。次の状態330では、VRは、「(最良に一致する名前)と言いましたか?」と尋ねる。ここで、(最良に一致する名前)は、VRが最良の一致をもたらすと決定したVR電話帳中の名前を表す。また、VRは、答えが必要とされていることをユーザに知らせるようにプロンプト音106を鳴らす。状態332として示されているように「いいえ」で答えた場合には、VRは状態344に進み、すべての一致が問い合わせられているかどうかを見る。すべての一致が問い合わせられていない場合には、VRは、状態346において次の最良の一致を検索し、次の最良の名前で、状態330におけるプロンプトを繰り返す。さらなる名前がない場合には、VRは名前機能300をキャンセルし、トップレベルメニュー110に戻る。
【0043】
状態336に示されているように、ユーザが、状態330のプロンプトに対して「はい」と答える場合には、VRは状態320に進み、一致する名前が、発見された唯一の一致する名前であるようにVRが進む。ユーザが速く話し過ぎる(STS)場合には、または状態330における問い合わせに対するユーザ応答が、拒否された場合(状態334)には、VRは状態338に進み、「はいと言いましたか?」と尋ねる。VRは、次にプロンプト音106を鳴らす。ユーザが、状態342に示されているように、状態338の問い合わせに対して「いいえ」で応答した場合には、VRは状態344に進み、最初の「いいえ」の答えに対して、状態332におけるように応答を処理する。ユーザが「はい」と答えた場合には、VRは状態320に進む。他のどの応答に対しても、またはユーザがタイムアウト内に答えない場合には、VRは、トップレベルメニュー110に進むために名前機能300を出る。
【0044】
図7Aに戻り参照すると、いったん、VRが1つの一致した名前が存在するものと判断すると、VRは状態320に進み、「(名前)を呼び出し中」と言う。ここで、(名前)はVR電話帳中の一致した名前を表す。VRは、その後、ユーザの応答のために1.5秒待つ。ユーザが沈黙しているか、または応答が「はい」の場合には(状態322)、VRは状態324において通話を開始する。VRは、沈黙は暗黙の「はい」として解釈する。状態326に示されているように、ユーザが「いいえ」と応答した場合には、VRは状態370において「キャンセルされました」と言う。VRは、その後、状態372において名前機能300をキャンセルし、トップレベルメニュー110に戻る。状態350に示されているように、ユーザの応答がSTSまたは拒否である場合には、VRは、状態352において、ユーザに対して「通話を望んでいましたか?」と尋ねる。VRは、その後、プロンプト音106を鳴らす。ユーザが「はい」と答える場合(状態354)には、VRは状態356において通話を開始する。ユーザが「いいえ」と答える、または応答がSTSまたは拒否である場合(状態358)には、VRは状態360において「キャンセルされました」と言う。名前機能300は、状態362においてキャンセルされ、そして、VRはトップレベルメニュー110に戻る。
【0045】
図8を参照すると、ユーザは、トップレベル機能100からリダイヤル機能200にアクセスすることができる。リダイヤル機能は、最後に呼び出した番号をユーザがリダイヤルできるようにするものである。トップレベルメニュー110から、ユーザは「リダイヤル」と言うことにより、リダイヤル機能200に入る。このリダイヤル機能200に入った後、VRは、状態210において、「(最後に呼び出した番号)をリダイヤルしますか」と言うことにより、ユーザを促す。ここで、(最後に呼び出した番号)はハンドセットによって呼び出された最後の番号を表す。VRは、さらに、プロンプト音106を鳴らして、ユーザに対して、応答が要求されていることを示す。ユーザが「いいえ」と応答し、またはキーパッド上の何らかのキーが押された場合(状態212)には、VRは状態214において「キャンセルされました」と言う。VRはリダイヤル機能をキャンセルし、トップレベルメニュー110に戻る。ユーザが「はい」と応答し、または沈黙である場合(状態216)には、VRは通話を開始する(状態218)。VRがSTS応答を検出するか、またはユーザの応答が拒否である場合(状態220)には、VRは状態222に進み、ユーザに対して「通話を望んでいましたか?」と尋ねる。VRは、その後、プロンプト音106を鳴らす。ユーザが「いいえ」と応答する(状態224)場合には、VRは状態214に進み、ここで、VRは「キャンセルされました」と言い、リダイヤル機能をキャンセルする。VRは、その後、トップレベルメニュー110に戻る。ユーザが「はい」と応答するか、または沈黙である(状態226)場合には、VRは状態218において通話を開始する。他のSTSまたは拒否であると(状態228)、VRは状態214に進み、ここで、VRは「キャンセルされました」と言い、リダイヤル機能をキャンセルする。VRは、その後、トップレベルメニュー110に戻る。
【0046】
図9Aを参照すると、ユーザはトップレベル機能100から音声ブック機能500にアクセスできる。音声ブック500によりユーザはVR電話帳に対してエントリを追加したり削除したりできるとともに、VR電話帳中のエントリを読むようにVRに命令することができる。この後者の特徴によりユーザはVR電話帳中をハンズフリー方法でブラウジングすることができる。トップレベルメニュー110から、ユーザは「音声ブック」と言うことにより音声ブック機能500に入る。いったんユーザが音声ブック機能500に入ると、隠れエキスパートウィンドウ502がユーザに対して約1.5秒間だけ利用可能となる。隠れエキスパートウィンドウ502は、トップレベル機能100において利用可能な隠れエキスパートメニュー600とは異なり、独立したものである。この隠れエキスパートウィンドウ502は音声ブック機能500でのみアクティブとなり、隠れエキスパートウィンドウ502により、ユーザはユーザプロンプトを待たずにすべての音声ブックコマンドにアクセス可能になる。ユーザが隠れエキスパートウィンドウ502の時間枠内に応答しない場合には、VRは音声ブックユーザプロンプト510に進む。音声ブックユーザプロンプト510において、VRは「リスト、追加、または削除、あるいは音声ブックを出るためにはクリアと言って下さい」と言う。次いで、VRはプロンプト音106を鳴らす。さらに、電話機は「ブックをクリア」キーパッドオプション514を表示する。
【0047】
ユーザがこの「ブックをクリア」オプションに対応するキーを押す場合(状態520)には、VRは状態522に進み、ハンドセットディスプレイを制御してユーザに対して「すべての音声ブックエントリを消去しますか?」と尋ねる問い合わせを示す。「はい」と「いいえ」を表すソフトキー523および525がユーザに利用可能である。ユーザが「はい」のソフトキーで選択する(状態524)場合には、ハンドセットディスプレイ152は「すべての音声ブックエントリを消去しました」を表示する。VRは次いで状態528に進み、「音声ブックは空です」と言い、VRはトップレベルメニュー110に戻る。ユーザが「いいえ」ソフトキーを選択する(状態526)場合には、VRは音声ブック機能をキャンセルし、トップレベルメニュー110に戻る。
【0048】
ユーザが「クリア」と言うか、またはクリアキーを押す(状態512)場合には、音声ブックユーザプロンプトに応答して、VRは音声ブック機能をキャンセルしてトップレベルメニュー110に戻る。ユーザ応答が「追加」であると(状態532)、VRは追加機能5200を開始する。同様に、ユーザ応答が「削除」であると(状態530)、VRは削除機能5300を開始する。
【0049】
音声ブックユーザプロンプト510に応答して、ユーザが「リスト」と言うと(状態5100)、VRはまずVR電話帳が空であるかをチェックする(状態5110)。VR電話帳が空である場合には、状態5112においてVRは「音声ブックは空です」と言い、隠れエキスパートウィンドウ502に戻る。
【0050】
図9Bを参照すると、VR電話帳が空でない場合には、状態5114においてVRは「ブックエントリ:(名前1)…(最終エントリ)」と言う。ここで、(名前1)はVR電話帳中の最初の名前を示し、(最終エントリ)はVR電話帳中の最後の名前を示す。さらに、ハンドセットディスプレイ152は「さらに」5116および「戻る」5118を表すソフトキーを提供する。ユーザが「さらに」ソフトキー5116を押す場合には、VRは次に進んで次の名前を読む。ユーザが「戻る」ソフトキー5118を押す場合には、VRは最初のエントリからの名前を読み始める。ユーザが沈黙のままである場合(状態5120)には、VRは状態5122に進み、VR電話帳からの名前のリストアップを最終エントリまで続ける。いったんVRが最終エントリを読むと(状態5124)、VRは「これ以上のエントリはありません」と言い、隠れエキスパートウィンドウ502より前のポイントに戻る。
【0051】
VRが音声ブックエントリのリストアップを行っている間に、VRがSTSを検出するか、VRがユーザ入力拒否を検出するか、あるいはユーザが話した場合(状態5130)には、VRは状態5132に進み、「エントリの聞き取りを続けますか?」と尋ねる。ユーザが「はい」と答えるか、または沈黙する場合(状態5134)には、VRは次の音声ブックエントリを読む。ユーザが「いいえ」と答える場合(状態5136)には、VRは隠れエキスパートウィンドウの直前のポイント506に戻る。VRが他のSTSまたは拒否を検出する場合(状態5140)には、状態5142においてVRは「はいと言いましたか?」と尋ねる。ユーザが「はい」と答える場合(状態5144)には、VRは次の音声ブックエントリを読む(状態5150)。ユーザが「いいえ」と答える場合(状態5146)には、VRは隠れエキスパートウィンドウ502の直前のポイント506に戻る。
【0052】
音声ブックのリストアップ間にユーザがコマンド「スリープ」で応答する場合(状態5160)には、VRは状態120に進み、待機モード102に戻る。
【0053】
図10Aを参照すると、ユーザは音声ブック機能ユーザプロンプト510において「追加」と言うことにより追加機能に入ることができる。追加機能に最初に入るときに、VRは既に最大数のエントリがあるか否かをチェックする(状態5210)。最大数のエントリがある場合には、VRは状態5212に進み、「音声ブックは一杯です」と言う。次いでVRは追加機能5200から出て、トップレベルメニュー110に戻る。
【0054】
音声ブックに利用可能なスペースがある場合には、VRは状態5220に進み、「追加する名前」と言う。VRは次いでプロンプト音106を鳴らす。プロンプトの後に、VRは状態5222においてユーザの入力を待つ。タイムアウト前にユーザの入力がない場合には、VRはシステムタイムアウトルーチン1200を開始する。タイムアウト前にユーザが名前を話した場合(状態5224)には、VRは状態5234においてこの名前がコマンド語と一致するか否かをチェックする。VRはユーザがコマンド語と一致する名前を保存することを許可しない。これは語の処理において結果として生じる曖昧さのためである。名前がコマンド語と一致すると、状態5250においてVRは「この名前は語:(語)ととてもよく一致します」と言う。ここで、(語)はユーザが追加を望んでいる名前に一致するとVRが決定したコマンド語を表す。VRはプロンプト音106も鳴らして、ユーザに対して応答が要求されていることを示す。VRは次いで状態5220に戻り、新しいユーザ応答を入力するように促す。
【0055】
いったん満足な名前が入力されると、VRは状態5230において「もう一度」と言うことにより、ユーザにその名前を繰り返すように促す。VRはプロンプト音106も鳴らす。図10Bを参照すると、状態5232においてVRはユーザがその名前を繰り返すのを待つ。ユーザがタイムアウト前に応答しない場合には、VRはシステムタイムアウトルーチン1200を開始する。
【0056】
名前がいずれのコマンド語と一致しなくても、2つのユーザ発声は依然として互いに一致しなければならない。状態5240においてVRは名前が一致する2つのユーザ発声をチェックする。2つの発声が一致しない場合には、VRは状態5242に進み、「語の一致に成功しませんでした。再度試して下さい」と言う。次いでVRは状態5220に戻り、新しい名前を入力するようにユーザを促す。2つのユーザ発声が一致すると、VRはユーザにその名前に対応する電話番号の入力を許可する。
【0057】
VRはキーパッドを使用してこの電話番号を入力するのを許可し、またはハンドセット電話帳に記憶されている番号から電話番号をコピーしてもよい。ユーザにハンドセット電話帳からのコピーを許可する前に、VRは状態5260においてハンドセット電話帳に何らかの電話番号が記憶されているか否かをチェックする。
【0058】
図10Cを参照すると、ハンドセット電話帳に何ら番号が記憶されていない場合には、VRは状態5262に進み、「キーパッドを使用して電話番号を入力して下さい。終了したときは、追加を押して下さい」と言う。この時点において、ユーザは電話番号を入力するのにキーパッドのみ使用することが許可されている。ユーザが電話番号を入力すると、入力された番号がハンドセットディスプレイ152上に表示される。さらに、ハンドセットディスプレイは「追加」ソフトキー5292の利用可能性を表示する。いったんユーザが電話番号の入力を行うと、ユーザは「追加」ソフトキー5292を押して、そのエントリを音声ブック中に保存しなければならない。ユーザが「追加」ソフトキー5292を押した後、VRは状態5280に進み、「(名前)が追加されました」と言う。ここで、(名前)は以前のプロンプトからのユーザの発声に対応する。VRは次に音声ブック機能500内の隠れエキスパートウィンドウ502に戻る。
【0059】
状態5260においてハンドセット電話帳中にエントリがあることをVRが決定する場合には、VRは状態5270に進み、「キーパッドを使用して電話番号を入れて下さい。終了したときは、追加を押して下さい」と言う。これはハンドセット電話帳にエントリがないケースと同じ音声プロンプトであることに注意すること。しかしながら、ハンドセットディスプレイ152によりユーザはハンドセット電話帳中のエントリをスクロールできる。ユーザがキーパッド押下を使用して電話番号の入力を選択する場合には、VRは状態5264にしたがって処理を進める。しかしながら、ユーザはハンドセット電話帳のスクロールを選択し(状態5272)、対応する電話番号を表示できる。いったんユーザがハンドセット電話帳中のエントリを特定すると、ユーザは「ビュー」ソフトキー5252を押して対応する電話番号を表示することができる。このエントリがユーザが追加したいものではない場合には、ユーザは「バック」ソフトキー5254を押して前のハンドセット電話帳ディスプレイ152に戻ることができる。ユーザは、ビューディスプレイ152において、「追加」ソフトキー5256を押すことにより、ハンドセット電話帳からの電話番号をVR電話帳に追加することを選択できる。いったんユーザが「追加」ソフトキー5256を押すと、VRは状態5280に進み、「(名前)が追加されました」と言う。次いでVRは音声ブック機能500内の隠れエキスパートウィンドウ502に戻る。
【0060】
図11Aを参照すると、ユーザはVR電話帳からエントリを同様に削除することができる。ユーザは、音声ブック機能のユーザプロンプト510において「削除」と言うことにより、削除機能5300に入る。削除機能に入る際に、VRは、まずVR電話帳が既に空となっているか否かをチェックする(状態5310)。VR電話帳が既に空の場合には、削除するためのエントリはない。状態5312において、VRは「音声ブックは空です」と言う。次に、VRは、トップレベルメニュー110に戻る。VR電話帳においてエントリがある場合には、VRは状態5320に移動し、「削除する名前」と言う。次に、VRは、プロンプト音106を鳴らす。VRは状態5322においてユーザの音声またはキー入力を待つ。ユーザによる入力がなく、システムがタイムアウトとなった場合には、VRは状態5324に進み、ここで、VRはプロンプトが既に繰り返されているか否かをチェックする。プロンプトがまだ繰り返されていない場合には、VRは状態5328に進み、「削除する名前を言うか、「次へ」ボタンを使用して名前をさらに聞いて下さい」と言う。VRはプロンプト106も鳴らす。次に、VRはブロック5322に戻り、ユーザの入力を待つ。システムが2回、タイムアウトになった場合には、VRは削除機能をキャンセルし、トップレベルメニュー110に戻る。
【0061】
ユーザは、名前を話すか、または「次へ」ソフトキー5314を押すことにより、前のプロンプトに応答できる。ユーザが、状態5380に示すように、「次へ」ソフトキー5314を押した場合には、VRは、図11Cを参照して以下で説明されている状態5332に進む。
【0062】
図11Bを参照すると、ユーザが、状態5326に示すように名前を言った場合には、VRは状態5330に進み、複数の名前が一致するか否かをチェックする。一致する名前が複数あるときには、VRは、VRが名前機能300において複数の名前の一致を取り扱うのと同様に複数の名前の一致を処理する。複数の名前が一致した場合には、VRは状態5340において「(最良に一致する名前)と言いましたか?」言う。ここで、(最良に一致する名前)は、VRが最良の一致をもたらすと決定したVR電話帳中の名前を表す。VRは、また、プロンプト音106を鳴らし、返答が要求されていることをユーザに知らせる。問い合わせされた名前が、ユーザの話したものでない場合には、状態5342に示されているように、ユーザは「いいえ」と答える。次に、VRは、状態5344に進み、すべての可能性のある一致について問い合わせされたか否かをチェックする。すべての名前の一致について問い合わせされていない場合には、VRは状態5346において、次の最良の名前の一致を検索し、状態5340に戻り、次の最良の名前の一致でプロンプトを繰り返す。しかしながら、さらなる名前がない場合には、VRは状態5390に進み(図11Aを参照)、「削除する名前を話すか、「次へ」ボタンを使用して名前をさらに聞いて下さい」と言う。VRはプロンプト音106を鳴らし、ユーザによる入力が要求されていることを知らせる。次に、VRは状態5322に戻り、ユーザによる入力を待つ。状態5348に示されているように、問い合わせされた名前がユーザの話した名前と一致した場合には、ユーザは「はい」と答える。次に、VRはポイント5394に進み、ここでVRは状態5372に進み、「(名前)は削除されました」と言う。状態5372に続き、VRは、音声ブック機能500中の隠れエキスパートウィンドウ502に戻る。
【0063】
状態5350に示されているように、ユーザが速く話し過ぎる(STS)場合には、またはブロック5340における問い合わせに対するユーザの返答が拒否された場合には、VRは状態5352に進み、「はいと言いましたか?」と尋ねる。VRはプロンプト音106を鳴らし、ユーザによる入力が要求されていることを示す。ユーザが「いいえ」と応答した場合(状態5356)には、VRはポイント5392に進み、最初の「いいえ」の答えに対するブロック5342におけるように、この応答を処理する。ユーザが「はい」と返答した場合には、VRは、ポイント5394に進むことにより、最初の「はい」の答えに対するブロック5348におけるように、この応答を処理する。状態5358に示されているように、他の何らかの応答に対して、VRは、削除機能をキャンセルし、トップレベルメニュー110に戻る。
【0064】
図11Cを参照すると、VRが、VR電話帳からのただ1つの名前とユーザからの入力とが一致すると決定した場合には、または、ユーザが「次へ」ソフトキーを押した場合には、VRは状態5332に進み、「(名前)を削除しますか?」と言う。(名前)は、VRが一致すると決定した、VR電話帳からの名前に対応する。VRはまた、プロンプト音106を鳴らし、返答が要求されていることをユーザに知らせる。次に、VRは状態5360においてユーザの入力を待つ。ユーザの応答がなく、VRがタイムアウトした場合には、VRは状態5332に戻り、プロンプトを繰り返す。状態5370に示されているように、ユーザの返答が「はい」であった場合には、またはユーザが「削除」ソフトキー5398を押した場合には、VRは状態5372に進み、「(名前)は削除されました」と言う。次に、VRは音声ブック機能502中の隠れエキスパートウィンドウ502に戻る。状態5376に示されているように、ユーザの返答が「いいえ」であった場合には、VRは、状態5320(図11A)に戻り、削除する名前を入力するようにユーザに促す。状態5378に示されているように、ユーザが「次へ」ソフトキー5399を押した場合には、VRは状態5382に進み、VR電話帳から次の名前を検索する。次に、VRは状態5332に戻り、VR電話帳中の次の名前についてユーザを促す。状態5362に示されているように、ユーザの応答がSTSまたは拒否である場合には、VRは状態5364に進み、「はいと言いましたか、(名前)を削除しますか?」と言う。次に、VRはプロンプト音106を鳴らす。この問い合わせに対するユーザの応答が「はい」である場合(状態5374)には、VRはブロック5372に進み、状態5370においてあたかもユーザが「はい」と答えたのと同じプロセスを使用することより、エントリを削除する。ユーザの応答が「いいえ」であった場合には、または、他のSTSまたは拒否である場合(状態5366)には、VRは状態5368に進み、「キャンセルされました」と言って、ブロック5320に戻り、削除する名前を入力するようにユーザに促す。
【0065】
図12Aを参照すると、トップレベル機能100においてユーザが「トレーニング」ソフトキー150を押すことによってのみ、トレーニング機能にアクセスできる。トレーニング機能900は、ユーザがキーパッドを押したことに対する応答によってのみ動作する。これは、最初にトレーニングを実行せずに、音声によるコマンドを介してトレーニングにアクセスすることは不可能だからである。いったんユーザがトレーニング機能900に入ると、VRは状態902に進み、ここで、ハンドセットディスプレイ152は、トレーニングするためにユーザが選択することができる2つの語彙セット、基本セット906と数字セット908を表示する。基本セットは、通話、リダイヤル、はい、いいえ、付加、削除、音声ブック、スリープ、ウェイクアップ、クリア、リスト、回答を含むコマンド語からなる。数字セットは、0、1、2、3、4、5、6、7、8、9、オー、スター、ポンド、照合、番号を含むキーパッドおよびダイヤル関連語である。ユーザが基本セットを選択するか(状態910)、または数字セットを選択するか(状態920)により、ユーザには完全トレーニングまたは再トレーニングの選択肢が与えられる。ハンドセットディスプレイ152は、トレーニングオプション942および再トレーニングオプション944を表示する。ハンドセットは、また、「出る」ソフトキー946を表示する。ユーザが語彙セットをトレーニングすることを選択する場合(状態914)には、VRは完全トレーニング700を初期化する。ユーザがただ、語彙セットを再トレーニングすることを選択した場合(状態916)には、VRは再トレーニング機能800を初期化する。ユーザは、「出る」ソフトキー946を選択することにより、トレーニングを実行しないように決めることもできる。この選択は状態924として示されている。ユーザが「出る」ソフトキー946を押した場合には、VRはポイント120に進み、VRを出て待機102に戻るように進む。
【0066】
図12Bを参照すると、ユーザは、「0」キーを押し続けることにより、すべての音声コマンドおよびVR電話帳のエントリを消去することができる(状態930)。この選択は隠されており、ハンドセットディスプレイ上には示されていない。ユーザが、「0」キーを押しつづけた場合には、VRは状態932に進み、ここで、ハンドセットディスプレイ950は、「音声コマンドおよび電話帳のエントリを消去しますか」と表示し、「はい」、「いいえ」のソフトキー選択952、954を提供する。ユーザが「はい」のソフトキーを押した場合(状態936)には、VRは状態938に進み、ここで、VRはすべてのVRコマンド語およびすべてのVR電話帳のエントリを消去する。次に、VRはポイント120に進み、音声認識モードを出る。ユーザが「いいえ」のソフトキーを押した場合(状態934)には、VRはポイント120に進み、内容を何ら変更することなく音声認識モードを出る。
【0067】
図13Aを参照すると、完全トレーニング機能700は、トレーニング機能900を介してアクセスされるか、またはトレーニングがまだ実行されていない場合(図1の104参照)にVRに入る際に自動的にアクセスされる。完全トレーニング機能700において、VRは、まず、初期トレーニングが完了しているか否かをチェックする(状態702)。初期トレーニングがまだ実行されていない場合には、VRはデフォルトで基本セットのトレーニングを行う(状態704)。ハンドセットディスプレイ152は、「基本セット」をヘッダー762として示す。トレーニング機能900から完全トレーニング機能700に入る場合には、トレーニング機能900において選択された語彙セットが、ハンドセットディスプレイ152上にヘッダー762として表示される。ハンドセットディスプレイ152は、また、「出る」ソフトキー764を表示する。ユーザが「出る」ソフトキー764を選択した場合には、VRは、状態706において、「音声認識装置はスリープ中です」と言う。次に、VRは音声認識モードを出て、待機102に進む。
【0068】
語彙セットが決定された後、VRは、状態710において「音声指示にしたがって、トレーニングを開始して下さい」と言う。次に、VRは、状態712において「語(語)を言って下さい」と言う。ここで、(語)は、トレーニングされている語彙セット中の最初の語を表す。VRは、プロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。次に、VRは、状態716においてユーザの入力を待つ。ユーザによる入力の前に、システムがタイムアウトとなった場合には、VRは状態712に戻り、プロンプトを繰り返す。
【0069】
図13Bを参照すると、ユーザがプロンプトに応答した場合には、VRはユーザに対して語を繰り返すように要求する。VRは、状態720において、「もう一度」と言う。次に、VRは、プロンプト音106を鳴らす。VRは、状態724において、ユーザが語を繰り返すのを待つ。ユーザによる入力の前にVRがタイムアウトとなった場合には、VRは状態720に戻り、「もう一度」プロンプトを繰り返す。ユーザが応答した場合には、状態726においてVRは、両方のユーザの発声を比較して、これらが一致しているか否かをチェックする。2つの発声が一致していない場合には、VRは状態740において「語の一致は成功しませんでした」と言う。次に、VRは状態712に戻り、同じ語についてトレーニングのルーチンを繰り返す。VRが、2つの発声が一致したと判断した場合には、VRはメモリにその語を保存し、状態728において、語彙セット中のすべての語がトレーニングされたか否かをチェックする。語彙セット中のすべての語がトレーニングされていない場合には、VRは語彙セット中の次の語を検索する(状態732)。次に、VRは、状態712に戻り、語彙セット中の次の語に対し、トレーニングのルーチンを繰り返す。いったん語彙セット中のすべての語がトレーニングされると、VRは状態730に進み、「(語彙セット)トレーニングは完了しました。音声認識は動作中です」と言う。この用語(語彙セット)は、現在トレーニングされている、基本または数字の現在の語彙セットと対応する。次に、VRは、トップレベルメニュー110に戻る。
【0070】
図14Aを参照すると、再トレーニング機能800はトレーニング機能900からアクセスできる。再トレーニング機能800によりユーザは語彙セットの任意の部分を再トレーニングできる。再トレーニング機能に入ると、VRは、「音声指示にしたがって、トレーニングを開始して下さい」(状態802)と言う。ユーザは多数のキーパッドオプションを持っている。ユーザは終了キーまたは「出る」ソフトキー870を押して(状態860)、ポイント120に進みVRを出ることができる。ユーザはクリアキーを押して(状態862)、トレーニング機能における前の表示に戻ることができる(状態864)。その他の任意のキーが押されると(状態866)、機能動作が起こらなくなる(状態868)。
【0071】
VRに再トレーニング機能800を抜け出させる任意のキー押しをユーザが選択しない場合には、状態810においてVRは再トレーニングされている語彙セットにおける最初の語を検索する。VRは状態812に進み、「(語)はこの語を再トレーニングしますか?」と言う。この問い合わせにおいて、(語)は再トレーニングされるべき語彙セット中の現在の語を表している。その後、VRはプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。状態814に示されているように、ユーザが「いいえ」で応答する場合には、または「いいえ」ソフトキー874を押す場合には、VRは語彙セット中の次の語を検索し(状態838)、状態812プロンプトに戻る。状態816に示されているように、ユーザが「はい」を応答する場合には、または「はい」ソフトキー872を押す場合には、VRはその語の再トレーニングを開始する。VRは状態820に進み、「語(語)を言って下さい」と言い、それからVRはプロンプト音106を鳴らす。それから、VRは状態822においてユーザ入力を待つ。ユーザがシステムタイムアウト前に応答しない場合には、VRはシステムタイムアウトルーチン1200を開始する。
【0072】
図14Bを参照すると、ユーザがシステムタイムアウト前に答える場合には、状態824においてVRは「もう一度」と言うことにより、ユーザがその語を繰り返すように要求する。VRはこの要求後にプロンプト音106を鳴らす。VRは状態826においてユーザが語を繰り返すのを待つ。ユーザが答える前に、このポイントからシステムがタイムアウトする場合には、VRはシステムタイムアウトルーチン1200を開始する。ユーザがシステムタイムアウト前に応答する場合には、状態828においてVRは両方の発声が一致することを確認する。2つの発声が一致しない場合には、VRは状態832に進み、「語の一致は成功しませんでした。再度試して下さい」と言う。その後、VRは状態820戻り、ユーザに同じ語を再トレーニングするように促す。2つの発声が一致する場合には、VRは状態830に進み、「(語)は再トレーニングされました」と言う。ハンドセットディスプレイ152は「次へ」および「済み」882および884に対するソフトキーを示す。
【0073】
図14Cを参照すると、ユーザが「済み」ソフトキーを選ぶ(状態850)場合には、VRは状態852に進み、「再トレーニングは完了しました」と言う。その後、VRはトップレベルメニュー110に戻る。ユーザが「次へ」ソフトキーを選ぶ(状態834)場合には、状態836においてVRは現在の語彙セット中のすべての語が再トレーニングされているか否かをチェックする。すべての語が再トレーニングされていない場合には、VRは状態838に戻り、再トレーニングのために語彙セット中の次の語を検索する。語彙セット中のすべての語が再トレーニングされている場合には、VRは状態852に進み、「再トレーニングは完了しました」と言い、トップレベルメニュー110に戻る。表示されず、または促されず、このポイントで利用可能な1つのコマンドは「スリープ」コマンドである。ユーザが「スリープ」コマンドを発行する(状態840)場合には、VRは現在の語彙セットになされたいかなる変化も保存し(状態842)、それからトップレベルメニュー110に戻る。
【0074】
図15Aを参照すると、ユーザは音声コマンドを使用して着信に応えることができる。電話機が着信を受けるとき、VRは最初に電話機が自動応答モードにあるか否かをチェックする(状態1010)。電話機が自動応答モードにある場合には、VRはユーザの応答を受ける必要がない(状態1012)。代わりに、VRがないかのように電話機自動応答が動作する。
【0075】
次に、VRは基本トレーニングが完了しているか否かを知るためにチェックする(状態1002)。基本トレーニングがなければ、VRはユーザの音声コマンドを認識することができない。したがって、基本トレーニングが行われていない場合には、システムは状態1004に進み、電話機はVR返答を開始しない。代わりに、電話機はVRがないかのように単にベルを鳴らす。基本トレーニングが既に実行されている場合には、VRの応答は着信がローミング通話かどうかに依存する。着信がローミング通話でない場合には、状態1008においてVRは短いベル音を発し、それから「着信です。応答しますか?」と言う。着信がローミング通話である場合には、状態1008においてVRは短いベル音を発し、「ローミング着信です。応答しますか?」と言う。話されるプロンプトとは無関係に、VRはプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。
【0076】
図15Bを参照すると、VRは状態1020においてユーザ応答を待つ。ユーザが応答しない場合には、VRは状態1032に進み、プロンプトが2回繰り返されたか否かを見る。プロンプトが2回繰り返されていなかった場合には、状態1030においてVRは「(ローミング)着信です」と言う。着信がローミング通話である場合には、VRは語「ローミング」と言うだけである。その後、VRはブロック1020に戻り、ユーザ応答を待つ。プロンプトが2回繰り返された後にユーザが依然として応答しない場合には、VRは「ミス通話」と言う(状態1034)。その後、VRは待機102に戻る。
【0077】
ユーザがVR着信プロンプトの何れかに対して「はい」または「応答」と応答した場合には、または通話に応えるように構成されているキーのうちの何れかを押す(状態1022)場合には、電話機は着信に返事する(状態1026)。その後、VRは通話応答音1036を鳴らし、通話が返答されたことをユーザに示す。
【0078】
代わりに、ユーザがVR着信プロンプトに対して「いいえ」と応答する場合には、またはユーザが着信アラートを沈黙させるように構成されているキーのうちの何れかを押す(状態1024)場合には、通話は応答されず、さらなるアラートはこの特定の通話に対して提供されない(状態1028)。
【0079】
VRがSTSまたは拒否を検出する(状態1040)場合には、VRは状態1042に進み、「はいと言いましたか?」と言う。ユーザが「いいえ」と応答する(状態1046)場合には、VRは状態1048に進み、着信アラートを停止する。ユーザが「はい」と応答する(状態1050)場合には、VRは着信に応答し(状態1052)、それから通話応答音1036を鳴らす。他のSTSまたは拒否が生じる(状態1044)場合には、VRはポイント1006に戻り、着信プロンプトを繰り返す。
【0080】
図16を参照すると、VRは速く話し過ぎる(STS)ルーチン1100を組み込んでおり、ユーザ応答が速過ぎる、またはVRプロンプトに部分的に重なる場合を取り扱う。STSルーチンが適切でなかった場合には、VRは入力拒否を増加する。その理由は応答ウィンドウが開いている間に生じるユーザ応答の一部のみをVRが解析するからである。STSが生じるとユーザ応答の一部だけが解析されるので、VRはユーザによって話される語を信頼性高く決定できない。STSルーチンはユーザ応答が要求される殆どすべての場合に適切である。標準STSルーチンが使用されない場合には、VRは一般的にSTSルーチンの修正バージョンを組み込んでいる。STSルーチン1100はVRがユーザに対して応答を入力するように促す場合にアクティブとなる(状態1102)。一般的にVRはプロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。VRがSTSを検出する(状態1104)場合には、VRは状態1106に進み、ここでは、ユーザに応答させるためにSTS発声後1秒間VRは沈黙したままである。その後、VRは状態1120に進み、前のプロンプトを繰り返す。VRは再びプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。VRは状態1108において有効なユーザ応答を待つ。ユーザが有効な応答を提供する場合には、VRは状態1110に進み、機能のコマンドを遂行する。VRが他のSTSのために、話された語を決定できない場合には、システムは状態1122において1秒間沈黙したままである。再び、VRは前のプロンプトを繰り返し(状態1132)、再びプロンプト音106を鳴らす。第2プロンプト後に他のSTS、拒否がある場合には、またはユーザ応答がない(状態1124)場合には、VRはユーザを訂正しようとしない。代わりに、VRはアクティブ機能をキャンセルし、トップレベルメニュー110に戻る。ユーザがSTSまたは拒否を行わないで応答する(状態1126)場合には、VRはそのコマンドで進み(状態1130)、STSルーチンを利用した機能のポイントに戻る。
【0081】
図17を参照すると、VRはシステムタイムアウト機能1200を組み込んでおり、VRがユーザ応答を要求し、何も受け取らない場合を取り扱う。ユーザ応答がないとき、システムタイムアウト機能1200はアクティブ機能をキャンセルするよりも、応答する他の機会をユーザに与える。VRは大半のプロンプトに対してシステムタイムアウト機能1200を使用するが、ときには、特に機能フローチャートにおいて入力タイムアウトを取り扱う。VRは、システムタイムアウト機能1200がアクティブであるさまざまな場合で、初期プロンプトとプロンプト音106を提供する(状態1202)。ユーザには2秒応答ウィンドウが与えられる(状態1204)。ユーザが応答する場合には、VRは状態1206に進み、コマンドを実行し、機能に戻る。ユーザが2秒応答ウィンドウ内に応答しない場合には、VRは初期プロンプトを繰り返し(状態1210)、プロンプト音106を繰り返す。再び、ユーザには2秒応答ウィンドウが与えられる(状態1212)。ユーザが応答する場合には、VRは状態1206に進み、コマンドを実行し、機能に戻る。ユーザが第2のプロンプトに応答するのに失敗した場合には、VRはポイント120に進み、待機102に向けてVRを出る。
【0082】
図18を参照すると、VRは、問い合わせに対するユーザの沈黙を「はい」応答として処理する暗黙はい/いいえ装置1300を組み込んでいる。この暗黙はい/いいえ装置1300は、VRがユーザから「はい」応答を期待するときにユーザインターフェースにおいて選択的に使用される。一般的に暗黙はい/いいえ装置1300は、VRがユーザからのコマンドを受け取り(状態1302)、それからコマンドの肯定を得ようとする(状態1304)場合に使用される。1.5秒ユーザ応答ウィンドウ(示されていない)では、潜在的ユーザ応答は、沈黙(状態1310)、「はい」(状態1320)、「いいえ」(状態1330)、およびSTSまたは拒否(状態1340)を含む。ユーザが沈黙である(状態1310)場合には、VRはこれを暗黙のはいと考える(状態1312)。VRは状態1314に進み、この機能を行う。ユーザが「はい」と応答する(状態1320)場合には、システムはこの機能を行う(状態1322)。ユーザが「いいえ」と応答する(状態1330)場合には、機能は状態1332においてキャンセルされ、VRはトップレベルメニュー110に戻る。応答がSTSまたは拒否であれば(状態1340)、VRは状態1342に進み、「はいと言いましたか?」と言うことにより、ユーザを促す。VRはプロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。その後、ユーザには他の応答ウィンドウが与えられる。上述のように、ユーザが「はい」と応答する(状態1346)場合には、システムは機能を行う(状態1346)。同様に、ユーザが「いいえ」と応答する場合には、またはユーザ応答が他のSTSまたは拒否である(状態1350)場合には、機能はキャンセルされ(状態1352)、そしてVRはトップレベルメニュー110に戻る。
【0083】
好適実施形態の先の記述は当業者がこの発明を製造または使用できるように提供されている。これら実施形態の種々変形は当業者には容易に明らかであり、ここで定義されている一般的原理は発明力を使用しないで他の実施形態に適用できる。故に、この発明はここで示された実施形態に限定されるものではないが、ここに開示された原理および新規特徴と一致する最大範囲に与えられるべきである。
【図面の簡単な説明】
【図1】
ユーザと、ハンドセットの受け台またはハンズフリーキット内の電話機とを示す図。
【図2A】
他のすべての機能へのアクセスを提供するトップレベル機能を示すフローチャート。
【図2B】
他のすべての機能へのアクセスを提供するトップレベル機能を示すフローチャート。
【図3A】
通話を発信するためのインターフェースをユーザに提供する通話機能を示すフローチャート。
【図3B】
通話を発信するためのインターフェースをユーザに提供する通話機能を示すフローチャート。
【図4A】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図4B】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図4C】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図5】
入力された電話番号をクリアするために通話機能内で使用される連続クリア機能を示すフローチャート。
【図6】
本発明のトップレベル機能内にある隠れエキスパートメニューを示すフローチャート。
【図7A】
ユーザが電話番号に関係する名前を言えるようにすることによって通話発信を行う名前機能を示すフローチャート。
【図7B】
ユーザが電話番号に関係する名前を言えるようにすることによって通話発信を行う名前機能を示すフローチャート。
【図8】
「リダイヤル」と言うことによって、最後に呼び出した通話の番号をユーザがリダイヤルできるようにするリダイヤル機能を示すフローチャート。
【図9A】
ユーザが電話番号エントリの音声ブックを編集できるようにする音声ブック機能を示すフローチャート。
【図9B】
ユーザが電話番号エントリの音声ブックを編集できるようにする音声ブック機能を示すフローチャート。
【図10A】
ユーザが名前および電話番号をVRの音声ブックに追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図10B】
ユーザが名前および電話番号をVRの音声ブックに追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図10C】
ユーザが名前および電話番号をVRの音声ブックに追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図11A】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図11B】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図11C】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図12A】
ユーザが特定のトレーニング機能にアクセスするのに利用する、トレーニング機能を示すフローチャート。
【図12B】
ユーザが特定のトレーニング機能にアクセスするのに利用する、トレーニング機能を示すフローチャート。
【図13A】
音声認識ユーザインターフェースの完全な機能にアクセスするために実行されなければならない完全トレーニング機能を示すフローチャート。
【図13B】
音声認識ユーザインターフェースの完全な機能にアクセスするために実行されなければならない完全トレーニング機能を示すフローチャート。
【図14A】
ユーザが基本および数字の語彙セット内の語のサブセットのみを再トレーニングすることができるようにする、トレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図14B】
ユーザが基本および数字の語彙セット内の語のサブセットのみを再トレーニングすることができるようにする、トレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図14C】
ユーザが基本および数字の語彙セット内の語のサブセットのみを再トレーニングすることができるようにする、トレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図15A】
ユーザが完全なハンズフリーモードで通話に応答できるようにする着信応答の特徴を示すフローチャート。
【図15B】
ユーザが完全なハンズフリーモードで通話に応答できるようにする着信応答の特徴を示すフローチャート。
【図16】
ユーザの音声入力が要求されたときに利用される速く話し過ぎる機構を示すフローチャート。
【図17】
ユーザがVRシステムによるプロンプトに適時に応答しなかったときに生じるシステムタイムアウトの処理を示すフローチャート。
【図18】
はい/いいえのユーザ応答が要求されたときに利用されることがある暗黙のはい/いいえデバイスを示すフローチャート。
【発明の名称】電話ハンドセットの音声認識ユーザインターフェース
【特許請求の範囲】
【請求項1】
電話機用の音声認識ユーザインターフェースを提供する方法において、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供することと、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供することと、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供することと、
対応するリスト機能コマンド語をユーザが言った場合、前記音声認識電話帳中のエントリを前記ユーザに対して読み返す前記音声ブック機能を提供することと、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供することとを含む方法。
【請求項2】
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供することをさらに含み、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項1記載の方法。
【請求項3】
前記音声ブック機能内に追加機能と削除機能とを提供することをさらに含み、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項1記載の方法。
【請求項4】
トレーニング機能を提供することをさらに含み、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項1記載の方法。
【請求項5】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに含む請求項1記載の方法。
【請求項6】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項5記載の方法。
【請求項7】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項6記載の方法。
【請求項8】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項7記載の方法。
【請求項9】
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供することをさらに含む請求項1記載の方法。
【請求項10】
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供することをさらに含む請求項1記載の方法。
【請求項11】
プロセッサにおける実行時に、前記プロセッサに、電話機用の音声認識ユーザインターフェースを提供させる命令を含むコンピュータ読取り可能な媒体において、
前記命令が、前記プロセッサに、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供させ、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供させ、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供させ、
対応するリスト機能コマンド語を前記ユーザが言った場合、前記音声認識電話帳中のエントリを前記ユーザに対して読み返す前記音声ブック機能を提供させ、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供させるコンピュータ読取り可能な媒体。
【請求項12】
前記命令は、実行時に前記プロセッサに、
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供させ、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項11記載のコンピュータ読取り可能な媒体。
【請求項13】
前記命令は、実行時に前記プロセッサに、
前記音声ブック機能内に追加機能と削除機能とを提供させ、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項11記載のコンピュータ読取り可能な媒体。
【請求項14】
前記命令は、実行時に前記プロセッサに、
トレーニング機能を提供させ、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項11記載のコンピュータ読取り可能な媒体。
【請求項15】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに含む請求項11記載のコンピュータ読取り可能な媒体。
【請求項16】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項15記載のコンピュータ読取り可能な媒体。
【請求項17】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項16記載のコンピュータ読取り可能な媒体。
【請求項18】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項17記載のコンピュータ読取り可能な媒体。
【請求項19】
前記命令は、実行時に前記プロセッサに
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供させることをさらに含む請求項11記載のコンピュータ読取り可能な媒体。
【請求項20】
前記命令は、実行時に前記プロセッサに、
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供させる請求項11記載のコンピュータ読取り可能な媒体。
【請求項21】
電話機用の音声認識ユーザインターフェースを提供する装置において、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供する手段と、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供する手段と、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供する手段と、
対応するリスト機能コマンド語をユーザが言った場合、前記音声認識電話帳中のエントリをユーザに対して読み返す前記音声ブック機能を提供する手段と、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供する手段とを具備する装置。
【請求項22】
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供する手段をさらに具備し、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項21記載の装置。
【請求項23】
前記音声ブック機能内に追加機能と削除機能とを提供する手段をさらに具備し、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項21記載の装置。
【請求項24】
トレーニング機能を提供する手段をさらに具備し、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項21記載の装置。
【請求項25】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに具備する請求項21記載の装置。
【請求項26】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項25記載の装置。
【請求項27】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項26記載の装置。
【請求項28】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項27記載の装置。
【請求項29】
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供する手段をさらに具備する請求項21記載の装置。
【請求項30】
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供する手段をさらに具備する請求項21記載の装置。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は通信および電気通信デバイスに関する。特に、本発明は新規かつ改良された音声認識ユーザインターフェース、および携帯電話機で使用する関連した方法、および関連したハンズフリー電話付属物に関する。
【0002】
【関連技術の説明】
ユーザインターフェースは前進する発展の分野を表わし続ける。技術革新は、セルラ電話機のような消費者操作デバイスが無数のメニューオプションを通してユーザにアクセス可能な非常に多くの機能を持つことを可能にする。セルラ電話機は一般的にLCDディスプレイを組み込んでおり、ユーザプロンプトおよびメニューオプションを示す。セルラ電話機はまた、その機能がアクティブメニューによって変化するソフトキーを組み込んでいる。ソフトキー機能は一般的にLCDディスプレイに表示される。セルラ電話機は一般的に、普通に呼び出す番号のユーザ定義電話帳を記憶する能力、単一ボタンの最後の番号のリダイヤル能力、前に呼び出した番号メモリ、および発呼者電話番号識別子を含む多くの特徴を組み合わせる。さらに、小さな手持ち型セルラ電話機は一般的に、ユーザがそれを手に持つ必要なく、ユーザの自動車で電話機を操作できるようにするハンズフリーカーキットアダプターのような付属物と結合することができる。
【0003】
電話機を保持する必要なく電話機を操作する能力はいくつかの欠点をもたらす。ユーザは依然として電話機ディスプレイでプロンプトを見ることを要求され、かつ番号をダイヤルすることを要求され、手動キーストロークで電話機の名簿を検索することを要求される。これは電話機で利用可能な種々のメニューを駆動すると同時にナビゲーションを試みているユーザに対して妨害を与えることになる。本発明は、完全なハンズフリーダイヤリングを可能にする音声認識ユーザインターフェースを電話ハンドセットまたはハンズフリーキット(HFK)に組み込むことによりこれらの問題を解決する。加えて、本発明の方法は、音声認識を利用する付加的な機能を提供する。音声認識ユーザインターフェースは、ユーザに要求される手動キーストロークの数を非常に最小化するため、標準電話ユーザインターフェースとともに使用される。
【0004】
【発明の概要】
本発明は、音声認識強化された電話ユーザインターフェースを実現する新規かつ改良された方法および装置である。方法は、音声認識を通して完全なダイヤリング機能アクセス可能性をユーザに許容するために開示される。これは、ユーザが真のハンズフリー電話インターフェースを持つことを可能にする。
【0005】
音声認識ユーザインターフェースはマイクロプロセッサで実行するソフトウエアコード、またはハードワイヤードデバイスとして実現されてもよい。音声認識装置(VR)は、ユーザと音声認識能力を持つ電話機との間のインターフェースを達成するプロセスおよび方法として記述する。音声認識プロセスそれ自体の詳細はこの出願の主題ではなく、議論しない。この出願は、ユーザと音声認識能力が提供された電話機との間のインターフェースのみを取り扱う。
【0006】
好ましい実施形態において、方法が開示され、「起きろ」のような起動用語を2回言うか、ハンドセットキーを押すかにより、ユーザが待機電話モードから音声認識モードに入ることができる。以下に詳述する好ましい実施形態では、方法はまず、初期音声トレーニングが前もって行われているかを見るためにチェックする。音声トレーニングが前もって行われていたのであれば、好ましい方法はトップレベルメニューに続く。しかし、音声トレーニングがまだ行われていないのであれば、方法はトレーニングメニューを開始する。
【0007】
好ましい方法は、トレーニングを要求する2つの語彙セット、基本セットおよび数字セットを含む。基本セットはユーザコマンド用語を含み、他方、数字セットはキーパッドおよびダイヤリング機能に関係する語を含む。好ましい方法において、ユーザはトレーニングされている語彙セット中の連続する語を言うように電話機により促される。ユーザは語を繰り返すように促され、そして音声認識装置が語の両発声の一致を決定すると、音声認識装置はその語を保存する。トレーニング方法は、現在の語彙セット中のすべての語がトレーニングされるまで続く。
【0008】
トップレベルメニューにおいて、好ましい方法は、ユーザが、4つの機能に対して音声コマンドアクセスすることを可能にし、および「スリープ」と言うことにより音声認識装置(VR)から抜け出す能力を可能にする。トップレベルメニューにおいて、方法はユーザがコマンド「リダイヤル」、「通話」、「音声ブック」を開始すること、または音声認識装置電話帳に以前に保存された名前を言うことを可能にする。トップレベルメニューでの可能な音声コマンドの各々、「リダイヤル」、「通話」、「音声ブック」または名前は、好ましい方法において、対応している機能を開始するであろう。
【0009】
好ましい方法のリダイヤル機能は、音声コマンドを通して、ダイヤルされた最後の番号に対してユーザが通話を発信できるようにする。
【0010】
通話機能は、音声認識装置電話帳内の名前を言うことにより、または音声コマンドを通して電話番号が入れられかつ発信できるようにする番号機能に入ることにより、ユーザが音声コマンドを使用して電話通話を発信することを可能にする。通話機能において、方法は最初に、数字セットトレーニングが完了されているかを見るためにチェックする。方法はそれから、音声認識装置(VR)電話帳に何らかのエントリがあるか見るためにチェックする。数字セットトレーニングが完了されていなくて、VR電話帳が空である場合には、方法はそのステータスをユーザに報告し、VRモード内のトップレベルメニューに戻るようにVRに指示する。VR電話帳が空でない限り、VRは名前を入力するようにユーザを促すであろう。ユーザが名前を話すと、VRは名前機能を開始する。数字セットトレーニングが完了されている場合には、ユーザは「番号」を言うことにより番号機能に付加的にアクセスできる。数字セットトレーニングが完了されていない場合には、好ましい方法では番号機能はアクセス可能ではない。逆に、番号機能は、数字セットトレーニングが完了されており、かつVR電話帳が空である場合に利用可能な唯一の機能である。
【0011】
番号機能において、方法は電話番号の数字を言うこと、または「通話」または「照合」を要求するようにユーザを促す。ユーザは、長さ32桁まで、一時に1つの数字で電話番号を入れることが許される。方法は、「クリア」と言うことにより、間違って入れられた数字を一時に1つユーザが削除することを可能にする。クリアコマンドは最後に入れられた数字が削除されるようにする。好ましい方法はまた、「照合」と言うことにより、入れられた電話番号をユーザが照合することを可能にする。ユーザが「照合」を命令する場合には、VRは入れられた数字を読み戻し、それからさらに数字を入れるように促すことが続く。これは、すべての電話番号の入力を完了する前に入れられた数字をユーザが照合することを可能にする。通話を発信する前に入れられた電話番号を照合するために、「照合」コマンドを同様に、使用することができる。数字が最初に入れられた後、ユーザは「通話」を言うことにより電話通話を発信できる。
【0012】
方法により組み込まれた名前機能は、ユーザが電話番号に関係する名前を言うことによりVR電話帳中の電話番号を再呼び出しできるようにする。トップレベルメニューまたは通話機能において、ユーザが名前を言うと、VRはVR電話帳中の複数の名前がその名前に一致するかを見るためにチェックする。VR電話帳中の複数の名前がユーザ要求名前と一致する場合には、VRはその一致した名前のリストを編集し、最も良く一致するものが要求されたものであったか否かをユーザに尋ねる。ユーザが同意しないのであれば、VRは次に最も良く一致するものが要求されたものであったか否かを尋ねることを続ける。ユーザが一致に同意するまで、または、VRが一致エントリのリストを使い尽くすまで、VRはこのループを続ける。VRが一致エントリのリストを使い尽した場合には、VRは名前機能を取り消し、トップレベルメニューに戻る。ユーザが一致したもののうちの1つに同意する場合には、VRはこれが一致した唯一の名前であるかのように続ける。ただ1つの名前が一致するのであれば、VRは通話するための名前の肯定を要求する。ユーザが肯定する場合には、VRから出て、通話が発信される。ユーザが肯定しない場合には、VRは名前機能を取り消し、トップレベルメニューに戻る。
【0013】
好ましい方法は音声ブック機能がトップレベルメニューでアクセスできるようにする。いくつかの機能は音声コマンドを通してアクセスできる一方、他の機能へのアクセスはハンドセットキーパッドによるユーザ入力を要求する。音声ブック機能に入るとき、VRは「追加」、「削除」、「リスト」を言うこと、またはキーパッドオプションから選択するようにユーザを促す。
【0014】
リスト機能はVR電話帳を通してユーザがブラウジングすることを可能にする。音声ブックメニューの「リスト」をユーザが言うことに応答して、VRはVR電話帳が空であるか否かを見るためにチェックする。VR電話帳が空である場合には、そのときブラウジングするエントリはない。VR電話帳が空でない場合には、VRはVR電話帳中の名前を読み、最後のエントリに到達するまで、またはVRがユーザにより中断されるまで続く。
【0015】
ユーザは「追加」と言って、VR電話帳に追加をする。VRの電話帳が一杯でない場合には、VRは追加する名前をユーザに尋ねる。ユーザが名前を言うと、VRはユーザにその名前を繰り返すように促す。ユーザが名前を繰り返した後に、VRは最初に新しい名前がコマンド語の1つに一致していないことを見るためにチェックする。名前がコマンド語に一致している場合には、ユーザは、この名前に近いコマンド語が伝えられるか、または別の名前を言うように命令される。次にVRは追加機能の名前入力ループの始めに向けられる。名前がコマンド語のうちの1つに一致していない場合には、VRは名前の両方の発声が一致しているかを見るためにチェックする。2つの語が一致していない場合には、VRはユーザに一致が不成功であり、再び試みるように伝える。一致が不成功であった後に、VRは追加機能の最初のプロンプトに戻る。一致の成功に続いて、VRは、(VRの電話帳ではなく)ハンドセットの電話帳が何らかのエントリを含んでいるか否かを見るためにチェックする。ハンドセットの電話帳が空である場合には、VRはユーザにキーパッドを使用して電話番号を入力するように命令する。ユーザが電話番号の入力を完了すると、VRはユーザに名前がVR電話帳に追加されたことを伝える。VRは名前を保存し、音声ブック機能に戻る。ハンドセットの電話帳が空でない場合には、VRは、ユーザがキーパッドを使用して電話番号を入力するか、ハンドセットの電話帳をスクロールして、番号を見付け、名前に割り当てる。ハンドセットの電話帳をスクロールするか、またはキーパッドで入力することによって電話番号を入力すると、ユーザは「追加」キーを押して、VR電話帳中にこの電話番号を保存する。次にVRはユーザに、名前がVR電話帳に追加されたことを伝える。VRは電話番号を保存し、音声ブック機能に戻る。
【0016】
ユーザは、音声ブック機能において「削除」と言うことによって、削除機能に入る。VRは最初に、VR電話帳にエントリがあるか見るためにチェックする。VR電話帳にエントリがある場合には、VRはユーザに削除する名前を尋ねる。さらに加えて、電話機上のソフトキーは「次へ」を示す。ユーザが名前で応答する場合には、VRは最初に、VR電話帳中の複数の名前が一致しているか否かを見るためにチェックする。複数の名前が一致している場合には、VRは一致している名前のリストを編集し、最も良く一致しているものを決定し、最も良く一致しているものがユーザによって発話されたものであるか否かをユーザに尋ねる。ユーザが「いいえ」と答えると、VRは、次に最も良く一致しているものを使用して要求を繰り返す。これは、一致している名前のリストをすべて使い尽くすまで、またはユーザがその一致に同意するまで繰り返される。一致している可能性のあるすべての名前を使い尽くしても、一致を見付けられなかった場合には、VRは削除機能のトップに戻る。ユーザが一致に同意すると、VRはメモリから名前および電話番号を削除し、名前が削除されたことをユーザに伝える。VR電話帳中の1つの名前のみが一致する場合には、VRはその名前が削除する名前であるか否かをユーザに尋ねる。ユーザが「はい」と答えると、VRは名前を削除することをユーザに伝え、トップレベルメニューに戻る。ユーザが「いいえ」と答えると、VRは削除機能のトップに戻る。
【0017】
電話機上の「次へ」のソフトキーが押されると、VRはVR電話帳から次の名前を検索し、それが削除する名前か否かをユーザに尋ねる。VRは、ユーザが最初に名前を言ったかのように同じやり方でプロセスを継続する。
【0018】
音声ブック機能のトップのキーパッドオプションは、ユーザがVRブックのエントリをクリアする選択をできるようにする。クリアブックオプションは頻繁に使用されないので、キーパッド機能としてのみ提供される。クリアブック機能はすべてのVR電話帳のエントリをクリアする。
【0019】
トレーニング機能は、基本セットのトレーニング、数字セットのトレーニング、または再トレーニングに対応する別のキーパッドオプションを提供する。基本セットのトレーニングおよび数字セットのトレーニングについては、上で概略的に記載したが、以下の詳細な説明でさらに説明する。再トレーニング機能は、基本セットまたは数字セットの部分のみを再トレーニング可能にする。ユーザは、基本セットまたは数字セットに関係するキーを選択するように促される。ユーザがこの選択を行うと、VRは対応する語彙セットから最初の語を検索し、これが再トレーニングすべき語であるか否かをユーザに尋ねる。ユーザが同意する場合には、VRは語を再トレーニングするようにユーザに命令し、再トレーニングに続いて、語彙セットから次の語を検索し、すべての語を使い尽くすまで、このプロセスを繰り返す。語が再トレーニングすべきものであるか否かを尋ねられた場合には、ユーザが「いいえ」と応答すると、VRは語彙セット中の次の語に進み、この新しい語で質問を繰り返す。ユーザはこれらの語を再トレーニングすることを実際に選択するかどうかにかかわらず、語彙セット中の語のすべてが質問されると、再トレーニングが完了し、トップレベルメニューに戻ることをVRはユーザに伝える。
【0020】
ハンズフリーモードで着信に応答する能力は、ハンズフリーモードで通話を開始する能力と同じくらい重要である。この方法は、音声で命令された通話応答を可能にする特徴を組み込むことによってこれを取り扱う。着信があるとき、VRは、着信があることをユーザに伝え、通話に応答するか否かをユーザに尋ねる。ユーザが「はい」と応答する場合には、通話は応答される。ユーザが「いいえ」と応答した場合には、この着信に対する別の通話音声アラートはない。
【0021】
本発明の特徴、目的、および利点は、同じ参照符号が全体を通して対応したものを識別している図面を考慮に入れると、以下の詳細な説明から、より明白になるであろう。
【0022】
【好ましい実施形態の詳細な説明】
さまざまな図中のブロックは、インターフェースの状態、プロセスのステップ、または、ブロックの対応する機能を実現するのに必要とされるハードウェアのブロックを表していると考えることができる。
【0023】
図1を参照すると、音声認識ユーザインターフェースの新規の特徴には、音声入力80のみを使用して電話機10に命令する、ユーザ70の能力が含まれている。好ましい実施形態において、電話機10は、ハンズフリーキット20内のセルラハンドセットである。電話機10がハンズフリーキット20内に受け入れられているとき、電話機とハンズフリーキット(示されていない)との間のインターフェースは、RF、制御、オーディオ信号がハンズフリーキットを通過できるようにする。典型的なセルラ電話機は、ディスプレイ152とともに、ディスプレイ152上に示された異なる機能を操作するソフトキー30も備えている。さらに、一般に参照されるような、電話機またはハンドセット10は、キーパッド50とともに、ユーザの音声入力80を受け取るマイクロホン60も有している。電話機の機能性は、プログラムコードを受け取りメモリ40に情報を記憶する、電話機内のマイクロプロセッサによって制御されている(電話機の外には表われていない)。
【0024】
図2Aを参照すると、移動電話機は、番号がない状態待機102にあるとき、典型的には、電話機のディスプレイ152は、見出し140、現行のシステムの日付と時間142、現行のソフトキーの選択144、146のような情報を示す。音声認識装置(VR)は、スリープモードにある。ユーザは、音声で命令される電話機の機能を可能にするために、音声認識装置を始めることができる。ユーザは、ステップ103において、エンドキーを押すか「起きろ」という用語を2回言うことによって、スリープモードから出て、VRアクティブモードに入ることができる。この時点で、ステップ104において、VRは、初期トレーニングが行われているか否かを見るためにチェックする。もし行われていなければ、VRは、完全トレーニング700に進む。もし多少の初期トレーニングが行われている場合には、VRは、隠れエキスパートメニュー600に進む。隠れエキスパートメニュー600は、ユーザにトップレベルメニューと同じ機能性を可能にするが、ユーザは、トップレベルメニューのプロンプトを待つ必要がない。1.5秒間のみアクティブである隠れエキスパートメニュー600は、後で詳しく説明する。隠れエキスパートメニュー600後の時点は、トップレベルメニューの状態110を表し、トップレベルメニューの状態110は、他のメニューおよび機能のプロセスの完了または取り消しに続いて、他のメニューおよび機能が戻るところである。トップレベルメニューの状態110において、VRは、ユーザに対して、ステップ108で、「通話、リダイヤル、音声ブック、またはスリープ」と言う。また、VRは、プロンプト音も鳴らす。ハンドセット上のディスプレイ152は、音声認識がオンになっていることを示す。さらに、ハンドセットは、900(図12Aおよび図12B)に示されるようなトレーニング機能にアクセスするために、トレーニングソフトキー150が利用可能であることを示す。
【0025】
図2Bを参照すると、プロンプト音106を鳴らした後に、VRは状態112に進み、タイムアウトまでユーザの音声入力を待つ。VRが状態112でタイムアウトした場合には、VRはトップレベルメニュー110に戻り、「通話、リダイヤル、音声ブック、またはスリープモード」と言うことによって、状態108において、再びユーザを促す。VRは再びプロンプト音を鳴らす。次に、VRはブロック112に戻り、再びユーザの音声入力を待つ。ユーザは、4つのコマンドのうち1つを言うか、または、VR電話帳のエントリ名を言うという選択肢を有する。利用可能なコマンドは、リダイヤル、通話、音声ブック、スリープである。ステップ122のリダイヤル、ステップ126の通話、ステップ128の音声ブックのコマンドが、VRに、対応する機能200、400、500を開始させる。これらの各々は、以下で詳述する。同様に、ユーザがVR電話帳にある名前を言う場合には、名前機能300が開始される。ステップ130において、ユーザが音声コマンド「スリープ」を言うか、または、任意のキーを押すと、VRは抜け出て、待機またはスリープモードに戻る。出口プロセスを開始する状態が、図1に、120のように示されている。VRは、状態132で、「音声認識装置はスリープ中です」と言い、出口音134を鳴らす。ハンドセットディスプレイ152は、「音声認識装置はスリープ中です」と表示する。次に、VRは、待機状態102に戻る。
【0026】
図3Aを参照すると、トップレベルメニュー110または隠れエキスパートメニュー600で、ユーザが「通話」コマンドを発声した後に、通話機能400に入る。通話機能400に入った直後、ユーザは、約1.5秒の間、隠れエキスパートウィンドウが開いている状態402にされる。この隠れエキスパートウィンドウ402は、トップレベル機能100において利用可能な隠れエキスパートメニュー600とは異なっている。この、状態402での隠れエキスパートウィンドウは、プロンプトを待つ必要なく、ユーザがすべての通話機能コマンドにアクセスできるようにする。ユーザが1.5秒ウィンドウ以内でコマンドを開始させない場合には、通話機能は状態404に進み、ここでVRは数字トレーニングが完了されているかどうかを調べる。次に、通話機能は、数字トレーニングが完了されているかどうかに応じて、状態406(図3B)または状態408に進む。状態406および408の両方において、VRは、VR電話帳に何らかのエントリがあるかどうかを調べる。
【0027】
VR電話帳にエントリがなく、数字セットトレーニングが完了されていない場合には、通話機能は状態434に進む。VRは、「音声ブックが空です」と言い、次に、通話機能を出て、トップレベルメニューの状態110に戻る。これは、数字セットトレーニングが実行されておらず、VR電話帳にエントリがない場合には、ユーザが通話機能のコマンドにアクセスできないために起こる。
【0028】
数字セットトレーニングは実行されていないが、VR電話帳が空でない場合には、「番号」コマンドは、ユーザにアクセスできないが、「名前」コマンドは、利用可能である。このような状況下で、通話機能の流れは、状態410に進む。VRは、「名前を話すか、または通話機能を出るためにはクリアと言って下さい」と言う。VRは、プロンプト音106を鳴らし、状態418に進んで、ユーザの入力を待つ。ユーザの入力前に状態418でタイムアウトが起こった場合には、VRは状態420に進み、ここでVRは前のプロンプトが繰り返されているかどうかを調べる。プロンプトが繰り返されていない場合には、VRは状態410に戻る。プロンプトが既に繰り返されていた場合には、VRは状態120に進み、機能をVRから出させる。
【0029】
図3Bを参照すると、VR電話帳にエントリがないが数字セットトレーニングは完了されている場合には、通話機能は状態430に進む。VRは、「音声ブックは空です」と言い、番号機能1400(図4A)の状態1420に進む。VR電話帳にエントリがないため、ユーザは、「名前」コマンドを使用できず、「番号」コマンドのみが使用可能である。したがって、機能の順序は、番号のプロンプトに直接流れる。
【0030】
数字セットトレーニングが完了されており、VR電話帳にエントリがある場合には、ユーザは、通話機能内のすべてのコマンドにアクセス可能である。通話機能の流れは状態412に進み、ここで、VRが「名前を話すか、言葉番号を言うか、通話機能を出るためにはクリアと言って下さい」と言う。VRは、プロンプト音106を鳴らし、状態414に進んで、ユーザの入力を待つ。ユーザが入力する前に状態414でタイムアウトが起こった場合には、VRは状態416に進み、ここでVRは前のプロンプトが繰り返されたかどうかを調べる。プロンプトが繰り返されていない場合には、VRは状態412に戻る。プロンプトが既に繰り返されていた場合には、VRは、状態120に進み、機能をVRから出させる。
【0031】
ユーザが状態414、418で提供される第1または第2の応答ウィンドウのいずれかで応答する場合には、通話機能の流れは、ユーザが状態426で「番号」、状態422で「クリア」と命令するか、状態424でVR電話帳にある名前を話すかのいずれかであるかに応じて、3つの方法のうち1つに進む。ユーザが状態424でVR電話帳にある名前を話す場合には、VRは名前機能300に進む。ユーザが状態422で「クリア」と言うかまたはクリアキーを押す場合には、VRは、通話機能をキャンセルし、トップレベルメニュー110に戻る。
【0032】
図4Aを参照すると、ユーザが状態426で「番号」と言う場合には、VRは番号機能1400に進む。番号機能1400において、最初にVRは状態1416を提供し、ここで、隠れエキスパートウィンドウが1.5秒間利用可能である。この隠れエキスパートウィンドウ1416は、隠れエキスパートメニュー600または他機能の任意の隠れエキスパートウィンドウとは別個であり、独立したものである。この隠れエキスパートウィンドウ1416において、ユーザは、状態1422のプロンプトを聞く前に、言葉で任意の番号機能コマンド入力を行うことが可能である。隠れエキスパートウィンドウ1416がタイムアウトした場合には、VRは番号のプロンプトの状態1422に進む。状態1422に至るポイント1420は、VR電話帳にエントリはないが数字セットトレーニングは完了されているときに、VRが通話機能から進むところである。状態1422において、VRは、「数字を一度に1つ言って下さい。終了したときは、通話または照合と言って下さい」と言うことによってユーザを促す。VRは、プロンプト音106を鳴らし、次に、ブロック1424に進んで、ユーザの入力を待つ。入力タイムアウト前にユーザが応答しない場合には、VRは状態1428に進み、前のプロンプトが5回繰り返されていたかどうかを調べる。プロンプトが既に5回繰り返されていた場合には、番号機能は状態120に進み、VRモードを出る。プロンプトが5回繰り返されていない場合には、VRは状態1422に戻る。ユーザが状態1424で入力タイムアウト前に応答する場合には、VRは、ユーザの入力がコマンド語または数字であるかどうかを調べる。
【0033】
コマンドが「照合」である場合(状態1454)には、状態1458においてVRは、ダイヤルされるべき番号を読み上げる。そして、VRは、隠れエキスパートウィンドウ1416に戻るポイント1410に進む。
【0034】
図4Aの下部および図4Bを参照すると、状態1430においてユーザが数字を言うと、状態1432においてVRは、数字の最大数がすでに入力されているかどうかを認識してチェックする。すでに入力された数字の数が数字の最大数と等しい場合には、1438の状態においてVRは、「最大数の長さになりました。終了したときは、通話または照合と言って下さい」と言う。そして、VRはポイント1410に進み、次のユーザ入力を待つために隠れエキスパートウィンドウ1416に戻る。数字の最大数が入力されていない場合には、状態1434においてVRは、ユーザによって言われた番号を繰り返す。そして、VRはポイント1410に進み、ここで、さらにユーザの入力を待つために、隠れエキスパートウィンドウ1416に戻る。
【0035】
状態1422のプロンプトに対するユーザ応答が「スリープ」である場合(状態1460)には、VRは、図4Bに示された状態1462に進み、「スリープと言いましたか?」と言う。ユーザが「はい」と応答すると(状態1464)、VRはポイント120に進み、VRを出る。ユーザが「いいえ」と応答すると(状態1466)、VRはポイント1410に進み、隠れエキスパートウィンドウ1416に戻る。ユーザ応答がSTSまたは拒否の場合(状態1490)には、VRは、状態1492に進み、「はいと言いましたか?」と言う。ユーザがこのプロンプトに対して「はい」と応答した場合(状態1496)には、VRはポイント120に進んで、VRを出る。ユーザ応答が「いいえ」、あるいは他のSTSまたは拒否である場合には、VRはポイント1410に進んで、隠れエキスパートウィンドウ1416に戻る。
【0036】
図4Aの下部および図4Cを参照すると、ユーザのコマンドが「クリア」であるか、またはユーザが「クリア」キーを押した場合(状態1440)には、VRは状態1444に進んで、入力された数字の数がゼロより大きいかどうかを見るためにチェックする。数字が入力されていない場合には、状態1454においてVRは「番号が入力されていません」と言って、ポイント1410に進み、隠れエキスパートウィンドウ1416に戻る(状態1422)。数字が前もって入力されている場合には、VRは状態1442に進んで、連続クリアコマンドが発行され、入力された数字の数が1よりも大きいかどうかをチェックする。連続「クリア」コマンドがあり、数字の数が1よりも大きい場合には、VRは連続クリア機能4400に進んで、望まれるのであれば、ユーザがエントリ全体をクリアできるようにする。連続「クリア」コマンドが発行されていないか、または、入力された数字が1つのみである場合には、VRは状態1446に進んで、入力された最後の番号を削除し、「クリアされました」と言う。そして、VRはポイント1410に戻り、次のユーザ入力を待つ。
【0037】
状態1450にあるようにユーザコマンドが「通話」である場合には、VRは、状態1452に進み、何らかの番号が入力されているかどうかを見るためにチェックする。何の番号も入力されていない場合には、VRは状態1454に進んで、「何の番号も入力されていません」と言い、次にポイント1420に戻って、ユーザ入力のためのプロンプトに戻る。番号が入力されている場合には、状態1470は、VRが「呼び出し中」と言うことを示し、入力された番号を繰り返す。ユーザがプロンプトに対して沈黙しているか、または、「はい」と答えると(状態1472)、VRは状態1494に進み、通話を開始する。ユーザが「いいえ」と言うと(状態1474)、VRはポイント1410に進んで、隠れエキスパートウィンドウ1416に戻る。ユーザ応答がSTSまたは拒否であることをVRが決定する場合(状態1480)には、VRは状態1482に進み、「通話したかったですか?」と尋ねる。ユーザが「はい」と答えるか、または、沈黙していると(状態1484)、VRは状態1488に進み、通話を開始する。ユーザ応答が「いいえ」または他の拒否の場合には(状態1486)、VRはポイント1410に進み、隠れエキスパートウィンドウ1416に戻る。
【0038】
上記のように、連続「クリア」コマンドは、すべての番号をクリアするオプションをユーザに可能にするように特に取り扱われる。連続クリア機能のフローチャートは、図5に示されている。いったん、連続「クリア」コマンドが入力されたとVRが決定すると、状態4410においてVRは、「電話番号全体をクリアしますか?」と言う。状態4420に示されているようにユーザが「はい」と答えると、「すべての数字がクリアされました」と言い(状態4422)、現在入力されているすべての数字をクリアする。次に、VRは、プロンプト音106を鳴らす。そして、VRはポイント1410に戻り、番号機能1400内の隠れエキスパートウィンドウ1416に進む。
【0039】
電話番号全体をクリアするかとのVRの問い合わせに対する応答において、ユーザが「いいえ」と答える場合(状態4430)には、状態4432においてVRは、「1つの数字がクリアされました」と言い、最後に入力された数字をクリアする。そして、VRは、プロンプト音106を鳴らす。「クリア」コマンドは、連続クリア機能が存在していない場合には、1つの数字のクリアになるので、連続クリア機能はデフォルトでこの結果になる。この時点において、フローは、肯定的な応答パスと同じパスをたどる。VRはポイント1410に戻り、番号機能1400内の隠れエキスパートウィンドウ1416に進む。
【0040】
図6を参照すると、隠れエキスパートメニュー600は、追加のコマンドまたは機能を提供しないので、正確には独立したメニューではない。むしろ、隠れエキスパートメニュー600は、ユーザが、VRのプロンプトを待つ必要なく、コマンドを入力するのを可能にする。最初のトレーニング判定(状態104)を通る、待機モードの状態102からのフロー図は、図1のトップレベル機能のフローチャートから来ることが図3から分かる。いったん、最初のトレーニングが実行されていることをVRが決定する(状態104)場合には、隠れエキスパートメニュー600が利用可能である。隠れエキスパートメニュー600の下で、ユーザはVRからのプロンプトを聞くよりも前にあらゆるトップレベルメニューコマンドにアクセスすることが可能である。VRは、1.5秒間だけ隠れエキスパートメニュー600を起動する。ユーザがプロンプトを待ちたい場合には、またはユーザが隠れエキスパートメニュー600の存在に気づいていない場合には、VRは、状態620に示された1.5秒間の応答ウィンドウの後、トップレベルメニュー110に進む。隠れエキスパートメニュー600は、さまざまな機能において利用可能である多くの隠れエキスパートウィンドウから区別すべきである。機能のそれぞれにおける隠れエキスパートウィンドウは、ユーザプロンプトを最初に聞く必要なく、それぞれの機能内で入力を可能にしている。
【0041】
図7Aを参照すると、名前機能300は、VRの電話帳中のエントリの名前を言うことによって、ユーザによりアクセスされる。トップレベル機能100、または通話機能400から、VR電話帳301中のエントリの名前を言った後に、ユーザが名前機能300に入る。状態310においてVRは、複数の名前が一致するかどうかを見るためにチェックする。
【0042】
図7Bを参照すると、複数の名前が一致すれば、VRは、最良の一致を確立するために名前を並べ替える。次の状態330では、VRは、「(最良に一致する名前)と言いましたか?」と尋ねる。ここで、(最良に一致する名前)は、VRが最良の一致をもたらすと決定したVR電話帳中の名前を表す。また、VRは、答えが必要とされていることをユーザに知らせるようにプロンプト音106を鳴らす。状態332として示されているように「いいえ」で答えた場合には、VRは状態344に進み、すべての一致が問い合わせられているかどうかを見る。すべての一致が問い合わせられていない場合には、VRは、状態346において次の最良の一致を検索し、次の最良の名前で、状態330におけるプロンプトを繰り返す。さらなる名前がない場合には、VRは名前機能300をキャンセルし、トップレベルメニュー110に戻る。
【0043】
状態336に示されているように、ユーザが、状態330のプロンプトに対して「はい」と答える場合には、VRは状態320に進み、一致する名前が、発見された唯一の一致する名前であるようにVRが進む。ユーザが速く話し過ぎる(STS)場合には、または状態330における問い合わせに対するユーザ応答が、拒否された場合(状態334)には、VRは状態338に進み、「はいと言いましたか?」と尋ねる。VRは、次にプロンプト音106を鳴らす。ユーザが、状態342に示されているように、状態338の問い合わせに対して「いいえ」で応答した場合には、VRは状態344に進み、最初の「いいえ」の答えに対して、状態332におけるように応答を処理する。ユーザが「はい」と答えた場合には、VRは状態320に進む。他のどの応答に対しても、またはユーザがタイムアウト内に答えない場合には、VRは、トップレベルメニュー110に進むために名前機能300を出る。
【0044】
図7Aに戻り参照すると、いったん、VRが1つの一致した名前が存在するものと判断すると、VRは状態320に進み、「(名前)を呼び出し中」と言う。ここで、(名前)はVR電話帳中の一致した名前を表す。VRは、その後、ユーザの応答のために1.5秒待つ。ユーザが沈黙しているか、または応答が「はい」の場合には(状態322)、VRは状態324において通話を開始する。VRは、沈黙は暗黙の「はい」として解釈する。状態326に示されているように、ユーザが「いいえ」と応答した場合には、VRは状態370において「キャンセルされました」と言う。VRは、その後、状態372において名前機能300をキャンセルし、トップレベルメニュー110に戻る。状態350に示されているように、ユーザの応答がSTSまたは拒否である場合には、VRは、状態352において、ユーザに対して「通話を望んでいましたか?」と尋ねる。VRは、その後、プロンプト音106を鳴らす。ユーザが「はい」と答える場合(状態354)には、VRは状態356において通話を開始する。ユーザが「いいえ」と答える、または応答がSTSまたは拒否である場合(状態358)には、VRは状態360において「キャンセルされました」と言う。名前機能300は、状態362においてキャンセルされ、そして、VRはトップレベルメニュー110に戻る。
【0045】
図8を参照すると、ユーザは、トップレベル機能100からリダイヤル機能200にアクセスすることができる。リダイヤル機能は、最後に呼び出した番号をユーザがリダイヤルできるようにするものである。トップレベルメニュー110から、ユーザは「リダイヤル」と言うことにより、リダイヤル機能200に入る。このリダイヤル機能200に入った後、VRは、状態210において、「(最後に呼び出した番号)をリダイヤルしますか」と言うことにより、ユーザを促す。ここで、(最後に呼び出した番号)はハンドセットによって呼び出された最後の番号を表す。VRは、さらに、プロンプト音106を鳴らして、ユーザに対して、応答が要求されていることを示す。ユーザが「いいえ」と応答し、またはキーパッド上の何らかのキーが押された場合(状態212)には、VRは状態214において「キャンセルされました」と言う。VRはリダイヤル機能をキャンセルし、トップレベルメニュー110に戻る。ユーザが「はい」と応答し、または沈黙である場合(状態216)には、VRは通話を開始する(状態218)。VRがSTS応答を検出するか、またはユーザの応答が拒否である場合(状態220)には、VRは状態222に進み、ユーザに対して「通話を望んでいましたか?」と尋ねる。VRは、その後、プロンプト音106を鳴らす。ユーザが「いいえ」と応答する(状態224)場合には、VRは状態214に進み、ここで、VRは「キャンセルされました」と言い、リダイヤル機能をキャンセルする。VRは、その後、トップレベルメニュー110に戻る。ユーザが「はい」と応答するか、または沈黙である(状態226)場合には、VRは状態218において通話を開始する。他のSTSまたは拒否であると(状態228)、VRは状態214に進み、ここで、VRは「キャンセルされました」と言い、リダイヤル機能をキャンセルする。VRは、その後、トップレベルメニュー110に戻る。
【0046】
図9Aを参照すると、ユーザはトップレベル機能100から音声ブック機能500にアクセスできる。音声ブック500によりユーザはVR電話帳に対してエントリを追加したり削除したりできるとともに、VR電話帳中のエントリを読むようにVRに命令することができる。この後者の特徴によりユーザはVR電話帳中をハンズフリー方法でブラウジングすることができる。トップレベルメニュー110から、ユーザは「音声ブック」と言うことにより音声ブック機能500に入る。いったんユーザが音声ブック機能500に入ると、隠れエキスパートウィンドウ502がユーザに対して約1.5秒間だけ利用可能となる。隠れエキスパートウィンドウ502は、トップレベル機能100において利用可能な隠れエキスパートメニュー600とは異なり、独立したものである。この隠れエキスパートウィンドウ502は音声ブック機能500でのみアクティブとなり、隠れエキスパートウィンドウ502により、ユーザはユーザプロンプトを待たずにすべての音声ブックコマンドにアクセス可能になる。ユーザが隠れエキスパートウィンドウ502の時間枠内に応答しない場合には、VRは音声ブックユーザプロンプト510に進む。音声ブックユーザプロンプト510において、VRは「リスト、追加、または削除、あるいは音声ブックを出るためにはクリアと言って下さい」と言う。次いで、VRはプロンプト音106を鳴らす。さらに、電話機は「ブックをクリア」キーパッドオプション514を表示する。
【0047】
ユーザがこの「ブックをクリア」オプションに対応するキーを押す場合(状態520)には、VRは状態522に進み、ハンドセットディスプレイを制御してユーザに対して「すべての音声ブックエントリを消去しますか?」と尋ねる問い合わせを示す。「はい」と「いいえ」を表すソフトキー523および525がユーザに利用可能である。ユーザが「はい」のソフトキーで選択する(状態524)場合には、ハンドセットディスプレイ152は「すべての音声ブックエントリを消去しました」を表示する。VRは次いで状態528に進み、「音声ブックは空です」と言い、VRはトップレベルメニュー110に戻る。ユーザが「いいえ」ソフトキーを選択する(状態526)場合には、VRは音声ブック機能をキャンセルし、トップレベルメニュー110に戻る。
【0048】
ユーザが「クリア」と言うか、またはクリアキーを押す(状態512)場合には、音声ブックユーザプロンプトに応答して、VRは音声ブック機能をキャンセルしてトップレベルメニュー110に戻る。ユーザ応答が「追加」であると(状態532)、VRは追加機能5200を開始する。同様に、ユーザ応答が「削除」であると(状態530)、VRは削除機能5300を開始する。
【0049】
音声ブックユーザプロンプト510に応答して、ユーザが「リスト」と言うと(状態5100)、VRはまずVR電話帳が空であるかをチェックする(状態5110)。VR電話帳が空である場合には、状態5112においてVRは「音声ブックは空です」と言い、隠れエキスパートウィンドウ502に戻る。
【0050】
図9Bを参照すると、VR電話帳が空でない場合には、状態5114においてVRは「ブックエントリ:(名前1)…(最終エントリ)」と言う。ここで、(名前1)はVR電話帳中の最初の名前を示し、(最終エントリ)はVR電話帳中の最後の名前を示す。さらに、ハンドセットディスプレイ152は「さらに」5116および「戻る」5118を表すソフトキーを提供する。ユーザが「さらに」ソフトキー5116を押す場合には、VRは次に進んで次の名前を読む。ユーザが「戻る」ソフトキー5118を押す場合には、VRは最初のエントリからの名前を読み始める。ユーザが沈黙のままである場合(状態5120)には、VRは状態5122に進み、VR電話帳からの名前のリストアップを最終エントリまで続ける。いったんVRが最終エントリを読むと(状態5124)、VRは「これ以上のエントリはありません」と言い、隠れエキスパートウィンドウ502より前のポイントに戻る。
【0051】
VRが音声ブックエントリのリストアップを行っている間に、VRがSTSを検出するか、VRがユーザ入力拒否を検出するか、あるいはユーザが話した場合(状態5130)には、VRは状態5132に進み、「エントリの聞き取りを続けますか?」と尋ねる。ユーザが「はい」と答えるか、または沈黙する場合(状態5134)には、VRは次の音声ブックエントリを読む。ユーザが「いいえ」と答える場合(状態5136)には、VRは隠れエキスパートウィンドウの直前のポイント506に戻る。VRが他のSTSまたは拒否を検出する場合(状態5140)には、状態5142においてVRは「はいと言いましたか?」と尋ねる。ユーザが「はい」と答える場合(状態5144)には、VRは次の音声ブックエントリを読む(状態5150)。ユーザが「いいえ」と答える場合(状態5146)には、VRは隠れエキスパートウィンドウ502の直前のポイント506に戻る。
【0052】
音声ブックのリストアップ間にユーザがコマンド「スリープ」で応答する場合(状態5160)には、VRは状態120に進み、待機モード102に戻る。
【0053】
図10Aを参照すると、ユーザは音声ブック機能ユーザプロンプト510において「追加」と言うことにより追加機能に入ることができる。追加機能に最初に入るときに、VRは既に最大数のエントリがあるか否かをチェックする(状態5210)。最大数のエントリがある場合には、VRは状態5212に進み、「音声ブックは一杯です」と言う。次いでVRは追加機能5200から出て、トップレベルメニュー110に戻る。
【0054】
音声ブックに利用可能なスペースがある場合には、VRは状態5220に進み、「追加する名前」と言う。VRは次いでプロンプト音106を鳴らす。プロンプトの後に、VRは状態5222においてユーザの入力を待つ。タイムアウト前にユーザの入力がない場合には、VRはシステムタイムアウトルーチン1200を開始する。タイムアウト前にユーザが名前を話した場合(状態5224)には、VRは状態5234においてこの名前がコマンド語と一致するか否かをチェックする。VRはユーザがコマンド語と一致する名前を保存することを許可しない。これは語の処理において結果として生じる曖昧さのためである。名前がコマンド語と一致すると、状態5250においてVRは「この名前は語:(語)ととてもよく一致します」と言う。ここで、(語)はユーザが追加を望んでいる名前に一致するとVRが決定したコマンド語を表す。VRはプロンプト音106も鳴らして、ユーザに対して応答が要求されていることを示す。VRは次いで状態5220に戻り、新しいユーザ応答を入力するように促す。
【0055】
いったん満足な名前が入力されると、VRは状態5230において「もう一度」と言うことにより、ユーザにその名前を繰り返すように促す。VRはプロンプト音106も鳴らす。図10Bを参照すると、状態5232においてVRはユーザがその名前を繰り返すのを待つ。ユーザがタイムアウト前に応答しない場合には、VRはシステムタイムアウトルーチン1200を開始する。
【0056】
名前がいずれのコマンド語と一致しなくても、2つのユーザ発声は依然として互いに一致しなければならない。状態5240においてVRは名前が一致する2つのユーザ発声をチェックする。2つの発声が一致しない場合には、VRは状態5242に進み、「語の一致に成功しませんでした。再度試して下さい」と言う。次いでVRは状態5220に戻り、新しい名前を入力するようにユーザを促す。2つのユーザ発声が一致すると、VRはユーザにその名前に対応する電話番号の入力を許可する。
【0057】
VRはキーパッドを使用してこの電話番号を入力するのを許可し、またはハンドセット電話帳に記憶されている番号から電話番号をコピーしてもよい。ユーザにハンドセット電話帳からのコピーを許可する前に、VRは状態5260においてハンドセット電話帳に何らかの電話番号が記憶されているか否かをチェックする。
【0058】
図10Cを参照すると、ハンドセット電話帳に何ら番号が記憶されていない場合には、VRは状態5262に進み、「キーパッドを使用して電話番号を入力して下さい。終了したときは、追加を押して下さい」と言う。この時点において、ユーザは電話番号を入力するのにキーパッドのみ使用することが許可されている。ユーザが電話番号を入力すると、入力された番号がハンドセットディスプレイ152上に表示される。さらに、ハンドセットディスプレイは「追加」ソフトキー5292の利用可能性を表示する。いったんユーザが電話番号の入力を行うと、ユーザは「追加」ソフトキー5292を押して、そのエントリを音声ブック中に保存しなければならない。ユーザが「追加」ソフトキー5292を押した後、VRは状態5280に進み、「(名前)が追加されました」と言う。ここで、(名前)は以前のプロンプトからのユーザの発声に対応する。VRは次に音声ブック機能500内の隠れエキスパートウィンドウ502に戻る。
【0059】
状態5260においてハンドセット電話帳中にエントリがあることをVRが決定する場合には、VRは状態5270に進み、「キーパッドを使用して電話番号を入れて下さい。終了したときは、追加を押して下さい」と言う。これはハンドセット電話帳にエントリがないケースと同じ音声プロンプトであることに注意すること。しかしながら、ハンドセットディスプレイ152によりユーザはハンドセット電話帳中のエントリをスクロールできる。ユーザがキーパッド押下を使用して電話番号の入力を選択する場合には、VRは状態5264にしたがって処理を進める。しかしながら、ユーザはハンドセット電話帳のスクロールを選択し(状態5272)、対応する電話番号を表示できる。いったんユーザがハンドセット電話帳中のエントリを特定すると、ユーザは「ビュー」ソフトキー5252を押して対応する電話番号を表示することができる。このエントリがユーザが追加したいものではない場合には、ユーザは「バック」ソフトキー5254を押して前のハンドセット電話帳ディスプレイ152に戻ることができる。ユーザは、ビューディスプレイ152において、「追加」ソフトキー5256を押すことにより、ハンドセット電話帳からの電話番号をVR電話帳に追加することを選択できる。いったんユーザが「追加」ソフトキー5256を押すと、VRは状態5280に進み、「(名前)が追加されました」と言う。次いでVRは音声ブック機能500内の隠れエキスパートウィンドウ502に戻る。
【0060】
図11Aを参照すると、ユーザはVR電話帳からエントリを同様に削除することができる。ユーザは、音声ブック機能のユーザプロンプト510において「削除」と言うことにより、削除機能5300に入る。削除機能に入る際に、VRは、まずVR電話帳が既に空となっているか否かをチェックする(状態5310)。VR電話帳が既に空の場合には、削除するためのエントリはない。状態5312において、VRは「音声ブックは空です」と言う。次に、VRは、トップレベルメニュー110に戻る。VR電話帳においてエントリがある場合には、VRは状態5320に移動し、「削除する名前」と言う。次に、VRは、プロンプト音106を鳴らす。VRは状態5322においてユーザの音声またはキー入力を待つ。ユーザによる入力がなく、システムがタイムアウトとなった場合には、VRは状態5324に進み、ここで、VRはプロンプトが既に繰り返されているか否かをチェックする。プロンプトがまだ繰り返されていない場合には、VRは状態5328に進み、「削除する名前を言うか、「次へ」ボタンを使用して名前をさらに聞いて下さい」と言う。VRはプロンプト106も鳴らす。次に、VRはブロック5322に戻り、ユーザの入力を待つ。システムが2回、タイムアウトになった場合には、VRは削除機能をキャンセルし、トップレベルメニュー110に戻る。
【0061】
ユーザは、名前を話すか、または「次へ」ソフトキー5314を押すことにより、前のプロンプトに応答できる。ユーザが、状態5380に示すように、「次へ」ソフトキー5314を押した場合には、VRは、図11Cを参照して以下で説明されている状態5332に進む。
【0062】
図11Bを参照すると、ユーザが、状態5326に示すように名前を言った場合には、VRは状態5330に進み、複数の名前が一致するか否かをチェックする。一致する名前が複数あるときには、VRは、VRが名前機能300において複数の名前の一致を取り扱うのと同様に複数の名前の一致を処理する。複数の名前が一致した場合には、VRは状態5340において「(最良に一致する名前)と言いましたか?」言う。ここで、(最良に一致する名前)は、VRが最良の一致をもたらすと決定したVR電話帳中の名前を表す。VRは、また、プロンプト音106を鳴らし、返答が要求されていることをユーザに知らせる。問い合わせされた名前が、ユーザの話したものでない場合には、状態5342に示されているように、ユーザは「いいえ」と答える。次に、VRは、状態5344に進み、すべての可能性のある一致について問い合わせされたか否かをチェックする。すべての名前の一致について問い合わせされていない場合には、VRは状態5346において、次の最良の名前の一致を検索し、状態5340に戻り、次の最良の名前の一致でプロンプトを繰り返す。しかしながら、さらなる名前がない場合には、VRは状態5390に進み(図11Aを参照)、「削除する名前を話すか、「次へ」ボタンを使用して名前をさらに聞いて下さい」と言う。VRはプロンプト音106を鳴らし、ユーザによる入力が要求されていることを知らせる。次に、VRは状態5322に戻り、ユーザによる入力を待つ。状態5348に示されているように、問い合わせされた名前がユーザの話した名前と一致した場合には、ユーザは「はい」と答える。次に、VRはポイント5394に進み、ここでVRは状態5372に進み、「(名前)は削除されました」と言う。状態5372に続き、VRは、音声ブック機能500中の隠れエキスパートウィンドウ502に戻る。
【0063】
状態5350に示されているように、ユーザが速く話し過ぎる(STS)場合には、またはブロック5340における問い合わせに対するユーザの返答が拒否された場合には、VRは状態5352に進み、「はいと言いましたか?」と尋ねる。VRはプロンプト音106を鳴らし、ユーザによる入力が要求されていることを示す。ユーザが「いいえ」と応答した場合(状態5356)には、VRはポイント5392に進み、最初の「いいえ」の答えに対するブロック5342におけるように、この応答を処理する。ユーザが「はい」と返答した場合には、VRは、ポイント5394に進むことにより、最初の「はい」の答えに対するブロック5348におけるように、この応答を処理する。状態5358に示されているように、他の何らかの応答に対して、VRは、削除機能をキャンセルし、トップレベルメニュー110に戻る。
【0064】
図11Cを参照すると、VRが、VR電話帳からのただ1つの名前とユーザからの入力とが一致すると決定した場合には、または、ユーザが「次へ」ソフトキーを押した場合には、VRは状態5332に進み、「(名前)を削除しますか?」と言う。(名前)は、VRが一致すると決定した、VR電話帳からの名前に対応する。VRはまた、プロンプト音106を鳴らし、返答が要求されていることをユーザに知らせる。次に、VRは状態5360においてユーザの入力を待つ。ユーザの応答がなく、VRがタイムアウトした場合には、VRは状態5332に戻り、プロンプトを繰り返す。状態5370に示されているように、ユーザの返答が「はい」であった場合には、またはユーザが「削除」ソフトキー5398を押した場合には、VRは状態5372に進み、「(名前)は削除されました」と言う。次に、VRは音声ブック機能502中の隠れエキスパートウィンドウ502に戻る。状態5376に示されているように、ユーザの返答が「いいえ」であった場合には、VRは、状態5320(図11A)に戻り、削除する名前を入力するようにユーザに促す。状態5378に示されているように、ユーザが「次へ」ソフトキー5399を押した場合には、VRは状態5382に進み、VR電話帳から次の名前を検索する。次に、VRは状態5332に戻り、VR電話帳中の次の名前についてユーザを促す。状態5362に示されているように、ユーザの応答がSTSまたは拒否である場合には、VRは状態5364に進み、「はいと言いましたか、(名前)を削除しますか?」と言う。次に、VRはプロンプト音106を鳴らす。この問い合わせに対するユーザの応答が「はい」である場合(状態5374)には、VRはブロック5372に進み、状態5370においてあたかもユーザが「はい」と答えたのと同じプロセスを使用することより、エントリを削除する。ユーザの応答が「いいえ」であった場合には、または、他のSTSまたは拒否である場合(状態5366)には、VRは状態5368に進み、「キャンセルされました」と言って、ブロック5320に戻り、削除する名前を入力するようにユーザに促す。
【0065】
図12Aを参照すると、トップレベル機能100においてユーザが「トレーニング」ソフトキー150を押すことによってのみ、トレーニング機能にアクセスできる。トレーニング機能900は、ユーザがキーパッドを押したことに対する応答によってのみ動作する。これは、最初にトレーニングを実行せずに、音声によるコマンドを介してトレーニングにアクセスすることは不可能だからである。いったんユーザがトレーニング機能900に入ると、VRは状態902に進み、ここで、ハンドセットディスプレイ152は、トレーニングするためにユーザが選択することができる2つの語彙セット、基本セット906と数字セット908を表示する。基本セットは、通話、リダイヤル、はい、いいえ、付加、削除、音声ブック、スリープ、ウェイクアップ、クリア、リスト、回答を含むコマンド語からなる。数字セットは、0、1、2、3、4、5、6、7、8、9、オー、スター、ポンド、照合、番号を含むキーパッドおよびダイヤル関連語である。ユーザが基本セットを選択するか(状態910)、または数字セットを選択するか(状態920)により、ユーザには完全トレーニングまたは再トレーニングの選択肢が与えられる。ハンドセットディスプレイ152は、トレーニングオプション942および再トレーニングオプション944を表示する。ハンドセットは、また、「出る」ソフトキー946を表示する。ユーザが語彙セットをトレーニングすることを選択する場合(状態914)には、VRは完全トレーニング700を初期化する。ユーザがただ、語彙セットを再トレーニングすることを選択した場合(状態916)には、VRは再トレーニング機能800を初期化する。ユーザは、「出る」ソフトキー946を選択することにより、トレーニングを実行しないように決めることもできる。この選択は状態924として示されている。ユーザが「出る」ソフトキー946を押した場合には、VRはポイント120に進み、VRを出て待機102に戻るように進む。
【0066】
図12Bを参照すると、ユーザは、「0」キーを押し続けることにより、すべての音声コマンドおよびVR電話帳のエントリを消去することができる(状態930)。この選択は隠されており、ハンドセットディスプレイ上には示されていない。ユーザが、「0」キーを押しつづけた場合には、VRは状態932に進み、ここで、ハンドセットディスプレイ950は、「音声コマンドおよび電話帳のエントリを消去しますか」と表示し、「はい」、「いいえ」のソフトキー選択952、954を提供する。ユーザが「はい」のソフトキーを押した場合(状態936)には、VRは状態938に進み、ここで、VRはすべてのVRコマンド語およびすべてのVR電話帳のエントリを消去する。次に、VRはポイント120に進み、音声認識モードを出る。ユーザが「いいえ」のソフトキーを押した場合(状態934)には、VRはポイント120に進み、内容を何ら変更することなく音声認識モードを出る。
【0067】
図13Aを参照すると、完全トレーニング機能700は、トレーニング機能900を介してアクセスされるか、またはトレーニングがまだ実行されていない場合(図1の104参照)にVRに入る際に自動的にアクセスされる。完全トレーニング機能700において、VRは、まず、初期トレーニングが完了しているか否かをチェックする(状態702)。初期トレーニングがまだ実行されていない場合には、VRはデフォルトで基本セットのトレーニングを行う(状態704)。ハンドセットディスプレイ152は、「基本セット」をヘッダー762として示す。トレーニング機能900から完全トレーニング機能700に入る場合には、トレーニング機能900において選択された語彙セットが、ハンドセットディスプレイ152上にヘッダー762として表示される。ハンドセットディスプレイ152は、また、「出る」ソフトキー764を表示する。ユーザが「出る」ソフトキー764を選択した場合には、VRは、状態706において、「音声認識装置はスリープ中です」と言う。次に、VRは音声認識モードを出て、待機102に進む。
【0068】
語彙セットが決定された後、VRは、状態710において「音声指示にしたがって、トレーニングを開始して下さい」と言う。次に、VRは、状態712において「語(語)を言って下さい」と言う。ここで、(語)は、トレーニングされている語彙セット中の最初の語を表す。VRは、プロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。次に、VRは、状態716においてユーザの入力を待つ。ユーザによる入力の前に、システムがタイムアウトとなった場合には、VRは状態712に戻り、プロンプトを繰り返す。
【0069】
図13Bを参照すると、ユーザがプロンプトに応答した場合には、VRはユーザに対して語を繰り返すように要求する。VRは、状態720において、「もう一度」と言う。次に、VRは、プロンプト音106を鳴らす。VRは、状態724において、ユーザが語を繰り返すのを待つ。ユーザによる入力の前にVRがタイムアウトとなった場合には、VRは状態720に戻り、「もう一度」プロンプトを繰り返す。ユーザが応答した場合には、状態726においてVRは、両方のユーザの発声を比較して、これらが一致しているか否かをチェックする。2つの発声が一致していない場合には、VRは状態740において「語の一致は成功しませんでした」と言う。次に、VRは状態712に戻り、同じ語についてトレーニングのルーチンを繰り返す。VRが、2つの発声が一致したと判断した場合には、VRはメモリにその語を保存し、状態728において、語彙セット中のすべての語がトレーニングされたか否かをチェックする。語彙セット中のすべての語がトレーニングされていない場合には、VRは語彙セット中の次の語を検索する(状態732)。次に、VRは、状態712に戻り、語彙セット中の次の語に対し、トレーニングのルーチンを繰り返す。いったん語彙セット中のすべての語がトレーニングされると、VRは状態730に進み、「(語彙セット)トレーニングは完了しました。音声認識は動作中です」と言う。この用語(語彙セット)は、現在トレーニングされている、基本または数字の現在の語彙セットと対応する。次に、VRは、トップレベルメニュー110に戻る。
【0070】
図14Aを参照すると、再トレーニング機能800はトレーニング機能900からアクセスできる。再トレーニング機能800によりユーザは語彙セットの任意の部分を再トレーニングできる。再トレーニング機能に入ると、VRは、「音声指示にしたがって、トレーニングを開始して下さい」(状態802)と言う。ユーザは多数のキーパッドオプションを持っている。ユーザは終了キーまたは「出る」ソフトキー870を押して(状態860)、ポイント120に進みVRを出ることができる。ユーザはクリアキーを押して(状態862)、トレーニング機能における前の表示に戻ることができる(状態864)。その他の任意のキーが押されると(状態866)、機能動作が起こらなくなる(状態868)。
【0071】
VRに再トレーニング機能800を抜け出させる任意のキー押しをユーザが選択しない場合には、状態810においてVRは再トレーニングされている語彙セットにおける最初の語を検索する。VRは状態812に進み、「(語)はこの語を再トレーニングしますか?」と言う。この問い合わせにおいて、(語)は再トレーニングされるべき語彙セット中の現在の語を表している。その後、VRはプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。状態814に示されているように、ユーザが「いいえ」で応答する場合には、または「いいえ」ソフトキー874を押す場合には、VRは語彙セット中の次の語を検索し(状態838)、状態812プロンプトに戻る。状態816に示されているように、ユーザが「はい」を応答する場合には、または「はい」ソフトキー872を押す場合には、VRはその語の再トレーニングを開始する。VRは状態820に進み、「語(語)を言って下さい」と言い、それからVRはプロンプト音106を鳴らす。それから、VRは状態822においてユーザ入力を待つ。ユーザがシステムタイムアウト前に応答しない場合には、VRはシステムタイムアウトルーチン1200を開始する。
【0072】
図14Bを参照すると、ユーザがシステムタイムアウト前に答える場合には、状態824においてVRは「もう一度」と言うことにより、ユーザがその語を繰り返すように要求する。VRはこの要求後にプロンプト音106を鳴らす。VRは状態826においてユーザが語を繰り返すのを待つ。ユーザが答える前に、このポイントからシステムがタイムアウトする場合には、VRはシステムタイムアウトルーチン1200を開始する。ユーザがシステムタイムアウト前に応答する場合には、状態828においてVRは両方の発声が一致することを確認する。2つの発声が一致しない場合には、VRは状態832に進み、「語の一致は成功しませんでした。再度試して下さい」と言う。その後、VRは状態820戻り、ユーザに同じ語を再トレーニングするように促す。2つの発声が一致する場合には、VRは状態830に進み、「(語)は再トレーニングされました」と言う。ハンドセットディスプレイ152は「次へ」および「済み」882および884に対するソフトキーを示す。
【0073】
図14Cを参照すると、ユーザが「済み」ソフトキーを選ぶ(状態850)場合には、VRは状態852に進み、「再トレーニングは完了しました」と言う。その後、VRはトップレベルメニュー110に戻る。ユーザが「次へ」ソフトキーを選ぶ(状態834)場合には、状態836においてVRは現在の語彙セット中のすべての語が再トレーニングされているか否かをチェックする。すべての語が再トレーニングされていない場合には、VRは状態838に戻り、再トレーニングのために語彙セット中の次の語を検索する。語彙セット中のすべての語が再トレーニングされている場合には、VRは状態852に進み、「再トレーニングは完了しました」と言い、トップレベルメニュー110に戻る。表示されず、または促されず、このポイントで利用可能な1つのコマンドは「スリープ」コマンドである。ユーザが「スリープ」コマンドを発行する(状態840)場合には、VRは現在の語彙セットになされたいかなる変化も保存し(状態842)、それからトップレベルメニュー110に戻る。
【0074】
図15Aを参照すると、ユーザは音声コマンドを使用して着信に応えることができる。電話機が着信を受けるとき、VRは最初に電話機が自動応答モードにあるか否かをチェックする(状態1010)。電話機が自動応答モードにある場合には、VRはユーザの応答を受ける必要がない(状態1012)。代わりに、VRがないかのように電話機自動応答が動作する。
【0075】
次に、VRは基本トレーニングが完了しているか否かを知るためにチェックする(状態1002)。基本トレーニングがなければ、VRはユーザの音声コマンドを認識することができない。したがって、基本トレーニングが行われていない場合には、システムは状態1004に進み、電話機はVR返答を開始しない。代わりに、電話機はVRがないかのように単にベルを鳴らす。基本トレーニングが既に実行されている場合には、VRの応答は着信がローミング通話かどうかに依存する。着信がローミング通話でない場合には、状態1008においてVRは短いベル音を発し、それから「着信です。応答しますか?」と言う。着信がローミング通話である場合には、状態1008においてVRは短いベル音を発し、「ローミング着信です。応答しますか?」と言う。話されるプロンプトとは無関係に、VRはプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。
【0076】
図15Bを参照すると、VRは状態1020においてユーザ応答を待つ。ユーザが応答しない場合には、VRは状態1032に進み、プロンプトが2回繰り返されたか否かを見る。プロンプトが2回繰り返されていなかった場合には、状態1030においてVRは「(ローミング)着信です」と言う。着信がローミング通話である場合には、VRは語「ローミング」と言うだけである。その後、VRはブロック1020に戻り、ユーザ応答を待つ。プロンプトが2回繰り返された後にユーザが依然として応答しない場合には、VRは「ミス通話」と言う(状態1034)。その後、VRは待機102に戻る。
【0077】
ユーザがVR着信プロンプトの何れかに対して「はい」または「応答」と応答した場合には、または通話に応えるように構成されているキーのうちの何れかを押す(状態1022)場合には、電話機は着信に返事する(状態1026)。その後、VRは通話応答音1036を鳴らし、通話が返答されたことをユーザに示す。
【0078】
代わりに、ユーザがVR着信プロンプトに対して「いいえ」と応答する場合には、またはユーザが着信アラートを沈黙させるように構成されているキーのうちの何れかを押す(状態1024)場合には、通話は応答されず、さらなるアラートはこの特定の通話に対して提供されない(状態1028)。
【0079】
VRがSTSまたは拒否を検出する(状態1040)場合には、VRは状態1042に進み、「はいと言いましたか?」と言う。ユーザが「いいえ」と応答する(状態1046)場合には、VRは状態1048に進み、着信アラートを停止する。ユーザが「はい」と応答する(状態1050)場合には、VRは着信に応答し(状態1052)、それから通話応答音1036を鳴らす。他のSTSまたは拒否が生じる(状態1044)場合には、VRはポイント1006に戻り、着信プロンプトを繰り返す。
【0080】
図16を参照すると、VRは速く話し過ぎる(STS)ルーチン1100を組み込んでおり、ユーザ応答が速過ぎる、またはVRプロンプトに部分的に重なる場合を取り扱う。STSルーチンが適切でなかった場合には、VRは入力拒否を増加する。その理由は応答ウィンドウが開いている間に生じるユーザ応答の一部のみをVRが解析するからである。STSが生じるとユーザ応答の一部だけが解析されるので、VRはユーザによって話される語を信頼性高く決定できない。STSルーチンはユーザ応答が要求される殆どすべての場合に適切である。標準STSルーチンが使用されない場合には、VRは一般的にSTSルーチンの修正バージョンを組み込んでいる。STSルーチン1100はVRがユーザに対して応答を入力するように促す場合にアクティブとなる(状態1102)。一般的にVRはプロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。VRがSTSを検出する(状態1104)場合には、VRは状態1106に進み、ここでは、ユーザに応答させるためにSTS発声後1秒間VRは沈黙したままである。その後、VRは状態1120に進み、前のプロンプトを繰り返す。VRは再びプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。VRは状態1108において有効なユーザ応答を待つ。ユーザが有効な応答を提供する場合には、VRは状態1110に進み、機能のコマンドを遂行する。VRが他のSTSのために、話された語を決定できない場合には、システムは状態1122において1秒間沈黙したままである。再び、VRは前のプロンプトを繰り返し(状態1132)、再びプロンプト音106を鳴らす。第2プロンプト後に他のSTS、拒否がある場合には、またはユーザ応答がない(状態1124)場合には、VRはユーザを訂正しようとしない。代わりに、VRはアクティブ機能をキャンセルし、トップレベルメニュー110に戻る。ユーザがSTSまたは拒否を行わないで応答する(状態1126)場合には、VRはそのコマンドで進み(状態1130)、STSルーチンを利用した機能のポイントに戻る。
【0081】
図17を参照すると、VRはシステムタイムアウト機能1200を組み込んでおり、VRがユーザ応答を要求し、何も受け取らない場合を取り扱う。ユーザ応答がないとき、システムタイムアウト機能1200はアクティブ機能をキャンセルするよりも、応答する他の機会をユーザに与える。VRは大半のプロンプトに対してシステムタイムアウト機能1200を使用するが、ときには、特に機能フローチャートにおいて入力タイムアウトを取り扱う。VRは、システムタイムアウト機能1200がアクティブであるさまざまな場合で、初期プロンプトとプロンプト音106を提供する(状態1202)。ユーザには2秒応答ウィンドウが与えられる(状態1204)。ユーザが応答する場合には、VRは状態1206に進み、コマンドを実行し、機能に戻る。ユーザが2秒応答ウィンドウ内に応答しない場合には、VRは初期プロンプトを繰り返し(状態1210)、プロンプト音106を繰り返す。再び、ユーザには2秒応答ウィンドウが与えられる(状態1212)。ユーザが応答する場合には、VRは状態1206に進み、コマンドを実行し、機能に戻る。ユーザが第2のプロンプトに応答するのに失敗した場合には、VRはポイント120に進み、待機102に向けてVRを出る。
【0082】
図18を参照すると、VRは、問い合わせに対するユーザの沈黙を「はい」応答として処理する暗黙はい/いいえ装置1300を組み込んでいる。この暗黙はい/いいえ装置1300は、VRがユーザから「はい」応答を期待するときにユーザインターフェースにおいて選択的に使用される。一般的に暗黙はい/いいえ装置1300は、VRがユーザからのコマンドを受け取り(状態1302)、それからコマンドの肯定を得ようとする(状態1304)場合に使用される。1.5秒ユーザ応答ウィンドウ(示されていない)では、潜在的ユーザ応答は、沈黙(状態1310)、「はい」(状態1320)、「いいえ」(状態1330)、およびSTSまたは拒否(状態1340)を含む。ユーザが沈黙である(状態1310)場合には、VRはこれを暗黙のはいと考える(状態1312)。VRは状態1314に進み、この機能を行う。ユーザが「はい」と応答する(状態1320)場合には、システムはこの機能を行う(状態1322)。ユーザが「いいえ」と応答する(状態1330)場合には、機能は状態1332においてキャンセルされ、VRはトップレベルメニュー110に戻る。応答がSTSまたは拒否であれば(状態1340)、VRは状態1342に進み、「はいと言いましたか?」と言うことにより、ユーザを促す。VRはプロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。その後、ユーザには他の応答ウィンドウが与えられる。上述のように、ユーザが「はい」と応答する(状態1346)場合には、システムは機能を行う(状態1346)。同様に、ユーザが「いいえ」と応答する場合には、またはユーザ応答が他のSTSまたは拒否である(状態1350)場合には、機能はキャンセルされ(状態1352)、そしてVRはトップレベルメニュー110に戻る。
【0083】
好適実施形態の先の記述は当業者がこの発明を製造または使用できるように提供されている。これら実施形態の種々変形は当業者には容易に明らかであり、ここで定義されている一般的原理は発明力を使用しないで他の実施形態に適用できる。故に、この発明はここで示された実施形態に限定されるものではないが、ここに開示された原理および新規特徴と一致する最大範囲に与えられるべきである。
【図面の簡単な説明】
【図1】
ユーザと、ハンドセットの受け台またはハンズフリーキット内の電話機とを示す図。
【図2A】
他のすべての機能へのアクセスを提供するトップレベル機能を示すフローチャート。
【図2B】
他のすべての機能へのアクセスを提供するトップレベル機能を示すフローチャート。
【図3A】
通話を発信するためのインターフェースをユーザに提供する通話機能を示すフローチャート。
【図3B】
通話を発信するためのインターフェースをユーザに提供する通話機能を示すフローチャート。
【図4A】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図4B】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図4C】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図5】
入力された電話番号をクリアするために通話機能内で使用される連続クリア機能を示すフローチャート。
【図6】
本発明のトップレベル機能内にある隠れエキスパートメニューを示すフローチャート。
【図7A】
ユーザが電話番号に関係する名前を言えるようにすることによって通話発信を行う名前機能を示すフローチャート。
【図7B】
ユーザが電話番号に関係する名前を言えるようにすることによって通話発信を行う名前機能を示すフローチャート。
【図8】
「リダイヤル」と言うことによって、最後に呼び出した通話の番号をユーザがリダイヤルできるようにするリダイヤル機能を示すフローチャート。
【図9A】
ユーザが電話番号エントリの音声ブックを編集できるようにする音声ブック機能を示すフローチャート。
【図9B】
ユーザが電話番号エントリの音声ブックを編集できるようにする音声ブック機能を示すフローチャート。
【図10A】
ユーザが名前および電話番号をVRの音声ブックに追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図10B】
ユーザが名前および電話番号をVRの音声ブックに追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図10C】
ユーザが名前および電話番号をVRの音声ブックに追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図11A】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図11B】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図11C】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図12A】
ユーザが特定のトレーニング機能にアクセスするのに利用する、トレーニング機能を示すフローチャート。
【図12B】
ユーザが特定のトレーニング機能にアクセスするのに利用する、トレーニング機能を示すフローチャート。
【図13A】
音声認識ユーザインターフェースの完全な機能にアクセスするために実行されなければならない完全トレーニング機能を示すフローチャート。
【図13B】
音声認識ユーザインターフェースの完全な機能にアクセスするために実行されなければならない完全トレーニング機能を示すフローチャート。
【図14A】
ユーザが基本および数字の語彙セット内の語のサブセットのみを再トレーニングすることができるようにする、トレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図14B】
ユーザが基本および数字の語彙セット内の語のサブセットのみを再トレーニングすることができるようにする、トレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図14C】
ユーザが基本および数字の語彙セット内の語のサブセットのみを再トレーニングすることができるようにする、トレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図15A】
ユーザが完全なハンズフリーモードで通話に応答できるようにする着信応答の特徴を示すフローチャート。
【図15B】
ユーザが完全なハンズフリーモードで通話に応答できるようにする着信応答の特徴を示すフローチャート。
【図16】
ユーザの音声入力が要求されたときに利用される速く話し過ぎる機構を示すフローチャート。
【図17】
ユーザがVRシステムによるプロンプトに適時に応答しなかったときに生じるシステムタイムアウトの処理を示すフローチャート。
【図18】
はい/いいえのユーザ応答が要求されたときに利用されることがある暗黙のはい/いいえデバイスを示すフローチャート。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/246,499 US6449496B1 (en) | 1999-02-08 | 1999-02-08 | Voice recognition user interface for telephone handsets |
US09/246,499 | 1999-02-08 | ||
PCT/US2000/003257 WO2000046969A1 (en) | 1999-02-08 | 2000-02-08 | Voice recognition user interface for telephone handsets |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002536917A JP2002536917A (ja) | 2002-10-29 |
JP2002536917A5 true JP2002536917A5 (ja) | 2009-06-25 |
Family
ID=22930933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000597937A Pending JP2002536917A (ja) | 1999-02-08 | 2000-02-08 | 電話ハンドセットの音声認識ユーザインターフェイス |
Country Status (12)
Country | Link |
---|---|
US (1) | US6449496B1 (ja) |
EP (1) | EP1151594B1 (ja) |
JP (1) | JP2002536917A (ja) |
KR (1) | KR100616787B1 (ja) |
CN (1) | CN1173541C (ja) |
AT (1) | ATE445285T1 (ja) |
AU (1) | AU2986600A (ja) |
BR (1) | BR0008078A (ja) |
CA (1) | CA2362053C (ja) |
DE (1) | DE60043098D1 (ja) |
HK (1) | HK1043460B (ja) |
WO (1) | WO2000046969A1 (ja) |
Families Citing this family (124)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7644282B2 (en) | 1998-05-28 | 2010-01-05 | Verance Corporation | Pre-processed information embedding system |
JP2000244625A (ja) * | 1999-02-23 | 2000-09-08 | Nec Saitama Ltd | 携帯電話機における音声認識起動方法及び音声認識携帯電話装置 |
US7260187B1 (en) * | 1999-05-11 | 2007-08-21 | Verizon Services Corp. | Voice response apparatus and method of providing automated voice responses with silent prompting |
JP3847624B2 (ja) * | 1999-07-28 | 2006-11-22 | 三菱電機株式会社 | 携帯電話機 |
US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
JP3570332B2 (ja) * | 2000-03-21 | 2004-09-29 | 日本電気株式会社 | 携帯電話装置及びその着信メロディ入力方法 |
US6661879B1 (en) * | 2000-07-19 | 2003-12-09 | Xtend Communications Corp. | System and method for recording telephonic communications |
US7194409B2 (en) * | 2000-11-30 | 2007-03-20 | Bruce Balentine | Method and system for preventing error amplification in natural language dialogues |
ATE261607T1 (de) * | 2000-12-14 | 2004-03-15 | Ericsson Telefon Ab L M | Sprachgesteuertes tragbares endgerät |
US7400712B2 (en) * | 2001-01-18 | 2008-07-15 | Lucent Technologies Inc. | Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access |
US20020097843A1 (en) * | 2001-01-19 | 2002-07-25 | Ivoice.Com, Inc. | Speech activated telephone device for connection to existing telephone |
GB0103053D0 (en) * | 2001-02-07 | 2001-03-21 | Nokia Mobile Phones Ltd | A communication terminal having a predictive text editor application |
US20020137553A1 (en) * | 2001-03-22 | 2002-09-26 | Kraemer Tim D. | Distinctive ringing for mobile devices using digitized user recorded audio message |
US20020137470A1 (en) * | 2001-03-23 | 2002-09-26 | Baron Jason C. | Method and system for multiple stage dialing using voice recognition |
USRE45096E1 (en) * | 2001-04-19 | 2014-08-26 | British Telecommunications Public Limited Company | Voice response system |
US6892081B1 (en) * | 2001-05-31 | 2005-05-10 | Nokia Corporation | Mobile terminal and method of operation using content sensitive menu keys in keypad locked mode |
EP1271346A1 (en) | 2001-06-28 | 2003-01-02 | Nokia Corporation | Method for searching data in at least two databases |
JP4437633B2 (ja) * | 2001-08-10 | 2010-03-24 | 富士通株式会社 | 携帯端末 |
GB0121150D0 (en) * | 2001-08-31 | 2001-10-24 | Mitel Knowledge Corp | Menu presentation system |
US7418381B2 (en) * | 2001-09-07 | 2008-08-26 | Hewlett-Packard Development Company, L.P. | Device for automatically translating and presenting voice messages as text messages |
FI20012358A0 (fi) | 2001-11-30 | 2001-11-30 | Nokia Corp | Matkaviestinlaite ja menetelmä ohjelmistotoimintojen suorittamiseksi |
US7324942B1 (en) * | 2002-01-29 | 2008-01-29 | Microstrategy, Incorporated | System and method for interactive voice services using markup language with N-best filter element |
KR20040001318A (ko) * | 2002-06-27 | 2004-01-07 | 엘지전자 주식회사 | 음성인식을 이용한 휴대폰의 원격 제어방법 |
US7372826B2 (en) * | 2002-08-01 | 2008-05-13 | Starent Networks, Corp. | Providing advanced communications features |
US7072684B2 (en) * | 2002-09-27 | 2006-07-04 | International Business Machines Corporation | Method, apparatus and computer program product for transcribing a telephone communication |
CA2499967A1 (en) | 2002-10-15 | 2004-04-29 | Verance Corporation | Media monitoring, management and information system |
KR20040035515A (ko) * | 2002-10-22 | 2004-04-29 | 엘지전자 주식회사 | 핸즈프리 기능을 구비한 이동통신 단말기와 그의 제어 방법 |
US7873390B2 (en) * | 2002-12-09 | 2011-01-18 | Voice Signal Technologies, Inc. | Provider-activated software for mobile communication devices |
US8041396B2 (en) * | 2002-12-20 | 2011-10-18 | Firefly Communications, Inc. | Method and system for emergency dialing of a wireless communication device |
US20040162116A1 (en) * | 2003-02-14 | 2004-08-19 | Lucent Technologies Inc. | User programmable voice dialing for mobile handset |
KR20040089232A (ko) * | 2003-04-11 | 2004-10-21 | 엘지전자 주식회사 | 통화 중 검색전화번호 전송방법 |
US20050118986A1 (en) * | 2003-09-11 | 2005-06-02 | Voice Signal Technologies, Inc. | Phone number and name pronunciation interchange via cell phone |
WO2005026958A1 (en) * | 2003-09-11 | 2005-03-24 | Voice Signal Technologies, Inc. | Method and apparatus for back-up of customized application information |
KR20050028150A (ko) * | 2003-09-17 | 2005-03-22 | 삼성전자주식회사 | 음성 신호를 이용한 유저-인터페이스를 제공하는휴대단말기 및 그 방법 |
US20060239501A1 (en) | 2005-04-26 | 2006-10-26 | Verance Corporation | Security enhancements of digital watermarks for multi-media content |
US20050131685A1 (en) * | 2003-11-14 | 2005-06-16 | Voice Signal Technologies, Inc. | Installing language modules in a mobile communication device |
KR100664105B1 (ko) * | 2003-12-04 | 2007-01-04 | 엘지전자 주식회사 | 휴대단말기의 음성 인식 방법 |
US7801283B2 (en) * | 2003-12-22 | 2010-09-21 | Lear Corporation | Method of operating vehicular, hands-free telephone system |
US20050134504A1 (en) * | 2003-12-22 | 2005-06-23 | Lear Corporation | Vehicle appliance having hands-free telephone, global positioning system, and satellite communications modules combined in a common architecture for providing complete telematics functions |
US7050834B2 (en) * | 2003-12-30 | 2006-05-23 | Lear Corporation | Vehicular, hands-free telephone system |
US7197278B2 (en) * | 2004-01-30 | 2007-03-27 | Lear Corporation | Method and system for communicating information between a vehicular hands-free telephone system and an external device using a garage door opener as a communications gateway |
US7778604B2 (en) * | 2004-01-30 | 2010-08-17 | Lear Corporation | Garage door opener communications gateway module for enabling communications among vehicles, house devices, and telecommunications networks |
KR20070002017A (ko) * | 2004-02-17 | 2007-01-04 | 보이스 시그널 테크놀로지스, 인코포레이티드. | 멀티모달 내장형 인터페이스들의 교체가능한 커스텀화 방법및 장치 |
US7570746B2 (en) * | 2004-03-18 | 2009-08-04 | Sony Corporation | Method and apparatus for voice interactive messaging |
KR100621401B1 (ko) * | 2004-03-31 | 2006-09-08 | 삼성전자주식회사 | 회전상태를 인식하여 저장된 정보를 탐색하는이동통신기기 및 그 방법 |
US20050239511A1 (en) * | 2004-04-22 | 2005-10-27 | Motorola, Inc. | Speaker identification using a mobile communications device |
KR100640505B1 (ko) * | 2004-06-01 | 2006-10-30 | 삼성전자주식회사 | 검색된 전화번호에 대한 전화번호 연계 기능을 수행하는방법 |
KR100605959B1 (ko) * | 2004-06-21 | 2006-08-02 | 삼성전자주식회사 | 음성을 이용한 번호입력방법 |
JP4773448B2 (ja) * | 2004-09-24 | 2011-09-14 | ノキア コーポレイション | 電子装置のユーザーからの入力を受信する方法 |
CN100463576C (zh) * | 2004-10-10 | 2009-02-18 | 英华达(南京)科技有限公司 | 导向语音个人移动通讯装置及其处理方法 |
JP4802489B2 (ja) * | 2004-12-07 | 2011-10-26 | 日本電気株式会社 | 音データ提供システムおよびその方法 |
US20060178159A1 (en) * | 2005-02-07 | 2006-08-10 | Don Timms | Voice activated push-to-talk device and method of use |
US8020004B2 (en) | 2005-07-01 | 2011-09-13 | Verance Corporation | Forensic marking using a common customization function |
US8781967B2 (en) | 2005-07-07 | 2014-07-15 | Verance Corporation | Watermarking in an encrypted domain |
US7668540B2 (en) * | 2005-09-19 | 2010-02-23 | Silverbrook Research Pty Ltd | Print on a mobile device with persistence |
CN100452863C (zh) * | 2006-02-16 | 2009-01-14 | 华为技术有限公司 | 一种可视电话控制方法及设备 |
US20070197266A1 (en) * | 2006-02-23 | 2007-08-23 | Airdigit Incorporation | Automatic dialing through wireless headset |
KR100744301B1 (ko) * | 2006-06-01 | 2007-07-30 | 삼성전자주식회사 | 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법 |
US20070286398A1 (en) * | 2006-06-07 | 2007-12-13 | Venkatesan Ramamoorthy | Voice Recognition Dialing For Alphabetic Phone Numbers |
US20080039056A1 (en) * | 2006-06-28 | 2008-02-14 | Motorola, Inc. | System and method for interaction of a mobile station with an interactive voice response system |
KR20080026691A (ko) * | 2006-09-21 | 2008-03-26 | 삼성전자주식회사 | 휴대용 단말에서 음성 다이얼링을 제어하는 장치 및 방법 |
US9753533B2 (en) | 2008-03-26 | 2017-09-05 | Pierre Bonnat | Method and system for controlling a user interface of a device using human breath |
KR20090107364A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US8958848B2 (en) | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US7759168B2 (en) * | 2008-05-13 | 2010-07-20 | International Business Machines Corporation | Electromagnetic interference shield for semiconductors using a continuous or near-continuous peripheral conducting seal and a conducting lid |
US8259938B2 (en) | 2008-06-24 | 2012-09-04 | Verance Corporation | Efficient and secure forensic marking in compressed |
KR101185093B1 (ko) * | 2008-12-19 | 2012-09-21 | 한국전자통신연구원 | Autosar 응용 소프트웨어의 소프트웨어 구조 모델링 도구를 위한 프로젝트 관리 장치 및 방법 |
WO2010124478A1 (zh) * | 2009-04-30 | 2010-11-04 | Sheng Yongxiang | 用户识别系统中语音管理用户的装置及方法 |
KR101387270B1 (ko) * | 2009-07-14 | 2014-04-18 | 주식회사 팬택 | 터치 궤적에 따라 메뉴 정보를 표시하는 이동 단말기 |
JP2013542470A (ja) * | 2009-09-11 | 2013-11-21 | ノヴォディジット・ソシエテ・ア・レスポンサビリテ・リミテ | 人間の呼気を使用してデバイスのユーザインタフェースを制御するための方法およびシステム |
US9264259B2 (en) * | 2009-12-31 | 2016-02-16 | General Motors Llc. | Instructional ring tone |
US20110184736A1 (en) * | 2010-01-26 | 2011-07-28 | Benjamin Slotznick | Automated method of recognizing inputted information items and selecting information items |
CN101976186B (zh) * | 2010-09-14 | 2013-04-03 | 方正科技集团苏州制造有限公司 | 一种计算机语音识别方法及其计算机 |
US8838977B2 (en) | 2010-09-16 | 2014-09-16 | Verance Corporation | Watermark extraction and content screening in a networked environment |
US8533481B2 (en) | 2011-11-03 | 2013-09-10 | Verance Corporation | Extraction of embedded watermarks from a host content based on extrapolation techniques |
US8615104B2 (en) | 2011-11-03 | 2013-12-24 | Verance Corporation | Watermark extraction based on tentative watermarks |
US8682026B2 (en) | 2011-11-03 | 2014-03-25 | Verance Corporation | Efficient extraction of embedded watermarks in the presence of host content distortions |
US8923548B2 (en) | 2011-11-03 | 2014-12-30 | Verance Corporation | Extraction of embedded watermarks from a host content using a plurality of tentative watermarks |
US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
US9547753B2 (en) | 2011-12-13 | 2017-01-17 | Verance Corporation | Coordinated watermarking |
US9323902B2 (en) | 2011-12-13 | 2016-04-26 | Verance Corporation | Conditional access using embedded watermarks |
CN103185599B (zh) * | 2011-12-28 | 2017-11-07 | 上海博泰悦臻电子设备制造有限公司 | 一种车载端数据处理系统及地理信息数据处理平台 |
US9117449B2 (en) | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
US9063731B2 (en) * | 2012-08-27 | 2015-06-23 | Samsung Electronics Co., Ltd. | Ultra low power apparatus and method to wake up a main processor |
US9571606B2 (en) | 2012-08-31 | 2017-02-14 | Verance Corporation | Social media viewing system |
US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
US9106964B2 (en) | 2012-09-13 | 2015-08-11 | Verance Corporation | Enhanced content distribution using advertisements |
US10438591B1 (en) | 2012-10-30 | 2019-10-08 | Google Llc | Hotword-based speaker recognition |
US9691377B2 (en) | 2013-07-23 | 2017-06-27 | Google Technology Holdings LLC | Method and device for voice recognition training |
CN103021409B (zh) * | 2012-11-13 | 2016-02-24 | 安徽科大讯飞信息科技股份有限公司 | 一种语音启动拍照系统 |
US20140149118A1 (en) * | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
US9264801B2 (en) * | 2012-12-04 | 2016-02-16 | Storz Endoskop Produktions Gmbh | System and method for pairing a command device incorporating a microphone to a remotely controlled medical system |
CN103888587B (zh) * | 2012-12-19 | 2016-01-20 | 中国移动通信集团公司 | 一种唤醒终端的方法、dsp芯片及终端 |
US9112984B2 (en) | 2013-03-12 | 2015-08-18 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9275638B2 (en) | 2013-03-12 | 2016-03-01 | Google Technology Holdings LLC | Method and apparatus for training a voice recognition model database |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9262794B2 (en) | 2013-03-14 | 2016-02-16 | Verance Corporation | Transactional video marking system |
CN104078042B (zh) * | 2013-03-25 | 2018-08-10 | 联想(北京)有限公司 | 一种电子设备及一种信息处理的方法 |
US9169684B2 (en) | 2013-04-26 | 2015-10-27 | GM Global Technology Operations LLC | Methods, program products, and systems relating to vehicular garage door control systems |
CN103280217B (zh) * | 2013-05-02 | 2016-05-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
US9251549B2 (en) | 2013-07-23 | 2016-02-02 | Verance Corporation | Watermark extractor enhancements based on payload ranking |
US20150031416A1 (en) | 2013-07-23 | 2015-01-29 | Motorola Mobility Llc | Method and Device For Command Phrase Validation |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
CN103531201B (zh) * | 2013-09-29 | 2016-04-06 | 上海云视科技股份有限公司 | 终端语音命名唤醒方法和系统 |
US9208334B2 (en) | 2013-10-25 | 2015-12-08 | Verance Corporation | Content management using multiple abstraction layers |
EP3117626A4 (en) | 2014-03-13 | 2017-10-25 | Verance Corporation | Interactive content acquisition using embedded codes |
TWI536366B (zh) * | 2014-03-18 | 2016-06-01 | 財團法人工業技術研究院 | 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體 |
US9712623B2 (en) * | 2014-05-30 | 2017-07-18 | Apple Inc. | Answering a call with client through a host |
US9602661B2 (en) | 2014-05-30 | 2017-03-21 | Apple Inc. | Answer and hold with client and host |
CN106161726A (zh) * | 2015-03-23 | 2016-11-23 | 钰太芯微电子科技(上海)有限公司 | 一种语音唤醒系统及语音唤醒方法及移动终端 |
CN106161755A (zh) * | 2015-04-20 | 2016-11-23 | 钰太芯微电子科技(上海)有限公司 | 一种关键词语音唤醒系统及唤醒方法及移动终端 |
US11437020B2 (en) | 2016-02-10 | 2022-09-06 | Cerence Operating Company | Techniques for spatially selective wake-up word recognition and related systems and methods |
US11600269B2 (en) | 2016-06-15 | 2023-03-07 | Cerence Operating Company | Techniques for wake-up word recognition and related systems and methods |
US10404847B1 (en) * | 2016-09-02 | 2019-09-03 | Amnon Unger | Apparatus, method, and computer readable medium for communicating between a user and a remote smartphone |
WO2018086033A1 (en) | 2016-11-10 | 2018-05-17 | Nuance Communications, Inc. | Techniques for language independent wake-up word detection |
CN106961508A (zh) * | 2017-06-01 | 2017-07-18 | 诺雪(重庆)科技有限公司 | 基于姓名识别的通信方法及装置 |
CN107564532A (zh) * | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 电子设备的唤醒方法、装置、设备及计算机可读存储介质 |
KR20190138915A (ko) | 2018-06-07 | 2019-12-17 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법 |
JP7055721B2 (ja) * | 2018-08-27 | 2022-04-18 | 京セラ株式会社 | 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム |
KR20200090438A (ko) | 2019-01-21 | 2020-07-29 | 삼성전자주식회사 | 디스플레이의 손상을 방지하기 위한 전자 장치 및 방법 |
GB2584167B (en) * | 2019-05-24 | 2023-06-28 | Sensae Aps | User interface, user interface system and method |
CN113470645B (zh) * | 2021-06-30 | 2024-05-28 | 百度在线网络技术(北京)有限公司 | 呼叫处理的方法、装置、设备以及存储介质 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4320256A (en) | 1979-11-27 | 1982-03-16 | Freeman Michael J | Verbally interactive telephone interrogation system with selectible variable decision tree |
US4348550A (en) | 1980-06-09 | 1982-09-07 | Bell Telephone Laboratories, Incorporated | Spoken word controlled automatic dialer |
US4644107A (en) | 1984-10-26 | 1987-02-17 | Ttc | Voice-controlled telephone using visual display |
JP2584249B2 (ja) | 1986-10-31 | 1997-02-26 | 三洋電機株式会社 | 音声認識電話機 |
US4853953A (en) | 1987-10-08 | 1989-08-01 | Nec Corporation | Voice controlled dialer with separate memories for any users and authorized users |
US4928302A (en) | 1987-11-06 | 1990-05-22 | Ricoh Company, Ltd. | Voice actuated dialing apparatus |
US5007081A (en) | 1989-01-05 | 1991-04-09 | Origin Technology, Inc. | Speech activated telephone |
JP2927891B2 (ja) * | 1989-06-19 | 1999-07-28 | 日本電気株式会社 | 音声ダイヤル装置 |
US5566229A (en) * | 1992-08-24 | 1996-10-15 | At&T | Voice directed communications system employing shared subscriber identifiers |
US5325421A (en) | 1992-08-24 | 1994-06-28 | At&T Bell Laboratories | Voice directed communications system platform |
US5483579A (en) * | 1993-02-25 | 1996-01-09 | Digital Acoustics, Inc. | Voice recognition dialing system |
US5452340A (en) | 1993-04-01 | 1995-09-19 | Us West Advanced Technologies, Inc. | Method of voice activated telephone dialing |
US5594784A (en) * | 1993-04-27 | 1997-01-14 | Southwestern Bell Technology Resources, Inc. | Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls |
EP0666542A3 (en) * | 1994-02-04 | 1996-05-15 | Fuji Facom Corp | Multimedia system for monitoring and controlling processes. |
EP0739121A3 (en) | 1995-04-19 | 1999-11-17 | Texas Instruments Incorporated | Voice activated telephone |
FI111893B (fi) * | 1995-06-02 | 2003-09-30 | Nokia Corp | Menetelmä ja laite puhelimen ohjaamiseksi komennoilla |
US5787152A (en) * | 1995-07-18 | 1998-07-28 | Freadman; Tommyca | Computer communications device |
EP0788268B1 (en) | 1996-01-31 | 2005-03-16 | Nokia Corporation | Interactive process for voice control between a telephone and its user |
US5719921A (en) * | 1996-02-29 | 1998-02-17 | Nynex Science & Technology | Methods and apparatus for activating telephone services in response to speech |
US5991637A (en) * | 1996-04-19 | 1999-11-23 | Mack, Ii; Gawins A. | Integrated passive and active communications system |
US5765130A (en) * | 1996-05-21 | 1998-06-09 | Applied Language Technologies, Inc. | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems |
US5892813A (en) * | 1996-09-30 | 1999-04-06 | Matsushita Electric Industrial Co., Ltd. | Multimodal voice dialing digital key telephone with dialog manager |
US6112103A (en) | 1996-12-03 | 2000-08-29 | Puthuff; Steven H. | Personal communication device |
US6289140B1 (en) * | 1998-02-19 | 2001-09-11 | Hewlett-Packard Company | Voice control input for portable capture devices |
US6098043A (en) * | 1998-06-30 | 2000-08-01 | Nortel Networks Corporation | Method and apparatus for providing an improved user interface in speech recognition systems |
US6167251A (en) * | 1998-10-02 | 2000-12-26 | Telespree Communications | Keyless portable cellular phone system having remote voice recognition |
US6212408B1 (en) * | 1999-05-03 | 2001-04-03 | Innovative Global Solution, Inc. | Voice command system and method |
-
1999
- 1999-02-08 US US09/246,499 patent/US6449496B1/en not_active Expired - Lifetime
-
2000
- 2000-02-08 WO PCT/US2000/003257 patent/WO2000046969A1/en active IP Right Grant
- 2000-02-08 BR BR0008078-0A patent/BR0008078A/pt not_active IP Right Cessation
- 2000-02-08 DE DE60043098T patent/DE60043098D1/de not_active Expired - Lifetime
- 2000-02-08 CN CNB008060177A patent/CN1173541C/zh not_active Expired - Lifetime
- 2000-02-08 AT AT00908545T patent/ATE445285T1/de not_active IP Right Cessation
- 2000-02-08 AU AU29866/00A patent/AU2986600A/en not_active Abandoned
- 2000-02-08 EP EP00908545A patent/EP1151594B1/en not_active Expired - Lifetime
- 2000-02-08 JP JP2000597937A patent/JP2002536917A/ja active Pending
- 2000-02-08 KR KR1020017010041A patent/KR100616787B1/ko active IP Right Grant
- 2000-02-08 CA CA002362053A patent/CA2362053C/en not_active Expired - Fee Related
-
2002
- 2002-07-10 HK HK02105124.6A patent/HK1043460B/zh not_active IP Right Cessation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002536917A5 (ja) | ||
CA2362053C (en) | Voice recognition user interface for telephone handsets | |
CN100380372C (zh) | 语音控制外语翻译设备用的方法和装置 | |
EP0788268B1 (en) | Interactive process for voice control between a telephone and its user | |
US9215305B2 (en) | Voice-operated interface for DTMF-controlled systems | |
US5805672A (en) | Accessory voice operated unit for a cellular telephone | |
US5594784A (en) | Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls | |
US8306193B2 (en) | Method of pairing a portable device with a communications module of a vehicular, hands-free telephone system | |
CN102111483B (zh) | 一种在通话过程中查询信息的方法、装置及移动终端 | |
JP2004248248A (ja) | ユーザがプログラム可能な移動局ハンドセット用の音声ダイヤル入力 | |
WO2010150101A1 (en) | Telecommunications device with voice-controlled functionality including walk-through pairing and voice-triggered operation | |
US6157844A (en) | Method and apparatus for selecting a communication mode in a mobile communication device having voice recognition capability | |
FI101333B (fi) | Puhekomennoilla ohjattava telepäätelaite | |
JP2004503183A (ja) | 電気通信セッションの進行中に電話番号を自動的に記録する方法と装置 | |
KR100467593B1 (ko) | 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체 | |
US7471776B2 (en) | System and method for communication with an interactive voice response system | |
US20070286395A1 (en) | Intelligent Multimedia Dial Tone | |
US5717740A (en) | Telephone station account number dialing device and method | |
KR20010000595A (ko) | 대화식 음성 제어가 가능한 이동전화단말기 및 그 제어 방법 | |
JP3384282B2 (ja) | 電話装置 | |
KR200219909Y1 (ko) | 대화식 음성 제어가 가능한 이동전화단말기 | |
KR20040001318A (ko) | 음성인식을 이용한 휴대폰의 원격 제어방법 | |
JPH01295552A (ja) | 音声ダイヤル装置 | |
KR20050008987A (ko) | 이동 단말기의 폰북 검색방법 |