JP2002536917A5 - - Google Patents

Download PDF

Info

Publication number
JP2002536917A5
JP2002536917A5 JP2000597937A JP2000597937A JP2002536917A5 JP 2002536917 A5 JP2002536917 A5 JP 2002536917A5 JP 2000597937 A JP2000597937 A JP 2000597937A JP 2000597937 A JP2000597937 A JP 2000597937A JP 2002536917 A5 JP2002536917 A5 JP 2002536917A5
Authority
JP
Japan
Prior art keywords
user
state
function
name
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000597937A
Other languages
English (en)
Other versions
JP2002536917A (ja
Filing date
Publication date
Priority claimed from US09/246,499 external-priority patent/US6449496B1/en
Application filed filed Critical
Publication of JP2002536917A publication Critical patent/JP2002536917A/ja
Publication of JP2002536917A5 publication Critical patent/JP2002536917A5/ja
Pending legal-status Critical Current

Links

Images

Description

【書類名】明細書
【発明の名称】電話ハンドセットの音声認識ユーザインターフェース
【特許請求の範囲】
【請求項1】
電話機用の音声認識ユーザインターフェースを提供する方法において、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供することと、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供することと、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供することと、
対応するリスト機能コマンド語をユーザが言った場合、前記音声認識電話帳中のエントリを前記ユーザに対して読み返す前記音声ブック機能を提供することと、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供することとを含む方法。
【請求項2】
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供することをさらに含み、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項1記載の方法。
【請求項3】
前記音声ブック機能内に追加機能と削除機能とを提供することをさらに含み、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項1記載の方法。
【請求項4】
トレーニング機能を提供することをさらに含み、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項1記載の方法。
【請求項5】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに含む請求項1記載の方法。
【請求項6】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項5記載の方法。
【請求項7】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項6記載の方法。
【請求項8】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項7記載の方法。
【請求項9】
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供することをさらに含む請求項1記載の方法。
【請求項10】
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供することをさらに含む請求項1記載の方法。
【請求項11】
プロセッサにおける実行時に、前記プロセッサに、電話機用の音声認識ユーザインターフェースを提供させる命令を含むコンピュータ読取り可能な媒体において、
前記命令が、前記プロセッサに、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供させ、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供させ、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供させ、
対応するリスト機能コマンド語を前記ユーザが言った場合、前記音声認識電話帳中のエントリを前記ユーザに対して読み返す前記音声ブック機能を提供させ、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供させるコンピュータ読取り可能な媒体。
【請求項12】
前記命令は、実行時に前記プロセッサに、
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供させ、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項11記載のコンピュータ読取り可能な媒体。
【請求項13】
前記命令は、実行時に前記プロセッサに、
前記音声ブック機能内に追加機能と削除機能とを提供させ、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項11記載のコンピュータ読取り可能な媒体。
【請求項14】
前記命令は、実行時に前記プロセッサに、
トレーニング機能を提供させ、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項11記載のコンピュータ読取り可能な媒体。
【請求項15】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに含む請求項11記載のコンピュータ読取り可能な媒体。
【請求項16】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項15記載のコンピュータ読取り可能な媒体。
【請求項17】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項16記載のコンピュータ読取り可能な媒体。
【請求項18】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項17記載のコンピュータ読取り可能な媒体。
【請求項19】
前記命令は、実行時に前記プロセッサに
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供させることをさらに含む請求項11記載のコンピュータ読取り可能な媒体。
【請求項20】
前記命令は、実行時に前記プロセッサに、
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供させる請求項11記載のコンピュータ読取り可能な媒体。
【請求項21】
電話機用の音声認識ユーザインターフェースを提供する装置において、
番号機能と、名前機能と、音声ブック機能とを含む、音声認識機能のすべてにアクセスできるようにトップレベルメニューを提供する手段と、
コマンド語が続く電話番号の数字のシーケンスを言うことによって、電話通話を発信できるように前記番号機能を提供する手段と、
音声認識電話帳中に以前に保存された名前を言うことによって、前記電話通話を発信できるように前記名前機能を提供する手段と、
対応するリスト機能コマンド語をユーザが言った場合、前記音声認識電話帳中のエントリをユーザに対して読み返す前記音声ブック機能を提供する手段と、
ユーザプロンプトの前に、前記音声認識機能にアクセスできるように隠れメニューを提供する手段とを具備する装置。
【請求項22】
対応するリダイヤル機能コマンド語を言うことによって、前記電話通話を発信できるようにリダイヤル機能を提供する手段をさらに具備し、
前記電話通話は、呼び出された最後の番号に対応する電話番号を使用して行われる請求項21記載の装置。
【請求項23】
前記音声ブック機能内に追加機能と削除機能とを提供する手段をさらに具備し、
それによって、
前記ユーザは、前記音声ブック機能中にある間に、対応する追加機能コマンド語を言うことにより前記追加機能にアクセスすることによって、前記音声認識電話帳にエントリを追加してもよく、
前記ユーザは、前記音声ブック機能中にある間に、対応する削除機能コマンド語を言うことにより前記削除機能にアクセスすることによって、前記音声認識電話帳中のエントリを削除してもよい請求項21記載の装置。
【請求項24】
トレーニング機能を提供する手段をさらに具備し、
それによって、
前記ユーザは、前記音声認識ユーザインターフェースの完全な語彙セットをトレーニングでき、
前記ユーザは、前記音声認識ユーザインターフェースの前記完全な語彙セットのうちの一部のみを再トレーニングするように選択できる請求項21記載の装置。
【請求項25】
前記音声認識機能は、予め定められたスリープコマンドを言うことによって前記音声認識機能が待機モードにされるスリープ機能をさらに具備する請求項21記載の装置。
【請求項26】
前記音声認識機能は、前記待機モードにされているときに、予め定められたウェイクアップコマンドのみに応答する請求項25記載の装置。
【請求項27】
前記予め定められたウェイクアップコマンドは、ウェイクアップ音声コマンドを含む請求項26記載の装置。
【請求項28】
前記予め定められたウェイクアップコマンドは、キー押下の予め定められたシーケンスをさらに含む請求項27記載の装置。
【請求項29】
予め定められた時間内に応答が検出されなかったときに、「はい」または「いいえ」応答のためのプロンプトの応答において肯定的な応答を黙示する暗黙はい/いいえデバイスを提供する手段をさらに具備する請求項21記載の装置。
【請求項30】
前記ユーザが、着信に対してアラートされ、音声コマンドを使用して前記着信に応答できる着信機能を提供する手段をさらに具備する請求項21記載の装置。
【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は通信および電気通信デバイスに関する。特に、本発明は新規かつ改良された音声認識ユーザインターフェース、および携帯電話機で使用する関連した方法、および関連したハンズフリー電話付属物に関する。
【0002】
関連技術の説明
ユーザインターフェースは前進する発展の分野を表わし続ける。技術革新は、セルラ電話機のような消費者操作デバイス無数のメニューオプションを通してユーザにアクセス可能な非常に多くの機能を持つことを可能にする。セルラ電話機は一般的にLCDディスプレイを組み込んでおり、ユーザプロンプトおよびメニューオプションを示す。セルラ電話機はまた、その機能がアクティブメニューによって変化するソフトキーを組み込んでいる。ソフトキー機能は一般的にLCDディスプレイに表示される。セルラ電話機は一般に、普通に呼び出す番号のユーザ定義電話帳を記憶する能力単一ボタンの最後の番号リダイヤル能力、前に呼び出した番号メモリ、および発呼者電話番号識別子を含む多くの特徴を組み合わせる。さらに、小さな手持ち型セルラ電話機は一般的に、ユーザがそれを手に持つ必要なく、ユーザの自動車で電話機を操作できるようにするハンズフリーカーキットアダプターのような付属物と結合ることができる。
【0003】
電話機保持する必要なく電話機を操作する能力はいくつかの欠点をもたらす。ユーザは依然として電話機ディスプレイでプロンプトを見ることを要求され、かつ番号をダイヤルすることを要求され、手動キーストロークで電話機の名簿を検索することを要求される。これは電話機で利用可能な種々のメニューを駆動すると同時にナビゲーションを試みているユーザに対して妨害を与えることになる。本発明は、完全なハンズフリーダイヤリングを可能にする音声認識ユーザインターフェースを電話ハンドセットまたはハンズフリーキット(HFK)に組み込むことによりこれらの問題を解決する。加えて、本発明の方法は、音声認識を利用する付加的な機能を提供する。音声認識ユーザインターフェースは、ユーザ要求される手動キーストロークの数を非常に最小化するため、標準電話ユーザインターフェースとともに使用される。
【0004】
【発明の概要】
本発明は、音声認識強化された電話ユーザインターフェースを実現する新規かつ改良された方法および装置である。方法は、音声認識を通して完全なダイヤリング機能アクセス可能性をユーザに許容するために開示される。これは、ユーザが真のハンズフリー電話インターフェースを持つことを可能にする。
【0005】
音声認識ユーザインターフェースはマイクロプロセッサで実行するソフトウエアコード、またはハードワイヤードデバイスとして実現されてもよい。音声認識装置(VR)は、ユーザ音声認識能力を持つ電話機との間のインターフェースを達成するプロセスおよび方法として記述る。音声認識プロセスそれ自体の詳細はこの出願の主題ではなく、議論ない。この出願は、ユーザと音声認識能力提供された電話機との間のインターフェースのみを取り扱う
【0006】
好ましい実施形態において、方法が開示され、「起きろ」のような起動用語を2回言うか、ハンドセットキーを押すかにより、ユーザが待機電話モードから音声認識モード入ることができる。以下に詳述る好ましい実施形態では、方法はまず、初期音声トレーニングが前もって行われているかを見るためにチェックする。音声トレーニング前もって行われていたのであれば、好ましい方法はトップレベルメニューに続く。しかし、音声トレーニングがまだ行われていないのであれば、方法はトレーニングメニューを開始する。
【0007】
好ましい方法は、トレーニングを要求する2つの語彙セット、基本セットおよび数字セットを含む。基本セットはユーザコマンド用語を含み、他方、数字セットはキーパッドおよびダイヤリング機能に関係する語を含む。好ましい方法において、ユーザはトレーニングされている語彙セット中の連続する語を言うように電話機により促される。ユーザは語を繰り返すようにされ、そして音声認識装置が語の両発声の一致を決定すると、音声認識装置はその語を保存するトレーニング方法は、現在の語彙セットのすべての語がトレーニングされるまで続く。
【0008】
トップレベルメニューにおいて、好ましい方法は、ユーザが、4つの機能に対して音声コマンドアクセスすることを可能にし、およびスリープと言うことにより音声認識装置(VR)から抜け出す能力を可能にする。トップレベルメニューにおいて、方法はユーザがコマンドリダイヤル「通話」音声ブックを開始すること、または音声認識装置電話帳に以前に保存された名前を言うことを可能にする。トップレベルメニューでの可能な音声コマンドの各々、リダイヤル「通話」音声ブックまたは名前は、好ましい方法において対応している機能を開始するであろう。
【0009】
好ましい方法のリダイヤル機能は、音声コマンドを通して、ダイヤルされた最後の番号に対してユーザが通話を発信できるようにする。
【0010】
通話機能は、音声認識装置電話帳内の名前を言うことにより、または音声コマンドを通して電話番号が入れられかつ発信できるようにする番号機能に入ることにより、ユーザが音声コマンドを使用して電話通話発信することを可能にする。通話機能において、方法は最初に、数字セットトレーニングが完了されているかを見るためにチェックする。方法はそれから、音声認識装置(VR)電話帳に何らかのエントリがあるか見るためにチェックする。数字セットトレーニングが完了されていなくて、VR電話帳が空である場合には、方法はそステータスをユーザに報告し、VRモード内トップレベルメニューに戻るようにVRに指示する。VR電話帳が空でない限り、VRは名前を入力するようにユーザを促すであろう。ユーザが名前を話すと、VRは名前機能を開始する。数字セットトレーニングが完了されている場合には、ユーザは番号を言うことにより番号機能に付加的にアクセできる。数字セットトレーニングが完了されていない場合には、好ましい方法では番号機能はアクセス可能ではない。逆に、番号機能は、数字セットトレーニングが完了されており、かつVR電話帳が空である場合に利用可能な唯一の機能である。
【0011】
番号機能において、方法は電話番号の数字を言うこと、または「通話」または照合を要求するようにユーザを促す。ユーザは、長さ32まで、一時に1つの数字で電話番号を入れることが許される。方法は、「クリア」と言うことにより、間違って入れられた数字を一時に1つユーザが削除することを可能にする。クリアコマンドは最後に入れられた数字が削除されるようにする。好ましい方法はまた、「照合と言うことにより入れられた電話番号をユーザが照合することを可能にする。ユーザが照合命令する場合には、VRは入れられた数字を読み戻し、それからさらに数字を入れるように促すことが続く。これは、すべての電話番号の入力を完了する前に入れられた数字をユーザが照合することを可能にする。通話を発信する前に入れられた電話番号を照合するために、「照合」コマンドを同様に、使用ることができる。数字が最初に入れられた後、ユーザは「通話」を言うことにより電話通話を発信できる。
【0012】
方法により組み込まれた名前機能は、ユーザが電話番号に関係する名前を言うことによりVR電話帳中の電話番号を再呼び出しできるようにする。トップレベルメニューまたは通話機能において、ユーザが名前を言うと、VRはVR電話帳の複数の名前がその名前一致するかを見るためにチェックする。VR電話帳の複数の名前がユーザ要求名前と一致する場合には、VRはその一致した名前のリストを編集し、最も良く一致するものが要求されたものであったか否かをユーザに尋ねるユーザが同意しないのであれば、VRは次に最も良く一致するものが要求されたものであったか否か尋ねることを続ける。ーザが一致同意するまで、または、VRが一致エントリのリストを使い尽くすまで、VRはこのループを続ける。VRが一致エントリのリストを使い尽した場合には、VRは名前機能を取り消し、トップレベルメニューに戻る。ユーザが一致したもののうちの1つに同意する場合には、VRはこれが一致た唯一の名前であるかのように続ける。ただ1つの名前が一致するのであれば、VRは通話するための名前の肯定を要求する。ユーザが肯定する場合には、VRから出て通話が発信される。ユーザが肯定しない場合には、VRは名前機能を取り消し、トップレベルメニューに戻る。
【0013】
好ましい方法は音声ブック機能がトップレベルメニューでアクセスできるようにする。くつかの機能音声コマンドを通してアクセスできる一方、他の機能へのアクセスはハンドセットキーパッドによるユーザ入力を要求する。音声ブック機能入るとき、VRは「追加削除リストを言うこと、またはキーパッドオプションから選択するようにユーザを促す
【0014】
リスト機能はVR電話帳をしてユーザがブラウジングすることを可能にする。音声ブックメニューのリストをユーザが言うことに応答して、VRはVR電話帳が空であるか否かを見るためにチェックする。VR電話帳が空である場合には、そのときブラウジングするエントリはない。VR電話帳が空でない場合には、VRはVR電話帳の名前を読み、最後のエントリに到達るまで、またはVRがユーザにより中断されるまで続く。
【0015】
ユーザは追加と言って、VR電話帳に追加をする。VRの電話帳が一杯でない場合には、VRは追加する名前をユーザに尋ねる。ユーザが名前を言うと、VRはユーザにその名前を繰り返すように促す。ユーザが名前を繰り返した後、VRは最初に新しい名前がコマンド語の1つに一致していないことを見るためにチェックする。名前がコマンド語に一致している場合には、ユーザは、この名前に近いコマンド語伝えられるか、または別の名前を言うように命令される。次にVRは追加機能の名前入力ループの始めに向けられる。名前がコマンド語のうちの1つに一致していない場合には、VRは名前の両方の発声が一致しているかを見るためにチェックする。2つの語が一致していない場合には、VRはユーザに一致が不成功であり、再び試みるように伝える。一致が不成功であった後に、VRは追加機能の最初のプロンプト戻る。一致成功に続いて、VRは、(VRの電話帳ではなく)ハンドセットの電話帳が何らかのエントリを含んでいるか否かを見るためにチェックする。ハンドセットの電話帳が空である場合には、VRはユーザにキーパッドを使用して電話番号を入力するように命令する。ユーザが電話番号の入力を完了すると、VRはユーザに名前がVR電話帳に追加されたことを伝える。VRは名前を保存し、音声ブック機能戻る。ハンドセットの電話帳が空でない場合には、VRは、ユーザがキーパッドを使用して電話番号を入力するか、ハンドセットの電話帳をスクロールして、番号を見付け、名前に割り当てる。ハンドセットの電話帳をスクロールするか、またはキーパッドで入力することによって電話番号を入力すると、ユーザは追加キーを押して、VR電話帳にこの電話番号を保存する。次にVRはユーザに、名前がVR電話帳に追加されたことを伝える。VRは電話番号を保存し、音声ブック機能に戻る。
【0016】
ユーザは、音声ブック機能において削除と言うことによって、削除機能に入る。VRは最初に、VR電話帳にエントリがあるか見るためにチェックする。VR電話帳にエントリがある場合には、VRはユーザに削除する名前を尋ねる。さらに加えて、電話上のソフトキーは次へを示す。ユーザが名前応答する場合には、VRは最初に、VR電話帳複数の名前が一致しているか否かを見るためにチェックする。複数の名前が一致している場合には、VRは一致している名前のリストを編集し、最も良く一致しているものを決定し、最も良く一致しているものがユーザによって発話されたものであるか否かをユーザに尋ねる。ユーザがいいえと答えると、VRは、次に最も良く一致しているものを使用して要求を繰り返す。これは、一致している名前のリストをすべて使い尽くすまで、またはユーザがその一致に同意するまで繰り返される。一致している可能性のあるすべての名前を使い尽くしても、一致を見付けられなかった場合には、VRは削除機能のトップに戻る。ユーザが一致に同意すると、VRはメモリから名前および電話番号を削除し、名前が削除されたことをユーザに伝える。VR電話帳の1つの名前のみが一致する場合には、VRはその名前が削除する名前であるか否かをユーザに尋ねる。ユーザがはいと答えると、VRは名前を削除することをユーザに伝え、トップレベルメニュー戻る。ユーザがいいえと答えると、VRは削除機能のトップに戻る。
【0017】
電話の「次へのソフトキーが押されると、VRはVR電話帳から次の名前を検索し、それが削除する名前か否かをユーザに尋ねる。VRは、ユーザが最初に名前を言ったかのように同じやり方でプロセスを継続する。
【0018】
音声ブック機能のトップのキーパッドオプションは、ユーザVRブックのエントリをクリアする選できるようにする。クリアブックオプションは頻繁に使用されないので、キーパッド機能としてのみ提供される。クリアブック機能はすべてのVR電話帳のエントリをクリアする。
【0019】
トレーニング機能は、基本セットのトレーニング、数字セットのトレーニング、または再トレーニングに対応する別のキーパッドオプションを提供する。基本セットのトレーニングおよび数字セットのトレーニングについては、上で概略的に記載したが、以下の詳細な説明でさらに説明する。再トレーニング能は、基本セットまたは数字セットの部分のみを再トレーニング可能にする。ユーザは、基本セットまたは数字セット関係するキーを選択するように促される。ユーザがこの選択を行うと、VRは対応する語彙セットから最初の語を検索し、これが再トレーニングすべき語であるか否かをユーザに尋ねる。ユーザが同意する場合には、VRは語を再トレーニングするようにユーザに命令し、再トレーニング続いて、語彙セットから次の語を検索し、すべての語を使い尽くすまで、このプロセスを繰り返す。語が再トレーニングすべきものであるか否かを尋ねられた場合には、ユーザが「いいえと応答すると、VRは語彙セット中の次の語に進み、この新しい語で質問を繰り返す。ユーザはこれらの語を再トレーニングすることを実際に選択するかどうかにかかわらず、語彙セット中の語のすべてが質問されると、再トレーニングが完了し、トップレベルメニューに戻ることをVRはユーザに伝える。
【0020】
ハンズフリーモードで着信に応答する能力は、ハンズフリーモードで通話を開始する能力と同じくらい重要である。この方法は、音声で命令された通話応答を可能にする特徴を組込むことによってこれを取り扱う着信があるとき、VRは、着信があることをユーザに伝え、通話に応答するか否かをユーザに尋ねる。ユーザがはいと応答する場合には通話は応答される。ユーザがいいえ応答し場合には、この着信に対する別の通話音声アラートはない
【0021】
本発明の特徴、目的、および利点、同じ参照符号が全体を通して対応したものを識別している図面を考慮に入れると、以下の詳細な説明から、より明白になるであろう。
【0022】
好ましい実施形態の詳細な説明
さまざまな図中のブロックは、インターフェースの状態、プロセスのステップ、または、ブロックの対応する機能を実現するのに必要とされるハードウェアのブロックを表していると考えることができる
【0023】
図1を参照すると、音声認識ユーザインターフェースの新規の特徴には、音声入力80のみを使用して電話機10に命令する、ユーザ70の能力が含まれている。好ましい実施形態において、電話機10は、ハンズフリーキット20のセルラハンドセットである。電話機10がハンズフリーキット20内に受け入れられているとき、電話機とハンズフリーキット(示されていない)との間のインターフェース、RF、制御、オーディオ信号がハンズフリーキットを通過できるようにする。典型的なセルラ電話機は、ディスプレイ152とともに、ディスプレイ152上に示された異なる機能を操作するソフトキー30も備えているさらに、一般に参照されるような、電話機またはハンドセット10は、キーパッド50とともに、ユーザの音声入力80を受けるマイクロホン60も有している。電話機の機能性は、プログラムコードを受け取りメモリ40に情報を記憶する、電話機内のマイクロプロセッサによって制御されている(電話機の外には表われていない)。
【0024】
図2Aを参照すると、移動電話機は、番号がない状態待機102にあるとき、典型的には、電話機のディスプレイ152は、見出し140、現行のシステムの日付と時間142、現行のソフトキーの選択144、146のような情報を示す。音声認識装置(VR)、スリープモードにある。ユーザは、音声で命令される電話機の機能を可能にするために、音声認識装置始めることができる。ユーザは、ステップ103において、エンドキーを押すか起きろという用語2回言うことによって、スリープモードから出て、VRアクティブモードに入ることができる。この時点で、ステップ104において、VR、初期トレーニングが行われているか否かを見るためにチェックする。もし行われていなければ、VRは、完全トレーニング700に進む。もし多少の初期トレーニング行われている場合には、VRは、隠れエキスパートメニュー600に進む。隠れエキスパートメニュー600は、ユーザにトップレベルメニューと同じ機能性を可能にするが、ユーザは、トップレベルメニューのプロンプトを待必要がない。1.5秒間のみアクティブである隠れエキスパートメニュー600は、後で詳しく説明る。隠れエキスパートメニュー600後の、トップレベルメニューの状態110を表し、トップレベルメニューの状態110は、他のメニューおよび機能のプロセスの完了または取り消しに続いて、他のメニューおよび機能が戻るところである。トップレベルメニューの状態110において、VRは、ユーザに対して、ステップ108で、「通話、リダイヤル、音声ブック、またはスリープ」と言う。また、VRは、プロンプト音鳴らす。ハンドセット上のディスプレイ152は、音声認識がオンになっていることを示すさらに、ハンドセットは、900(図12Aおよび図12B)に示されるようなトレーニング機能にアクセスするために、トレーニングソフトキー150が利用可能であることを示す。
【0025】
図2Bを参照すると、プロンプト音106を鳴らした後に、VRは状態112に進み、タイムアウトまでユーザの音声入力を待。VRが状態112でタイムアウトした場合には、VRはトップレベルメニュー110に戻り、「通話、リダイヤル、音声ブック、またはスリープモード」と言うことによって、状態108において、再びユーザを促す。VRは再びプロンプト音を鳴らす。次に、VRはブロック112に戻り、再びユーザの音声入力を待。ユーザは、4つのコマンドのうち1つを言うか、または、VR電話帳のエントリ名を言うという選択肢を有する。利用可能なコマンドは、リダイヤル、通話、音声ブック、スリープである。テップ122のリダイヤルテップ126の通話、ステップ128の音声ブックのコマンドが、VR対応する機能200、400、500を開始させる。これらの各々は、以下で詳述る。同様に、ユーザがVR電話帳にある名前を言う場合には、名前機能300が開始される。ステップ130において、ユーザが音声コマンドスリープを言うか、または、任意のキーを押すとVRは抜け出て、待機またはスリープモードに戻る。出口プロセスを開始する状態が、図1に、120のように示されている。VRは、状態132で、音声認識装置はスリープ中ですと言い、出口音134を鳴らす。ハンドセットディスプレイ152は、音声認識装置はスリープ中ですと表示する。次に、VRは、待機状態102に戻る。
【0026】
図3Aを参照すると、ップレベルメニュー110または隠れエキスパートメニュー600で、ユーザが「通話」コマンド発声した後に、通話機能400に入る通話機能400に入った直後、ユーザは、約1.5秒の間、隠れエキスパートウィンドウが開いている状態402にされる。この隠れエキスパートウィンドウ402は、トップレベル機能100において利用可能な隠れエキスパートメニュー600とは異なっている。この、状態402での隠れエキスパートウィンドウは、プロンプトを待つ必要なユーザがすべての通話機能コマンドにアクセスできるようにする。ユーザが1.5秒ウィンドウ以内コマンドを開始させない場合には通話機能は状態404に進み、ここでVRは数字トレーニングが完了されているかどうかを調べる。次に、通話機能は、数字トレーニングが完了されていかどうかに応じて、状態406(図3B)または状態408に進む。状態406および408の両方において、VRは、VR電話帳に何らかのエントリがあるかどうかを調べる。
【0027】
VR電話帳にエントリがなく、数字セットトレーニングが完了されていな場合には通話機能は状態434に進む。VRは、音声ブックが空ですと言い、次に、通話機能を出て、トップレベルメニューの状態110に戻る。これは、数字セットトレーニング実行されておらず、VR電話帳にエントリがない場合には、ユーザが通話機能のコマンドにアクセスできないために起こる。
【0028】
数字セットトレーニング実行されていないが、VR電話帳が空でない場合には番号コマンドは、ユーザにアクセスできないが名前コマンドは、利用可能である。このような状況下で、通話機能の流れは、状態410に進む。VRは、名前を話すか、または通話機能を出るためにはクリア言って下さい」と言う。VRは、プロンプト音106を鳴らし、状態418に進んで、ユーザの入力を待。ユーザの入力前に状態418でタイムアウトが起こった場合には、VRは状態420に進み、ここでVRは前のプロンプトが繰り返されているかどうかを調べる。プロンプトが繰り返されていない場合には、VRは状態410に戻る。プロンプトが既に繰り返されていた場合には、VRは状態120に進み機能をVRから出させる
【0029】
図3Bを参照すると、VR電話帳にエントリがないが数字セットトレーニングは完了されている場合には通話機能は状態430に進む。VRは、音声ブックは空ですと言い、番号機能1400(図4A)の状態1420に進む。VR電話帳にエントリがないため、ユーザは、名前コマンドを使用できず番号コマンドのみが使用可能である。したがって、機能の順序は、番号のプロンプトに直接流れる。
【0030】
数字セットトレーニングが完了されており、VR電話帳にエントリがある場合には、ユーザは、通話機能すべてのコマンドにアクセス可能である。通話機能の流れは状態412に進み、ここで、VRが名前を話すか、言葉番号を言うか、通話機能を出るためにはクリア言って下さい」と言。VRは、プロンプト音106を鳴らし、状態414に進んで、ユーザの入力を待。ユーザが入力する前に状態414でタイムアウトが起こった場合には、VRは状態416に進み、ここでVRは前のプロンプトが繰り返されたかどうかを調べる。プロンプトが繰り返されていない場合には、VRは状態412に戻る。プロンプトが既に繰り返されていた場合には、VRは、状態120に進み、機能をVRから出させる
【0031】
ユーザが状態414、418で提供される第1または第2の応答ウィンドウのいずれかで応答する場合には通話機能の流れは、ユーザが状態426で番号、状態422でクリア命令するか、状態424でVR電話帳にある名前を話すかのいずれかであるかに応じて、3つの方法のうち1つに進む。ユーザが状態424でVR電話帳にある名前を話す場合には、VRは名前機能300に進む。ユーザが状態422でクリアと言うかまたはクリアキーを押す場合には、VRは、通話機能をキャンセルし、トップレベルメニュー110に戻る。
【0032】
図4Aを参照すると、ユーザが状態426で番号と言う場合には、VRは番号機能1400に進む。番号機能1400において、最初にVRは状態1416を提供しここで、隠れエキスパートウィンドウが1.5秒間利用可能であ。この隠れエキスパートウィンドウ1416は、隠れエキスパートメニュー600または他機能の任意の隠れエキスパートウィンドウとは別個であり、独立したものである。この隠れエキスパートウィンドウ1416において、ユーザは、状態1422のプロンプトを聞く前に、言葉で任意の番号機能コマンド入力を行うことが可能である。隠れエキスパートウィンドウ1416がタイムアウトした場合には、VRは番号のプロンプト状態1422に進む。状態1422に至るポイント1420は、VR電話帳にエントリはないが数字セットトレーニングは完了されているときに、VRが通話機能から進むところである。状態1422において、VRは、数字を一度に1つ言って下さい終了したときは通話または照合言って下さい」と言うことによってユーザを促す。VRは、プロンプト音106を鳴らし、次に、ブロック1424に進んで、ユーザの入力を待。入力タイムアウト前にユーザが応答しない場合には、VRは状態1428に進み、前のプロンプトが5回繰り返されていたかどうかを調べ。プロンプトが既に5回繰り返されていた場合には、番号機能は状態120に進み、VRモードを出る。プロンプトが5回繰り返されていない場合には、VRは状態1422に戻る。ユーザが状態1424で入力タイムアウト前に応答する場合には、VRは、ユーザの入力がコマンド語または数字であるかどうかを調べる。
【0033】
コマンドが照合である場合(状態1454)には、状態1458においてVRは、ダイヤルされるべき番号を読み上げる。そして、VRは、隠れエキスパートウィンドウ1416に戻るポイント1410進む。
【0034】
図4Aの下部および図4Bを参照すると、状態1430においてユーザが数字を言うと、状態1432においてVRは、数字の最大数がすでに入力されているかどうかを認識してチェックする。すでに入力された数字の数が数字の最大と等しい場合には、1438の状態においてVRは、最大の長さになりました。終了したときは、通話または照合と言って下さい」言う。そして、VRはポイント1410に進み、次ユーザ入力を待ために隠れエキスパートウィンドウ1416に戻る。数字の最大が入力されていない場合には、状態1434においてVRは、ユーザによって言われた番号繰り返す。そして、VRはポイント1410に進みここで、さらにユーザの入力を待つために、隠れエキスパートウィンドウ1416に戻る。
【0035】
状態1422のプロンプトに対するユーザ応答がスリープである場合(状態1460)には、VRは、図4Bに示された状態1462に進みスリープと言いましたか?言う。ユーザがはい応答すると(状態1464)、VRはポイント120に進み、VRを出る。ユーザが「いいえ」と応答すると(状態1466)、VRはポイント1410に進み、隠れエキスパートウィンドウ1416に戻る。ユーザ応答がSTSまたは拒否の場合(状態1490)には、VRは、状態1492進み、はいと言いましたか?言う。ユーザがこのプロンプトに対してはい」と応答した場合(状態1496)には、VRはポイント120に進んで、VRを出る。ユーザ応答がいいえあるいは他のSTSまたは拒否である場合には、VRはポイント1410に進んで、隠れエキスパートウィンドウ1416
【0036】
図4Aの下部および図4Cを参照すると、ユーザのコマンドがクリアであるか、またはユーザがクリアキーを押した場合(状態1440)には、VRは状態1444に進んで、入力された数字の数がゼロよ大きいかどうかを見るためにチェックす数字が入力されていない場合には、状態1454においてVRは「番号が入力されていません言ってポイント1410に進み、隠れエキスパートウィンドウ1416(状態1422)。数字が前もって入力されている場合には、VRは状態1442に進んで連続クリアコマンドが発行され、入力された数字の数が1よりも大きいかどうかをチェックす連続「クリアコマンドがあり、数字の数が1よりも大きい場合には、VRは連続クリア機能4400に進んで望まれるのであれば、ユーザがエントリ体をクリアできるようにする連続「クリアコマンドが発行されていないかまたは、入力された数が1つのみである場合には、VRは状態1446に進んで、入力された最後の番号を削除し、クリアされました」言う。そして、VRはポイント1410に戻り、次のユーザ入力を待
【0037】
状態1450にあるようにユーザコマンドが「通話」である場合には、VRは、状態1452進み、何らかの番号が入力されているかどうかを見るためにチェックする。何の番号も入力されていない場合には、VRは状態1454進んで、「何の番号も入力されていません」言い、次にポイント1420に戻って、ユーザ入力のためのプロンプト番号が入力されている場合には、状態1470は、VRが「呼び出し中」言うことを示し、入力された番号繰り返す。ユーザがプロンプトに対して沈黙しているか、または、「はいと答えると(状態1472)、VRは状態1494進み、通話を開始する。ユーザがいいえと言うと(状態1474)、VRはポイント1410に進んで、隠れエキスパートウィンドウ1416ーザ応答がSTSまたは拒否であることVRが決定する場合(状態1480)には、VRは状態1482進み、「通話したかったですかと尋ねる。ユーザがはいと答えるか、または、沈黙していると(状態1484)、VRは状態1488進み、通話を開始する。ユーザ応答がいいえ」または他の拒否の場合には(状態1486)、VRはポイント1410に進み、隠れエキスパートウィンドウ1416
【0038】
上記のように、連続クリアコマンドは、すべての番号クリアするオプションをユーザに可能にするように特に取り扱われる。連続クリア機能のフローチャートは、図5に示されている。いったん、クリアコマンドが入力されたとVRが決定すると、状態4410においてVRは、電話番号全体をクリアしますか?」言う状態4420に示されているようにユーザがはいと答えると、「すべての数字がクリアされました」言い(状態4422)、現在入力されているすべての数字をクリアする。次に、VRは、プロンプト音106を鳴らす。そして、VRはポイント1410に戻り、番号機能1400内隠れエキスパートウィンドウ1416に進む
【0039】
電話番号全体をクリアするとのVRの問い合わせに対する応答において、ユーザがいいえと答える場合(状態4430)には、状態4432においてVRは、1つの数字がクリアされました」言い、最後に入力された数字をクリアする。そして、VRは、プロンプト音106を鳴らすクリアコマンドは、連続クリア機能が存在していない場合には1つの数字のクリアになるので、連続クリア機能はデフォルトでこの結果になる。この時点において、フローは、肯定的な応答パス同じパスをたどる。VRはポイント1410に戻り番号機能1400内の隠れエキスパートウィンドウ1416に進
【0040】
図6を参照すると、隠れエキスパートメニュー600は、追加のコマンドまたは機能を提供しないので、正確には独立したメニューではない。むしろ、隠れエキスパートメニュー600は、ユーザが、VRのプロンプト必要なく、コマンドを入力するのを可能する。初のトレーニング判定(状態104)を通待機モードの状態102からのフローは、図1のトップレベル機能のフローチャートから来ることが図3から分かる。いったん、初のトレーニングが実行されていることをVRが決定する(状態104)場合には、隠れエキスパートメニュー600利用可能である。隠エキスパートメニュー600ので、ユーザはVRからのプロンプトを聞くよりもにあらゆるトップレベルメニューコマンドにアクセスすることが可能である。VRは、1.5秒間だけ隠れエキスパートメニュー600を起動する。ユーザがプロンプトを待ちたい場合にはまたはユーザが隠れエキスパートメニュー600の存在に気づいていない場合には、VRは、状態620に示された1.5秒間の応答ウィンドウの後、トップレベルメニュー110進む。隠れエキスパートメニュー600は、さまざまな機能において利用可能である多くの隠れエキスパートウィンドウから区別すべきである。機能それぞれにおける隠れエキスパートウィンドウは、ユーザプロンプトを最初に聞く必要く、それぞれの機能内で入力を可能にしている
【0041】
図7Aを参照すると、名前機能300は、VRの電話帳中エントリの名前を言うことによって、ユーザによりアクセスされる。トップレベル機能100、または通話機能400から、VR電話帳301エントリの名前を言った後に、ユーザが名前機能300に入る。状態310においてVRは、複数の名前が一致するかどうかを見るためにチェックする。
【0042】
図7Bを参照すると、複数の名前が一致すれば、VRは、最良の一致確立するために名前を並べ替える。次の状態330では、VRは、「(最良に一致する名前)と言いましたか?」と尋ねる。ここで、(最良に一致する名前)は、VRが最良の一致をもたらすと決定したR電話帳の名前を表す。また、VRは、答えが必要とされていることをユーザに知らせるようにプロンプト音106を鳴らす態332として示されているように「いいえで答えた場合には、VRは状態344に進み、すべての一致問い合わせられているかどうかを見る。すべての一致問い合わせられていない場合には、VRは、状態346において最良の一致を検索し、次最良の名前で、状態330におけるプロンプトを繰り返すさらなる名前がい場合には、VRは名前機能300をキャンセルし、トップレベルメニュー110に戻る。
【0043】
態336に示されているように、ユーザが、状態330のプロンプトに対して「はいと答える場合には、VRは状態320に進み、一致する名前が、発見された唯一の一致する名前であるようにVRが進む。ユーザが速く話し過ぎる(STS)場合にはまたは状態330における問い合わせに対するユーザ応答が、拒否された場合(状態334)には、VRは状態338進み、はいと言いましたか?と尋ねる。VRは、次にプロンプト音106を鳴らす。ユーザが、状態342に示されているように、状態338の問い合わせに対していいえ応答した場合には、VRは状態344に進み、最初のいいえの答えに対して、状態332におけるように応答を処理す。ユーザがはいと答えた場合には、VRは状態320進む。他のどの応答に対しても、またはユーザがタイムアウト内に答えない場合には、VRは、トップレベルメニュー110進むために名前機能300出る
【0044】
図7Aに戻り参照すると、いったん、VRがつの一致した名前が存在するものと判断すると、VRは状態320に進み「(名前)を呼び出し中」と言うここで、(名前)はVR電話帳の一致した名前を表す。VRは、その後、ユーザの応答のために1.5秒待つーザが沈黙しているか、または応答がはい場合には(状態322)、VRは状態324において通話開始する。VRは、沈黙は暗黙の「はいとして解釈する。状態326に示されているように、ユーザがいいえと応答した場合には、VRは状態370において「キャンセルされました」言う。VRは、その後、状態372において名前機能300をキャンセルし、トップレベルメニュー110に戻る。状態350に示されているように、ユーザの応答がSTSまたは拒否である場合には、VRは、状態352において、ユーザに対して「通話を望んでいましたかと尋ねる。VRは、その後、プロンプト音106を鳴らす。ユーザが「はい」と答える場合(状態354)には、VRは状態356において通話開始するーザが「いいえ」と答える、または応答がSTSまたは拒否である場合(状態358)には、VRは状態360において「キャンセルされました」言う。名前機能300は、状態362においてキャンセルされ、そして、VRはトップレベルメニュー110に戻る。
【0045】
図8を参照すると、ユーザは、トップレベル機能100からリダイヤル機能200にアクセスすることができる。ダイヤル機能は、後に呼び出した番号をユーザがリダイヤルできるようにするものである。トップレベルメニュー110から、ユーザはリダイヤル言うことにより、リダイヤル機能200に入る。このリダイヤル機能200に入った後、VRは、状態210において、「(最後に呼び出した番号)をリダイヤルしますか」と言うことにより、ユーザを促す。ここで、(最後に呼び出した番号)はハンドセットによって呼び出された最後の番号を表す。VRは、さらに、プロンプト音106を鳴らして、ユーザに対して、応答が要求されていることを示すザが「いいえ」と応答しまたはキーパッドの何らかのキーが押された場合(状態212には、VRは状態214において「キャンセルされました」言う。VRはリダイヤル機能をキャンセルし、トップレベルメニュー110に戻る。ザが「はい」と応答し、または沈黙である場合(状態216)には、VRは通話開始する(状態218)RがSTS応答を検出するか、またはユーザの応答が拒否である場合(状態220)には、VRは状態222に進み、ユーザに対して「通話を望んでいましたか?と尋ねる。VRは、その後、プロンプト音106を鳴らす。ユーザがいいえと応答する(状態224)場合には、VRは状態214に進み、ここで、VRはキャンセルされました」言い、リダイヤル機能をキャンセルする。VRは、その後、トップレベルメニュー110に戻る。ザが「はい」と応答するか、または沈黙である(状態226)場合には、VRは状態218において通話開始するのSTSまたは拒否であると(状態228)、VRは状態214に進み、ここで、VRはキャンセルされました」言い、リダイヤル機能をキャンセルする。VRは、その後、トップレベルメニュー110に戻る。
【0046】
図9Aを参照すると、ユーザはトップレベル機能100から音声ブック機能500にアクセスできる。音声ブック500によりユーザはVR電話帳に対してエントリを追加したり削除したりできるとともに、VR電話帳中のエントリを読むようにVRに命令することができる。この後者の特徴によりユーザはVR電話帳中をハンズフリー方法でブラウジングすることができる。トップレベルメニュー110からユーザは音声ブックと言うことにより音声ブック機能500に入る。いったんユーザが音声ブック機能500に入ると、隠れエキスパートウィンドウ502がユーザに対して1.5秒間だけ利用可能となる。れエキスパートウィンドウ502はトップレベル機能100において利用可能な隠れエキスパートメニュー600とは異なり、独立したものである。この隠れエキスパートウィンドウ502は音声ブック機能500でのみアクティブとなり、隠れエキスパートウィンドウ502により、ユーザはユーザプロンプトを待たずにすべての音声ブックコマンドにアクセス可能になるーザが隠れエキスパートウィンドウ502の時間枠内に応答しない場合には、VRは音声ブックユーザプロンプト510に進音声ブックユーザプロンプト510において、VRはリスト、追加、または削除、あるいは音声ブックを出るためにはクリアと言って下さい」と言う。次いで、VRはプロンプト音106を鳴らすさらに、電話機は「ブックをクリア」キーパッドオプション514を表示する。
【0047】
ーザがこの「ブックをクリア」オプションに対応するキーを押す場合(状態520)には、VRは状態522に進み、ハンドセットディスプレイを制御してユーザに対して「すべての音声ブックエントリを消去しますか?」と尋ねる問い合わせ示すはい」と「いいえ」を表すソフトキー523および525がユーザに利用可能である。ユーザが「はい」のソフトキーで選択する(状態524)場合には、ハンドセットディスプレイ152は「すべての音声ブックエントリを消去しました」を表示する。VRは次いで状態528に進み、「音声ブックは空です」と言い、VRはトップレベルメニュー110に戻る。ーザが「いいえ」ソフトキーを選択する(状態526)場合には、VRは音声ブック機能をキャンセルし、トップレベルメニュー110に戻る。
【0048】
ーザが「クリア」と言うか、またはクリアキーを押す(状態512)場合には、音声ブックユーザプロンプトに応答してVRは音声ブック機能をキャンセルしてトップレベルメニュー110に戻る。ユーザ応答が「追加」であると(状態532)、VRは追加機能5200を開始する。同様に、ユーザ応答が「削除」であると状態530)、VRは削除機能5300を開始する。
【0049】
音声ブックユーザプロンプト510に応答して、ユーザが「リスト」と言うと状態5100)、VRはまずVR電話帳が空であるかをチェックする(状態5110)。VR電話帳が空である場合には、状態5112においてVRは「音声ブックは空です」と言い、隠れエキスパートウィンドウ502に戻る。
【0050】
図9Bを参照すると、VR電話帳が空でない場合には、状態5114においてVRは「ブックエントリ:(名前1)…(最終エントリ)」と言う。ここで、(名前1)はVR電話帳の最初の名前を示し、(最終エントリ)はVR電話帳中の最後の名前を示す。さらに、ハンドセットディスプレイ152は「さらに」5116および「戻る」5118を表すソフトキーを提供する。ユーザが「さらに」ソフトキー5116を押す場合には、VRは次に進んで次の名前を読む。ユーザが「戻る」ソフトキー5118を押す場合には、VRは最初のエントリからの名前を読始めるユーザが沈黙のままである場合(状態5120)には、VRは状態5122進み、VR電話帳からの名前のリストアップ最終エントリまで続ける。いったんVRが最終エントリ読むと(状態5124)、VRは「これ以上のエントリはありません」と言い、隠れエキスパートウィンドウ502より前のポイントに戻る。
【0051】
VR音声ブックエントリのリストアップを行っている間にVRがSTSを検出するか、VRユーザ入力拒否を検出するか、あるいはユーザが話した場合(状態5130)には、VRは状態5132に進み、「エントリの聞き取りを続けますか?」と尋ねる。ユーザが「はい」と答えるか、または沈黙する場合(状態5134)にはRは次の音声ブックエントリを読む。ユーザが「いいえ」と答える場合(状態5136)にはRは隠れエキスパートウィンドウの直前のポイント506に戻る。Rが他のSTSまたは拒否を検出する場合(状態5140)には、状態5142においてVRは「はいと言いましたか?」と尋ねる。ユーザが「はい」と答える場合(状態5144)には、VRは次の音声ブックエントリを読む(状態5150)ーザが「いいえ」と答える場合(状態5146)には、VRは隠れエキスパートウィンドウ502の直前のポイント506に戻る。
【0052】
音声ブックのリストアップ間にユーザがコマンド「スリープ」で応答する場合(状態5160)には、VRは状態120に進み、待機モード102に戻る
【0053】
図10Aを参照すると、ユーザは音声ブック機能ユーザプロンプト510において「追加」と言うことにより追加機能に入ることができる。追加機能最初に入るときに、VRは既に最大数のエントリがあるか否かをチェックする(状態5210)大数のエントリがある場合には、VRは状態5212に進み、「音声ブックは一杯です」と言う。次いでVRは追加機能5200から出て、トップレベルメニュー110に戻る。
【0054】
音声ブックに利用可能なスペースがある場合には、VRは状態5220に進み、「追加する名前」と言う。VRは次いでプロンプト音106を鳴らす。プロンプトの後、VRは状態5222においてユーザの入力を待つ。タイムアウト前にユーザの入力がない場合には、VRはシステムタイムアウトルーチン1200を開始するタイムアウト前にユーザが名前を話した場合(状態5224)には、VRは状態5234においてこの名前がコマンド語と一致するか否かをチェックする。VRはユーザがコマンド語と一致する名前を保存することを許可しない。これは語の処理において結果として生じる曖昧さのためである。前がコマンド語と一致すると、状態5250においてVRは「この名前は語:(語)ととてもよく一致します」と言う。ここで、(語)はユーザが追加を望んでいる名前に一致するとVRが決定したコマンド語を表す。VRはプロンプト音106も鳴らして、ユーザに対して応答が要求されていることを示す。VRは次いで状態5220に戻り、新しいユーザ応答を入力するように促す
【0055】
いったん満足な名前が入力されると、VRは状態5230において「もう一度」と言うことにより、ユーザにその名前を繰り返すように促す。VRはプロンプト音106も鳴らす。図10Bを参照すると、状態5232においてVRはユーザがその名前を繰り返すのを待つ。ーザがタイムアウト前に応答しない場合には、VRはシステムタイムアウトルーチン1200を開始する。
【0056】
名前がいずれのコマンド語と一致しなくても、2つのユーザ発声は依然として互いに一致しなければならない。状態5240においてVRは名前が一致する2つのユーザ発声をチェックする。2つの発声が一致しない場合は、VRは状態5242に進み、「語の一致に成功しませんでした。再度試して下さい」と言う。次いでVRは状態5220に戻り、しい名前を入力するようにユーザを促す2つのユーザ発声が一致すると、VRはユーザにその名前に対応する電話番号の入力を許可する。
【0057】
VRはキーパッドを使用してこの電話番号を入力するのを許可し、またはハンドセット電話帳に記憶されている番号から電話番号をコピーしてもよい。ユーザにハンドセット電話帳からのコピーを許可する前に、VRは状態5260においてハンドセット電話帳に何らかの電話番号が記憶されているか否かをチェックする。
【0058】
図10Cを参照すると、ハンドセット電話帳に何ら番号が記憶されていない場合には、VRは状態5262に進み、「キーパッドを使用して電話番号を入力して下さい。終了しときは、追加を押して下さい」と言う。この時点において、ユーザは電話番号を入力するのにキーパッドのみ使用することが許可されている。ユーザが電話番号を入力する、入力された番号がハンドセットディスプレイ152に表示される。さらに、ハンドセットディスプレイは「追加」ソフトキー5292の利用可能性を表示する。いったんユーザが電話番号の入力を行うと、ユーザは「追加」ソフトキー5292を押して、そのエントリを音声ブック中に保存しなければならない。ユーザが「追加」ソフトキー5292を押した後、VRは状態5280に進み、「(名前)が追加されました」と言う。ここで、(名前)は以前のプロンプトからのユーザの発声に対応する。VRは次に音声ブック機能500の隠れエキスパートウィンドウ502に戻る。
【0059】
状態5260においてハンドセット電話帳中にエントリがあることをVRが決定する場合には、VRは状態5270に進み、「キーパッドを使用して電話番号を入れて下さい。終了したときは、追加を押して下さい」と言う。これはハンドセット電話帳にエントリがないケースと同じ音声プロンプトであることに注意すること。しかしながら、ハンドセットディスプレイ152によりユーザはハンドセット電話帳中のエントリをスクロールできる。ユーザがキーパッド押下を使用して電話番号の入力を選択する場合には、VRは状態5264にしたがって処理を進める。しかしながら、ユーザはハンドセット電話帳のスクロールを選択し(状態5272)、対応する電話番号を表示できる。いったんユーザがハンドセット電話帳中のエントリを特定すると、ユーザはビューソフトキー5252を押して対応する電話番号を表示することができる。のエントリがユーザが追加したいものではない場合には、ユーザはバックソフトキー5254を押して前のハンドセット電話帳ディスプレイ152に戻ることができる。ユーザは、ビューディスプレイ152において、追加ソフトキー5256を押すことにより、ハンドセット電話帳からの電話番号をVR電話帳に追加することを選択できる。いったんユーザが追加ソフトキー5256を押すと、VRは状態5280に進み、「(名前)が追加されました」と言う。次いでVRは音声ブック機能500内の隠れエキスパートウィンドウ502に戻る。
【0060】
図11Aを参照すると、ユーザはVR電話帳からエントリを同様に削除することができる。ユーザは、音声ブック機能のユーザプロンプト510において「削除」と言うことにより削除機能5300に入る。削除機能に入る際に、VRは、まずVR電話帳が既に空となっているか否かをチェックする(状態5310)。VR電話帳が既に空の場合には、削除するためのエントリはない。状態5312において、VRは「音声ブックは空です」と言う。次に、VRは、トップレベルメニュー110に戻る。VR電話帳においてエントリがある場合には、VRは状態5320移動し、「削除する名前」と言う。次に、VRは、プロンプト音106を鳴らす。VRは状態5322においてユーザの声またはキー入力を待つ。ユーザによる入力がなく、システムがタイムアウトとなった場合には、VRは状態5324に進み、ここで、VRはプロンプトが既に繰り返されているか否かをチェックする。プロンプトがまだ繰り返されていない場合には、VRは状態5328に進み、「削除する名前を言うか、次へボタンを使用して名前をさらに聞いて下さい」と言う。VRはプロンプト106も鳴らす。次に、VRはブロック5322戻り、ユーザの入力を待つ。システムが2回タイムアウトになった場合には、VRは削除機能をキャンセルし、トップレベルメニュー110に戻る。
【0061】
ユーザは、名前を話すか、または次へソフトキー5314を押すことにより、前のプロンプトに応答できる。ユーザが、状態5380に示すように、次へソフトキー5314を押した場合には、VRは、図11Cを参照して以下で説明されている状態5332に進む。
【0062】
図11Bを参照すると、ユーザが、状態5326に示すように名前を言った場合には、VRは状態5330に進み、複数の名前が一致するか否かをチェックする。一致する名前が複数あるときには、VRは、VRが名前機能300において複数の名前一致取り扱うのと同様に複数の名前の一致を処理する。複数の名前が一致した場合には、VRは状態5340において「(最良に一致する名前)と言いましたか?」言う。ここで、(最良に一致する名前は、VRが最良の一致をもたらすと決定したVR電話帳中の名前を表す。VRは、また、プロンプト音106を鳴らし、返答が要求されていることをユーザに知らせる。問い合わせされた名前が、ユーザの話したものでない場合には状態5342に示されているように、ユーザは「いいえ」と答える。次に、VRは、状態5344に進み、すべての可能性のある一致について問い合わせされたか否かをチェックする。すべての名前の一致について問い合わせされていない場合には、VRは状態5346において、次の最良の名前の一致を検索し、状態5340に戻り、次の最良の名前の一致でプロンプトを繰り返す。しかしながら、さらなる名前がい場合には、VRは状態5390に進み(図11Aを参照)、「削除する名前を話すか、次へボタンを使用して名前をさらに聞いて下さい」と言う。VRはプロンプト音106を鳴らし、ユーザによる入力が要求されていることを知らせる。次に、VRは状態5322に戻り、ユーザによる入力を待つ。状態5348に示されているように、問い合わせされた名前がユーザの話した名前と一致した場合には、ユーザは「はい」と答える。次に、VRはポイント5394に進み、ここでVRは状態5372に進み、「(名前)は削除されました」と言う。状態5372に続き、VRは、音声ブック機能500の隠れエキスパートィンドウ502に戻る。
【0063】
状態5350に示されているように、ユーザが速く話し過ぎる(STS)場合にはまたはブロック5340における問い合わせに対するユーザの返答が拒否された場合には、VRは状態5352に進み、「はいと言いましたか?」と尋ねる。VRはプロンプト音106を鳴らし、ユーザによる入力が要求されていることを示す。ユーザが「いいえ」と応答した場合(状態5356)には、VRはポイント5392に進み、最初の「いいえ」の答えに対するブロック5342におけるように、この応答を処理する。ユーザが「はい」と返答した場合には、VRは、ポイント5394に進ことにより、最初の「はい」の答えに対するブロック5348におけるように、この応答を処理する。状態5358に示されているように、他の何らかの応答に対して、VRは、削除機能をキャンセルし、トップレベルメニュー110戻る。
【0064】
図11Cを参照すると、VRが、VR電話帳からのただ1つの名前とユーザからの力とが一致する決定した場合には、または、ユーザが次へソフトキーを押した場合には、VRは状態5332に進み、「(名前)を削除しますか?」と言う。(名前)は、Rが一致すると決定した、VR電話帳からの名前対応する。VRはまた、プロンプト音106を鳴らし、返答が要求されていることをユーザに知らせる。次に、VRは状態5360においてユーザの入力を待つ。ユーザの応答がなく、VRがタイムアウトした場合には、VRは状態5332に戻り、プロンプトを繰り返す。状態5370に示されているように、ユーザの返答が「はい」であった場合には、またはユーザが「削除ソフトキー5398を押した場合には、VRは状態5372に進み、「(名前)は削除されました」と言う。次に、VRは音声ブック機能502の隠れエキスパートウィンドウ502に戻る。状態5376に示されているように、ユーザの返答が「いいえ」であった場合には、VRは、状態5320(図11A)戻り、削除する名前を入力するようにユーザに促す。状態5378に示されているように、ユーザが「次へソフトキー5399を押した場合には、VRは状態5382に進み、VR電話帳から次の名前を検索する。次に、VRは状態53戻り、VR電話帳の次の名前についてユーザを促す。状態5362に示されているように、ユーザの応答がSTSまたは拒否である場合には、VRは状態5364進み、「はいと言いましたか、(名前)を削除しますか?」と言う。次に、VRはプロンプト音106を鳴らす。この問い合わせに対するユーザの応答が「はい」であ場合(状態5374)には、VRはブロック5372進み、状態5370においてあたかもユーザが「はい」と答えたのと同じプロセスを使用することよりエントリを削除する。ユーザの応答が「いいえ」であった場合には、または、他のSTSまたは拒否である場合(状態5366)には、VRは状態5368進み、「キャンセルされました」と言って、ブロック5320戻り、削除する名前を入力するようにユーザに促す。
【0065】
図12Aを参照すると、トップレベル機能100においてユーザが「トレーニング」ソフトキー150を押すことによってのみ、トレーニング機能にアクセスできる。トレーニング機能900は、ユーザがキーパッドを押したことに対する応答によってのみ動作する。これは、最初にトレーニングを実行せずに音声によるコマンドを介してトレーニングにアクセスすることは不可能だからである。いったんユーザがトレーニング機能900に入ると、VRは状態902進み、ここで、ハンドセットディスプレイ152は、トレーニングするためにユーザが選択することができる2つの語彙セット、基本セット906と数字セット908を表示する。基本セットは、通話、リダイヤル、はい、いいえ、付加、削除、音声ブック、スリープ、ウェイクアップ、クリア、リスト、回答を含むコマンド語からなる。数字セットは、0、1、2、3、4、5、6、7、8、9、オー、スター、ポンド、照合番号を含むキーパッドおよびダイヤル関連語である。ユーザが基本セットを選択するか(状態910)、または数字セットを選択するか(状態920)により、ユーザには完全トレーニングまたは再トレーニングの選択肢が与えられる。ハンドセットディスプレイ152は、トレーニングオプション942および再トレーニングオプション944を表示する。ハンドセットは、また、「出る」ソフトキー946を表示する。ユーザが語彙セットをトレーニングすることを選択する場合(状態914)には、VRは完全トレーニング700を初期化する。ユーザがただ、語彙セットを再トレーニングすることを選択した場合(状態916)には、VRは再トレーニング機能800を初期化する。ユーザは、「出る」ソフトキー946を選択することにより、トレーニングを実行しないように決めることもできる。この選択は状態924として示されている。ユーザが「出る」ソフトキー946を押した場合には、VRはポイント120進み、VRを出て機102に戻るように進む
【0066】
図12Bを参照すると、ユーザは、「0」キーを押し続けることにより、すべての音声コマンドおよびVR電話帳のエントリ消去することができる(状態930)。この選択は隠されており、ハンドセットディスプレイ上には示されていない。ユーザが、「0」キーを押しつづけた場合には、VRは状態932進み、ここで、ハンドセットディスプレイ950は、「音声コマンドおよび電話帳のエントリ消去しますか」と表示し、「はい」、「いいえ」のソフトキー選択952、954を提供する。ユーザが「はい」のソフトキーを押した場合(状態936)には、VRは状態938進み、ここで、VRはすべてのVRコマンド語およびすべてのVR電話帳のエントリ消去する。次に、VRはポイント120進み、音声認識モードを出る。ユーザが「いいえ」のソフトキーを押した場合(状態934)には、VRはポイント120進み、内容を何ら変更することなく音声認識モードを出る
【0067】
図13Aを参照すると、完全トレーニング機能700は、トレーニング機能900を介してアクセスされるか、またはトレーニングがまだ実行されていない場合(図1の104参照)にVRに入る際に自動的にアクセスされる。完全トレーニング機能700において、VRは、まず、初期トレーニングが完了しているか否かをチェックする(状態702)。初期トレーニングがまだ実行されていない場合には、VRはデフォルトで基本セットのトレーニング行う(状態704)。ハンドセットディスプレイ152は、「基本セット」をヘッダー762として示すトレーニング機能900から完全トレーニング機能700に入る場合にはトレーニング機能900において選択された語彙セットが、ハンドセットディスプレイ152上にヘッダー762として表示される。ハンドセットディスプレイ152は、また、「出る」ソフトキー764を表示する。ユーザが「出る」ソフトキー764を選択した場合には、VRは、状態706において、「音声認識装置はスリープ中です」と言う。次に、VRは音声認識モードを出て、待機102進む。
【0068】
語彙セットが決定された後、VRは、状態710において「音声指示にしたがって、トレーニングを開始して下さい」と言う。次に、VRは、状態712において語(語)を言って下さい」と言う。ここで、(語)は、トレーニングされている語彙セット中の最初の語を表す。VRは、プロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。次に、VRは、状態716においてユーザの入力を待つ。ユーザによる入力の前に、システムがタイムアウトとなった場合には、VRは状態712に戻り、プロンプトを繰り返す。
【0069】
図13Bを参照すると、ユーザがプロンプトに応答した場合には、VRはユーザに対して語を繰り返すように要求する。VRは、状態720において、「もう一度」と言う。次に、VRは、プロンプト音106を鳴らす。VRは、状態724において、ユーザが語を繰り返すのを待つ。ユーザによる入力の前にVRがタイムアウトとなった場合には、VRは状態720に戻り、「もう一度」プロンプトを繰り返す。ユーザが応答した場合には、状態726においてVRは、両方のユーザの発声を比較して、これらが一致しているか否かをチェックする。2つの発声が一致していない場合には、VRは状態740において「語の一致は成功しませんでした」と言う。次に、VRは状態712に戻り、同じ語についてトレーニングのルーチンを繰り返す。VRが、2つの発声が一致したと判断した場合には、VRはメモリにその語保存し、状態728において、語彙セットのすべての語トレーニングされたか否かをチェックする。語彙セットのすべての語トレーニングされていない場合には、VRは語彙セットの次の語を検索する(状態732)。次に、VRは、状態712戻り、語彙セットの次の語に対し、トレーニングのルーチンを繰り返す。いったん語彙セットのすべての語トレーニングされると、VRは状態730に進み、「(語彙セット)トレーニングは完了しました。音声認識は動作中です」と言う。この用語(語彙セット)は、現在トレーニングされている、基本または数字の現在の語彙セットと対応する。次に、VRは、トップレベルメニュー110に戻る。
【0070】
図14Aを参照すると、再トレーニング機能800はトレーニング機能900からアクセスできる。再トレーニング機能800によりユーザ語彙セットの任意の部分を再トレーニングできる。再トレーニング機能に入ると、VRは、音声指示にしたがって、トレーニングを開始して下さい」(状態802)と言う。ユーザは多数のキーパッドオプションを持っている。ユーザは終了キーまたは「出る」ソフトキー870を押して(状態860)、ポイント120に進みVRを出ることができる。ユーザはクリアキーを押して(状態862)、トレーニング機能における前の表示に戻ることができる(状態864)。その他の任意のキーが押されると(状態866)、機能動作が起こらなくなる(状態868)。
【0071】
Rに再トレーニング機能800を抜け出させる任意のキー押しをユーザが選択しない場合には、状態810においてVRは再トレーニングされている語彙セットにおける最初の語を検索する。VRは状態812に進み、(語)はこの語を再トレーニングしますか?」と言う。この問い合わせにおいて、(語)は再トレーニングされるべき語彙セット中の現在の語を表している。その後、VRはプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。状態814に示されているように、ユーザがいいえ」で応答する場合には、またはいいえソフトキー874を押す場合には、VRは語彙セットの次の語を検索し(状態838)、状態812プロンプトに戻る。態816に示されているように、ユーザが「はいを応答する場合にはまたは「はいソフトキー872を押す場合には、VRはその語の再トレーニングを開始する。VR状態820に進み、語(語)を言って下さい」と言い、それからVRはプロンプト音106を鳴らす。それから、VRは状態822においてユーザ入力を待つ。ユーザがシステムタイムアウト前に応答しない場合には、VRはシステムタイムアウトルーチン1200を開始する。
【0072】
図14Bを参照すると、ユーザがシステムタイムアウト前答える場合には、状態824においてVRは「もう一度」と言うことにより、ユーザがその語を繰り返すように要求する。VRはこの要求後にプロンプト音106を鳴らす。VRは状態826においてユーザが語を繰り返すを待つ。ユーザが答える前に、このポイントからシステムがタイムアウトする場合には、VRはシステムタイムアウトルーチン1200を開始する。ユーザがシステムタイムアウト前に応答する場合には、状態828においてVRは両方の発声が一致することを確認する。2つの発声が一致しない場合には、VRは状態832に進み、「語の一致は成功しませんでした。再度試して下さい」と言う。その後、VR状態820戻り、ユーザに同じ語を再トレーニングするように促す。2つの発声が一致する場合には、VRは状態830進み、(語)は再トレーニングされました」と言う。ハンドセットディスプレイ152はへ」および済み882および884に対するソフトキーを示す。
【0073】
図14Cを参照すると、ユーザが済みソフトキーを選ぶ(状態850)場合には、VRは状態852に進み、トレーニングは完了しました」と言う。その後、VRはトップレベルメニュー110に戻る。ユーザがへ」ソフトキーを選ぶ(状態834)場合には、状態836においてVRは現在の語彙セットのすべての語トレーニングされているか否かをチェックする。すべての語が再トレーニングされていない場合には、VRは状態838に戻り、再トレーニングのために語彙セットの次の語を検索する。語彙セットのすべての語が再トレーニングされている場合には、VRは状態852に進み、トレーニングは完了しました」と言い、トップレベルメニュー110に戻る。表示され、または促されず、このポイントで利用可能な1つのコマンドはスリープコマンドである。ユーザがスリープコマンドを発行する(状態840)場合には、VRは現在の語彙セットになされたいかなる変化も保存し(状態842)、それからトップレベルメニュー110に戻る。
【0074】
図15Aを参照すると、ユーザは音声コマンドを使用して着信に応えることができる。電話着信を受けると、VRは最初に電話が自動応答モードにあるか否かをチェックする(状態1010)。電話が自動応答モードにある場合には、VRはユーザの応答を受ける必要がない(状態1012)。代わりに、VRがないかのように電話自動応答が動作する。
【0075】
次に、VRは基本トレーニングが完了している否かを知るためにチェックする(状態1002)。基本トレーニングがなければ、VRはユーザの音声コマンドを認識することができない。したがって、基本トレーニングが行われていない場合には、システムは状態1004に進み、電話はVR返答を開始しない。代わりに、電話はVRがないかのように単にベルを鳴らす。基本トレーニングが既に実行されている場合には、VRの応答は着信がローミング通話かどうかに依存する。着信がローミング通話でない場合には、状態1008においてVRは短いベル音を発し、それから「着信です。応答しますか?」と言う着信がローミング通話である場合には、状態1008においてVRは短いベル音を発しローミング着信です。応答しますか?」と言う話されるプロンプトとは無関係に、VRはプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。
【0076】
図15Bを参照すると、VRは状態1020においてユーザ応答を待つ。ユーザが応答しない場合には、VRは状態1032に進み、プロンプトが2回繰り返されたか否かを見る。プロンプトが2回繰り返されていなかった場合には、状態1030においてVRはローミング着信です」と言う着信がローミング通話である場合にはVRはローミング」と言うだけである。その後、VRはブロック1020に戻り、ユーザ応答を待つ。プロンプトが2回繰り返された後にユーザが依然として応答しない場合には、VRはミス通話」と言う(状態1034)。その後、VRは待機102に戻る。
【0077】
ユーザがVR着信プロンプトの何れかに対して「はいまたは応答応答した場合には、または通話に応えるように構成されているキーのうちの何れかを押す(状態1022)場合には、電話着信に返事する(状態1026)。その後、VRは通話応答音1036を鳴らし通話が返答されたことをユーザに示す。
【0078】
代わりに、ユーザがVR着信プロンプトに対して「いいえ」と応答する場合には、またはユーザが着信アラート沈黙させるように構成されているキーのうちの何れかを押(状態1024)場合には通話は応答されさらなるアラートこの特定の通話に対して提供されない(状態1028)。
【0079】
VRがSTSまたは拒否を検出す(状態1040)場合には、VRは状態1042に進み、「はと言いましたか」と言う。ユーザがいいえ」と応答す(状態1046)場合には、VRは状態1048に進み、着信アラートを停止する。ユーザがはい」と応答す(状態1050)場合には、VRは着信に応答し(状態1052)、それから通話応答音1036を鳴らす。他のSTSまたは拒否が生じる(状態1044)場合には、VRはポイント1006に戻り、着信プロンプトを繰り返す。
【0080】
図16を参照すると、VRは速く話し過ぎる(STS)ルーチン1100組み込んでおり、ユーザ応答が速過ぎる、またはVRプロンプトに部分的に重なる場合を取り扱う。STSルーチンが適切でなかった場合には、VRは入力拒否を増加する。その理由は応答ウィンドウが開いている間に生じるユーザ応答の一部のみをVRが解析するからである。STSが生じるとユーザ応答の一部だけが解析されるので、VRはユーザによって話される語を信頼性高く決定できない。STSルーチンはユーザ応答が要求される殆どすべての場合に適切である。標準STSルーチンが使用されない場合には、VRは一般的にSTSルーチンの修正バージョンを組み込んでいる。STSルーチン1100はVRがユーザに対して応答を入力するように促す場合にアクティブとなる(状態1102)。一般にVRはプロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。VRがSTSを検出す(状態1104)場合には、VRは状態1106に進み、ここでは、ユーザに応答させるためにSTS発声後1秒間VRは沈黙したままである。その後、VRは状態1120に進み、のプロンプトを繰り返す。Rは再びプロンプト音106を鳴らして、応答が要求されていることをユーザに知らせる。VRは状態1108において有効なユーザ応答を待つ。ユーザが有効応答を提供する場合には、VRは状態1110に進み、機能のコマンドを遂行する。VRが他のSTSのために、話された語を決定できない場合には、システムは状態1122において1秒間沈黙したままである。再び、VRはのプロンプトを繰り返し(状態1132)、再びプロンプト音106を鳴らす。第2プロンプト後に他のSTS、拒否がある場合には、またはユーザ応答がない(状態1124)場合には、VRはユーザを訂正しようとしない。代わりに、VRはアクティブ機能をキャンセルし、トップレベルメニュー110に戻る。ユーザがSTSまたは拒否を行わないで応答す(状態1126)場合には、VRはそのコマンドで進み(状態1130)、STSルーチンを利用した機能のポイントに戻る。
【0081】
図17を参照すると、VRはシステムタイムアウト機能1200を組み込んでおり、VRがユーザ応答を要求し、何も受け取らない場合を取り扱う。ユーザ応答がいとき、システムタイムアウト機能1200はアクティブ機能をキャンセルするよりも応答する他の機会をユーザに与える。VRは大半のプロンプトに対してシステムタイムアウト機能1200を使用するが、ときには、特に機能フローチャートにおいて入力タイムアウトを取り扱う。VRは、システムタイムアウト機能1200がアクティブであるさまざまな場合で、初期プロンプトとプロンプト音106を提供する(状態1202)。ユーザは2秒応答ウィンドウ与えられる(状態1204)。ユーザが応答する場合には、VRは状態1206に進み、コマンドを実行し、機能に戻る。ユーザが2秒応答ウィンドウ内に応答しない場合には、VRは初期プロンプトを繰り返し(状態1210)、プロンプト音106を繰り返す。再び、ユーザは2秒応答ウィンドウ与えられる(状態1212)。ユーザが応答する場合には、VRは状態1206に進み、コマンドを実行し、機能に戻る。ユーザが第2プロンプトに応答するのに失敗した場合には、VRはポイント120に進み、待機102に向けてVRを出る
【0082】
図18を参照すると、VRは、問い合わせに対するユーザの沈黙をはい応答として処理する暗黙はい/いいえ装置1300を組み込んでいる。この暗黙はい/いいえ装置1300はVRがユーザからはい応答を期待するときにユーザインターフェースにおいて選択的に使用される。一般に暗黙はい/いいえ装置1300はVRがユーザからのコマンドを受け取り状態1302)、それからコマンドの肯定を得ようとする(状態1304)場合に使用される。1.5秒ユーザ応答ウィンドウ(示されていない)では、潜在的ユーザ応答は、沈黙(状態1310)、はい(状態1320)、いいえ(状態1330)、およびSTSまたは拒否(状態1340)を含む。ユーザが沈黙であ(状態1310)場合には、VRはこれを暗黙のはいと考える(状態1312)。VRは状態1314に進み、この機能を行う。ユーザがはい」と応答す(状態1320)場合には、システムはこの機能を行う(状態1322)。ユーザがいいえ」と応答す(状態1330)場合には、機能は状態1332においてキャンセルされ、VRはトップレベルメニュー110に戻る。応答がSTSまたは拒否であれば(状態1340)、VRは状態1342に進み「は言いましたか?」と言うことにより、ユーザ促す。VRはプロンプト音106を鳴らし、応答が要求されていることをユーザに知らせる。その後、ユーザには他の応答ウィンドウ与えられる。上述のように、ユーザがはい」と応答す(状態1346)場合には、システムは機能を行う(状態1346)。同様に、ユーザがいいえ」と応答する場合には、またはユーザ応答が他のSTSまたは拒否である(状態1350)場合には、機能はキャンセルされ(状態1352)、そしてVRはトップレベルメニュー110に戻る。
【0083】
好適実施形態の先の記述は当業者がこの発明を製造または使用できるように提供されている。これら実施形態の種々変形は当業者には容易に明らかであり、ここで定義されている一般的原理は発明力を使用しないで他の実施形態に適用できる。故に、この発明はここで示された実施形態に限定されるものではないが、ここに開示された原理および新規特徴と一致する最大範囲に与えられるべきである。
【図面の簡単な説明】
【図1】
ユーザと、ハンドセットの受け台またはハンズフリーキット内の電話とを示す図。
【図2A】
他のすべての機能へのアクセスを提供するトップレベル機能を示すフローチャート。
【図2B】
他のすべての機能へのアクセスを提供するトップレベル機能を示すフローチャート。
【図3A】
通話を発信するためのインターフェースをユーザに提供する通話機能を示すフローチャート。
【図3B】
通話を発信するためのインターフェースをユーザに提供する通話機能を示すフローチャート。
【図4A】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図4B】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図4C】
ユーザが電話番号の数字を言えるようにすることによって通話発信を行う番号機能を示すフローチャート。
【図5】
入力された電話番号をクリアするために通話機能内で使用される連続クリア機能を示すフローチャート。
【図6】
本発明のトップレベル機能内にある隠れエキスパートメニューを示すフローチャート。
【図7A】
ユーザが電話番号に関係する名前を言えるようにすることによって通話発信を行う名前機能を示すフローチャート。
【図7B】
ユーザが電話番号に関係する名前を言えるようにすることによって通話発信を行う名前機能を示すフローチャート。
【図8】
リダイヤルと言うことによって、最後に呼び出した通話の番号をユーザがリダイヤルできるようにするリダイヤル機能を示すフローチャート。
【図9A】
ユーザが電話番号エントリの音声ブックを編集できるようにする音声ブック機能を示すフローチャート。
【図9B】
ユーザが電話番号エントリの音声ブックを編集できるようにする音声ブック機能を示すフローチャート。
【図10A】
ユーザが名前および電話番号をVRの音声ブック追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図10B】
ユーザが名前および電話番号をVRの音声ブック追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図10C】
ユーザが名前および電話番号をVRの音声ブック追加できるようにする、音声ブック機能内で利用可能な追加機能のフローチャート。
【図11A】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図11B】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図11C】
ユーザがVRの音声ブック内の名前および電話番号を削除できるようにする、音声ブック機能内で利用可能な削除機能のフローチャート。
【図12A】
ユーザが特定のトレーニング機能にアクセスするのに利用する、トレーニング機能を示すフローチャート。
【図12B】
ユーザが特定のトレーニング機能にアクセスするのに利用する、トレーニング機能を示すフローチャート。
【図13A】
音声認識ユーザインターフェースの完全な機能にアクセスするために実行されなければならない完全トレーニング機能を示すフローチャート。
【図13B】
音声認識ユーザインターフェースの完全な機能にアクセスするために実行されなければならない完全トレーニング機能を示すフローチャート。
【図14A】
ユーザが基本および数字の語彙セットの語のサブセットのみを再トレーニングすることができるようにするトレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図14B】
ユーザが基本および数字の語彙セットの語のサブセットのみを再トレーニングすることができるようにするトレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図14C】
ユーザが基本および数字の語彙セットの語のサブセットのみを再トレーニングすることができるようにするトレーニング機能を通してアクセス可能な再トレーニング機能のフローチャート。
【図15A】
ユーザが完全なハンズフリーモードで通話に応答できるようにする着信応答の特徴を示すフローチャート。
【図15B】
ユーザが完全なハンズフリーモードで通話に応答できるようにする着信応答の特徴を示すフローチャート。
【図16】
ユーザの音声入力が要求されたときに利用される速く話し過ぎる機構を示すフローチャート。
【図17】
ユーザがVRシステムによるプロンプトに適時に応答しなかったときに生じるシステムタイムアウトの処理を示すフローチャート。
【図18】
はい/いいえのユーザ応答が要求されたときに利用されることがある暗黙のはい/いいえデバイスを示すフローチャート。
JP2000597937A 1999-02-08 2000-02-08 電話ハンドセットの音声認識ユーザインターフェイス Pending JP2002536917A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/246,499 US6449496B1 (en) 1999-02-08 1999-02-08 Voice recognition user interface for telephone handsets
US09/246,499 1999-02-08
PCT/US2000/003257 WO2000046969A1 (en) 1999-02-08 2000-02-08 Voice recognition user interface for telephone handsets

Publications (2)

Publication Number Publication Date
JP2002536917A JP2002536917A (ja) 2002-10-29
JP2002536917A5 true JP2002536917A5 (ja) 2009-06-25

Family

ID=22930933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000597937A Pending JP2002536917A (ja) 1999-02-08 2000-02-08 電話ハンドセットの音声認識ユーザインターフェイス

Country Status (12)

Country Link
US (1) US6449496B1 (ja)
EP (1) EP1151594B1 (ja)
JP (1) JP2002536917A (ja)
KR (1) KR100616787B1 (ja)
CN (1) CN1173541C (ja)
AT (1) ATE445285T1 (ja)
AU (1) AU2986600A (ja)
BR (1) BR0008078A (ja)
CA (1) CA2362053C (ja)
DE (1) DE60043098D1 (ja)
HK (1) HK1043460B (ja)
WO (1) WO2000046969A1 (ja)

Families Citing this family (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
JP2000244625A (ja) * 1999-02-23 2000-09-08 Nec Saitama Ltd 携帯電話機における音声認識起動方法及び音声認識携帯電話装置
US7260187B1 (en) * 1999-05-11 2007-08-21 Verizon Services Corp. Voice response apparatus and method of providing automated voice responses with silent prompting
JP3847624B2 (ja) * 1999-07-28 2006-11-22 三菱電機株式会社 携帯電話機
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
JP3570332B2 (ja) * 2000-03-21 2004-09-29 日本電気株式会社 携帯電話装置及びその着信メロディ入力方法
US6661879B1 (en) * 2000-07-19 2003-12-09 Xtend Communications Corp. System and method for recording telephonic communications
US7194409B2 (en) * 2000-11-30 2007-03-20 Bruce Balentine Method and system for preventing error amplification in natural language dialogues
ATE261607T1 (de) * 2000-12-14 2004-03-15 Ericsson Telefon Ab L M Sprachgesteuertes tragbares endgerät
US7400712B2 (en) * 2001-01-18 2008-07-15 Lucent Technologies Inc. Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access
US20020097843A1 (en) * 2001-01-19 2002-07-25 Ivoice.Com, Inc. Speech activated telephone device for connection to existing telephone
GB0103053D0 (en) * 2001-02-07 2001-03-21 Nokia Mobile Phones Ltd A communication terminal having a predictive text editor application
US20020137553A1 (en) * 2001-03-22 2002-09-26 Kraemer Tim D. Distinctive ringing for mobile devices using digitized user recorded audio message
US20020137470A1 (en) * 2001-03-23 2002-09-26 Baron Jason C. Method and system for multiple stage dialing using voice recognition
USRE45096E1 (en) * 2001-04-19 2014-08-26 British Telecommunications Public Limited Company Voice response system
US6892081B1 (en) * 2001-05-31 2005-05-10 Nokia Corporation Mobile terminal and method of operation using content sensitive menu keys in keypad locked mode
EP1271346A1 (en) 2001-06-28 2003-01-02 Nokia Corporation Method for searching data in at least two databases
JP4437633B2 (ja) * 2001-08-10 2010-03-24 富士通株式会社 携帯端末
GB0121150D0 (en) * 2001-08-31 2001-10-24 Mitel Knowledge Corp Menu presentation system
US7418381B2 (en) * 2001-09-07 2008-08-26 Hewlett-Packard Development Company, L.P. Device for automatically translating and presenting voice messages as text messages
FI20012358A0 (fi) 2001-11-30 2001-11-30 Nokia Corp Matkaviestinlaite ja menetelmä ohjelmistotoimintojen suorittamiseksi
US7324942B1 (en) * 2002-01-29 2008-01-29 Microstrategy, Incorporated System and method for interactive voice services using markup language with N-best filter element
KR20040001318A (ko) * 2002-06-27 2004-01-07 엘지전자 주식회사 음성인식을 이용한 휴대폰의 원격 제어방법
US7372826B2 (en) * 2002-08-01 2008-05-13 Starent Networks, Corp. Providing advanced communications features
US7072684B2 (en) * 2002-09-27 2006-07-04 International Business Machines Corporation Method, apparatus and computer program product for transcribing a telephone communication
CA2499967A1 (en) 2002-10-15 2004-04-29 Verance Corporation Media monitoring, management and information system
KR20040035515A (ko) * 2002-10-22 2004-04-29 엘지전자 주식회사 핸즈프리 기능을 구비한 이동통신 단말기와 그의 제어 방법
US7873390B2 (en) * 2002-12-09 2011-01-18 Voice Signal Technologies, Inc. Provider-activated software for mobile communication devices
US8041396B2 (en) * 2002-12-20 2011-10-18 Firefly Communications, Inc. Method and system for emergency dialing of a wireless communication device
US20040162116A1 (en) * 2003-02-14 2004-08-19 Lucent Technologies Inc. User programmable voice dialing for mobile handset
KR20040089232A (ko) * 2003-04-11 2004-10-21 엘지전자 주식회사 통화 중 검색전화번호 전송방법
US20050118986A1 (en) * 2003-09-11 2005-06-02 Voice Signal Technologies, Inc. Phone number and name pronunciation interchange via cell phone
WO2005026958A1 (en) * 2003-09-11 2005-03-24 Voice Signal Technologies, Inc. Method and apparatus for back-up of customized application information
KR20050028150A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 음성 신호를 이용한 유저-인터페이스를 제공하는휴대단말기 및 그 방법
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US20050131685A1 (en) * 2003-11-14 2005-06-16 Voice Signal Technologies, Inc. Installing language modules in a mobile communication device
KR100664105B1 (ko) * 2003-12-04 2007-01-04 엘지전자 주식회사 휴대단말기의 음성 인식 방법
US7801283B2 (en) * 2003-12-22 2010-09-21 Lear Corporation Method of operating vehicular, hands-free telephone system
US20050134504A1 (en) * 2003-12-22 2005-06-23 Lear Corporation Vehicle appliance having hands-free telephone, global positioning system, and satellite communications modules combined in a common architecture for providing complete telematics functions
US7050834B2 (en) * 2003-12-30 2006-05-23 Lear Corporation Vehicular, hands-free telephone system
US7197278B2 (en) * 2004-01-30 2007-03-27 Lear Corporation Method and system for communicating information between a vehicular hands-free telephone system and an external device using a garage door opener as a communications gateway
US7778604B2 (en) * 2004-01-30 2010-08-17 Lear Corporation Garage door opener communications gateway module for enabling communications among vehicles, house devices, and telecommunications networks
KR20070002017A (ko) * 2004-02-17 2007-01-04 보이스 시그널 테크놀로지스, 인코포레이티드. 멀티모달 내장형 인터페이스들의 교체가능한 커스텀화 방법및 장치
US7570746B2 (en) * 2004-03-18 2009-08-04 Sony Corporation Method and apparatus for voice interactive messaging
KR100621401B1 (ko) * 2004-03-31 2006-09-08 삼성전자주식회사 회전상태를 인식하여 저장된 정보를 탐색하는이동통신기기 및 그 방법
US20050239511A1 (en) * 2004-04-22 2005-10-27 Motorola, Inc. Speaker identification using a mobile communications device
KR100640505B1 (ko) * 2004-06-01 2006-10-30 삼성전자주식회사 검색된 전화번호에 대한 전화번호 연계 기능을 수행하는방법
KR100605959B1 (ko) * 2004-06-21 2006-08-02 삼성전자주식회사 음성을 이용한 번호입력방법
JP4773448B2 (ja) * 2004-09-24 2011-09-14 ノキア コーポレイション 電子装置のユーザーからの入力を受信する方法
CN100463576C (zh) * 2004-10-10 2009-02-18 英华达(南京)科技有限公司 导向语音个人移动通讯装置及其处理方法
JP4802489B2 (ja) * 2004-12-07 2011-10-26 日本電気株式会社 音データ提供システムおよびその方法
US20060178159A1 (en) * 2005-02-07 2006-08-10 Don Timms Voice activated push-to-talk device and method of use
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
US7668540B2 (en) * 2005-09-19 2010-02-23 Silverbrook Research Pty Ltd Print on a mobile device with persistence
CN100452863C (zh) * 2006-02-16 2009-01-14 华为技术有限公司 一种可视电话控制方法及设备
US20070197266A1 (en) * 2006-02-23 2007-08-23 Airdigit Incorporation Automatic dialing through wireless headset
KR100744301B1 (ko) * 2006-06-01 2007-07-30 삼성전자주식회사 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법
US20070286398A1 (en) * 2006-06-07 2007-12-13 Venkatesan Ramamoorthy Voice Recognition Dialing For Alphabetic Phone Numbers
US20080039056A1 (en) * 2006-06-28 2008-02-14 Motorola, Inc. System and method for interaction of a mobile station with an interactive voice response system
KR20080026691A (ko) * 2006-09-21 2008-03-26 삼성전자주식회사 휴대용 단말에서 음성 다이얼링을 제어하는 장치 및 방법
US9753533B2 (en) 2008-03-26 2017-09-05 Pierre Bonnat Method and system for controlling a user interface of a device using human breath
KR20090107364A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
US8958848B2 (en) 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof
US7759168B2 (en) * 2008-05-13 2010-07-20 International Business Machines Corporation Electromagnetic interference shield for semiconductors using a continuous or near-continuous peripheral conducting seal and a conducting lid
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
KR101185093B1 (ko) * 2008-12-19 2012-09-21 한국전자통신연구원 Autosar 응용 소프트웨어의 소프트웨어 구조 모델링 도구를 위한 프로젝트 관리 장치 및 방법
WO2010124478A1 (zh) * 2009-04-30 2010-11-04 Sheng Yongxiang 用户识别系统中语音管理用户的装置及方法
KR101387270B1 (ko) * 2009-07-14 2014-04-18 주식회사 팬택 터치 궤적에 따라 메뉴 정보를 표시하는 이동 단말기
JP2013542470A (ja) * 2009-09-11 2013-11-21 ノヴォディジット・ソシエテ・ア・レスポンサビリテ・リミテ 人間の呼気を使用してデバイスのユーザインタフェースを制御するための方法およびシステム
US9264259B2 (en) * 2009-12-31 2016-02-16 General Motors Llc. Instructional ring tone
US20110184736A1 (en) * 2010-01-26 2011-07-28 Benjamin Slotznick Automated method of recognizing inputted information items and selecting information items
CN101976186B (zh) * 2010-09-14 2013-04-03 方正科技集团苏州制造有限公司 一种计算机语音识别方法及其计算机
US8838977B2 (en) 2010-09-16 2014-09-16 Verance Corporation Watermark extraction and content screening in a networked environment
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
CN103185599B (zh) * 2011-12-28 2017-11-07 上海博泰悦臻电子设备制造有限公司 一种车载端数据处理系统及地理信息数据处理平台
US9117449B2 (en) 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
US9063731B2 (en) * 2012-08-27 2015-06-23 Samsung Electronics Co., Ltd. Ultra low power apparatus and method to wake up a main processor
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US10438591B1 (en) 2012-10-30 2019-10-08 Google Llc Hotword-based speaker recognition
US9691377B2 (en) 2013-07-23 2017-06-27 Google Technology Holdings LLC Method and device for voice recognition training
CN103021409B (zh) * 2012-11-13 2016-02-24 安徽科大讯飞信息科技股份有限公司 一种语音启动拍照系统
US20140149118A1 (en) * 2012-11-28 2014-05-29 Lg Electronics Inc. Apparatus and method for driving electric device using speech recognition
US9264801B2 (en) * 2012-12-04 2016-02-16 Storz Endoskop Produktions Gmbh System and method for pairing a command device incorporating a microphone to a remotely controlled medical system
CN103888587B (zh) * 2012-12-19 2016-01-20 中国移动通信集团公司 一种唤醒终端的方法、dsp芯片及终端
US9112984B2 (en) 2013-03-12 2015-08-18 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US9361885B2 (en) 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US9275638B2 (en) 2013-03-12 2016-03-01 Google Technology Holdings LLC Method and apparatus for training a voice recognition model database
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
US9262794B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
CN104078042B (zh) * 2013-03-25 2018-08-10 联想(北京)有限公司 一种电子设备及一种信息处理的方法
US9169684B2 (en) 2013-04-26 2015-10-27 GM Global Technology Operations LLC Methods, program products, and systems relating to vehicular garage door control systems
CN103280217B (zh) * 2013-05-02 2016-05-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US20150031416A1 (en) 2013-07-23 2015-01-29 Motorola Mobility Llc Method and Device For Command Phrase Validation
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
CN103531201B (zh) * 2013-09-29 2016-04-06 上海云视科技股份有限公司 终端语音命名唤醒方法和系统
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
EP3117626A4 (en) 2014-03-13 2017-10-25 Verance Corporation Interactive content acquisition using embedded codes
TWI536366B (zh) * 2014-03-18 2016-06-01 財團法人工業技術研究院 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體
US9712623B2 (en) * 2014-05-30 2017-07-18 Apple Inc. Answering a call with client through a host
US9602661B2 (en) 2014-05-30 2017-03-21 Apple Inc. Answer and hold with client and host
CN106161726A (zh) * 2015-03-23 2016-11-23 钰太芯微电子科技(上海)有限公司 一种语音唤醒系统及语音唤醒方法及移动终端
CN106161755A (zh) * 2015-04-20 2016-11-23 钰太芯微电子科技(上海)有限公司 一种关键词语音唤醒系统及唤醒方法及移动终端
US11437020B2 (en) 2016-02-10 2022-09-06 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US11600269B2 (en) 2016-06-15 2023-03-07 Cerence Operating Company Techniques for wake-up word recognition and related systems and methods
US10404847B1 (en) * 2016-09-02 2019-09-03 Amnon Unger Apparatus, method, and computer readable medium for communicating between a user and a remote smartphone
WO2018086033A1 (en) 2016-11-10 2018-05-17 Nuance Communications, Inc. Techniques for language independent wake-up word detection
CN106961508A (zh) * 2017-06-01 2017-07-18 诺雪(重庆)科技有限公司 基于姓名识别的通信方法及装置
CN107564532A (zh) * 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 电子设备的唤醒方法、装置、设备及计算机可读存储介质
KR20190138915A (ko) 2018-06-07 2019-12-17 현대자동차주식회사 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법
JP7055721B2 (ja) * 2018-08-27 2022-04-18 京セラ株式会社 音声認識機能を有する電子機器、その電子機器の制御方法およびプログラム
KR20200090438A (ko) 2019-01-21 2020-07-29 삼성전자주식회사 디스플레이의 손상을 방지하기 위한 전자 장치 및 방법
GB2584167B (en) * 2019-05-24 2023-06-28 Sensae Aps User interface, user interface system and method
CN113470645B (zh) * 2021-06-30 2024-05-28 百度在线网络技术(北京)有限公司 呼叫处理的方法、装置、设备以及存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4320256A (en) 1979-11-27 1982-03-16 Freeman Michael J Verbally interactive telephone interrogation system with selectible variable decision tree
US4348550A (en) 1980-06-09 1982-09-07 Bell Telephone Laboratories, Incorporated Spoken word controlled automatic dialer
US4644107A (en) 1984-10-26 1987-02-17 Ttc Voice-controlled telephone using visual display
JP2584249B2 (ja) 1986-10-31 1997-02-26 三洋電機株式会社 音声認識電話機
US4853953A (en) 1987-10-08 1989-08-01 Nec Corporation Voice controlled dialer with separate memories for any users and authorized users
US4928302A (en) 1987-11-06 1990-05-22 Ricoh Company, Ltd. Voice actuated dialing apparatus
US5007081A (en) 1989-01-05 1991-04-09 Origin Technology, Inc. Speech activated telephone
JP2927891B2 (ja) * 1989-06-19 1999-07-28 日本電気株式会社 音声ダイヤル装置
US5566229A (en) * 1992-08-24 1996-10-15 At&T Voice directed communications system employing shared subscriber identifiers
US5325421A (en) 1992-08-24 1994-06-28 At&T Bell Laboratories Voice directed communications system platform
US5483579A (en) * 1993-02-25 1996-01-09 Digital Acoustics, Inc. Voice recognition dialing system
US5452340A (en) 1993-04-01 1995-09-19 Us West Advanced Technologies, Inc. Method of voice activated telephone dialing
US5594784A (en) * 1993-04-27 1997-01-14 Southwestern Bell Technology Resources, Inc. Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
EP0666542A3 (en) * 1994-02-04 1996-05-15 Fuji Facom Corp Multimedia system for monitoring and controlling processes.
EP0739121A3 (en) 1995-04-19 1999-11-17 Texas Instruments Incorporated Voice activated telephone
FI111893B (fi) * 1995-06-02 2003-09-30 Nokia Corp Menetelmä ja laite puhelimen ohjaamiseksi komennoilla
US5787152A (en) * 1995-07-18 1998-07-28 Freadman; Tommyca Computer communications device
EP0788268B1 (en) 1996-01-31 2005-03-16 Nokia Corporation Interactive process for voice control between a telephone and its user
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
US5991637A (en) * 1996-04-19 1999-11-23 Mack, Ii; Gawins A. Integrated passive and active communications system
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
US5892813A (en) * 1996-09-30 1999-04-06 Matsushita Electric Industrial Co., Ltd. Multimodal voice dialing digital key telephone with dialog manager
US6112103A (en) 1996-12-03 2000-08-29 Puthuff; Steven H. Personal communication device
US6289140B1 (en) * 1998-02-19 2001-09-11 Hewlett-Packard Company Voice control input for portable capture devices
US6098043A (en) * 1998-06-30 2000-08-01 Nortel Networks Corporation Method and apparatus for providing an improved user interface in speech recognition systems
US6167251A (en) * 1998-10-02 2000-12-26 Telespree Communications Keyless portable cellular phone system having remote voice recognition
US6212408B1 (en) * 1999-05-03 2001-04-03 Innovative Global Solution, Inc. Voice command system and method

Similar Documents

Publication Publication Date Title
JP2002536917A5 (ja)
CA2362053C (en) Voice recognition user interface for telephone handsets
CN100380372C (zh) 语音控制外语翻译设备用的方法和装置
EP0788268B1 (en) Interactive process for voice control between a telephone and its user
US9215305B2 (en) Voice-operated interface for DTMF-controlled systems
US5805672A (en) Accessory voice operated unit for a cellular telephone
US5594784A (en) Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
US8306193B2 (en) Method of pairing a portable device with a communications module of a vehicular, hands-free telephone system
CN102111483B (zh) 一种在通话过程中查询信息的方法、装置及移动终端
JP2004248248A (ja) ユーザがプログラム可能な移動局ハンドセット用の音声ダイヤル入力
WO2010150101A1 (en) Telecommunications device with voice-controlled functionality including walk-through pairing and voice-triggered operation
US6157844A (en) Method and apparatus for selecting a communication mode in a mobile communication device having voice recognition capability
FI101333B (fi) Puhekomennoilla ohjattava telepäätelaite
JP2004503183A (ja) 電気通信セッションの進行中に電話番号を自動的に記録する方法と装置
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
US7471776B2 (en) System and method for communication with an interactive voice response system
US20070286395A1 (en) Intelligent Multimedia Dial Tone
US5717740A (en) Telephone station account number dialing device and method
KR20010000595A (ko) 대화식 음성 제어가 가능한 이동전화단말기 및 그 제어 방법
JP3384282B2 (ja) 電話装置
KR200219909Y1 (ko) 대화식 음성 제어가 가능한 이동전화단말기
KR20040001318A (ko) 음성인식을 이용한 휴대폰의 원격 제어방법
JPH01295552A (ja) 音声ダイヤル装置
KR20050008987A (ko) 이동 단말기의 폰북 검색방법