JPH03500693A

JPH03500693A - 音声コマンドによりデジットシーケンスを入力するための方法

Info

Publication number: JPH03500693A
Application number: JP63508908A
Authority: JP
Inventors: ジャーソン・イラ　アラン; リンズレイ・ブレット　ルイス
Original assignee: モトローラ・インコーポレーテッド
Priority date: 1987-10-19
Filing date: 1988-08-24
Publication date: 1991-02-14
Anticipated expiration: 2010-09-06
Also published as: CA1312668C; KR890702177A; KR0129856B1; MX165502B; EP0389514A1; WO1989004035A1; DE3855164D1; US4870686A; DE3855164T2; ATE136146T1; JPH0782351B2; EP0389514A4; EP0389514B1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】立　コマンドによ　−ジットシーケンスを　るためのり　フＬヱとチＥ月Ｈコる。％ＬＪ艮２　１、発明の分野目　本発明は一般的には音声認識制御システムに関する６より特定的には、本発明は車両無線電話の応用において遍遇するようなノイズの多い環境で使用するのに特に適したハンドフリー音声コマンド自動ダイヤルシステムに間する。

２、従来技術の説明典型的には、無線および陸線電話システムの双方において、ユーザは該ユーザの耳に近く配置される、一端にスピーカを、かつ該ユーザの口に近く保持される、他端にマイクロホンを含むハンドセットにより通信する。動作においては、ユーザの一方の手がハンドセットをその適正な方向に保持するために占有され、それによりユーザの自由な手のみが車両を運転するような仕事を達成するために残される。ユーザに対し非常に大きな程度の自由を与えるためには、陸線電話システムにおいてはスピーカホンが一般に使用されている。ｉ＆近、自動車において使用するための車両用スピーカホンが開発された０例えば、イーストモンドによる米国特許第４，３７８，６０３号およびビルマーによる米国特許第４．４００，５８４号は、共に本発明と同じ譲り受け人に譲渡されているが、ハンドフリー動作を備えた車両用スピーカホンを記述している。

人間の音声に応答する、音声認識制御システムは自動車の応用において使用するために非常に望ましいものである。

大部分の移動無線送受信ｔＩ！（トランシーバ）の機能（例えば、オン／オフ、送信／受信、ボリュウム、スケルチ、その他）あるいは移動無線電話制御のｍ能（例えば、ブツシュボタンダイヤル、音声認識装置トレーニング、電話呼の応答）は容易に何らのマニュアル動作を要求することなく音声コマンドによって行なうことができる。従って、車両用スピーカホンと共に音声認識を用いることは自動車の運転手に彼の手をステアリングホイールから放しあるいは彼の目を道路からそらす事を全く要求することなく完全にハンドフリ・−な電話会話を提供する可能性を持っている。この特徴はスピーカホンのハンドフリーの可能性を拡張するのみならず、車両において移動無ｔｉ　を話を使用する安全性と便宜性を付加する。

不幸なことに、車両の無線電話に完全にハンドフリーな制御を適用することは幾つかの重要な障害を引き起こす。

車両環境において音声認識が利用される時、車両において本質的に存在する高度の環境ノイズが信頼できる音声制御に対しかなりの障害を与える。さらに、車両用スピーカホンは典型的には、頭上の自動車の日除は板に取付けられるように、使用者の口から遠いマイクロホンを有している。

その結果、必要とされる高いマイクロホンの感度は音声認識装置に印加される環境背景ノイズの量を大幅に増大させ、これはその認識の信頼性を劣化させる。

より特定的には、自動ダイヤル式電話における音声認識エラーの問題はシステムの性能をかなり低下させる。自動およびレパートリ−ダイヤルの機能が最近セルラ電話の用途において利用されてきており、それにより使用者は口頭で電話デジット（ｄｉｇｉｔｓ）を入力しあるいは予め規定されたキーワードを用いて予め格納された番号を口頭で呼出すことができる。もし音声認識ユニットがコマンドキーワードを誤まって認識すれば、音声コマンドコントローラは一般に認証（ｖｅｒｉｆｉｃａｔｉｏｎ）の目的で使用者に認識されたコマンドを返送するであろう、使用者は従って、正しいキーワードを再入力する。この人力／認証／再入力のプロセスは通常最小の不都合に過ぎないが、その理由はそれが典型的に大多数のコマンドに対しほんの数秒しかかからないからである。しかしながら、もし音声認識装置が電話番号を表す長い−続きのデジットにおける単一のデジットを誤って検出すれば、入力／認証／再入力のプロセスは非常に時間を消費するものとなりかつ、非常に少なくとも、使用者にとってはかなり不満足なものとなるであろう。

これらの理由のため、音声コマンドによりデジットを入力するための従来の技術は非常に限られてきた。幾つかの音声認識制御装置は使用者が所定数、例えば、電話番号については７または１１、のデジットを発するのを待つ、最後の期待されたデジットの認識に応じて、該制御装置は音声合成を用いて認識された番号を認証のため使用者に音声で返答する。使用者は次に所定のエラーコマンドのキーワードを話すことにより誤って認識された電話番号が入力されることを防止できる。しかしながら、認識の精度が高くない車両の環境においては、正しい認識のために完全なデジットのシーケンスを数回繰返すことが必要になる。他のものにおいては、音声コマンドのダイアル装置が認識の直後に各車−のデジットを繰返す、この別の方法は高いノイズ環境においてはより信頼できることが分かつているが、それは、特に認識精度が高い場合に、デジットの長いつながり（ｓｔｒｉｎｇ）を入力するためにかなりの量の時間を必要以上に要求する。そのうえ、あるデジットが誤って認識された時車−デジットの認証プロセスは非常に厄介なものとなるが、それは使用者がエラーコマンドを話すためにメンタル的に停止し、正しくない単一の桁を繰返し、正しい応答を聞き、かつ次にその先を続けなければならない場合に使用者は容易に入力すべき次の桁を忘れることがあるからである。全体として、従来技術の行入力／認証手順は使用者にとって親しみ易いものではない。

従って、音声認識制御システムにおいて音声コマンドにより一続き（ＳｅＱｕｅｎＣｆ３）のデジットを入力しかつ認証するための利口な方法に対する必要性が存在する。

九肌座鳳Ｉ従って、本発明の一般的な目的は音声認識により一続きのキーワードを入力しかつ認証するための改良された方法および装置を提供することにある。

本発明のより特定的な目的は、部分的なシーケンスのデジットのつながり（ストリング）を入力しかつ選択的に編集することにより電話にダイヤルするための改良された使用者相互作用的音声認識制御システムを提供することにある。

本発明によれば、１１桁（デジット）の電話番号のような、使用者が話した発声の全シーケンスを信頼性よく入力する音声通信装置のための使用者と相互作用する音声コマンド制御システムが提供される。この音声コマンド制御システムは使用者の話した発声の複数の部分的シーケンス、可変長ストリングをデジットのような、複数の所定の’ｒ−ワードに対応するものとして認識する音声認識ユニットを含む、この制御システムは最初の発声のつながりが所定の休止時間インターバルの開停止した後休止信号を与え、かつ次に該最初の発声のつながりに応答して認識されたキーワードの使用者への表示を提供する。該制御システムはまた休止信号に応答してかつ所定のエラーコマンドキーワードに対応する第２の発声のつながりの認識に応答して特定のキーワードを訂正するための機構を提供する。

好ましい実施例においては、ハンドフリー、ユーザ相互作用音声コマンドダイヤルシステムが車両用スピーカホンを用いた移動無線電話と共に使用される。−続きの桁の後所定の休止時間インターバルが認識された時、認識された桁がシステムによって返送される。付加的な桁のつながりが次に入力でき、かつ認識された後続の桁ストリングのみが次の休止の後に返答される。もしくワード「クリア（ＣＬＥＡＲ）　Ｊのような）エラーコマンドキーワードが次に認識されると、入力された最後の桁ストリングのみがクリアされる。もしエラーコマンド語が続けて２回認識されると、桁ストリング全体がクリアされる。もしコントローラがユーザが話しをしているがしかし何も認識されないことを検出すると、システムは（多分ワード「リピート（ＲＥＰＥＡＴ）　Ｊによって）応答し使用者に音声認識装置が先のストリングを認識できなかったことおよびそれが繰返されるべきことを指示する。ｉ＆後の桁のストリングが入力されると、使用者は（ワード「ターミネート（ＴＥＲＨＩＮ＾ＴＥ）　Ｊのような）停止コマンドを話しかつ認識された桁の全シーケンスが返答されかつ無線電話に出力される。

このようにして、使用者は環境ノイズ条件に応じて認識処理の認証モードを変更する柔軟性を有する。高い認識精度が期待できる環境においては、使用者は全デジットのシーケンスを休止することなく入力でき、かつシステムは直ちに全シーケンスを確認しかつ格納するであろう、これに対し、高い背景ノイズの条件下では使用者は各ストリングが発声された後に休止することにより部分的シーケンスの桁ストリングの認証を要求する選択を行なうことができる。

もし認識エラーがあれば、特定の桁ストリングを全デジットシーケンスを再入力させることなく訂正できる。各休止の後にキーワードのストリングを認証する本方法はまた非常に使用者に親しみ易いものであり、それは人間は通常長い桁のシーケンス（例えば、長距離電話番号）を桁ストリングの予め規定されたグループ（例えば、１−３１２−３９７−１０００）として読み、記憶し、かつ話すからである。

区画ぷり１１社葭朋新規であると信じられる本発明の特徴は特に添付の請求の範囲に記載されている。しかしながら、発明それ自体はそのさらに他の目的および利点と共に添付の図面を取り入れて以下の説明を参照することにより最も良く理解でき、それらの図において、第１図は、本発明に係わるデジット入力方法を用いた音声通信装置のための音声コマンド制御システムを示すブロック図、そして第２ａ図および第２ｂ図は好ましい実施例に係わるデジット入力方法の／ラクティスに従い前記制御システムによって行なわれる特定のシーケンスの動作を示すフローチャートである。

ましい　Ｊの＝細ｆ９述次に添付の図面を参照すると、第１図は、本発明に係わるユーザ相互作用制御システム１００の一般的なブロック図を示している。このシステムは基本的には音声通信装置１４０に接続されたデバイスコントローラ１２０かう構成されている。音声認識装置１１０が使用者からの音声コマンドをシステムのためのコマンド信号に翻訳するためにデバイスコントローラに結合されている。デバイスコントローラは音声認識装置からの情報と共に、タイマ１２４、アクティビティ検出器１１４、およびコントローラメモリ１３４からの情報を監視する。該コントローラは、認識テングレートを選択しかつ音声認識装置１１０をイネーブルし、タイマをリセットし、データをコントローラメモリ１３４に格納しかつそこからデータを読出し、音声通信装置のダイヤル動作を制御し、かつ使用者へのフィードバックを提供するために音声合成装Ｗ１３０に情報を提供する能力を有している１本システムは使用者の手が他の仕事を行なうために自由になるような、スピーカホンと共に使用するのによく適している。スピーカホン１５０はこのハンドフリーの特徴を提供するためにオーディオ経路の方向を制御する。

音声通信装置１４０は例えば、２方向無線システム、電話システム、インターコム（内部通信）システム、音声データエントリシステム、その他のような、任意の無線または陸線音声通信システムの部分を含むことができる０本実施例においては、音声通信装置１４０はセルラ移動無線電話のような、無線電話送受信１１（）−ランシーバ）である。

そのような無線電話の詳細な説明はモトローラ社のインストラクションマニュアル第６８Ｐ８１０６６Ｅ４０号、ｒＤＹＮＡ　Ｔ、Ａ、Ｃ，（登録商標）セルラ移動電話」に見ることができる。しかしながら、音声制御を必要とする任意の陸線電話または単信無線送受信機を用いることができる。さらに、ハンドフリーな使用者相互作用動作を行なう任意の電子装置もまた本発明を利用することができる。

音声通信装置１４０は送信経路１４４および受信経路１４２を利用し送信／受信オーディオおよびダイヤル情報を通信チャネルにインタフェースする。移動無線電話の好ましい実施例においては、これらの経路は二！無線電話動作のための一対の無線周波数（ＲＦ）チャネルにインタフェースすることができる。

音声認識装置１１０はライン１５８における入力音声信号に対し音声認識を行なう、認識中は、音声認識装置１１０は先に格納したワードのテンプレートを入力音声情報に対し比較する１本実施例における認識アルゴリズムは連続音声認識、ダイナミック時間ワーピング、エネルギ正規化、そしてテンプレート整合を判定するためチェビシェフ距離測定法を導入する。音響　”　、および１１ｉｌζ皿ヱ玉ＩＢＥＥ喝！倉Ｊ（１９８２年５月３日−５日）、第２巻、ｐｐ、８９９− ９０２、ジェイ・ニス・プライドル、エム・ディ・ブラウンおよびアール・エム・チェンバレインによる［つながりのあるワードの認識のためのアルゴリズムＪに記載されたような、従来技術の認識アルゴリズム＃Ｊ、１な用いることができる。

本実施例においては、８ビツトのマイクロコンピュータが音声認識装置１１０の機能を達成する。さらに、第１図の幾つかの他の制御システムのブロックも部分的にＣ０ＤＥＣ／ＦＩ　ＬＴＥＲおよびＤＳＰ　（デジタル信号プロセッサ）の助けにより同じマイクロコンピュータによって実施される。ブロック１１０の機能を達成するために用いることができる代表的な音声認識用のハードウェアはジェイ・ベカム、ジェイ・グリーン、ジェイ・キャニング、およびビー・スティーブンズによる「実時間ハードウェア連続音声認識システム」と題する”響　３　および−昇　理にるＩＥＥＥ国際会−（１９８２年５月３日−５日）、第２巻、ｐｐ、８６３−８６６の論文、およびそこに含まれた参考文献に記載されている。しかしながら、本発明はいずれの特定のハードウェアにもあるいはいずれの特定の形式の音声認識にも限定されない、より特定的には、本発明は通話者に依存するあるいは通話者に依存しない音声認識、分離されたあるいは連続的なワード認識、そしてソフトウェアベースのあるいはハードウェアベースの実施の使用を意図するものである。

デバイスコントローラ１２０は典型的には音声通信装置１４０、音声認識装置１１０、そして音声合成装置１３０の間をインタフェースするマイクロプロセッサである。デバイスコントローラ１２０は音声認識装置１１０によって提供されるデバイス制御データ１１２を特定の音声通信装置によって認識し得る制御信号に翻訳する。これらの制御信号は装置に使用者によって指令された特定の動作機能を達成するよう指示する０例えば、もし使用者の話した発声が予め規定された電話番号のシーケンスであれば、デバイスコントローラ１２０はコントローラバス１４８を介して適正なダイヤル信号を生成するであろう、コントローラ１あるいは任意の数の他の動作機能のような、音声通信装置１４０の他の特徴機能の音声コマンド制御を行なうことができる。

デバイスコントローラ１２０はまた音声通信装置１４０の動作ステータスを表わす装置ステータスデータ１２２を提供する。このデータは音声合成装置１３０に印加され、スピーカ１７６を介して出力された時使用者に認識可能な音声に翻訳される０例えば、使用者の話した発声がデジットシーゲンスを終了させるための予め規定されたコマンドキーワードに対応する時、音声合成装置１３０は認識された電話番号を使用者への返答として合成する。ステータスデータ１２２はまた名前および電話番号（「オフィス（Ｏｆｆｉｃｅ）」、’５５５−１２３４」等）　、音声認識応答ｍ報（「レディ（Ｒｅａｄｙ）　Ｊ、「終了？　（Ｔｅｒ１ｎａｔｅ？）」等）、あるいは無Ｉ！電話ステータス情報（「呼ドロップ（Ｃａｌｆ　Ｄｒｏｐｐｅｄ）」、「システムビジィ（ｓｙｓｔｅｎ　Ｂｕｓｙ）　Ｊ等）に関する情報を含むことができる。

本実施例においては、音声合成装置１３０として１９チヤネルのボコーダが使用されている。そのようなボコーダの例はジェイ・エヌ・ホルムズ、ｒＪＳＲＵチャネルボコーダＪ、ＩＥＥ紀要、第１２７巻、パートＦ、第１号、１９８０年２月、ｐｐ、５３−６０に見ることができる。しかしながら、当業者に明らかなように、任意の音声合成装置を利用することができる。さらに、本発明は、使用者に指示を提供できる任意の手段が音声合成ブロック１３０の基本的な応答機能を達成できることを考えている２例えば、任意の可視的表示器（例えば、ＬＥＤ、ＬＣＤ、ＣＲＴ、その他）あるいは可聴表示器（例えば、トーン発生器または他の可聴信号発生器）に置換えることができる。さらに、好ましい実施例においては、１４桁の電話番号ディスプレイが現在認識されている桁の使用者への付加的な表示を連続的に提供する。

制御メモリ１３４、これは典型的にはランダムアクセスメモリ（ＲＡＭ）であるが、は音声認識装置１１０によって認識される複数のキーワードを格納する。メモリバス１３６はキーワード入力のプロセス中に制御メモリ１３４に情報を送り、かつキーワードの認証プロセスの間にデバイスコントローラ１２０によって格納された情報へのアクセスを提供する。もし音声合成装置１１０または音声通信装置１４０がデジット入力格納機能を行なうために内部ＲＡＭを導入しておれば、外部制御メモリ１３４は省略できる。

音声アクティビティ検出器１１４は好ましい実施例においてはエネルギを基準とした検出器である。検出器１１４は音声認識装置からの情報を利用することによりさらに高度の機構に置換えることができる。いずれの場合においても、音声アクティビティ検出器１１４は音声アクティビティに対して入力音声信号１５８を監視する機能を達成し、それによりデバイスコントローラ１２０が認識されるべき音声が存在するか否かを判定できるように°する。検出器１１４に用いることができる代表的な技術については、アール・ジェイ・フローレイおよびエム・エル・マルパスによる、「ソフトデシジョンノイズ抑圧フィルタを用いた音声増強Ｊ、ＩＥＥＢ”響　立　およびけ　理に　る糸ｌ　Ａ　Ｓ　Ｓ　Ｐ　−２８巻、第２号（１９８０年４月）、ｐｐ１３７−１４５、を参照されたい。

タイマブロック１２４は最後のキーワードが認識されてから経過した時間を計測するのみならず、先の音声活動から経過した時間の計測をも与える。これらの時間インターバルはデータバス１２６を介してコントローラ１２０により初期化され、監視され、かつリセットすることができる。

再び、これらのタイマのさらに詳細な説明についてはフローチャートの記述を参照されたい。

スピーカホン１５０はハンドフリー制御システムの受信／応答オーディオ多重化機能のみならず、送信／受信オーディオのスイッチング機能を行なう、使用者の話した入力音声はマイクロホン１５２に印加され、このマイクロホン１５２は典型的には使用者の口から離れて遠隔的に取付けられる（例えば、自動車の日よけ板に取付けられる）、マイクロホン１５２は電気的入力音声信号を発生し、この信号は次に前置増幅器１５３によって増幅されてスピーカホン１５０に入力音声信号１５４を提供する。スピーカホン１５０は１５４における入力音声信号を入力信号ライン１５８を介して音声認識装置１１０に向ける。

単信システムにおいては、移動無線の使用者が話している時、信号検出装置１６０は検出器出力１６２を介して正の制御信号を提供し送信オーディオスイッチ１５６を閉じ、かつ検出器出力１６４を介して負の制御信号を提供し受信オーディオスイッチ１６６を開く、逆に、陸線パーティが話している時、信号検出器１６０は受信オーディオスイッチ１６６を閉じるために逆極性の信号を提供し、一方送信オーディオスイッチ１５６を開く、受信オーディオスイッチ１６６が閉じられている時、音声通信装置１４０からの受信機オーディオ１４６は受信オーディオスイッチ１６６を通りスイッチされた受信オーディオ出力１６８を介してマルチプレクサ１７０に向けられる。マルチプレクサ１７０は音声合成装置１３０からの音声応答オーディオ１３２およびスイッチされた受信オーディオ１６８の間のオーディオ経路をデバイスコントローラ１２０からのマルチプレクサ信号信号１２８に応じて制御する。デバイスコントローラが情報を音声合成装置に送る時は常に、マルチプレクサ信号１２８はマルチプレクサ１７０を音声応答オーディオをスピーカに向けるよう指示する。車両用スピーカホンオーディオ１７２は通常スピーカ１７６に印加される前にオーディオ増幅器１７４により増幅される。

ここに説明された車両用スピーカホンの実施例は多くの可能な構成の内の１つにすぎない０例えば、音声認識装置１１０は常に、陸線パーティが話しているか否かに係わらず移動無線の使用者のコマンドに応答することが望まれるであろう、そのような場合、入力音声信号１５４は直接音声認識装ｒＩｔ１１０に接続される。さらに幾つかの通信システムにおいては、オーディオスイッチ１５６および１６６を信号検出装置からの制御信号に応答して等しいが逆の減衰を提供する可変利得装置に置換えることが好都合であるかもしれない、信号検出装置１６０はまたデバイスコント０−５１２０に陸線パーティまたは移動使用者のいずれが話しているかを表示するための信号を供給することができ、これは陸線パーティからの音声を誤って認識することを防止するために使用できる。

今までの説明で明らかであるように、デバイスコントローラ１２０は使用者相互作用的ハンドフリー音声コマンド制御システム１００の心臓部である。技術上知られておりかつ本発明に適したデバイスコントローラの一例はマイクロプロセッサである。デバイスコントローラ１２０の詳細な動作は引続き制御システム１００に対するソフトウェアフローチャートによって説明される。しかしながら、発明を理解するために、以下の例は雑音の多い環境において特定の桁シーケンスを入力する場合を説明するために使用される。この例は本発明の特徴および利点を明瞭に示している。

使用者がダイヤルシステムに完全な桁シーゲンス１−２−３−４−５−６−７を入力することを希望するものと仮定する。ここで用いられているように、完全なキーワード「シーケンス」　（例えば、１−２−３−４−５−６−７　）は１つまたはそれ以上の部分シーケンスのキーワードの「ストリングｊ　（例えば、１ −２−３゜４．５−６．７）で構成され、この場合各ストリングは予め規定された休止時間インターバル、即ち音声活動のない時間により分離される。ｖ、用者は最初に［エンター（ＥＮＴＥＲ）　Ｊのような口頭でのコマンドにより制御システムを行入力モードに向ける。

システムは次にワード「デジット（ＤＩＧＩＴＳ）　Ｊのような合成された応答で返答する。

自動車の中のような、ノイズの多い環境では、音声認識の精度は背景ノイズによりしばしば制限される。従って、使用者は完全な桁シーケンスｔ　−２−３−４ −５−６−７を３個の部分的シーケンスの桁ストリング、即ち、１−２−３．４ −５．６−７で入力することを決定できる。各ストリングは任意の長さにすることができることに注意を要する。使用者は次に「ワン・ツク・スリー」の発声を行ない、かつ次に休止する。もしいずれのキーワードも認識されなければ、いずれの桁もディスプレイに現われず、がっ制御システムは合成されたワード「リピート（ＲＥＰＥ八旬」へ応答するであろう。

従って、使用者は再び「ワン・ツク・スリー」を発声し、これに休止が続く、もしこの桁ストリングが「ワン・スリー・スリー」として誤って認識されれば、表示装置は１−３−３を表示し、かつ合成装置は音声による確認「ワン・スリー・スリーＪで応答するであろう、これは正しくないから、使用者は次にコマンドワード「クリア（ＣＬＥＡＲ）　Ｊを発音する。このコマンドキーワードの認識に応じて、システムは最も最近の桁ストリングをクリアし、全シーケンスがクリアされたことを表示するために２回の「ビープ」を生成し、次に表示装置を消去する。

再び、使用者は「ワン・ツク・スリー」を発音し、次に３秒の休止期間を続ける。もし正しい桁ストリングニー２−３が認識されれば、１−２−３がディスプレイに現れ、合成装置は「ワン・ツク・スリー」と応答する。＃ｌ用者は次に「フォア・ファイブＪの発音を続け、その後他の休止を与える。もしこれらの発声が背景ノイズのなめに４−６と誤って認識されれば、１−２−３−４−６がディスプレイ上に現れ、かつ合成装置は「フォア・シックスｊと応答するであろう、このｆｉｔＩｅの桁ストリグを訂正するために、使用者は「クリア」を発音する。

Ｉ＆後の桁ストリング４−６のみがクリアされ、かつディスプレイは再び１−２ −３を表示する０合成装置は次に単一の［ビープ」をもって応答し使用者に最も最近の桁ストリングのみがクリアされたこと、および先に入力されたストリングはメモリに残っていることを表示する。ふたたび、使用者は「フォア・ファイブ」を発声しその後休止を続ける。もし正しく認識されれば、合成装置は「フォア・ファイブ」と応答し、かつディスプレイは１−２−３−４−５を表示する。

このシーケンスに続き、使用者は「シックス・セブン」を発生し、これに他の休止期間が続く、もし正しく認識されれば、全シーケンス１−２−３−４−５−６ −７が表示され、かつ合成装置は、認識された最後の桁ストリングを表わす、コンファメーション「シックス・セブン」によって応答する。全桁シーケンスが今や入力されながら、使用者はコマンド「ターミネートＪを発生する０次に合成装置は全シーケンス「ワン・ツク・スリー・フォア・ファイブ・シックス・セブンＪによって応答する０表示１−２−３−４−５−６−７が全桁シーケンスを認証するため維持される。

第２ａ図および第２ｂ図は、桁シーゲンス入力手順の量制御システム１００によって行なわれるシ〜ゲンスのステップを記述する。好ましい実施例においては、コントローラのダイヤルシーケンスはコマンドワードＥＮＴＥＲの認識に応じてステップ２０２でスタートする。ステップ２０４においてコントローラメモリ１３４のメモリロケーションを初期化するため、スタートポインタＳＰおよびエンドポインタＥＰがメモリロケーション０（ゼロ）に初期化される。ステップ２０６において応答フラグがリセットされ、そしてタイマブロック１２４の休止タイマおよび認識タイマがステップ２０８においてゼロにリセットされる。

ステップ２１０においては、コントローラは音声認識装置がＯないし９の単−桁に対応する何らかのキーワードを認識したか否かを判定する。もし単−桁が認識されておれば、ステップ２１２において応答フラグがテストされる。

もし応答フラグが先にセットされておれば、使用者の先の桁に未だ返答されていない少なくとも１つの桁が格納される。従って、特定の桁ストリングにおける最初に格納された桁のメモリロケーションを示す、スタートポインタＳＰが合せられるべきではない、しなしながら、もし応答フラグがセットされておらなければ、認識された現在の桁はストリングの最初の桁を表わす、その場合、ステップネ１４はスタートポインタＳＰを現在の桁が格納される場所に対応するメモリロケーションに更新する。

ステップ２１６においては、認識された桁（デジット）がコントローラメモリ１３４のエンドポインタにＥＰに対応するメモリロケーションに格納される。エンドポインタＥＰは次にステップ２１８において増分され次に利用可能なメモリロケーションを指示するようにされる０両方のタイマが次にステップ２２０においてリセットされる。応答フラグがステップ２２１においてセットされるが、これはデジットが今や格納されているからである。制御は次にステップ２１０に戻り認識されるべき次のデジットを待機する。

もしステップ２１０において何らの桁キーワードも認識されなければ、制御はステップ２２２に進み停止コマンドキーワードが認識されたか否かをチェックする。好ましい実施例においては、行入力手順の終了を表わすために使用されるコマンドキーワードとしてワードＴＥＲＭ　Ｉ　ＮＡＴＥが選択された。もしＴＥＲＭＩＮＡＴＥが認識されれば、ステップ２２４において全桁シーケンスが音声合成装Ｗ、１３０により返送される０合成されるべき桁シーゲンスはメモリロケーションＺＥＲＯ（ゼロ）で始まりかつメモリロケーションＥＰ−１で終わる、メモリ１３４を読取ることによって得られる６次に、この完全な桁シーケンスがステップ２２６において音声通信装置１４０に出力される０桁入力手順はステップ２２８において終了する。

ＴＥＲＭＩＮＡＴＥコマンドが認識された後は何らの桁編集手順も行なわれないことに注意を要する。音声合成による桁シーケンスの確認のみが与えられ、かっ全桁シーケンスが可視的ディスプレイに残る０例えば、もし使用者がその直後にワードＴＥＲＭＩＮＡＴＥが続く全桁シーケンスを発声すれば、システムは認識されたシーケンスが正しいものと仮定する。この入力モードは認識精度が高いものと期待されている場合に使用される。しかしながら、使用者はステップ２０２において行入力手順を再スタートすることにより何らかのエラーを修正することを希望できるため、ステップ２２８の後でエラーが訂正できないということを意味するものではない、一層重要なことには、使用者は常にＴＥＲＭＩＮＡＴＥのワードの前に休止（ボーズ）を挿入することにより丁度入力した桁ストリングを訂正するオプションを常に有している。従って、使用者は訂正手順を相互作用的に用い、あるいはキーワードシーケンスを迅速に入力しかつ確認するために柔軟性を有している。

もしコマンドキーワードＴＥＲＭＩ　ＮＡＴＥがステップ２２２において認識されなければ、コントローラはコマンドキーワードＣＬＥＡＲがステップ２３０において認識されたか否かを見るためにチェックを行なう、もしＣＬＥＡＲコマンドが認識されておれば、ステップ２３２において音声合成装置によりオーディオ返答信号が出力される。好ましい実施例においては、音声合成装置は単一の「ビープトーンを発生ずるよう指令される。しかしながら、数多くの他の確認信号を選択することもできる。ステップ２３４において、コントローラはＯまなは１つの桁ストリングが入力されたか否かを、スタートポインタＳＰがゼロか否かをチェックすることによって、判定する。もし１つのストリングのみが入力されておれば、単一のストリングをクリアすることが全桁シーケンスをクリアすることと等価である。従って、第２のビープトーンがステップ２４４において指示され使用者に、最後のストリングだけでなく、全シーケンスがクリアされた事を通知する。もし何らの桁ストリングも入力されておらなければ、ステップ２３４におけるテストはまたステップ２４４に移行する結果となり、これはスタートポインタＳＰが依然としてゼロであるからである。もし１個より多くのストリングが入力されておれば、コントローラはステップ２３６において連続的なＣＬＥＡＲコマンドキーワードが認識された２回目である、即ちこれは使用者が全シーケンスをクリアすることを希望している状態を意味する、場合であるかを見るためチェックを行なう、２番目の連続するＣＬＥＡＲはスタートポインタＳＰがエンドポインタＥＰに等しいかどうかチェックすることにより容易に判定することができる。もし第２の連続的ＣＬＥＡＲキーワードが認識されておれば、コントローラは再びステップ２４４に進み音声合成装置により第２のビープトーンを出力する。

ＣＬＥＡＲコマンドが認識された最初の時である場合、かつもし１つより多くのストリングが入力されておれば、制御はステップ２３８に進み最後に入力された桁ストリングのみをクリアする。メモリポインタに関しては、桁ストリングはエンドポインタＥＰをスタートポインタＳＰのロケーションに等しくセットすることによりクリアされる。応答フラグがステップ２４０においてリセットされるが、これは応答されていない桁ストリングは何ら残っていないからである。ステップ２４２はタイマをリセットし、かつ制御は次にステップ２１０において次の桁を認識するために戻る。

先に述べたように、もし１つのストリングのみが入力されておれば、あるいはもし２つの連続するＣＬＥＡＲコマンドが認識されておれば、第２のビープトーンがステップ２４４において出力される。全桁シーケンスが次にステップ２４６においてクリアされる０桁シーケンスをクリアするため、スタートポインタＳＰおよびエンドポインタＥＰが共にステップ２０４においてなされたようにメモリロケーションＯ（ゼロ）に等しくセットされる。ステップ２４８は応答フラグをリセットするが、これはメモリに何らの桁ストリングも残っていないからである。

ステップ２５０はタイマをリセットする。制御は再びステップ２１０において次のキーワードを捜すために戻る。

もしステップ２１０において何らの桁キーワードも認識されなければ、ステップ２２２においてＴＥＲＭＩＮＡＴＥは認識されず、かつＣＬＥＡＲがステップ２３０において認識され、次に制御はステップ２５２に進み音声アクティビティ検出器１１４からのアクティビティライン１１６をチェックする。もし音声活動（アクティビティ）があれば、休止タイマのみがステップ２５４においてリセットされ、かつ制御はステップ２１０において次の桁を捜すために戻る。

逆に、音声活動がなければ、休止タイマがステップ２５６においてチェックされそれが経過したか否がが判定される。好ましい実施例においては、休止タイマは音声活動が３秒間なかった後に経過する。もし休止タイマが経過しておらなければ、制御は再びステップ２１０に戻る。しかしながら、もし３秒の休止が検出されれば、ステップ２５８において応答フラグが試験され桁ストリングが返答されるべきか否かが判定される。もし応答フラグが先にステップ２２１においてセットされておれば、ステップ２５８は制御をステップ２６０に移しそこで最後に入力された桁ストリングが音声合成を介して使用者に返答される。再び、メモリポインタに介しては、最後に入力された桁ストリングがメモリロケーションＳＰで始まり、かつメモリロケーションＥＰ−１に続く、応答フラグがステップ２６２においてリセットされかつタイマがステップ２６４においてリセットされ、その後制御は再びステップ２１０に移される。

今だ返答されていない何らの桁も認識されていないことを意味する、応答フラグがセットされていない状態であれば、認識タイマがステップ２６８においてテストされる。

認識タイマは今だ認識されていない音声活動が生じたか否かを判定するために使用される。ステップ２６８は単に認識タイマが休止タイマより大きいか否かを判定する。双方のタイマは常に、音声活動が認識なしに生じている、ステップ２５４の場合を除き共にリセットされるから、認識タイマを休止タイマと比較することが適切になる。休止タイマが経過したから、ステップ２６８において休止タイマの値は丁度３秒になる。これは最後の音声活動から３秒が経過したことを示す、もしキーワードが認識されてから３秒より多くが生じておれば、認識タイマは休止タイマを越えるであろう０例えば、もし使用者が２秒間話し、次に３秒間休止したが、何も認識されなかった場合には、認識タイマは少なくとも５秒の値を有し、一方体止タイマは３秒となっているであろう、この場合、制御はステップ２７０に進みそこで合成装置はワードＲＥＰＥＡＴを使用者に返送するよう指示される。ステップ２７２において双方のタイマがリセットされ、制御は次に桁認識ステップ２１０に戻る。

しかしながら、もしステップ２６８においてタイマが等しければ、何らの音声活動も３秒より長く生じていないこととなる。この場合、制御はステップ２７６に進みそこで認識タイマがテストされる。好ましい実施例においては、認識タイマは何らの音声認識もない６秒の後に経過する。

もしそのような場合であれば、合成装置はステップ２７８においてワードＴＩＭＥＯＵＴを返送して使用者に行入力手順がステップ２８０において終了したことを通知するよう指令される。もし認識タイマがまだ経過しておらなければ、制御は再び戻りステップ２１０において音声活動を監視し続ける。

以上要するに、本発明は音声コマンドにより一連のキーワードを入力しかつ認証するための高度に相互作用的でありかつ使用者に親しみ易い方法を提供することが理解できる。上述のように、本制御システムは可変長の桁ストリングを入力する場合、および桁ストリングの間で選択的に休止することにより認証プロセスを制御する場合に使用者に大きな柔軟性を許容する。もし高い認識精度が期待される場合には、使用者は休止することなく全桁シーケンスを迅速に入力できる。これに対し、認識精度が劣化している条件下では、使用者は任意の桁数が話された後に休止することにより部分的なシーケンスの桁ストリングにつき認証を要求するオプションを有している。

本発明の特定の実施例が示されかつ説明されたが、当業者により他の変形および改良を成すことができる。特に、コマンドワードＣＬＥＡＲおよびＴＥＲＭＩ　ＮＡＴＥ、または応答ワードＢＥＥＲ，ＲＥＰＥＡＴ、およびＴＩＭＥＯＵＴは好ましい実施例においては特定の用途に対し代表的な英語ワードとしてのみ選択されたことを認識すべきである。しかしながら、他のコマンドワードおよび応答ワードももし望むなら、特に異なる言語と共に使用するために、選択することができる。数多くのハードウェアおよびソフトウェア的な修正もまた本キーワード入力方法を種々の他の応用に適応させるなめに行なうことができる。ここに開示されかつ請求された基本的な内にある原理を保持するすべてのそのような変更は本発明の範囲内にあるものである。

ｒ− 補正書の写しく翻訳文）提出書く特許法第１８４条の８）平成２年４月１１日特許庁長官　吉　１）文　毅　殿ＰＣＴ／ＵＳ８８１０２８５１、発明の名称音声コマンドによりデジットシーゲンスを入力するための方法３、特許出願人住　所　アメリカ合衆国イリノイ州６０１９６、シャンバーブ、イースト・アルゴンフィン・ロード１３０３名　称　モトローラ・インコーホレーテッド代表者　ギルマン・ジエームズ　ダブリュ４、代理人住　所　〒２３１神奈川県横浜市中区本町１丁目７番地東ビル　電話０４５　（２１１）２７９５５、補正書の提出年月日　１９８９年１２月１２日請求の範囲１（補正）、１！イン　−パルによって　されｔ・之ｍユ９可変長の音声の発声ストリングに含まれるキーワードを認識する段階、発声ストリングが所定の休止期間の開停止した後休止信号を提供する段階、前記休止信号に応答して、使用者に前記休止信号の前に生じた発声ストリングに対応する認識された特定のキーワードの表示を使用者に提供する段階、そして前記休止信号に応答してかつ前記休止信号の後に生じた発声ストリングに含まれる所定のエラーコマンドキーワードの認識に応答して特定のキーワードを訂正する段階、を具備することを特徴とする電子的装置を制御するためのユーザ相互作用的方法。

２、前記認識［ｔは特定の認識されたキーワードをメモリに格納する段階を含む請求項１に記載の方法。

３、前記表示提供段階は前記の格納されたキーワードをメモリから読出す段階を含む請求項２に記載の方法。

４、前記訂正段階は前記所定のエラーコマンドキーワードの認識の使用者に対する表示を提供する段階を含む請求項１に記載の方法。

５、前記訂正段階は前記所定のエラーコマンドキーワードの認識に応答して、前記休止信号の前に生じた最後の発声ストリングのみに対応する格納されたキーワードをメモリからクリアする段階を含む請求項２に記載の方法。

６、前記訂正段階はさらに、連続する発声ストリングに含まれる２つの同じエラーコマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードをクリアする段階、を含む請求項２に記載の方法。

７、さらに、発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードを出力する段階、を具備する請求項２に記載の方法。

８、前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声の生じたことの使用者への表示を提供する段階を含む請求項１に記載の方法。

９、前記所定の休止時間は５秒より大きくない請求項１に記載の方法。

１０、休止時間インターバルによって分離された少なくとも２つの可変長音声発声ストリングに含まれるキーワードを認識するための手段、発声ストリングが所定の休止期間の開停止した後休止信号を提供するための手段、前記休止信号に応答して、前記休止信号の前に生じた最後の発声ストリングに対応する認識された特定のキーワードの使用者に対する表示を提供するための手段、そして前記休止信号にさらに応答し、前記休止信号の後に生じた次の発声ストリングに含まれる所定のエラーコマンドキーワードの認識に応答して前記特定のキーワードを訂正するための手段、を具備することを特徴とする使用者相互作用的音声認識制御装置。

１１、前記制御装置は電話通信装置のための自動ダイヤル装置である請求項１０に記載の装置。

１２、前記電話通信装置は無線電話装置である請求項１１に記載の装置。

１３、前記電話通信装置はスピーカホンを含む請求項１１に記載の装置。

１４、前記認識手段は連続ワード音声認識を実施する請求項１０に記載の装置。

１５、前記認識手段は特定の認識されたキーワードをメモリに格納するための手段を含む請求項１０に記載の装置。

１６、前記表示提供手段は前記の格納されたキーワードをメモリから読取るための手段を含む請求項１５に記載の装置。

１７、前記表示提供手段は音声合成装置を含む請求項１０に記載の方法。

１８、前記表示提供手段は可視的ディスプレイを含む請求項１０に記載の装置。

１９、前記所定の休止時間は５秒より大きくない請求項１０に記載の装置。

２０、前記訂正手段は前記所定のエラーコマンドキーワードの認識の使用者への表示を提供するための手段を含む請求項１０に記載の装置。

２１、前記訂正手段はさらに前記所定のエラーコマンドキーワードの認識に応答して、前記休止信号の前に発生した最後の発声ストリングのみに対応する格納されたキーワードをメモリからクリアするための手段を含む請求項１５に記載の装置。

２２、前記訂正手段はさらに、連続する発声ストリングに含まれる２つの同じエラーコマンドキーワードを認識するための手段、そしてそのような認識に応答してメモリに格納されたすべてのキーワードをクリアするための手段、を含む請求項１５に記載の装置。

２３゜前記表示提供手段はさらに何らの対応するキーワードの認識なく音声の発声の生じたことの使用者への表示を提供するための手段含む請求項１０に記載の装置。

２４、さらに、発声ストリングに含まれる所定の停止コマンドキーワードを認識するための手段、そしてそのような認識に応答してメモリに格納されたすべてのキーワードを出力するための手段、を具備する請求項１５に記載の装置。

２５、複数の可変長発声ストリングからなる全シーケンスの音声の発声を前記全シーケンスに含まれるキーワードに対応するデータ出力を提供する音声認識コントローラに入力するための方法であって、各発声ストリングには休止時間インターバルが続き、かつ各発声ストリングは少なくとも１つのキーワードを含み、前記方法は（ａ）ｆｉ初のキーワードセットに対応する第１の発声ストリングを認識する段階、（ｂ）前記第１の認識されたキーワードセットを読取り／書込みメモリに格納する段階、（ｃ）前記第１の発声ストリングが所定の休止期間の開停止した後休止信号を提供する段階、（ｄ）前記休止信号に応答して前記第１の格納されたキーワードセットをメモリから取出す段階、（ｅ）少なくとも前記第１の取出されたキーワードセットの使用者への表示を提供する段階、（ｆ＞所定のエラーコマンドキーワードに対応する第２の発声ストリングを認識する段階、そして（ｇ）前記所定のエラーコマンドキーワードの認識に応答して前記第１の格納されたキーワードセットを訂正する段階、を具備することを特徴とする前記方法。

２６、前記認識段階は連続ワード音声認識を行なう請求項２５に記載の方法。

２７、前記表示提供段階は前記最初のキーワードセットにのみ対応する音声を合成する段階を含む請求項２５に記載の方法。

２８、前記表示提供段階はさらにすべての格納されたキーワードを可視的に表示する段階を含む請求項２５に記載の方法。

２９、前記所定の休止時間は５秒より大きくない請求項２５に記載の方法。

３０、前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識の使用者への表示を提供する段階を含む請求項２５に記載の方法。

３１、前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識に応答して前記第１の格納されたキーワードのみをメモリからクリアする段階を含む請求項２５に記載の方法。

３２、前記訂正段階はさらに、連続する発声ストリングに含まれる２つの同じエラーコマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードをクリアする段階、を含む請求項２５に記載の方法。

３３、さらに、発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードを出力する段階、を具備する請求項２５に記載の方法。

３４、前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声が生じたことの使用者への表示を提供する段階を含む請求項２５に記載の方法。

国際調査報告

Claims

【特許請求の範囲】

１．１つまたはそれ以上の可変長の音声の発声ストリングに含まれるキーワードを認識する段階であって、各発声ストリングには休止時間インターバルが続くもの、発声ストリングが所定の休止期間の間停止した後休止信号を提供する段階、前記休止信号に応答して、使用者に前記休止信号の前に生じた発声ストリングに対応する認識された特定のキーワードの表示を使用者に提供する段階、そして前記休止信号に応答してかつ前記休止信号の後に生じた発声ストリングに含まれる所定のエラーコマンドキーワードの認識に応答して特定のキーワードを訂正する段階、を具備することを特徴とする電子的装置を制御するためのユーザ相互作用的方法。
２．前記認識段階は特定の認識されたキーワードをメモリに格納する段階を含む請求項１に記載の方法。
３．前記表示提供段階は前記の格納されたキーワードをメモリから読出す段階を含む請求項２に記載の方法。
４．前記訂正段階は前記所定のエラーコマンドキーワードの認識の使用者に対する表示を提供する段階を含む請求項１に記載の方法。
５．前記訂正段階は前記所定のエラーコマンドキーワードの認識に応答して、前記休止信号の前に生じた最後の発声ストリングのみに対応する格納されたキーワードをメモリからクリアする段階を含む請求項２に記載の方法。
６．前記訂正段階はさらに、連続する発声ストリングに含まれる２つの同じエラーコマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードをクリアする段階、を含む請求項２に記載の方法。
７．さらに、発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードを出力する段階、を具備する請求項２に記載の方法。
８．前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声の生じたことの使用者への表示を提供する段階を含む請求項１に記載の方法。
９．前記所定の休止時間は５秒より大きくない請求項１に記載の方法。
１０．休止時間インターバルによって分離された少なくとも２つの可変長音声発声ストリングに含まれるキーワードを認識するための手段、発声ストリングが所定の休止期間の間停止した後休止信号を提供するための手段、前記休止信号に応答して、前記休止信号の前に生じた最後の発声ストリングに対応する認識された特定のキーワードの使用者に対する表示を提供するための手段、そして前記休止信号にさらに応答し、前記休止信号の後に生じた次の発声ストリングに含まれる所定のエラーコマンドキーワードの認識に応答して前記特定のキーワードを訂正するための手段、を具備することを特徴とする使用者相互作用的音声認識制御装置。
１１．前記制御装置は電話通信装置のための自動ダイヤル装置である請求項１０に記載の装置。
１２．前記電話通信装置は無線電話装置である請求項１１に記載の装置。
１３．前記電話通信装置はスピーカホンを含む請求項１１に記載の装置。
１４．前記認識手段は連続ワード音声認識を実施する請求項１０に記載の装置。
１５．前記認識手段は特定の認識されたキーワードをメモリに格納するための手段を含む請求項１０に記載の装置。
１６．前記表示提供手段は前記の格納されたキーワードをメモリから読取るための手段を含む請求項１５に記載の装置。
１７．前記表示提供手段は音声合成装置を含む請求項１０に記載の方法。
１８．前記表示提供手段は可視的デイスプレイを含む請求項１０に記載の装置。
１９．前記所定の休止時間は５秒より大きくない請求項１０に記載の装置。
２０．前記訂正手段は前記所定のエラーコマンドキーワードの認識の使用者への表示を提供するための手段を含む請求項１０に記載の装置。
２１．前記訂正手段はさらに前記所定のエラーコマンドキーワードの認識に応答して、前記休止信号の前に発生した最後の発声ストリングのみに対応する格納されたキーワードをメモリからクリアするための手段を含む請求項１５に記載の装置。
２２．前記訂正手段はさらに、連携する発声ストリングに含まれる２つの同じエラーコマンドキーワードを認識するための手段、そしてそのような認識に応答してメモリに格納されたすべてのキーワードをクリアするための手段、を含む請求項１５に記載の装置。
２３．前記表示提供手段はさらに何らの対応するキーワードの認識なく音声の発声の生じたことの使用者への表示を提供するための手段含む請求項１０に記載の装置。
２４．さらに、発声ストリングに含まれる所定の停止コマンドキーワードを認識するための手段、そしてそのような認識に応答してメモリに格納されたすべてのキーワードを出力するための手段、を具備する請求項１５に記載の装置。
２５．複数の可変長発声ストリングからなる全シーケンスの音声の発声を前記全シーケンスに含まれるキーワードに対応するデータ出力を提供する音声認識コントローラに入力するための方法であって、各発声ストリングには休止時間インターバルが続き、かつ各発声ストリングは少なくとも１つのキーワードを含み、前記方法は（ａ）最初のキーワードセットに対応する第１の発声ストリングを認識する段階、（ｂ）前記第１の認識されたキーワードセットを読取り／書込みメモリに格納する段階、（ｃ）前記第１の発声ストリングが所定の休止期間の間停止した後休止信号を提供する段階、（ｄ）前記休止信号に応答して前記第１の格納されたキーワードセットをメモリから取出す段階、（ｅ）少なくとも前記第１の取出されたキーワードセットの使用者への表示を提供する段階、（ｆ）所定のエラーコマンドキーワードに対応する第２の発声ストリングを認識する段階、そして（ｇ）前記所定のエラーコマンドキーワードの認識に応答して前記第１の格納されたキーワードセットを訂正する段階、を具備することを特徴とする前記方法。
２６．前記認識段階は連続ワード音声認識を行なう請求項２５に記載の方法。
２７．前記表示提供段階は前記最初のキーワードセットにのみ対応する音声を合成する段階を含む請求項２５に記載の方法。
２８．前記表示提供段階はさらにすべての格納されたキーワードを可視的に表示する段階を含む請求項２５に記載の方法。
２９．前記所定の休止時間は５秒より大きくない請求項２５に記載の方法。
３０．前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識の使用者への表示を提供する段階を含む請求項２５に記載の方法。
３１．前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識に応答して前記第１の格納されたキーワードのみをメモリからクリアする段階を含む請求項２５に記載の方法。
３２．前記訂正段階はさらに、連続する発声ストリングに含まれる２つの同じエラーコマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードをクリアする段階、を含む請求項２５に記載の方法。
３３．さらに、発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワードを出力する段階、を具備する請求項２５に記載の方法。
３４．前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声が生じたことの使用者への表示を提供する段階を含む請求項２５に記載の方法。