JPH03500693A - 音声コマンドによりデジットシーケンスを入力するための方法 - Google Patents
音声コマンドによりデジットシーケンスを入力するための方法Info
- Publication number
- JPH03500693A JPH03500693A JP63508908A JP50890888A JPH03500693A JP H03500693 A JPH03500693 A JP H03500693A JP 63508908 A JP63508908 A JP 63508908A JP 50890888 A JP50890888 A JP 50890888A JP H03500693 A JPH03500693 A JP H03500693A
- Authority
- JP
- Japan
- Prior art keywords
- keywords
- string
- recognition
- user
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 74
- 230000004044 response Effects 0.000 claims description 51
- 238000004891 communication Methods 0.000 claims description 24
- 238000012937 correction Methods 0.000 claims description 21
- 230000001755 vocal effect Effects 0.000 claims description 11
- 230000003993 interaction Effects 0.000 claims description 5
- 230000002452 interceptive effect Effects 0.000 claims description 5
- 230000000007 visual effect Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 101100005660 Mus musculus Ccr8 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Electrophonic Musical Instruments (AREA)
- Traffic Control Systems (AREA)
- Selective Calling Equipment (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
立 コマンドによ −ジットシーケンスを るためのり フLヱと
チE月Hコる。%LJ艮
2 1、発明の分野
目 本発明は一般的には音声認識制御システムに関する6より特定的には、本発
明は車両無線電話の応用において遍遇するようなノイズの多い環境で使用するの
に特に適したハンドフリー音声コマンド自動ダイヤルシステムに間する。
2、従来技術の説明
典型的には、無線および陸線電話システムの双方において、ユーザは該ユーザの
耳に近く配置される、一端にスピーカを、かつ該ユーザの口に近く保持される、
他端にマイクロホンを含むハンドセットにより通信する。動作においては、ユー
ザの一方の手がハンドセットをその適正な方向に保持するために占有され、それ
によりユーザの自由な手のみが車両を運転するような仕事を達成するために残さ
れる。ユーザに対し非常に大きな程度の自由を与えるためには、陸線電話システ
ムにおいてはスピーカホンが一般に使用されている。i&近、自動車において使
用するための車両用スピーカホンが開発された0例えば、イーストモンドによる
米国特許第4,378,603号およびビルマーによる米国特許第4.400,
584号は、共に本発明と同じ譲り受け人に譲渡されているが、ハンドフリー動
作を備えた車両用スピーカホンを記述している。
人間の音声に応答する、音声認識制御システムは自動車の応用において使用する
ために非常に望ましいものである。
大部分の移動無線送受信tI!(トランシーバ)の機能(例えば、オン/オフ、
送信/受信、ボリュウム、スケルチ、その他)あるいは移動無線電話制御のm能
(例えば、ブツシュボタンダイヤル、音声認識装置トレーニング、電話呼の応答
)は容易に何らのマニュアル動作を要求することなく音声コマンドによって行な
うことができる。従って、車両用スピーカホンと共に音声認識を用いることは自
動車の運転手に彼の手をステアリングホイールから放しあるいは彼の目を道路か
らそらす事を全く要求することなく完全にハンドフリ・−な電話会話を提供する
可能性を持っている。この特徴はスピーカホンのハンドフリーの可能性を拡張す
るのみならず、車両において移動無ti を話を使用する安全性と便宜性を付加
する。
不幸なことに、車両の無線電話に完全にハンドフリーな制御を適用することは幾
つかの重要な障害を引き起こす。
車両環境において音声認識が利用される時、車両において本質的に存在する高度
の環境ノイズが信頼できる音声制御に対しかなりの障害を与える。さらに、車両
用スピーカホンは典型的には、頭上の自動車の日除は板に取付けられるように、
使用者の口から遠いマイクロホンを有している。
その結果、必要とされる高いマイクロホンの感度は音声認識装置に印加される環
境背景ノイズの量を大幅に増大させ、これはその認識の信頼性を劣化させる。
より特定的には、自動ダイヤル式電話における音声認識エラーの問題はシステム
の性能をかなり低下させる。自動およびレパートリ−ダイヤルの機能が最近セル
ラ電話の用途において利用されてきており、それにより使用者は口頭で電話デジ
ット(digits)を入力しあるいは予め規定されたキーワードを用いて予め
格納された番号を口頭で呼出すことができる。もし音声認識ユニットがコマンド
キーワードを誤まって認識すれば、音声コマンドコントローラは一般に認証(v
erification)の目的で使用者に認識されたコマンドを返送するであ
ろう、使用者は従って、正しいキーワードを再入力する。この人力/認証/再入
力のプロセスは通常最小の不都合に過ぎないが、その理由はそれが典型的に大多
数のコマンドに対しほんの数秒しかかからないからである。しかしながら、もし
音声認識装置が電話番号を表す長い−続きのデジットにおける単一のデジットを
誤って検出すれば、入力/認証/再入力のプロセスは非常に時間を消費するもの
となりかつ、非常に少なくとも、使用者にとってはかなり不満足なものとなるで
あろう。
これらの理由のため、音声コマンドによりデジットを入力するための従来の技術
は非常に限られてきた。幾つかの音声認識制御装置は使用者が所定数、例えば、
電話番号については7または11、のデジットを発するのを待つ、最後の期待さ
れたデジットの認識に応じて、該制御装置は音声合成を用いて認識された番号を
認証のため使用者に音声で返答する。使用者は次に所定のエラーコマンドのキー
ワードを話すことにより誤って認識された電話番号が入力されることを防止でき
る。しかしながら、認識の精度が高くない車両の環境においては、正しい認識の
ために完全なデジットのシーケンスを数回繰返すことが必要になる。他のものに
おいては、音声コマンドのダイアル装置が認識の直後に各車−のデジットを繰返
す、この別の方法は高いノイズ環境においてはより信頼できることが分かつてい
るが、それは、特に認識精度が高い場合に、デジットの長いつながり(stri
ng)を入力するためにかなりの量の時間を必要以上に要求する。そのうえ、あ
るデジットが誤って認識された時車−デジットの認証プロセスは非常に厄介なも
のとなるが、それは使用者がエラーコマンドを話すためにメンタル的に停止し、
正しくない単一の桁を繰返し、正しい応答を聞き、かつ次にその先を続けなけれ
ばならない場合に使用者は容易に入力すべき次の桁を忘れることがあるからであ
る。全体として、従来技術の行入力/認証手順は使用者にとって親しみ易いもの
ではない。
従って、音声認識制御システムにおいて音声コマンドにより一続き(SeQue
nCf3)のデジットを入力しかつ認証するための利口な方法に対する必要性が
存在する。
九肌座鳳I
従って、本発明の一般的な目的は音声認識により一続きのキーワードを入力しか
つ認証するための改良された方法および装置を提供することにある。
本発明のより特定的な目的は、部分的なシーケンスのデジットのつながり(スト
リング)を入力しかつ選択的に編集することにより電話にダイヤルするための改
良された使用者相互作用的音声認識制御システムを提供することにある。
本発明によれば、11桁(デジット)の電話番号のような、使用者が話した発声
の全シーケンスを信頼性よく入力する音声通信装置のための使用者と相互作用す
る音声コマンド制御システムが提供される。この音声コマンド制御システムは使
用者の話した発声の複数の部分的シーケンス、可変長ストリングをデジットのよ
うな、複数の所定の’r−ワードに対応するものとして認識する音声認識ユニッ
トを含む、この制御システムは最初の発声のつながりが所定の休止時間インター
バルの開停止した後休止信号を与え、かつ次に該最初の発声のつながりに応答し
て認識されたキーワードの使用者への表示を提供する。該制御システムはまた休
止信号に応答してかつ所定のエラーコマンドキーワードに対応する第2の発声の
つながりの認識に応答して特定のキーワードを訂正するための機構を提供する。
好ましい実施例においては、ハンドフリー、ユーザ相互作用音声コマンドダイヤ
ルシステムが車両用スピーカホンを用いた移動無線電話と共に使用される。−続
きの桁の後所定の休止時間インターバルが認識された時、認識された桁がシステ
ムによって返送される。付加的な桁のつながりが次に入力でき、かつ認識された
後続の桁ストリングのみが次の休止の後に返答される。もしくワード「クリア(
CLEAR) Jのような)エラーコマンドキーワードが次に認識されると、入
力された最後の桁ストリングのみがクリアされる。もしエラーコマンド語が続け
て2回認識されると、桁ストリング全体がクリアされる。もしコントローラがユ
ーザが話しをしているがしかし何も認識されないことを検出すると、システムは
(多分ワード「リピート(REPEAT) Jによって)応答し使用者に音声認
識装置が先のストリングを認識できなかったことおよびそれが繰返されるべきこ
とを指示する。i&後の桁のストリングが入力されると、使用者は(ワード「タ
ーミネート(TERHIN^TE) Jのような)停止コマンドを話しかつ認識
された桁の全シーケンスが返答されかつ無線電話に出力される。
このようにして、使用者は環境ノイズ条件に応じて認識処理の認証モードを変更
する柔軟性を有する。高い認識精度が期待できる環境においては、使用者は全デ
ジットのシーケンスを休止することなく入力でき、かつシステムは直ちに全シー
ケンスを確認しかつ格納するであろう、これに対し、高い背景ノイズの条件下で
は使用者は各ストリングが発声された後に休止することにより部分的シーケンス
の桁ストリングの認証を要求する選択を行なうことができる。
もし認識エラーがあれば、特定の桁ストリングを全デジットシーケンスを再入力
させることなく訂正できる。各休止の後にキーワードのストリングを認証する本
方法はまた非常に使用者に親しみ易いものであり、それは人間は通常長い桁のシ
ーケンス(例えば、長距離電話番号)を桁ストリングの予め規定されたグループ
(例えば、1−312−397−1000)として読み、記憶し、かつ話すから
である。
区画ぷり11社葭朋
新規であると信じられる本発明の特徴は特に添付の請求の範囲に記載されている
。しかしながら、発明それ自体はそのさらに他の目的および利点と共に添付の図
面を取り入れて以下の説明を参照することにより最も良く理解でき、それらの図
において、
第1図は、本発明に係わるデジット入力方法を用いた音声通信装置のための音声
コマンド制御システムを示すブロック図、そして
第2a図および第2b図は好ましい実施例に係わるデジット入力方法の/ラクテ
ィスに従い前記制御システムによって行なわれる特定のシーケンスの動作を示す
フローチャートである。
ましい Jの=細f9述
次に添付の図面を参照すると、第1図は、本発明に係わるユーザ相互作用制御シ
ステム100の一般的なブロック図を示している。このシステムは基本的には音
声通信装置140に接続されたデバイスコントローラ120かう構成されている
。音声認識装置110が使用者からの音声コマンドをシステムのためのコマンド
信号に翻訳するためにデバイスコントローラに結合されている。デバイスコント
ローラは音声認識装置からの情報と共に、タイマ124、アクティビティ検出器
114、およびコントローラメモリ134からの情報を監視する。該コントロー
ラは、認識テングレートを選択しかつ音声認識装置110をイネーブルし、タイ
マをリセットし、データをコントローラメモリ134に格納しかつそこからデー
タを読出し、音声通信装置のダイヤル動作を制御し、かつ使用者へのフィードバ
ックを提供するために音声合成装W130に情報を提供する能力を有している1
本システムは使用者の手が他の仕事を行なうために自由になるような、スピーカ
ホンと共に使用するのによく適している。スピーカホン150はこのハンドフリ
ーの特徴を提供するためにオーディオ経路の方向を制御する。
音声通信装置140は例えば、2方向無線システム、電話システム、インターコ
ム(内部通信)システム、音声データエントリシステム、その他のような、任意
の無線または陸線音声通信システムの部分を含むことができる0本実施例におい
ては、音声通信装置140はセルラ移動無線電話のような、無線電話送受信11
()−ランシーバ)である。
そのような無線電話の詳細な説明はモトローラ社のインストラクションマニュア
ル第68P81066E40号、rDYNA T、A、C,(登録商標)セルラ
移動電話」に見ることができる。しかしながら、音声制御を必要とする任意の陸
線電話または単信無線送受信機を用いることができる。さらに、ハンドフリーな
使用者相互作用動作を行なう任意の電子装置もまた本発明を利用することができ
る。
音声通信装置140は送信経路144および受信経路142を利用し送信/受信
オーディオおよびダイヤル情報を通信チャネルにインタフェースする。移動無線
電話の好ましい実施例においては、これらの経路は二!無線電話動作のための一
対の無線周波数(RF)チャネルにインタフェースすることができる。
音声認識装置110はライン158における入力音声信号に対し音声認識を行な
う、認識中は、音声認識装置110は先に格納したワードのテンプレートを入力
音声情報に対し比較する1本実施例における認識アルゴリズムは連続音声認識、
ダイナミック時間ワーピング、エネルギ正規化、そしてテンプレート整合を判定
するためチェビシェフ距離測定法を導入する。音響 ” 、および11ilζ皿
ヱ玉IBEE喝!倉J(1982年5月3日−5日)、第2巻、pp、899−
902、ジェイ・ニス・プライドル、エム・ディ・ブラウンおよびアール・エム
・チェンバレインによる[つながりのあるワードの認識のためのアルゴリズムJ
に記載されたような、従来技術の認識アルゴリズム#J、1な用いることができ
る。
本実施例においては、8ビツトのマイクロコンピュータが音声認識装置110の
機能を達成する。さらに、第1図の幾つかの他の制御システムのブロックも部分
的にC0DEC/FI LTERおよびDSP (デジタル信号プロセッサ)の
助けにより同じマイクロコンピュータによって実施される。ブロック110の機
能を達成するために用いることができる代表的な音声認識用のハードウェアはジ
ェイ・ベカム、ジェイ・グリーン、ジェイ・キャニング、およびビー・スティー
ブンズによる「実時間ハードウェア連続音声認識システム」と題する”響 3
および−昇 理にるIEEE国際会−(1982年5月3日−5日)、第2巻、
pp、863−866の論文、およびそこに含まれた参考文献に記載されている
。しかしながら、本発明はいずれの特定のハードウェアにもあるいはいずれの特
定の形式の音声認識にも限定されない、より特定的には、本発明は通話者に依存
するあるいは通話者に依存しない音声認識、分離されたあるいは連続的なワード
認識、そしてソフトウェアベースのあるいはハードウェアベースの実施の使用を
意図するものである。
デバイスコントローラ120は典型的には音声通信装置140、音声認識装置1
10、そして音声合成装置130の間をインタフェースするマイクロプロセッサ
である。デバイスコントローラ120は音声認識装置110によって提供される
デバイス制御データ112を特定の音声通信装置によって認識し得る制御信号に
翻訳する。これらの制御信号は装置に使用者によって指令された特定の動作機能
を達成するよう指示する0例えば、もし使用者の話した発声が予め規定された電
話番号のシーケンスであれば、デバイスコントローラ120はコントローラバス
148を介して適正なダイヤル信号を生成するであろう、コントローラ1あるい
は任意の数の他の動作機能のような、音声通信装置140の他の特徴機能の音声
コマンド制御を行なうことができる。
デバイスコントローラ120はまた音声通信装置140の動作ステータスを表わ
す装置ステータスデータ122を提供する。このデータは音声合成装置130に
印加され、スピーカ176を介して出力された時使用者に認識可能な音声に翻訳
される0例えば、使用者の話した発声がデジットシーゲンスを終了させるための
予め規定されたコマンドキーワードに対応する時、音声合成装置130は認識さ
れた電話番号を使用者への返答として合成する。ステータスデータ122はまた
名前および電話番号(「オフィス(Office)」、’555−1234」等
) 、音声認識応答m報(「レディ(Ready) J、「終了? (Ter1
nate?)」等)、あるいは無I!電話ステータス情報(「呼ドロップ(Ca
lf Dropped)」、「システムビジィ(systen Busy) J
等)に関する情報を含むことができる。
本実施例においては、音声合成装置130として19チヤネルのボコーダが使用
されている。そのようなボコーダの例はジェイ・エヌ・ホルムズ、rJSRUチ
ャネルボコーダJ、IEE紀要、第127巻、パートF、第1号、1980年2
月、pp、53−60に見ることができる。しかしながら、当業者に明らかなよ
うに、任意の音声合成装置を利用することができる。さらに、本発明は、使用者
に指示を提供できる任意の手段が音声合成ブロック130の基本的な応答機能を
達成できることを考えている2例えば、任意の可視的表示器(例えば、LED、
LCD、CRT、その他)あるいは可聴表示器(例えば、トーン発生器または他
の可聴信号発生器)に置換えることができる。さらに、好ましい実施例において
は、14桁の電話番号ディスプレイが現在認識されている桁の使用者への付加的
な表示を連続的に提供する。
制御メモリ134、これは典型的にはランダムアクセスメモリ(RAM)である
が、は音声認識装置110によって認識される複数のキーワードを格納する。メ
モリバス136はキーワード入力のプロセス中に制御メモリ134に情報を送り
、かつキーワードの認証プロセスの間にデバイスコントローラ120によって格
納された情報へのアクセスを提供する。もし音声合成装置110または音声通信
装置140がデジット入力格納機能を行なうために内部RAMを導入しておれば
、外部制御メモリ134は省略できる。
音声アクティビティ検出器114は好ましい実施例においてはエネルギを基準と
した検出器である。検出器114は音声認識装置からの情報を利用することによ
りさらに高度の機構に置換えることができる。いずれの場合においても、音声ア
クティビティ検出器114は音声アクティビティに対して入力音声信号158を
監視する機能を達成し、それによりデバイスコントローラ120が認識されるべ
き音声が存在するか否かを判定できるように°する。検出器114に用いること
ができる代表的な技術については、アール・ジェイ・フローレイおよびエム・エ
ル・マルパスによる、「ソフトデシジョンノイズ抑圧フィルタを用いた音声増強
J、IEEB”響 立 およびけ 理に る糸l A S S P −28巻、
第2号(1980年4月)、pp137−145、を参照されたい。
タイマブロック124は最後のキーワードが認識されてから経過した時間を計測
するのみならず、先の音声活動から経過した時間の計測をも与える。これらの時
間インターバルはデータバス126を介してコントローラ120により初期化さ
れ、監視され、かつリセットすることができる。
再び、これらのタイマのさらに詳細な説明についてはフローチャートの記述を参
照されたい。
スピーカホン150はハンドフリー制御システムの受信/応答オーディオ多重化
機能のみならず、送信/受信オーディオのスイッチング機能を行なう、使用者の
話した入力音声はマイクロホン152に印加され、このマイクロホン152は典
型的には使用者の口から離れて遠隔的に取付けられる(例えば、自動車の日よけ
板に取付けられる)、マイクロホン152は電気的入力音声信号を発生し、この
信号は次に前置増幅器153によって増幅されてスピーカホン150に入力音声
信号154を提供する。スピーカホン150は154における入力音声信号を入
力信号ライン158を介して音声認識装置110に向ける。
単信システムにおいては、移動無線の使用者が話している時、信号検出装置16
0は検出器出力162を介して正の制御信号を提供し送信オーディオスイッチ1
56を閉じ、かつ検出器出力164を介して負の制御信号を提供し受信オーディ
オスイッチ166を開く、逆に、陸線パーティが話している時、信号検出器16
0は受信オーディオスイッチ166を閉じるために逆極性の信号を提供し、一方
送信オーディオスイッチ156を開く、受信オーディオスイッチ166が閉じら
れている時、音声通信装置140からの受信機オーディオ146は受信オーディ
オスイッチ166を通りスイッチされた受信オーディオ出力168を介してマル
チプレクサ170に向けられる。マルチプレクサ170は音声合成装置130か
らの音声応答オーディオ132およびスイッチされた受信オーディオ168の間
のオーディオ経路をデバイスコントローラ120からのマルチプレクサ信号信号
128に応じて制御する。デバイスコントローラが情報を音声合成装置に送る時
は常に、マルチプレクサ信号128はマルチプレクサ170を音声応答オーディ
オをスピーカに向けるよう指示する。車両用スピーカホンオーディオ172は通
常スピーカ176に印加される前にオーディオ増幅器174により増幅される。
ここに説明された車両用スピーカホンの実施例は多くの可能な構成の内の1つに
すぎない0例えば、音声認識装置110は常に、陸線パーティが話しているか否
かに係わらず移動無線の使用者のコマンドに応答することが望まれるであろう、
そのような場合、入力音声信号154は直接音声認識装rIt110に接続され
る。さらに幾つかの通信システムにおいては、オーディオスイッチ156および
166を信号検出装置からの制御信号に応答して等しいが逆の減衰を提供する可
変利得装置に置換えることが好都合であるかもしれない、信号検出装置160は
またデバイスコント0−5120に陸線パーティまたは移動使用者のいずれが話
しているかを表示するための信号を供給することができ、これは陸線パーティか
らの音声を誤って認識することを防止するために使用できる。
今までの説明で明らかであるように、デバイスコントローラ120は使用者相互
作用的ハンドフリー音声コマンド制御システム100の心臓部である。技術上知
られておりかつ本発明に適したデバイスコントローラの一例はマイクロプロセッ
サである。デバイスコントローラ120の詳細な動作は引続き制御システム10
0に対するソフトウェアフローチャートによって説明される。しかしながら、発
明を理解するために、以下の例は雑音の多い環境において特定の桁シーケンスを
入力する場合を説明するために使用される。この例は本発明の特徴および利点を
明瞭に示している。
使用者がダイヤルシステムに完全な桁シーゲンス1−2−3−4−5−6−7を
入力することを希望するものと仮定する。ここで用いられているように、完全な
キーワード「シーケンス」 (例えば、1−2−3−4−5−6−7 )は1つ
またはそれ以上の部分シーケンスのキーワードの「ストリングj (例えば、1
−2−3゜4.5−6.7)で構成され、この場合各ストリングは予め規定され
た休止時間インターバル、即ち音声活動のない時間により分離される。v、用者
は最初に[エンター(ENTER) Jのような口頭でのコマンドにより制御シ
ステムを行入力モードに向ける。
システムは次にワード「デジット(DIGITS) Jのような合成された応答
で返答する。
自動車の中のような、ノイズの多い環境では、音声認識の精度は背景ノイズによ
りしばしば制限される。従って、使用者は完全な桁シーケンスt −2−3−4
−5−6−7を3個の部分的シーケンスの桁ストリング、即ち、1−2−3.4
−5.6−7で入力することを決定できる。各ストリングは任意の長さにするこ
とができることに注意を要する。使用者は次に「ワン・ツク・スリー」の発声を
行ない、かつ次に休止する。もしいずれのキーワードも認識されなければ、いず
れの桁もディスプレイに現われず、がっ制御システムは合成されたワード「リピ
ート(REPE八旬」へ応答するであろう。
従って、使用者は再び「ワン・ツク・スリー」を発声し、これに休止が続く、も
しこの桁ストリングが「ワン・スリー・スリー」として誤って認識されれば、表
示装置は1−3−3を表示し、かつ合成装置は音声による確認「ワン・スリー・
スリーJで応答するであろう、これは正しくないから、使用者は次にコマンドワ
ード「クリア(CLEAR) Jを発音する。このコマンドキーワードの認識に
応じて、システムは最も最近の桁ストリングをクリアし、全シーケンスがクリア
されたことを表示するために2回の「ビープ」を生成し、次に表示装置を消去す
る。
再び、使用者は「ワン・ツク・スリー」を発音し、次に3秒の休止期間を続ける
。もし正しい桁ストリングニー2−3が認識されれば、1−2−3がディスプレ
イに現れ、合成装置は「ワン・ツク・スリー」と応答する。#l用者は次に「フ
ォア・ファイブJの発音を続け、その後他の休止を与える。もしこれらの発声が
背景ノイズのなめに4−6と誤って認識されれば、1−2−3−4−6がディス
プレイ上に現れ、かつ合成装置は「フォア・シックスjと応答するであろう、こ
のfitIeの桁ストリグを訂正するために、使用者は「クリア」を発音する。
I&後の桁ストリング4−6のみがクリアされ、かつディスプレイは再び1−2
−3を表示する0合成装置は次に単一の[ビープ」をもって応答し使用者に最も
最近の桁ストリングのみがクリアされたこと、および先に入力されたストリング
はメモリに残っていることを表示する。ふたたび、使用者は「フォア・ファイブ
」を発声しその後休止を続ける。もし正しく認識されれば、合成装置は「フォア
・ファイブ」と応答し、かつディスプレイは1−2−3−4−5を表示する。
このシーケンスに続き、使用者は「シックス・セブン」を発生し、これに他の休
止期間が続く、もし正しく認識されれば、全シーケンス1−2−3−4−5−6
−7が表示され、かつ合成装置は、認識された最後の桁ストリングを表わす、コ
ンファメーション「シックス・セブン」によって応答する。全桁シーケンスが今
や入力されながら、使用者はコマンド「ターミネートJを発生する0次に合成装
置は全シーケンス「ワン・ツク・スリー・フォア・ファイブ・シックス・セブン
Jによって応答する0表示1−2−3−4−5−6−7が全桁シーケンスを認証
するため維持される。
第2a図および第2b図は、桁シーゲンス入力手順の量制御システム100によ
って行なわれるシ〜ゲンスのステップを記述する。好ましい実施例においては、
コントローラのダイヤルシーケンスはコマンドワードENTERの認識に応じて
ステップ202でスタートする。ステップ204においてコントローラメモリ1
34のメモリロケーションを初期化するため、スタートポインタSPおよびエン
ドポインタEPがメモリロケーション0(ゼロ)に初期化される。ステップ20
6において応答フラグがリセットされ、そしてタイマブロック124の休止タイ
マおよび認識タイマがステップ208においてゼロにリセットされる。
ステップ210においては、コントローラは音声認識装置がOないし9の単−桁
に対応する何らかのキーワードを認識したか否かを判定する。もし単−桁が認識
されておれば、ステップ212において応答フラグがテストされる。
もし応答フラグが先にセットされておれば、使用者の先の桁に未だ返答されてい
ない少なくとも1つの桁が格納される。従って、特定の桁ストリングにおける最
初に格納された桁のメモリロケーションを示す、スタートポインタSPが合せら
れるべきではない、しなしながら、もし応答フラグがセットされておらなければ
、認識された現在の桁はストリングの最初の桁を表わす、その場合、ステップネ
14はスタートポインタSPを現在の桁が格納される場所に対応するメモリロケ
ーションに更新する。
ステップ216においては、認識された桁(デジット)がコントローラメモリ1
34のエンドポインタにEPに対応するメモリロケーションに格納される。エン
ドポインタEPは次にステップ218において増分され次に利用可能なメモリロ
ケーションを指示するようにされる0両方のタイマが次にステップ220におい
てリセットされる。応答フラグがステップ221においてセットされるが、これ
はデジットが今や格納されているからである。制御は次にステップ210に戻り
認識されるべき次のデジットを待機する。
もしステップ210において何らの桁キーワードも認識されなければ、制御はス
テップ222に進み停止コマンドキーワードが認識されたか否かをチェックする
。好ましい実施例においては、行入力手順の終了を表わすために使用されるコマ
ンドキーワードとしてワードTERM I NATEが選択された。もしTER
MINATEが認識されれば、ステップ224において全桁シーケンスが音声合
成装W、130により返送される0合成されるべき桁シーゲンスはメモリロケー
ションZERO(ゼロ)で始まりかつメモリロケーションEP−1で終わる、メ
モリ134を読取ることによって得られる6次に、この完全な桁シーケンスがス
テップ226において音声通信装置140に出力される0桁入力手順はステップ
228において終了する。
TERMINATEコマンドが認識された後は何らの桁編集手順も行なわれない
ことに注意を要する。音声合成による桁シーケンスの確認のみが与えられ、かっ
全桁シーケンスが可視的ディスプレイに残る0例えば、もし使用者がその直後に
ワードTERMINATEが続く全桁シーケンスを発声すれば、システムは認識
されたシーケンスが正しいものと仮定する。この入力モードは認識精度が高いも
のと期待されている場合に使用される。しかしながら、使用者はステップ202
において行入力手順を再スタートすることにより何らかのエラーを修正すること
を希望できるため、ステップ228の後でエラーが訂正できないということを意
味するものではない、一層重要なことには、使用者は常にTERMINATEの
ワードの前に休止(ボーズ)を挿入することにより丁度入力した桁ストリングを
訂正するオプションを常に有している。従って、使用者は訂正手順を相互作用的
に用い、あるいはキーワードシーケンスを迅速に入力しかつ確認するために柔軟
性を有している。
もしコマンドキーワードTERMI NATEがステップ222において認識さ
れなければ、コントローラはコマンドキーワードCLEARがステップ230に
おいて認識されたか否かを見るためにチェックを行なう、もしCLEARコマン
ドが認識されておれば、ステップ232において音声合成装置によりオーディオ
返答信号が出力される。好ましい実施例においては、音声合成装置は単一の「ビ
ープトーンを発生ずるよう指令される。しかしながら、数多くの他の確認信号を
選択することもできる。ステップ234において、コントローラはOまなは1つ
の桁ストリングが入力されたか否かを、スタートポインタSPがゼロか否かをチ
ェックすることによって、判定する。もし1つのストリングのみが入力されてお
れば、単一のストリングをクリアすることが全桁シーケンスをクリアすることと
等価である。従って、第2のビープトーンがステップ244において指示され使
用者に、最後のストリングだけでなく、全シーケンスがクリアされた事を通知す
る。もし何らの桁ストリングも入力されておらなければ、ステップ234におけ
るテストはまたステップ244に移行する結果となり、これはスタートポインタ
SPが依然としてゼロであるからである。もし1個より多くのストリングが入力
されておれば、コントローラはステップ236において連続的なCLEARコマ
ンドキーワードが認識された2回目である、即ちこれは使用者が全シーケンスを
クリアすることを希望している状態を意味する、場合であるかを見るためチェッ
クを行なう、2番目の連続するCLEARはスタートポインタSPがエンドポイ
ンタEPに等しいかどうかチェックすることにより容易に判定することができる
。もし第2の連続的CLEARキーワードが認識されておれば、コントローラは
再びステップ244に進み音声合成装置により第2のビープトーンを出力する。
CLEARコマンドが認識された最初の時である場合、かつもし1つより多くの
ストリングが入力されておれば、制御はステップ238に進み最後に入力された
桁ストリングのみをクリアする。メモリポインタに関しては、桁ストリングはエ
ンドポインタEPをスタートポインタSPのロケーションに等しくセットするこ
とによりクリアされる。応答フラグがステップ240においてリセットされるが
、これは応答されていない桁ストリングは何ら残っていないからである。ステッ
プ242はタイマをリセットし、かつ制御は次にステップ210において次の桁
を認識するために戻る。
先に述べたように、もし1つのストリングのみが入力されておれば、あるいはも
し2つの連続するCLEARコマンドが認識されておれば、第2のビープトーン
がステップ244において出力される。全桁シーケンスが次にステップ246に
おいてクリアされる0桁シーケンスをクリアするため、スタートポインタSPお
よびエンドポインタEPが共にステップ204においてなされたようにメモリロ
ケーションO(ゼロ)に等しくセットされる。ステップ248は応答フラグをリ
セットするが、これはメモリに何らの桁ストリングも残っていないからである。
ステップ250はタイマをリセットする。制御は再びステップ210において次
のキーワードを捜すために戻る。
もしステップ210において何らの桁キーワードも認識されなければ、ステップ
222においてTERMINATEは認識されず、かつCLEARがステップ2
30において認識され、次に制御はステップ252に進み音声アクティビティ検
出器114からのアクティビティライン116をチェックする。もし音声活動(
アクティビティ)があれば、休止タイマのみがステップ254においてリセット
され、かつ制御はステップ210において次の桁を捜すために戻る。
逆に、音声活動がなければ、休止タイマがステップ256においてチェックされ
それが経過したか否がが判定される。好ましい実施例においては、休止タイマは
音声活動が3秒間なかった後に経過する。もし休止タイマが経過しておらなけれ
ば、制御は再びステップ210に戻る。しかしながら、もし3秒の休止が検出さ
れれば、ステップ258において応答フラグが試験され桁ストリングが返答され
るべきか否かが判定される。もし応答フラグが先にステップ221においてセッ
トされておれば、ステップ258は制御をステップ260に移しそこで最後に入
力された桁ストリングが音声合成を介して使用者に返答される。再び、メモリポ
インタに介しては、最後に入力された桁ストリングがメモリロケーションSPで
始まり、かつメモリロケーションEP−1に続く、応答フラグがステップ262
においてリセットされかつタイマがステップ264においてリセットされ、その
後制御は再びステップ210に移される。
今だ返答されていない何らの桁も認識されていないことを意味する、応答フラグ
がセットされていない状態であれば、認識タイマがステップ268においてテス
トされる。
認識タイマは今だ認識されていない音声活動が生じたか否かを判定するために使
用される。ステップ268は単に認識タイマが休止タイマより大きいか否かを判
定する。双方のタイマは常に、音声活動が認識なしに生じている、ステップ25
4の場合を除き共にリセットされるから、認識タイマを休止タイマと比較するこ
とが適切になる。休止タイマが経過したから、ステップ268において休止タイ
マの値は丁度3秒になる。これは最後の音声活動から3秒が経過したことを示す
、もしキーワードが認識されてから3秒より多くが生じておれば、認識タイマは
休止タイマを越えるであろう0例えば、もし使用者が2秒間話し、次に3秒間休
止したが、何も認識されなかった場合には、認識タイマは少なくとも5秒の値を
有し、一方体止タイマは3秒となっているであろう、この場合、制御はステップ
270に進みそこで合成装置はワードREPEATを使用者に返送するよう指示
される。ステップ272において双方のタイマがリセットされ、制御は次に桁認
識ステップ210に戻る。
しかしながら、もしステップ268においてタイマが等しければ、何らの音声活
動も3秒より長く生じていないこととなる。この場合、制御はステップ276に
進みそこで認識タイマがテストされる。好ましい実施例においては、認識タイマ
は何らの音声認識もない6秒の後に経過する。
もしそのような場合であれば、合成装置はステップ278においてワードTIM
EOUTを返送して使用者に行入力手順がステップ280において終了したこと
を通知するよう指令される。もし認識タイマがまだ経過しておらなければ、制御
は再び戻りステップ210において音声活動を監視し続ける。
以上要するに、本発明は音声コマンドにより一連のキーワードを入力しかつ認証
するための高度に相互作用的でありかつ使用者に親しみ易い方法を提供すること
が理解できる。上述のように、本制御システムは可変長の桁ストリングを入力す
る場合、および桁ストリングの間で選択的に休止することにより認証プロセスを
制御する場合に使用者に大きな柔軟性を許容する。もし高い認識精度が期待され
る場合には、使用者は休止することなく全桁シーケンスを迅速に入力できる。こ
れに対し、認識精度が劣化している条件下では、使用者は任意の桁数が話された
後に休止することにより部分的なシーケンスの桁ストリングにつき認証を要求す
るオプションを有している。
本発明の特定の実施例が示されかつ説明されたが、当業者により他の変形および
改良を成すことができる。特に、コマンドワードCLEARおよびTERMI
NATE、または応答ワードBEER,REPEAT、およびTIMEOUTは
好ましい実施例においては特定の用途に対し代表的な英語ワードとしてのみ選択
されたことを認識すべきである。しかしながら、他のコマンドワードおよび応答
ワードももし望むなら、特に異なる言語と共に使用するために、選択することが
できる。数多くのハードウェアおよびソフトウェア的な修正もまた本キーワード
入力方法を種々の他の応用に適応させるなめに行なうことができる。ここに開示
されかつ請求された基本的な内にある原理を保持するすべてのそのような変更は
本発明の範囲内にあるものである。
r−
補正書の写しく翻訳文)提出書く特許法第184条の8)平成2年4月11日
特許庁長官 吉 1)文 毅 殿
PCT/US88102851
、発明の名称
音声コマンドによりデジットシーゲンスを入力するための方法3、特許出願人
住 所 アメリカ合衆国イリノイ州60196、シャンバーブ、イースト・アル
ゴンフィン・ロード1303名 称 モトローラ・インコーホレーテッド代表者
ギルマン・ジエームズ ダブリュ4、代理人
住 所 〒231神奈川県横浜市中区本町1丁目7番地東ビル 電話045 (
211)27955、補正書の提出年月日 1989年12月12日請求の範囲
1(補正)、1!イン −パルによって されt・之mユ9可変長の音声の発声
ストリングに含まれるキーワードを認識する段階、
発声ストリングが所定の休止期間の開停止した後休止信号を提供する段階、
前記休止信号に応答して、使用者に前記休止信号の前に生じた発声ストリングに
対応する認識された特定のキーワードの表示を使用者に提供する段階、そして前
記休止信号に応答してかつ前記休止信号の後に生じた発声ストリングに含まれる
所定のエラーコマンドキーワードの認識に応答して特定のキーワードを訂正する
段階、を具備することを特徴とする電子的装置を制御するためのユーザ相互作用
的方法。
2、前記認識[tは特定の認識されたキーワードをメモリに格納する段階を含む
請求項1に記載の方法。
3、前記表示提供段階は前記の格納されたキーワードをメモリから読出す段階を
含む請求項2に記載の方法。
4、前記訂正段階は前記所定のエラーコマンドキーワードの認識の使用者に対す
る表示を提供する段階を含む請求項1に記載の方法。
5、前記訂正段階は前記所定のエラーコマンドキーワードの認識に応答して、前
記休止信号の前に生じた最後の発声ストリングのみに対応する格納されたキーワ
ードをメモリからクリアする段階を含む請求項2に記載の方法。
6、前記訂正段階はさらに、
連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識
する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ
ードをクリアする段階、
を含む請求項2に記載の方法。
7、さらに、
発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし
て
そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段
階、
を具備する請求項2に記載の方法。
8、前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声
の生じたことの使用者への表示を提供する段階を含む請求項1に記載の方法。
9、前記所定の休止時間は5秒より大きくない請求項1に記載の方法。
10、休止時間インターバルによって分離された少なくとも2つの可変長音声発
声ストリングに含まれるキーワードを認識するための手段、
発声ストリングが所定の休止期間の開停止した後休止信号を提供するための手段
、
前記休止信号に応答して、前記休止信号の前に生じた最後の発声ストリングに対
応する認識された特定のキーワードの使用者に対する表示を提供するための手段
、そして前記休止信号にさらに応答し、前記休止信号の後に生じた次の発声スト
リングに含まれる所定のエラーコマンドキーワードの認識に応答して前記特定の
キーワードを訂正するための手段、
を具備することを特徴とする使用者相互作用的音声認識制御装置。
11、前記制御装置は電話通信装置のための自動ダイヤル装置である請求項10
に記載の装置。
12、前記電話通信装置は無線電話装置である請求項11に記載の装置。
13、前記電話通信装置はスピーカホンを含む請求項11に記載の装置。
14、前記認識手段は連続ワード音声認識を実施する請求項10に記載の装置。
15、前記認識手段は特定の認識されたキーワードをメモリに格納するための手
段を含む請求項10に記載の装置。
16、前記表示提供手段は前記の格納されたキーワードをメモリから読取るため
の手段を含む請求項15に記載の装置。
17、前記表示提供手段は音声合成装置を含む請求項10に記載の方法。
18、前記表示提供手段は可視的ディスプレイを含む請求項10に記載の装置。
19、前記所定の休止時間は5秒より大きくない請求項10に記載の装置。
20、前記訂正手段は前記所定のエラーコマンドキーワードの認識の使用者への
表示を提供するための手段を含む請求項10に記載の装置。
21、前記訂正手段はさらに前記所定のエラーコマンドキーワードの認識に応答
して、前記休止信号の前に発生した最後の発声ストリングのみに対応する格納さ
れたキーワードをメモリからクリアするための手段を含む請求項15に記載の装
置。
22、前記訂正手段はさらに、
連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識
するための手段、そしてそのような認識に応答してメモリに格納されたすべての
キーワードをクリアするための手段、
を含む請求項15に記載の装置。
23゜前記表示提供手段はさらに何らの対応するキーワードの認識なく音声の発
声の生じたことの使用者への表示を提供するための手段含む請求項10に記載の
装置。
24、さらに、
発声ストリングに含まれる所定の停止コマンドキーワードを認識するための手段
、そして
そのような認識に応答してメモリに格納されたすべてのキーワードを出力するた
めの手段、
を具備する請求項15に記載の装置。
25、複数の可変長発声ストリングからなる全シーケンスの音声の発声を前記全
シーケンスに含まれるキーワードに対応するデータ出力を提供する音声認識コン
トローラに入力するための方法であって、各発声ストリングには休止時間インタ
ーバルが続き、かつ各発声ストリングは少なくとも1つのキーワードを含み、前
記方法は(a)fi初のキーワードセットに対応する第1の発声ストリングを認
識する段階、
(b)前記第1の認識されたキーワードセットを読取り/書込みメモリに格納す
る段階、
(c)前記第1の発声ストリングが所定の休止期間の開停止した後休止信号を提
供する段階、
(d)前記休止信号に応答して前記第1の格納されたキーワードセットをメモリ
から取出す段階、(e)少なくとも前記第1の取出されたキーワードセットの使
用者への表示を提供する段階、
(f>所定のエラーコマンドキーワードに対応する第2の発声ストリングを認識
する段階、そして(g)前記所定のエラーコマンドキーワードの認識に応答して
前記第1の格納されたキーワードセットを訂正する段階、
を具備することを特徴とする前記方法。
26、前記認識段階は連続ワード音声認識を行なう請求項25に記載の方法。
27、前記表示提供段階は前記最初のキーワードセットにのみ対応する音声を合
成する段階を含む請求項25に記載の方法。
28、前記表示提供段階はさらにすべての格納されたキーワードを可視的に表示
する段階を含む請求項25に記載の方法。
29、前記所定の休止時間は5秒より大きくない請求項25に記載の方法。
30、前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識の使用
者への表示を提供する段階を含む請求項25に記載の方法。
31、前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識に応答
して前記第1の格納されたキーワードのみをメモリからクリアする段階を含む請
求項25に記載の方法。
32、前記訂正段階はさらに、
連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識
する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ
ードをクリアする段階、
を含む請求項25に記載の方法。
33、さらに、
発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし
て
そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段
階、
を具備する請求項25に記載の方法。
34、前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発
声が生じたことの使用者への表示を提供する段階を含む請求項25に記載の方法
。
国際調査報告
Claims (34)
- 1.1つまたはそれ以上の可変長の音声の発声ストリングに含まれるキーワード を認識する段階であって、各発声ストリングには休止時間インターバルが続くも の、発声ストリングが所定の休止期間の間停止した後休止信号を提供する段階、 前記休止信号に応答して、使用者に前記休止信号の前に生じた発声ストリングに 対応する認識された特定のキーワードの表示を使用者に提供する段階、そして前 記休止信号に応答してかつ前記休止信号の後に生じた発声ストリングに含まれる 所定のエラーコマンドキーワードの認識に応答して特定のキーワードを訂正する 段階、を具備することを特徴とする電子的装置を制御するためのユーザ相互作用 的方法。
- 2.前記認識段階は特定の認識されたキーワードをメモリに格納する段階を含む 請求項1に記載の方法。
- 3.前記表示提供段階は前記の格納されたキーワードをメモリから読出す段階を 含む請求項2に記載の方法。
- 4.前記訂正段階は前記所定のエラーコマンドキーワードの認識の使用者に対す る表示を提供する段階を含む請求項1に記載の方法。
- 5.前記訂正段階は前記所定のエラーコマンドキーワードの認識に応答して、前 記休止信号の前に生じた最後の発声ストリングのみに対応する格納されたキーワ ードをメモリからクリアする段階を含む請求項2に記載の方法。
- 6.前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ ードをクリアする段階、 を含む請求項2に記載の方法。
- 7.さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし て そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段 階、 を具備する請求項2に記載の方法。
- 8.前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声 の生じたことの使用者への表示を提供する段階を含む請求項1に記載の方法。
- 9.前記所定の休止時間は5秒より大きくない請求項1に記載の方法。
- 10.休止時間インターバルによって分離された少なくとも2つの可変長音声発 声ストリングに含まれるキーワードを認識するための手段、 発声ストリングが所定の休止期間の間停止した後休止信号を提供するための手段 、 前記休止信号に応答して、前記休止信号の前に生じた最後の発声ストリングに対 応する認識された特定のキーワードの使用者に対する表示を提供するための手段 、そして前記休止信号にさらに応答し、前記休止信号の後に生じた次の発声スト リングに含まれる所定のエラーコマンドキーワードの認識に応答して前記特定の キーワードを訂正するための手段、 を具備することを特徴とする使用者相互作用的音声認識制御装置。
- 11.前記制御装置は電話通信装置のための自動ダイヤル装置である請求項10 に記載の装置。
- 12.前記電話通信装置は無線電話装置である請求項11に記載の装置。
- 13.前記電話通信装置はスピーカホンを含む請求項11に記載の装置。
- 14.前記認識手段は連続ワード音声認識を実施する請求項10に記載の装置。
- 15.前記認識手段は特定の認識されたキーワードをメモリに格納するための手 段を含む請求項10に記載の装置。
- 16.前記表示提供手段は前記の格納されたキーワードをメモリから読取るため の手段を含む請求項15に記載の装置。
- 17.前記表示提供手段は音声合成装置を含む請求項10に記載の方法。
- 18.前記表示提供手段は可視的デイスプレイを含む請求項10に記載の装置。
- 19.前記所定の休止時間は5秒より大きくない請求項10に記載の装置。
- 20.前記訂正手段は前記所定のエラーコマンドキーワードの認識の使用者への 表示を提供するための手段を含む請求項10に記載の装置。
- 21.前記訂正手段はさらに前記所定のエラーコマンドキーワードの認識に応答 して、前記休止信号の前に発生した最後の発声ストリングのみに対応する格納さ れたキーワードをメモリからクリアするための手段を含む請求項15に記載の装 置。
- 22.前記訂正手段はさらに、 連携する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 するための手段、そしてそのような認識に応答してメモリに格納されたすべての キーワードをクリアするための手段、 を含む請求項15に記載の装置。
- 23.前記表示提供手段はさらに何らの対応するキーワードの認識なく音声の発 声の生じたことの使用者への表示を提供するための手段含む請求項10に記載の 装置。
- 24.さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識するための手段 、そして そのような認識に応答してメモリに格納されたすべてのキーワードを出力するた めの手段、 を具備する請求項15に記載の装置。
- 25.複数の可変長発声ストリングからなる全シーケンスの音声の発声を前記全 シーケンスに含まれるキーワードに対応するデータ出力を提供する音声認識コン トローラに入力するための方法であって、各発声ストリングには休止時間インタ ーバルが続き、かつ各発声ストリングは少なくとも1つのキーワードを含み、前 記方法は(a)最初のキーワードセットに対応する第1の発声ストリングを認識 する段階、 (b)前記第1の認識されたキーワードセットを読取り/書込みメモリに格納す る段階、 (c)前記第1の発声ストリングが所定の休止期間の間停止した後休止信号を提 供する段階、 (d)前記休止信号に応答して前記第1の格納されたキーワードセットをメモリ から取出す段階、(e)少なくとも前記第1の取出されたキーワードセットの使 用者への表示を提供する段階、 (f)所定のエラーコマンドキーワードに対応する第2の発声ストリングを認識 する段階、そして(g)前記所定のエラーコマンドキーワードの認識に応答して 前記第1の格納されたキーワードセットを訂正する段階、 を具備することを特徴とする前記方法。
- 26.前記認識段階は連続ワード音声認識を行なう請求項25に記載の方法。
- 27.前記表示提供段階は前記最初のキーワードセットにのみ対応する音声を合 成する段階を含む請求項25に記載の方法。
- 28.前記表示提供段階はさらにすべての格納されたキーワードを可視的に表示 する段階を含む請求項25に記載の方法。
- 29.前記所定の休止時間は5秒より大きくない請求項25に記載の方法。
- 30.前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識の使用 者への表示を提供する段階を含む請求項25に記載の方法。
- 31.前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識に応答 して前記第1の格納されたキーワードのみをメモリからクリアする段階を含む請 求項25に記載の方法。
- 32.前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ ードをクリアする段階、 を含む請求項25に記載の方法。
- 33.さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし て そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段 階、 を具備する請求項25に記載の方法。
- 34.前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発 声が生じたことの使用者への表示を提供する段階を含む請求項25に記載の方法 。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/110,144 US4870686A (en) | 1987-10-19 | 1987-10-19 | Method for entering digit sequences by voice command |
PCT/US1988/002851 WO1989004035A1 (en) | 1987-10-19 | 1988-08-24 | Method for entering digit sequences by voice command |
US110,144 | 1993-08-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03500693A true JPH03500693A (ja) | 1991-02-14 |
JPH0782351B2 JPH0782351B2 (ja) | 1995-09-06 |
Family
ID=22331440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63508908A Expired - Lifetime JPH0782351B2 (ja) | 1987-10-19 | 1988-08-24 | 音声コマンドによりデジットシーケンスを入力するための方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US4870686A (ja) |
EP (1) | EP0389514B1 (ja) |
JP (1) | JPH0782351B2 (ja) |
KR (1) | KR0129856B1 (ja) |
AT (1) | ATE136146T1 (ja) |
CA (1) | CA1312668C (ja) |
DE (1) | DE3855164T2 (ja) |
MX (1) | MX165502B (ja) |
WO (1) | WO1989004035A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001236091A (ja) * | 2000-02-23 | 2001-08-31 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識結果の誤り訂正方法およびその装置 |
Families Citing this family (108)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02209055A (ja) * | 1989-02-09 | 1990-08-20 | Toshiba Corp | 電話装置 |
AU650845B2 (en) * | 1989-08-28 | 1994-07-07 | K. Michael Sekins | Lung cancer hyperthermia via ultrasound and/or convection with perfluorocarbon liquids |
US5175759A (en) * | 1989-11-20 | 1992-12-29 | Metroka Michael P | Communications device with movable element control interface |
US5095503A (en) * | 1989-12-20 | 1992-03-10 | Motorola, Inc. | Cellular telephone controller with synthesized voice feedback for directory number confirmation and call status |
US5268959A (en) * | 1990-06-22 | 1993-12-07 | Hong Inpon D | Telephone long distance redialing apparatus and process |
WO1992003882A1 (en) * | 1990-08-20 | 1992-03-05 | Motorola, Inc. | Dialing editing method and apparatus |
US6002558A (en) * | 1990-09-18 | 1999-12-14 | Rines; Carol Mary | Method of and apparatus for expanding functionality of vehicle cassette tape-player decks to permit dictation or other recording and automatic remote station relaying of the same |
US5201028A (en) * | 1990-09-21 | 1993-04-06 | Theis Peter F | System for distinguishing or counting spoken itemized expressions |
US5315688A (en) * | 1990-09-21 | 1994-05-24 | Theis Peter F | System for recognizing or counting spoken itemized expressions |
US5155689A (en) * | 1991-01-17 | 1992-10-13 | By-Word Technologies, Inc. | Vehicle locating and communicating method and apparatus |
US5539810A (en) * | 1992-01-27 | 1996-07-23 | Highwaymaster Communications, Inc. | Data messaging in a communications network |
US5983108A (en) * | 1992-01-27 | 1999-11-09 | Highwaymaster Communications, Inc. | Method and apparatus for a nation-wide cellular telephone network |
US5454027A (en) * | 1992-01-27 | 1995-09-26 | Hm Holding Corporation | Phantom mobile identification number method and apparatus |
GB2264209B (en) * | 1992-02-06 | 1995-11-08 | Technophone Ltd | Cordless telephone arrangement |
US5371779A (en) * | 1992-03-13 | 1994-12-06 | Nec Corporation | Call initiating system for mobile telephone units |
US5297183A (en) * | 1992-04-13 | 1994-03-22 | Vcs Industries, Inc. | Speech recognition system for electronic switches in a cellular telephone or personal communication network |
US5350359A (en) * | 1992-07-16 | 1994-09-27 | Temple University Of The Commonwealth System Of Higher Education | Control, treatment and/or diagnosis of physiological conditions with degassed perfluorocarbon liquid |
DE4225475A1 (de) * | 1992-08-01 | 1994-02-03 | Philips Patentverwaltung | Einrichtung zur Spracherkennung |
US5450525A (en) * | 1992-11-12 | 1995-09-12 | Russell; Donald P. | Vehicle accessory control with manual and voice response |
US5717743A (en) * | 1992-12-16 | 1998-02-10 | Texas Instruments Incorporated | Transparent telephone access system using voice authorization |
US5717738A (en) * | 1993-01-11 | 1998-02-10 | Texas Instruments Incorporated | Method and device for generating user defined spoken speed dial directories |
US5668929A (en) * | 1993-01-21 | 1997-09-16 | Hirsch Electronics Corporation | Speech activated security systems and methods |
US5483579A (en) * | 1993-02-25 | 1996-01-09 | Digital Acoustics, Inc. | Voice recognition dialing system |
US5594784A (en) * | 1993-04-27 | 1997-01-14 | Southwestern Bell Technology Resources, Inc. | Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls |
SE9304222L (sv) * | 1993-12-21 | 1995-06-22 | Telia Ab | Metod och anordning vid samtal från mobilstationer |
US5481595A (en) * | 1994-03-08 | 1996-01-02 | Uniden America Corp. | Voice tag in a telephone auto-dialer |
FI96082C (fi) * | 1994-04-13 | 1996-04-25 | Ne Products Oy | Menetelmä valintavälineellä radiolähetinvastaanottimelle annettavan valintasekvenssin valintojen tulkitsemisessa |
US5652903A (en) * | 1994-11-01 | 1997-07-29 | Motorola, Inc. | DSP co-processor for use on an integrated circuit that performs multiple communication tasks |
US5913170A (en) | 1994-11-16 | 1999-06-15 | Highwaymaster Communications, Inc. | Locating system and method using a mobile communications network |
AU705525B2 (en) * | 1994-12-02 | 1999-05-27 | Voice Control Systems, Inc. | Intelligent call processing platform for home telephone system |
US5893037A (en) * | 1994-12-09 | 1999-04-06 | Eastman Kodak Company | Combined electronic/silver-halide image capture system with cellular transmission capability |
US5724243A (en) * | 1995-02-10 | 1998-03-03 | Highwaymaster Communications, Inc. | Method and apparatus for determining expected time of arrival |
US5583925A (en) * | 1995-03-22 | 1996-12-10 | Lucent Technologies, Inc. | Automatic three-way calling feature for a telecommunications system |
FI111893B (fi) * | 1995-06-02 | 2003-09-30 | Nokia Corp | Menetelmä ja laite puhelimen ohjaamiseksi komennoilla |
CA2180392C (en) * | 1995-07-31 | 2001-02-13 | Paul Wesley Cohrs | User selectable multiple threshold criteria for voice recognition |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
DE19624988A1 (de) * | 1996-06-22 | 1998-01-02 | Peter Dr Toma | Verfahren zur automatischen Erkennung eines gesprochenen Textes |
US5737491A (en) * | 1996-06-28 | 1998-04-07 | Eastman Kodak Company | Electronic imaging system capable of image capture, local wireless transmission and voice recognition |
FI101333B (fi) * | 1996-09-02 | 1998-05-29 | Nokia Mobile Phones Ltd | Puhekomennoilla ohjattava telepäätelaite |
US5950160A (en) * | 1996-10-31 | 1999-09-07 | Microsoft Corporation | Method and system for displaying a variable number of alternative words during speech recognition |
US5899976A (en) * | 1996-10-31 | 1999-05-04 | Microsoft Corporation | Method and system for buffering recognized words during speech recognition |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
US5884258A (en) * | 1996-10-31 | 1999-03-16 | Microsoft Corporation | Method and system for editing phrases during continuous speech recognition |
US5926789A (en) * | 1996-12-19 | 1999-07-20 | Bell Communications Research, Inc. | Audio-based wide area information system |
US6377663B1 (en) * | 1997-01-03 | 2002-04-23 | Ncr Corporation | Call management system and associated method for a local telephone circuit |
DE19709990C2 (de) * | 1997-03-11 | 2000-03-02 | Philips Corp Intellectual Pty | System zur Erkennung gesprochener Ziffernfolgen |
FR2761848B1 (fr) * | 1997-04-04 | 2004-09-17 | Parrot Sa | Dispositif de commande vocale pour radiotelephone, notamment pour utilisation dans un vehicule automobile |
US20040157612A1 (en) * | 1997-04-25 | 2004-08-12 | Minerva Industries, Inc. | Mobile communication and stethoscope system |
FI111673B (fi) * | 1997-05-06 | 2003-08-29 | Nokia Corp | Menetelmä puhelinnumeron valitsemiseksi puhekomennoilla ja puhekomennoilla ohjattava telepäätelaite |
US6163596A (en) * | 1997-05-23 | 2000-12-19 | Hotas Holdings Ltd. | Phonebook |
US5930751A (en) * | 1997-05-30 | 1999-07-27 | Lucent Technologies Inc. | Method of implicit confirmation for automatic speech recognition |
US6473610B1 (en) | 1997-06-19 | 2002-10-29 | Byard G. Nilsson | Wireless prepaid telephone system with dispensable instruments |
US6308053B1 (en) | 1997-06-19 | 2001-10-23 | Byard G. Nilsson | Recyclable wireless telephone unit with a secured activation switch |
US6298250B1 (en) | 1997-06-19 | 2001-10-02 | Kimberly Nanette Engen | Wireless prepaid telephone system with extended capability |
US6751482B1 (en) | 1997-06-19 | 2004-06-15 | Byard G. Nilsson | Wireless mobile telephone system with alternative power instruments and DTMF Capability |
US6862463B1 (en) | 1997-06-19 | 2005-03-01 | Byard G. Nilsson | Wireless telephone system with information service |
US6049710A (en) | 1997-06-19 | 2000-04-11 | Kimberley Nanette Engen | Wireless prepaid telephone system with dispensable instruments |
US6292675B1 (en) | 1997-10-21 | 2001-09-18 | Byard G. Nilsson | Wireless mobile telephone system with voice-dialing telephone instruments and DTMF capability |
US6993321B1 (en) | 1997-06-19 | 2006-01-31 | Nilsson Byard G | Wireless telephone system with mobile instruments for outgoing calls |
US6167118A (en) * | 1997-12-30 | 2000-12-26 | Dsc Telecom L.P. | Method and a system for by-passing a receiver-off-hook timer for voice dialing systems and for supporting spoken digit dialing |
KR100259918B1 (ko) * | 1998-03-05 | 2000-06-15 | 윤종용 | 핸즈프리키트의 쇼트메시지 음성합성 장치 및 방법 |
GB9806401D0 (en) * | 1998-03-25 | 1998-05-20 | Domain Dynamics Ltd | Improvements in voice operated mobile communications |
JP4036528B2 (ja) * | 1998-04-27 | 2008-01-23 | 富士通株式会社 | 意味認識システム |
US6321195B1 (en) * | 1998-04-28 | 2001-11-20 | Lg Electronics Inc. | Speech recognition method |
US6141010A (en) * | 1998-07-17 | 2000-10-31 | B. E. Technology, Llc | Computer interface method and apparatus with targeted advertising |
JP3001000B1 (ja) * | 1998-09-08 | 2000-01-17 | セイコーエプソン株式会社 | 音声認識装置における連続単語認識方法および音声認識装置における連続単語認識処理プログラムを記録した記録媒体 |
JP2000115330A (ja) * | 1998-09-30 | 2000-04-21 | Nec Corp | 携帯電話機及びこれと接続されるポータブルオーディオ |
US6711536B2 (en) * | 1998-10-20 | 2004-03-23 | Canon Kabushiki Kaisha | Speech processing apparatus and method |
US6249765B1 (en) * | 1998-12-22 | 2001-06-19 | Xerox Corporation | System and method for extracting data from audio messages |
US6643622B2 (en) | 1999-02-19 | 2003-11-04 | Robert O. Stuart | Data retrieval assistance system and method utilizing a speech recognition system and a live operator |
US6243684B1 (en) | 1999-02-19 | 2001-06-05 | Usada, Inc. | Directory assistance system and method utilizing a speech recognition system and a live operator |
US6526292B1 (en) | 1999-03-26 | 2003-02-25 | Ericsson Inc. | System and method for creating a digit string for use by a portable phone |
US6862713B1 (en) * | 1999-08-31 | 2005-03-01 | International Business Machines Corporation | Interactive process for recognition and evaluation of a partial search query and display of interactive results |
DE19942871B4 (de) | 1999-09-08 | 2013-11-21 | Volkswagen Ag | Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug |
DE10013879A1 (de) * | 2000-03-21 | 2001-09-27 | Bosch Gmbh Robert | Verfahren zur Sprachsteuerung eines elektrischen Geräts |
ATE241195T1 (de) * | 2000-09-29 | 2003-06-15 | Ericsson Telefon Ab L M | Verfahren und einrichtung zur analyse einer folge von gesprochenen nummern |
US20020042709A1 (en) * | 2000-09-29 | 2002-04-11 | Rainer Klisch | Method and device for analyzing a spoken sequence of numbers |
US6788767B2 (en) * | 2000-12-28 | 2004-09-07 | Gateway, Inc. | Apparatus and method for providing call return service |
US20020137470A1 (en) * | 2001-03-23 | 2002-09-26 | Baron Jason C. | Method and system for multiple stage dialing using voice recognition |
US20030023439A1 (en) * | 2001-05-02 | 2003-01-30 | Gregory Ciurpita | Method and apparatus for automatic recognition of long sequences of spoken digits |
EP1262954A1 (en) * | 2001-05-30 | 2002-12-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for verbal entry of digits or commands |
US6996528B2 (en) * | 2001-08-03 | 2006-02-07 | Matsushita Electric Industrial Co., Ltd. | Method for efficient, safe and reliable data entry by voice under adverse conditions |
WO2003015378A1 (fr) * | 2001-08-10 | 2003-02-20 | Zhiying Song | Telephone mobile avec composeur vocal, sans touches numeriques |
WO2003054856A1 (de) * | 2001-12-21 | 2003-07-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Verfahren und vorrichtung zur spracherkennung |
DE10216117A1 (de) * | 2002-04-12 | 2003-10-23 | Philips Intellectual Property | Verfahren und System zur Spracherkennung von Symbolfolgen |
US20040162116A1 (en) * | 2003-02-14 | 2004-08-19 | Lucent Technologies Inc. | User programmable voice dialing for mobile handset |
WO2004092962A1 (ja) * | 2003-04-17 | 2004-10-28 | Fujitsu Limited | 半導体装置、リセット制御システム及びメモリリセット方法 |
US7689423B2 (en) * | 2005-04-13 | 2010-03-30 | General Motors Llc | System and method of providing telematically user-optimized configurable audio |
DE102005019028B4 (de) * | 2005-04-23 | 2020-11-12 | Volkswagen Ag | Telefonsystem und Verfahren zum Betreiben eines Telefonsystems für ein Kraftfahrzeug |
KR100907974B1 (ko) * | 2005-05-13 | 2009-07-16 | 노키아 코포레이션 | 전자 장치에 캐릭터를 입력하는 방법 |
US9818120B2 (en) | 2015-02-20 | 2017-11-14 | Innovative Global Systems, Llc | Automated at-the-pump system and method for managing vehicle fuel purchases |
US8626377B2 (en) | 2005-08-15 | 2014-01-07 | Innovative Global Systems, Llc | Method for data communication between a vehicle and fuel pump |
US20070106506A1 (en) * | 2005-11-07 | 2007-05-10 | Ma Changxue C | Personal synergic filtering of multimodal inputs |
TW200735682A (en) * | 2006-03-09 | 2007-09-16 | Action Star Entpr Co Ltd | Wireless audio emitting device having automatic channel lock function and method thereof |
US7957972B2 (en) * | 2006-09-05 | 2011-06-07 | Fortemedia, Inc. | Voice recognition system and method thereof |
US8055502B2 (en) * | 2006-11-28 | 2011-11-08 | General Motors Llc | Voice dialing using a rejection reference |
US20080221882A1 (en) * | 2007-03-06 | 2008-09-11 | Bundock Donald S | System for excluding unwanted data from a voice recording |
TR201006031A2 (tr) * | 2010-07-22 | 2011-10-21 | Sestek Ses Ve İleti̇şi̇m Bi̇lgi̇sayar Teknoloji̇leri̇ Sanayi̇ Ti̇caret Anoni̇m Şi̇rketi̇ | Otomatik dikte sistemlerinde konuşma sentezi ile teyit yöntemi ve bu yöntemin uygulanması için sistem |
SG189182A1 (en) * | 2010-10-29 | 2013-05-31 | Anhui Ustc Iflytek Co Ltd | Method and system for endpoint automatic detection of audio record |
DE102011013755B4 (de) | 2010-12-31 | 2021-07-08 | Volkswagen Aktiengesellschaft | Verfahren und Vorrichtung zur alphanumerischen Spracheingabe in Kraftfahrzeugen |
US10192550B2 (en) * | 2016-03-01 | 2019-01-29 | Microsoft Technology Licensing, Llc | Conversational software agent |
US10140986B2 (en) | 2016-03-01 | 2018-11-27 | Microsoft Technology Licensing, Llc | Speech recognition |
US10140988B2 (en) | 2016-03-01 | 2018-11-27 | Microsoft Technology Licensing, Llc | Speech recognition |
EP3509062B1 (en) * | 2016-08-31 | 2020-05-27 | Sony Corporation | Audio recognition device, audio recognition method, and program |
KR102223017B1 (ko) | 2017-05-16 | 2021-03-04 | 구글 엘엘씨 | 공유된 음성 작동 디바이스상의 호출 핸들링 |
WO2019220725A1 (ja) * | 2018-05-18 | 2019-11-21 | パナソニックIpマネジメント株式会社 | 音声認識装置、音声認識方法、及びプログラム |
CN111326140B (zh) * | 2020-03-12 | 2023-05-30 | 科大讯飞股份有限公司 | 语音识别结果判别方法、纠正方法、装置、设备及存储介质 |
WO2022245396A1 (en) * | 2021-05-17 | 2022-11-24 | Google Llc | Arranging and/or clearing speech-to-text content without a user providing express instructions |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB974850A (en) * | 1963-06-12 | 1964-11-11 | Standard Telephones Cables Ltd | Speech recognition system |
US3742143A (en) * | 1971-03-01 | 1973-06-26 | Bell Telephone Labor Inc | Limited vocabulary speech recognition circuit for machine and telephone control |
US3928724A (en) * | 1974-10-10 | 1975-12-23 | Andersen Byram Kouma Murphy Lo | Voice-actuated telephone directory-assistance system |
GB1557286A (en) * | 1975-10-31 | 1979-12-05 | Nippon Electric Co | Speech recognition |
JPS5688503A (en) * | 1979-12-21 | 1981-07-18 | Matsushita Electric Ind Co Ltd | Heater |
US4336421A (en) * | 1980-04-08 | 1982-06-22 | Threshold Technology, Inc. | Apparatus and method for recognizing spoken words |
EP0041195A1 (en) * | 1980-05-30 | 1981-12-09 | General Electric Company | Improved paging arrangement |
US4348550A (en) * | 1980-06-09 | 1982-09-07 | Bell Telephone Laboratories, Incorporated | Spoken word controlled automatic dialer |
CH645501GA3 (ja) * | 1981-07-24 | 1984-10-15 | ||
JPS5870287A (ja) * | 1981-10-22 | 1983-04-26 | 日産自動車株式会社 | 音声認識装置 |
US4528687A (en) * | 1981-10-22 | 1985-07-09 | Nissan Motor Company, Limited | Spoken-instruction controlled system for an automotive vehicle |
US4525793A (en) * | 1982-01-07 | 1985-06-25 | General Electric Company | Voice-responsive mobile status unit |
US4426733A (en) * | 1982-01-28 | 1984-01-17 | General Electric Company | Voice-controlled operator-interacting radio transceiver |
US4614839A (en) * | 1982-08-19 | 1986-09-30 | Aisin Seiki K.K. | Road-vehicle telephone apparatus |
US4624008A (en) * | 1983-03-09 | 1986-11-18 | International Telephone And Telegraph Corporation | Apparatus for automatic speech recognition |
JPS59225656A (ja) * | 1983-06-07 | 1984-12-18 | Fujitsu Ltd | 音声ダイヤル電話端末 |
JPS6054687A (ja) * | 1983-07-19 | 1985-03-29 | スロ−ン−ケツタリング インステイテユ−ト フオ− キヤンサ− リサ−チ | ヒト モノクロ−ン抗体の製法 |
US4593157A (en) * | 1984-09-04 | 1986-06-03 | Usdan Myron S | Directory interface and dialer |
DE3574640D1 (de) * | 1984-09-28 | 1990-01-11 | Int Standard Electric Corp | Schluesselworterkennungssystem unter anwendung eines sprachmusterverkettungsmodels. |
FR2571191B1 (fr) * | 1984-10-02 | 1986-12-26 | Renault | Systeme de radiotelephone, notamment pour vehicule automobile |
US4644107A (en) * | 1984-10-26 | 1987-02-17 | Ttc | Voice-controlled telephone using visual display |
EP0235127B2 (en) * | 1985-09-03 | 1993-05-05 | Motorola, Inc. | Hands-free control system for a radiotelephone |
-
1987
- 1987-10-19 US US07/110,144 patent/US4870686A/en not_active Expired - Lifetime
-
1988
- 1988-08-15 CA CA000574731A patent/CA1312668C/en not_active Expired - Fee Related
- 1988-08-24 WO PCT/US1988/002851 patent/WO1989004035A1/en active IP Right Grant
- 1988-08-24 JP JP63508908A patent/JPH0782351B2/ja not_active Expired - Lifetime
- 1988-08-24 DE DE3855164T patent/DE3855164T2/de not_active Expired - Fee Related
- 1988-08-24 AT AT88909654T patent/ATE136146T1/de not_active IP Right Cessation
- 1988-08-24 EP EP88909654A patent/EP0389514B1/en not_active Expired - Lifetime
- 1988-10-11 MX MX013368A patent/MX165502B/es unknown
-
1989
- 1989-06-19 KR KR1019890701098A patent/KR0129856B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001236091A (ja) * | 2000-02-23 | 2001-08-31 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識結果の誤り訂正方法およびその装置 |
Also Published As
Publication number | Publication date |
---|---|
CA1312668C (en) | 1993-01-12 |
KR890702177A (ko) | 1989-12-23 |
KR0129856B1 (ko) | 1998-04-11 |
MX165502B (es) | 1992-11-16 |
EP0389514A1 (en) | 1990-10-03 |
WO1989004035A1 (en) | 1989-05-05 |
DE3855164D1 (de) | 1996-05-02 |
US4870686A (en) | 1989-09-26 |
DE3855164T2 (de) | 1996-10-10 |
ATE136146T1 (de) | 1996-04-15 |
JPH0782351B2 (ja) | 1995-09-06 |
EP0389514A4 (en) | 1992-05-20 |
EP0389514B1 (en) | 1996-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03500693A (ja) | 音声コマンドによりデジットシーケンスを入力するための方法 | |
US7203651B2 (en) | Voice control system with multiple voice recognition engines | |
US5651056A (en) | Apparatus and methods for conveying telephone numbers and other information via communication devices | |
ES2295025T3 (es) | Interfaz de usuario hablada para dispositivos habilitados mediante la voz. | |
KR100984528B1 (ko) | 분산형 음성 인식 시스템에서 음성 인식을 위한 시스템 및방법 | |
EP1286330B1 (en) | Method and apparatus for data entry by voice under adverse conditions | |
US20050125235A1 (en) | Method and apparatus for using earcons in mobile communication devices | |
US20070005206A1 (en) | Automobile interface | |
KR960004692B1 (ko) | 음성 명령에 의한 전화 호출 종료 방법 | |
JP2004248248A (ja) | ユーザがプログラム可能な移動局ハンドセット用の音声ダイヤル入力 | |
EP1352389B1 (en) | System and method for storage of speech recognition models | |
JPH08307509A (ja) | 手を使わずに電話機のダイアル操作を行う方法および装置 | |
ES2244499T3 (es) | Procedimiento para el reconocimiento de manifestaciones verbales de oradores que no hablan su propio idioma en un sistema de procesamiento de voz. | |
EP1151431A1 (en) | Method and apparatus for testing user interface integrity of speech-enabled devices | |
US20020198721A1 (en) | Device having speech-control means and having test-means for testing a function of the speech-control means | |
US20070129945A1 (en) | Voice quality control for high quality speech reconstruction | |
JPH06252997A (ja) | 電話、音声認識装置および音声認識方法 | |
JP2000101705A (ja) | 無線電話機 | |
JP3519259B2 (ja) | 音声認識作動装置 | |
JP2002101204A (ja) | 通話仲介システム及び聴覚障害者用電話機 | |
JP3069150B2 (ja) | 音声ダイヤル装置 | |
JPH11298382A (ja) | ハンズフリー装置 | |
JPH11112633A (ja) | 携帯電話 | |
JPS61158253A (ja) | 音声電話制御方法およびその装置 | |
JPH0329548A (ja) | 音声認識電話機 |