JPH0782351B2 - 音声コマンドによりデジットシーケンスを入力するための方法 - Google Patents

音声コマンドによりデジットシーケンスを入力するための方法

Info

Publication number
JPH0782351B2
JPH0782351B2 JP63508908A JP50890888A JPH0782351B2 JP H0782351 B2 JPH0782351 B2 JP H0782351B2 JP 63508908 A JP63508908 A JP 63508908A JP 50890888 A JP50890888 A JP 50890888A JP H0782351 B2 JPH0782351 B2 JP H0782351B2
Authority
JP
Japan
Prior art keywords
recognition
keyword
user
string
providing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63508908A
Other languages
English (en)
Other versions
JPH03500693A (ja
Inventor
アラン ジャーソン・イラ
ルイス リンズレイ・ブレット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of JPH03500693A publication Critical patent/JPH03500693A/ja
Publication of JPH0782351B2 publication Critical patent/JPH0782351B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Traffic Control Systems (AREA)
  • Selective Calling Equipment (AREA)
  • Electrically Operated Instructional Devices (AREA)

Description

【発明の詳細な説明】 発明の背景 発明の分野 本発明は一般的には音声認識制御システムに関する。よ
り特定的には、本発明は車両無線電話の応用において遭
遇するようなノイズの多い環境で使用するのに特に適し
たハンドフリー音声コマンド自動ダイヤルシステムに関
する。
従来技術の説明 典型的には、無線および陸線電話システムの双方におい
て、ユーザは該ユーザに耳に近く配置される、一端にス
ピーカを、かつ該ユーザの口に近く保持される、他端に
マイクロホンを含むハンドセットにより通信する。動作
においては、ユーザの一方の手がハンドセットをその適
正な方向に保持するために占有され、それによりユーザ
の自由な手のみが車両を運転するような仕事を達成する
ために残される。ユーザに対し非常に大きな程度の自由
を与えるためには、陸線電話システムにおいてはスピー
カホンが一般に使用されている。最近、自動車において
使用するための車両用スピーカホンが開発された。例え
ば、イーストモンドによる米国特許第4,378,603号およ
びビルマーによる米国特許第4,400,584号は、共に本発
明と同じ譲り受け人に譲渡されているが、ハンドフリー
動作を備えた車両用スピーカホンを記述している。
人間の音声に応答する、音声認識制御システムは自動車
の応用において使用するために非常に望ましいものであ
る。大部分の移動無線送受信機(トランシーバ)の機能
(例えば、オン/オフ、送信/受信、ボリュウム、スケ
ルチ、その他)あるいは移動無線電話制御の機能(例え
ば、プッシュボタンダイヤル、音声認識装置トレーニン
グ、電話呼の応答)は容易に何らのマニュアル動作を要
求することなく音声コマンドによって行なうことができ
る。従って、車両用スピーカホンと共に音声認識を用い
ることは自動車の運転手に彼の手をステアリングホイー
ルから放しあるいは彼の目を道路からそらす事を全く要
求することなく完全にハンドフリーは電話会話を提供す
る可能性を持っている。この特徴はスピーカホンのハン
ドフリーの可能性を拡張するのみならず、車両において
移動無線電話を使用する安全性と便宜性を付加する。
不幸なことに、車両の無線電話に完全なハンドフリーな
制御を適用することは幾つかの重要な障害を引き起こ
す。車両環境において音声認識が利用される時、車両に
おいて本質的に存在する高度の環境ノイズが信頼できる
音声制御に対しかなりの障害を与える。さらに、車両用
スピーカホンは典型的には、頭上の自動車の日除け板に
取付けられるように、使用者の口から遠いマイクロホン
を有している。その結果、必要とされる高いマイクロホ
ンの感度は音声認識装置に印加される環境背景ノイズの
量を大幅に増大させ、これはその認識の信頼性を劣化さ
せる。
より特定的には、自動ダイヤル式電話における音声認識
エラーの問題はシステムの性能をかなり低下させる。自
動およびレパートリーダイヤルの機能が最近セルラ電話
の用途において利用されてきており、それにより使用者
は口頭で電話デジット(digits)を入力しあるいは予め
規定されたキーワードを用いて予め格納された番号を口
頭で呼出すことができる。もし音声認識ユニットがコマ
ンドキーワードを誤まって認識すれば、音声コマンドコ
ントローラは一般に認証(verification)の目的で使用
者に認識されたコマンドを返送するであろう。使用者は
従って、正しいキーワードを再入力する。この入力/認
証/再入力のプロセスは通常最小の不都合に過ぎない
が、その理由はそれが典型的に大多数のコマンドに対し
ほんの数秒しかかからないからである。しかしながら、
もし音声認識装置が電話番号を表す長い一続きのデジッ
トにおける単一のデジットを誤って検出すれば、入力/
認証/再入力のプロセスは非常に時間を消費するものと
なりかつ、非常に少なくとも、使用者にとってはかなり
不満足なものとなるであろう。
これらの理由のため、音声コマンドによりデジットを入
力するための従来の技術は非常に限られてきた。幾つか
の音声認識制御装置は使用者が所定数、例えば、電話番
号については7または11、のデジットを発するのを待
つ。最後の期待されたデジットの認識に応じて、該制御
装置は音声合成を用いて認識された番号を認証のため使
用者に音声で返答する。使用者は次に所定のエラーコマ
ンドのキーワードを話すことにより誤って認識された電
話番号が入力されることを防止できる。しかしながら、
認識の精度が高くない車両の環境においては、正しい認
識のために完全なデジットのシーケンスを数回繰返すこ
とが必要になる。他のものにおいては、音声コマンドの
ダイアル装置が認識の直後に各単一のデジットを繰返
す。この別の方法は高いノイズ環境においてはより信頼
できることが分かっているが、それは、特に認識精度が
高い場合に、デジットの長いつながり(string)を入力
するためにかなりの量の時間を必要以上に要求する。そ
のうえ、あるデジットが誤って認識された時単一デジッ
トの認証プロセスは非常に厄介なものとなるが、それは
使用者がエラーコマンドを話すためにメンタル的に停止
し、正しくない単一の桁を繰返し、正しい応答を聞き、
かつ次にその先を続けなければならない場合に使用者は
容易に入力すべき次の桁を忘れることがあるからであ
る。全体として、従来技術の桁入力/認証手順は使用者
にとって親しみ易いものではない。
従って、音声認識制御システムにおいて音声コマンドに
より一続き(sequence)のデジットを入力しかつ認証す
るための利口な方法に対する必要性が存在する。
発明の概要 従って、本発明の一般的な目的は音声認識により一続き
のキーワードを入力しかつ認証するための改良された方
法および装置を提供することにある。
本発明のより特定的な目的は、部分的なシーケンスのデ
ジットのつながり(ストリング)を入力しかつ選択的に
編集することにより電話にダイヤルするための改良され
た使用者相互作用的音声認識制御システムを提供するこ
とにある。
本発明によれば、11桁(デジット)の電話番号のよう
な、使用者が話した発声の全シーケンスを信頼性よく入
力する音声通信装置のための使用者と相互作用する音声
コマンド制御システムが提供される。この音声コマンド
制御システムは使用者の話した発声の複数の部分的シー
ケンス、可変長ストリングをデジットのような、複数の
所定のキーワードに対応するものとして認識する音声認
識ユニットを含む。この制御システムは最初の発声のつ
ながりが所定の休止時間インターバルの間停止した後休
止信号を与え、かつ次に該最初の発声のつながりに応答
して認識されたキーワードの使用者への表示を提供す
る。該制御システムはまた休止信号に応答してかつ所定
のエラーコマンドキーワードに対応する第2の発声のつ
ながりの認識に応答して特定のキーワードを訂正するた
めの機構を提供する。
好ましい実施例においては、ハンドフリー、ユーザ相互
作用音声コマンドダイヤルシステムが車両用スピーカホ
ンを用いた移動無線電話と共に使用される。一続きの桁
の後所定の休止時間インターバルが認識された時、認識
された桁がシステムによって返送される。付加的な桁の
つながりが次に入力でき、かつ認識された後続の桁スト
リングのみが次の休止の後に返答される。もし(ワード
「クリア(CLEAR)」のような)エラーコマンドキーワ
ードが次に認識されると、入力された最後の桁ストリン
グのみがクリアされる。もしエラーコマンド語が続けて
2回認識されると、桁ストリング全体がクリアされる。
もしコントローラがユーザが話しをしているがしかし何
も認識されないことを検出すると、システムは(多分ワ
ード「リピート(REPEAT)」によって)応答し使用者に
音声認識装置が先のストリングを認識できなかったこと
および繰返されるべきことを指示する。最後の桁ストリ
ングが入力されると、使用者は(ワード「ターミネート
(TERMINATE)」のような)停止コマンドを話しかつ認
識された桁の全シーケンスが返答されかつ無線電話に出
力される。
このようにして、使用者は環境ノイズ条件に応じて認識
処理の認証モードを変更する柔軟性を有する。高い認識
精度が期待できる環境においては、使用者は全デジット
のシーケンスを休止することなく入力でき、かつシステ
ムは直ちに全シーケンスを確認しかつ格納するであろ
う。これに対し、高い背景ノイズの条件下では使用者は
各ストリングが発声された後に休止することにより部分
的シーケンスの桁ストリングの認証を要求する選択を行
なうことができる。もし認識エラーがあれば、特定の桁
ストリングを全デジットシーケンスを再入力させること
なく訂正できる。各休止の後にキーワードのストリング
を認証する本方法はまた非常に使用者に親しみ易いもの
であり、それは人間は通常長い桁のシーケンス(例え
ば、長距離電話番号)を桁ストリングの予め規定された
グループ(例えば、1−312−397−1000)として読み、
記憶し、かつ話すからである。
図面の簡単な説明 新規であると信じられる本発明の特徴は特に添付の請求
の範囲に記載されている。しかしながら、発明それ自体
はそのさらに他の目的および利点と共に添付の図面を取
り入れて以下の説明を参照することにより最も良く理解
でき、それらの図において、 第1図は、本発明に係わるデジット入力方法を用いた音
声通信装置のための音声コマンド制御システムを示すブ
ロック図、そして 第2a図および第2b図は好ましい実施例に係わるデジット
入力方法のプラクティスに従い前記制御システムによっ
て行なわれる特定のシーケンスの動作を示すフローチャ
ートである。
好ましい実施例の詳細な記述 次に添付の図面を参照すると、第1図は、本発明に係わ
るユーザ相互作用制御システム100の一般的なブロック
図を示している。このシステムは基本的には音声通信装
置140に接続されたデバイスコントローラ120から構成さ
れている。音声認識装置110が使用者からの音声コマン
ドをシステムのためのコマンド信号に翻訳するためにデ
バイスコントローラに結合されている。デバイスコント
ローラは音声認識装置からの情報と共に、タイマ124、
アクティビティ検出器114、およびコントローラメモリ1
34からの情報を監視する。該コントローラは、認識テン
プレートを選択しかつ音声認識装置110をイネーブル
し、タイマをリセットし、データをコントローラメモリ
134に格納しかつそこからデータを読出し、音声通信装
置のダイヤル動作を制御し、かつ使用者へのフィードバ
ックを提供するために音声合成装置130に情報を提供す
る能力を有している。本システムは使用者の手が他の仕
事を行なうために自由になるような、スピーカホンと共
に使用するのによく適している。スピーカホン150はこ
のハンドフリーの特徴を提供するためにオーディオ経路
の方向を制御する。
音声通信装置140は例えば、2方向無線システム、電話
システム、インターコム(内部通信)システム、音声デ
ータエントリシステム、その他のような、任意の無線ま
たは陸線音声通信システムの部分を含むことができる。
本実施例においては、音声通信装置140はセルラ移動無
線電話のような、無線電話送受信機(トランシーバ)で
ある。そのような無線電話の詳細な説明はモトローラ社
のインストラクションマニュアル第68P81066E40号、「D
YNA T.A.C.(登録商標)セルラ移動電話」に見ることが
できる。しかしながら、音声制御を必要とする任意の陸
線電話または単信無線送受信機を用いることができる。
さらに、ハンドフリーな使用者相互作用動作を行なう任
意の電子装置もまた本発明を利用することができる。
音声通信装置140は送信経路144および受信経路142を利
用し送信/受信オーディオおよびダイヤル情報を通信チ
ャネルにインタフェースする。移動無線電話の好ましい
実施例においては、これらの経路は二重無線電話動作の
ための一対の無線周波数(RF)チャネルにインタフェー
スすることができる。
音声認識装置110はライン158における入力音声信号に対
し音声認識を行なう。認識中は、音声認識装置110は先
に格納したワードのテンプレートを入力音声情報に対し
比較する。本実施例における認識アルゴリズムは連続音
声認識、ダイナミック時間ワーピング、エネルギ正規
化、そしてテンプレート整合を判定するためにチェビシ
ェフ距離測定法を導入する。音響、音声、および信号処
理に関するIEEE国際会議(1982年5月3日−5日)、第
2巻、pp.899−902、ジェイ・エス・ブライドル、エム
・ディ・ブラウンおよびアール・エム・チェンバレイン
による「つながりのあるワードの認識のためのアルゴリ
ズム」に記載されたような、従来技術の認識アルゴリズ
ムもまた用いることができる。
本実施例においては、8ビットのマイクロコンピュータ
が音声認識装置110の機能を達成する。さらに、第1図
の幾つかの他の制御システムのブロックも部分的にCODE
C/FILTERおよびDSP(デジタル信号プロセッサ)の助け
により同じマイクロコンピュータによって実施される。
ブロック110の機能を達成するために用いることができ
る代表的な音声認識用のハードウェアはジェイ・ペカ
ム、ジェイ・グリーン、ジェイ・キャニング、およびピ
ー・スティーブンスによる「実時間ハードウェア連続音
声認識装置システム」と題する音響、音声、および信号
処理に関するIEEE国際会議(1982年5月3日−5日)、
第2巻、pp.863−866の論文、およびそこに含まれた参
考文献に記載されている。しかしながら、本発明はいず
れの特定のハードウェアにもあるいはいずれの特定の形
式の音声認識にも限定されない。より特定的には、本発
明は通話者に依存するあるいは通話者に依存しない音声
認識、分離されたあるいは連続的なワード認識、そして
ソフトウェアベースのあるいはハードウェアベースの実
施の使用を意図するものである。
デバイスコントローラ120は典型的には音声通信装置14
0、音声認識装置110、そして音声合成装置130の間をイ
ンタフェースするマイクロプロセッサである。デバイス
コントローラ120は音声認識装置110によって提供される
デバイス制御データ112を特定の音声通信装置によって
認識し得る制御信号に翻訳する。これらの制御信号は装
置に使用者によって指令された特定の動作機能を達成す
るよう指示する。例えば、もし使用者の話した発声が予
め規定された電話番号のシーケンスであれば、デバイス
コントローラ120はコントローラバス148を介して適正な
ダイヤル信号を生成するであろう。コントローラ120は
また、コントロールヘッドのロック解除、呼応答、ある
いは任意の数の他の動作機能のような、音声通信装置14
0の他の特徴機能の音声コマンド制御を行なうことがで
きる。
デバイスコントローラ120はまた音声通信装置140の動作
ステータスを表わす装置ステータスデータ122を提供す
る。このデータは音声合成装置130に印加され、スピー
カ176を介して出力された時使用者に認識可能な音声に
翻訳される。例えば、使用者の話した発声がデジットシ
ーケンスを終了させるための予め規定されたコマンドキ
ーワードに対応する時、音声合成装置130は認識された
電話番号を使用者への返答として合成する。ステータス
データ122はまた名前および電話番号(「オフィス(off
ice)」、「555−1234」等)、音声認識応答情報(「レ
ディ(Ready)」、「終了?(Terminate?)」等)、あ
るいは無線電話ステータス情報(「呼ドロップ(Call D
ropped)」、「システムビジイ(System Busy)」等)
に関する情報を含むことができる。
本実施例において、音声合成装置130として19チャネル
のボコーダが使用されている。そのようなボコーダの例
はジェイ・エヌ・ホルムズ、「JSRUチャネルボコーダ」
IEE紀要、第127巻、パートF、第1号、1980年2月、p
p.53−60に見ることができる。しかしながら、当業者に
明らかなように、任意の音声合成装置を利用することが
できる。さらに、本発明は、使用者に指示を提供できる
任意の手段が音声合成ブロック130の基本的な応答機能
を達成できることを考えている。例えば、任意の可視的
表示器(例えば、LED、LCD、CRT、その他)あるいは可
聴表示器(例えば、トーン発生器または他の可聴信号発
生器)に置換えることができる。さらに、好ましい実施
例においては、14桁の電話番号ディスプレイが現在認識
されている桁の使用者への付加的な表示を連続的に提供
する。
制御メモリ134、これらは典型的にはランダムアクセス
メモリ(RAM)であるが、は音声認識装置110によって認
識される複数のキーワードを格納する。メモリバス136
はキーワード入力のプロセス中に制御メモリ134に情報
を送り、かつキーワードの認証プロセスの間にデバイス
コントローラ120によって格納された情報へのアクセス
を提供する。もし音声合成装置110または音声通信装置1
40がデジット入力格納機能を行なうために内部RAMを導
入しておれば、外部制御メモリ134は省略できる。
音声アクティビテイ検出器114は好ましい実施例におい
てはエネルギを基準とした検出器である。検出器114は
音声認識装置からの情報を利用することによりさらに高
度の機構に置換えることができる。いずれの場合におい
ても、音声アクティビテイ検出器114は音声アクティビ
テイに対する入力音声信号158を監視する機能を達成
し、それによりデバイスコントローラ120が認識される
べき音声が存在するか否かを判定できるようにする。検
出器114に用いることができる代表的な技術について
は、アール・ジェイ・マコーレイおよびエム・エル・マ
ルパスによる、「ソフトデシジョンノイズ抑圧フィルタ
を用いた音声増強」、IEEE音響、音声、および信号処理
に関する紀要、ASSP−28巻、第2号(1980年4月)、pp
137−145、を参照されたい。
タイマブロック124は最後のキーワードが認識されてか
ら経過した時間を計測するのみならず、先の音声活動か
ら経過した時間の計測をも与える。これらの時間インタ
ーバルはデータバス126を介してコントローラ120により
初期化され、監視され、かつリセットすることができ
る。再び、これらのタイマのさらに詳細な説明について
はフローチャートの記述を参照されたい。
スピーカホン150はハンドフリー制御システムの受信/
応答オーディオ多重化機能のみならず、送信/受信オー
ディオのスイッチング機能を行なう。使用者の話した入
力音声はマイクロホン152に印加され、このマイクロホ
ン152は典型的には使用者の口から離れて遠隔的に取付
けられる(例えば、自動車の日よけ板に取付けられ
る)。マイクロホン152は電気的入力音声信号を発声
し、この信号は次に前置増幅器153によって増幅されて
スピーカホン150に入力音声信号154を提供する。スピー
カホン150は154における入力音声信号を入力信号ライン
158を介して音声認識装置110に向ける。
単信システムにおいて、移動無線の使用者が話している
時、信号検出装置160は検出器出力162を介して正の制御
信号を提供し送信オーディオスイッチ156を閉じ、かつ
検出器出力164を介して負の制御信号を提供し受信オー
ディオスイッチ166を開く。逆に、陸線パーティが話し
ている時、信号検出器160は受信オーディオスイッチ166
を閉じるために逆極性の信号を提供し、一方送信オーデ
ィオスイッチ156を開く。受信オーディオスイッチ166が
閉じられている時、音声通信装置140からの受信機オー
ディオ146は受信オーディオスイッチ166を通りスイッチ
された受信オーディオ出力168を介してマルチプレクサ1
70に向けられる。マルチプレクサ170は音声合成装置130
からの音声応答オーディオ132およびスイッチされた受
信オーディオ168の間のオーディオ経路をデバイスコン
トローラ120からのマルチプレクス制御信号128に応じて
制御する。デバイスコントローラが情報を音声合成装置
に送る時は常に、マルチプレクサ信号128はマルチプレ
クサ170を音声応答オーディオをスピーカに向けるよう
に指示する。車両用スピーカホンオーディオ172は通常
スピーカ176に印加される前にオーディオ増幅器174によ
り増幅される。
ここに説明された車両用スピーカホンの実施例は多くの
可能な構成の内の1つにすぎない、例えば、音声認識装
置110は常に、陸線パーティが話しているか否かに係わ
らず移動無線の使用者のコマンドに応答することが望ま
れるであろう。そのような場合、入力音声信号154は直
接音声認識装置110に接続される。さらに幾つかの通信
システムにおいては、オーディオスイッチ156および166
を信号検出装置からの制御信号に応答して等しいが逆の
減衰を提供する可変利得装置に置換えることが好都合で
あるかもしれない。信号検出装置160はまたデバイスコ
ントローラ120に陸線パーティまたは移動使用者のいず
れが話しているかを表示するための信号を供給すること
ができ、これは陸線パーティからの音声を誤って認識す
ることを防止するために使用できる。
今までの説明で明らかであるように、デバイスコントロ
ーラ120は使用者相互作用的ハンドフリー音声コマンド
制御システム100の心臓部である。技術上知られており
かつ本発明に適したデバイスコントローラの一例はマイ
クロプロセッサである。デバイスコントローラ120の詳
細な動作は引続き制御システム100に対するソフトウェ
アフローチャートによって説明される。しかしながら、
発明を理解するために、以下の例は雑音の多い環境にお
いて特定の桁シーケンスを入力する場合を制御するため
に使用される。この例は本発明の特徴および利点を明瞭
に示している。
使用者がダイヤルシステムに完全な桁シーケンス1−2
−3−4−5−6−7を入力することを希望するものと
仮定する。ここで用いられているように、完全なキーワ
ード「シーケンス」(例えば、1−2−3−4−5−6
−7)は1つまたはそれ以上の部分シーケンスのキーワ
ードの「ストリング」(例えば、1−2−3,4,5−6,7)
で構成され、この場合各ストリングは予め規定された休
止時間インターバル、即ち音声活動のない時間により分
離される。使用者は最初に「エンター(ENTER)」のよ
うな口頭でのコマンドにより制御システムを桁入力モー
ドに向ける。システムは次にワード「デジット(DIGIT
S)」のような合成された応答で返答する。
自動車の中のような、ノイズの多い環境では、音声認識
の精度は背景ノイズによりしばしば制限される。従っ
て、使用者は完全な桁シーケンス1−2−3−4−5−
6−7を3個に部分的シーケンスの桁ストリング、即ち
1−2−3、4−5、6−7で入力することを決定でき
る。各ストリングは任意に長さにすることができること
に注意を要する。使用者は次に「ワン・ツゥ・スリー」
の発声を行ない、かつ次に休止する。もしいずれのキー
ワードも認識されなければ、いずれの桁もディスプレイ
に現われず、かつ制御システムは合成されたワード「リ
ピート(REPEAT)」で応答するであろう。
従って、使用者は再び「ワン・ツゥ・スリー」を発声
し、これに休止が続く。もしこの桁ストリングが「ワン
・スリー・スリー」として誤って認識されれば、表示装
置は1−3−3を表示し、かつ合成装置は音声による確
認「ワン・スリー・スリー」で応答するであろう。これ
は正しくないから、使用者は次にコマンドワード「クリ
ア(CLEAR)」を発音する。このコマンドキーワードの
認識に応じて、システムは最も最近の桁ストリングをク
リアし、全シーケンスがクリアされたことを表示するた
めに2回の「ビープ」を生成し、次に表示装置を消去す
る。
再び、使用者は「ワン・ツゥ・スリー」を発音し、次に
3秒の休止期間を続ける。もし正しい桁ストリング1−
2−3が認識されれば、1−2−3がディスプレイに現
れ、合成装置は「ワン・ツゥ・スリー」と応答する。使
用者は次に「フォア・ファイブ」の発音を続け、その後
他の休止を与える。もしこれらの発音が背景ノイズのた
めに4−6と誤って認識されれば、1−2−3−4−6
がディスプレイ上に現れ、かつ合成装置は「フォア・シ
ックス」と応答するであろう。この最後の桁ストリング
を訂正するために、使用者は「クリア」を発音する。最
後の桁のストリング4−6のみがクリアされ、かつディ
スプレイは再び1−2−3を表示する。合成装置は次に
単一の「ビープ」をもって応答し使用者に最も最近の桁
ストリングのみがクリアされたこと、および先に入力さ
れたストリングはメモリに残っていることを表示する。
ふたたび、使用者は「フォア・ファイブ」を発声しその
後休止を続ける。もし正しく認識されれば、合成装置は
「フォア・ファイブ」と応答し、かつディスプレイは1
−2−3−4−5を表示する。
このシーケンスに続き、使用者は「シックス・セブン」
を発生し、これに他の休止期間が続く。もし正しく認識
されれば、全シーケンス1−2−3−4−5−6−7が
表示され、かつ合成装置は、認識された最後の桁ストリ
ングを表わす、コンファメーション「シックス・セブ
ン」によって応答する。全桁シーケンスが今や入力され
たから、使用者はコマンド「ターミネート」を発生す
る。次に合成装置は全シーケンス「ワン・ツゥ・スリー
・フォア・ファイブ・シックス・セブン」によって応答
する。表示1−2−3−4−5−6−7が全桁シーケン
スを認証するため維持される。
第2a図および第2b図は、桁シーケンス入力手順の間制御
システム100によって行なわれるシーケンスのステップ
を記述する。好ましい実施例においては、コントローラ
のダイヤルシーケンスはコマンドワードENTERの認識に
応じてステップ202でスタートする。ステップ204におい
てコントローラメモリ134のメモリロケーションを初期
化するため、スタートポインタSPおよびエンドポインタ
EPがメモリロケーション0(ゼロ)に初期化される。ス
テップ206において応答フラグがリセットされ、そして
タイマブロック124の休止タイマおよび認識タイマがス
テップ208においてゼロにリセットされる。
ステップ210においては、コントローラは音声認識装置
が0ないし9の単一桁に対応する何らかのキーワードを
認識したか否かを判定する。もし単一桁が認識されてお
れば、ステップ212において応答フラグがテストされ
る。もし応答フラグが先にセットされておれば、使用者
の先の桁に未だ返答されていない少なくとも1つの桁が
格納される。従って、特定の桁ストリングにおける最初
に格納された桁のメモリロケーションを示す、スタート
ポインタSPが合せられるべきではない。しなしながら、
もし応答フラグがセットされておらなければ、認識され
た現在の桁はストリングの最初の桁を表わす。その場
合、ステップ214はスタートポインタSPを現在の桁が格
納される場所に対応するメモリロケーションに更新す
る。
ステップ216においては、認識された桁(デジット)が
コントローラメモリ134のエンドポインタEPに対応する
メモリロケーションに格納される。エンドポインタEPは
次にステップ218において増分され次に利用可能なメモ
リロケーションを指示するようにされる。両方のタイマ
が次にステップ220においてリセットされる。応答フラ
グがステップ221においてセットされるが、これはデジ
ットが今や格納されているからである。制御は次にステ
ップ210に戻り認識されるべき次のデジットを待機す
る。
もしステップ210において何らの桁キーワードも認識さ
れなければ、制御はステップ222に進み停止コマンドキ
ーワードが認識されたか否かをチェックする。好ましい
実施例においては、桁入力手順の終了を表わすために使
用されるコマンドキーワードとしてワードTERMINATEが
選択された。もしTERMINATEが認識されれば、ステップ2
24において全桁シーケンスが音声合成装置130により返
送される。合成されるべき桁シーケンスはメモリロケー
ションZERO(ゼロ)で始まりかつメモリロケーションEP
−1で終わる、メモリ134を読取ることによって得られ
る。次に、この完全な桁シーケンスがステップ226にお
いて音声通信装置140に出力される。桁入力手順はステ
ップ228において終了する。
TERMINATEコマンドが認識された後は何らの桁編集手順
も行なわれないことに注意を要する。音声合成による桁
シーケンスの確認のみが与えられ、かつ全桁シーケンス
が可視的ディスプレイに残る。例えば、もし使用者がそ
の直後にワードTERMINATEが続く全桁シーケンスを発声
すれば、システムは認識されたシーケンスが正しいもの
と仮定する。この入力モードは認識精度が高いものと期
待されている場合に使用される。しかしながら、使用者
はステップ202において桁入力手順を再スタートするこ
とにより何らかのエラーを修正することを希望できるた
め、ステップ228の後でエラーが訂正できないというこ
とを意味するものではない。一層重要なことには、使用
者は常にTERMINATEのワードの前に休止(ポーズ)を挿
入することにより丁度入力した桁ストリングを訂正する
オプションを常に有している。従って、使用者は訂正手
順を相互作用的に用い、あるいはキーワードシーケンス
を迅速に入力しかつ確認するために柔軟性を有してい
る。
もしコマンドキーワードTERMINATEがステップ222におい
て認識されなければ、コントローラはコマンドキーワー
ドCLEARがステップ230において認識されたか否かを見る
ためにチェックを行なう。もしCLEARコマンドが認識さ
れておれば、ステップ232において音声合性装置により
オーディオ返答信号が出力される。好ましい実施例にお
いては、音声合性装置は単一の「ビープ」トーンを発生
するよう指令される。しかしながら、数多くの他の確認
信号を選択することもできる。ステップ234において、
コントローラは0または1つの桁ストリングが入力され
たか否かを、スタートポインタSPがゼロか否かをチェッ
クすることによって、判定する。もし1つのストリング
のみが入力されておれば、単一のストリングをクリアす
ることが全桁シーケンスをクリアすることと等価であ
る。従って、第2のビープトーンがステップ244におい
て指示され使用者に、最後のストリングだけでなく、全
シーケンスがクリアされた事を通知する。もし何らの桁
ストリングも入力されておらなければ、ステップ234に
おけるテストはまたステップ244に移行する結果とな
り、これはスタートポインタSPが依然としてゼロである
からである。もし1個より多くのストリングが入力され
ておれば、コントローラはステップ236において連続的
なCLEARコマンドキーワードが認識された2回目であ
る、即ちこれは使用者が全シーケンスをクリアすること
を希望している状態を意味する、場合であるかを見るた
めチェックを行なう。2番目の連続するCLEARはスター
トポインタSPがエンドポインタEPに等しいかどうかチェ
ックすることにより容易に判定することができる。もし
第2の連続的CLEARキーワードが認識されておれば、コ
ントローラは再びステップ244に進み音声合成装置によ
り第2のビープトーンを出力する。CLEARコマンドが認
識された最初の時である場合、かつもし1つより多くの
ストリングが入力されておれば、制御はステップ238に
進み最後に入力された桁ストリングのみをクリアする。
メモリポインタに関しては、桁ストリングはエンドポイ
ンタEPをスタートポインタSPのロケーションに等しくセ
ットすることによりクリアされる。応答フラグがステッ
プ240においてリセットされるが、これは応答されてい
ない桁ストリングは何も残っていないからである。ステ
ップ242はタイマをリセットし、かつ制御は次にステッ
プ210において次の桁を認識するために戻る。
先に述べたように、もし1つのストリングのみが入力さ
れておれば、あるいはもし2つの連続するCLEARコマン
ドが認識されておれば、第2のビープトーンがステップ
244において出力される。全桁シーケンスが次にステッ
プ246においてクリアされる。桁シーケンスをクリアす
るため、スタートポインタSPおよびエンドポインタEPが
共にステップ204においてなされたようにメモリロケー
ション0(ゼロ)に等しくセットされる。ステップ248
は応答フラグをリセットするが、これはメモリに何らの
桁ストリングも残っていないからである。ステップ250
はタイマをリセットする。制御は再びステップ210にお
いて次のキーワードを捜すために戻る。
もしステップ210において何らの桁キーワードも認識さ
れなければ、ステップ222においてTERMINATEは認識され
ず、かつCLEARがステップ230において認識され、次に制
御はステップ252に進み音声アクティビテイ検出器114か
らのアクティビテイライン116をチェックする。もし音
声活動(アクティビテイ)があれば、休止タイマのみが
ステップ254においてリセットされ、かつ制御はステッ
プ210において次の桁を捜すために戻る。
逆に、音声活動がなければ、休止タイマがステップ256
においてチェックされそれが経過したか否かが判定され
る。好ましい実施例においては、休止タイマは音声活動
が3秒間なかった後に経過する。もし休止タイマが経過
しておらなければ、制御は再びステップ210に戻る。し
かしながら、もし3秒の休止が検出されれば、ステップ
258において応答フラクが試験され桁ストリングが返答
されるべきか否かが判定される。もし応答フラグが先に
ステップ221においてセットされておれば、ステップ258
は制御をステップ260に移しそこで最後に入力された桁
ストリングが音声合成を介して使用者に返答される。再
び、メモリポインタに介しては、最後に入力された桁ス
トリングがメモリロケーションSPで始まり、かつメモリ
ロケーションEP−1に続く。応答フラグがステップ262
においてリセットされかつタイマがステップ264におい
てリセットされ、その後制御は再びステップ210に移さ
れる。
今だ返答されていない何らの桁も認識されていないこと
を意味する、応答フラグがセットされていない状態であ
れば、認識タイマがステップ268においてテストされ
る。認識タイマは今だ認識されていない音声活動が生じ
たか否かを判定するために使用される。ステップ268は
単に認識タイマが休止タイマより大きいか否かを判定す
る。双方のタイマは常に、音声活動が認識なしに生じて
いる、ステップ254の場合を除き共にリセットされるか
ら、認識タイマを休止タイマと比較することが適切にな
る。休止タイマが経過したから、ステップ268において
休止タイマの値は丁度3秒になる。これは最後の音声活
動から3秒が経過したことを示す。もしキーワードが認
識されてから3秒より多くが生じておれば、認識タイマ
は休止タイマを越えるであろう。例えば、もし使用者が
2秒間話し、次に3秒間休止したが、何も認識されなか
った場合には、認識タイマは少なくとも5秒の値を有
し、一方休止タイマは3秒となっているであろう。この
場合、制御はステップ270に進みそこで合成装置はワー
ドREPEATを使用者に返送するよう指示される。ステップ
272において双方のタイマがリセットされ、制御は次に
桁認識ステップ210に戻る。
しかしながら、もしステップ268においてタイマが等し
ければ、何らの音声活動も3秒より長く生じていないこ
ととなる。この場合、制御はステップ276に進みそこで
認識タイマがテストされる。好ましい実施例において
は、認識タイマは何らの音声認識もない6秒の後に経過
する。もしそのような場合であれば、合成装置はステッ
プ278においてワードTIMEOUTを返送して使用者に桁入力
手順がステップ280において終了したことを通知するよ
うに指令される。もし認識タイマがまだ経過しておらな
ければ、制御は再び戻りステップ210において音声活動
を監視し続ける。
以上要するに、本発明は音声コマンドにより一連のキー
ワードを入力しかつ認証するための高度に相互作用的で
ありかつ使用者に親しみ易い方法を提供することが理解
できる。上述のように、本制御システムは可変長の桁ス
トリングを入力する場合、および桁ストリングの間で選
択的に休止することにより認証プロセスを制御する場合
に使用者に大きな柔軟性を許容する。もし高い認識精度
が期待される場合には、使用者は休止することなく全桁
シーケンスを迅速に入力できる。これに対し、認識精度
が劣化している条件下では、使用者は任意の桁数が話さ
れた後に休止することにより部分的なシーケンスの桁ス
トリングにつき認証を要求するオプションを有してい
る。
本発明の特定の実施例が示されかつ説明されたが、当業
者により他の変形および改良を成すことができる。特
に、コマンドワードCLEARおよびTERMINATE、または応答
ワードBEEP、REPEAT、およびTIMEOUTは好ましい実施例
においては特定の用途に対し代表的な英語ワードとして
のみ選択されたことを認識すべきである。しかしなが
ら、他のコマンドワードおよび応答ワードももし望むな
ら、特に異なる言語と共に使用するために、選択するこ
とができる。数多くのハードウェアおよびソフトウェア
的な修正もまた本キーワード入力方法を種々の他の応用
に適応させるために行なうことができる。ここに開示さ
れかつ請求された基本的な内にある原理を保持するすべ
てのそのような変更は本発明の範囲内にあるものであ
る。

Claims (34)

    【特許請求の範囲】
  1. 【請求項1】休止時間インターバルによって分離された
    少なくとも2つの可変長の音声の発声ストリングに含ま
    れるキーワードを認識する段階、 発声ストリングが所定の休止期間の間停止した後に、休
    止信号を提供する段階、 前記休止信号に応答して、前記休止信号の前に生じた発
    声ストリングに対応する認識された特定のキーワードの
    指示を使用者に提供する段階、そして 前記休止信号に応答して、さらに前記休止信号の後に生
    じた発声ストリングに含まれる所定のエラーコマンドキ
    ーワードの認識に応答して前記特定のキーワードを訂正
    する段階、 を具備することを特徴とする使用者相互作用的電子装置
    制御方法。
  2. 【請求項2】前記認識段階は特定の認識されたキーワー
    ドをメモリに格納する段階を含む請求項1に記載の方
    法。
  3. 【請求項3】前記指示提供段階は前記の格納されたキー
    ワードをメモリから読出す段階を含む請求項2に記載の
    方法。
  4. 【請求項4】前記訂正段階は前記所定のエラーコマンド
    キーワードの認識の指示を使用者に対して提供する段階
    を含む請求項1に記載の方法。
  5. 【請求項5】前記訂正段階は前記所定のエラーコマンド
    キーワードの認識に応答して、前記休止信号の前に生じ
    た最後の発声ストリングのみに対応する格納されたキー
    ワードをメモリからクリアする段階を含む請求項2に記
    載の方法。
  6. 【請求項6】前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコ
    マンドキーワードを認識する段階、そして そのような認識に応答してメモリに格納されたすべての
    キーワードをクリアする段階、 を含む請求項2に記載の方法。
  7. 【請求項7】さらに、 発声ストリングに含まれる所定の停止コマンドキーワー
    ドを認識する段階、そして そのような認識に応答してメモリに格納されたすべての
    キーワードを出力する段階、 を具備する請求項2に記載の方法。
  8. 【請求項8】前記指示提供段階はさらに何らの対応する
    キーワードの認識なく音声の発声の生じたことの指示を
    使用者へ提供する段階を含む請求項1に記載の方法。
  9. 【請求項9】前記所定の休止時間は5秒より大きくない
    請求項1に記載の方法。
  10. 【請求項10】休止時間インターバルによって分離され
    た少なくとも2つの可変長音声発声ストリングに含まれ
    るキーワードを認識するための手段、 発声ストリングが所定の休止期間の間停止した後に、休
    止信号を提供するための手段、 前記休止信号に応答して、前記休止信号の前に生じた最
    後の発声ストリングに対応する認識された特定のキーワ
    ードの指示を使用者に提供するための手段、そして 前記休止信号にさらに応答し、前記休止信号の後に生じ
    た次の発声ストリングに含まれる所定のエラーコマンド
    キーワードの認識に応答して前記特定のキーワードを訂
    正するための手段、 を具備することを特徴とする使用者相互作用的音声認識
    制御装置。
  11. 【請求項11】前記制御装置は電話通信装置のための自
    動ダイヤル装置である請求項10に記載の装置。
  12. 【請求項12】前記電話通信装置は無線電話装置である
    請求項11に記載の装置。
  13. 【請求項13】前記電話通信装置はスピーカホンを含む
    請求項11に記載の装置。
  14. 【請求項14】前記認識手段は連続ワード音声認識を実
    施する請求項10に記載の装置。
  15. 【請求項15】前記認識手段は特定の認識されたキーワ
    ードをメモリに格納するための手段を含む請求項10に記
    載の装置。
  16. 【請求項16】前記指示提供手段は前記の格納されたキ
    ーワードをメモリから読取るための手段を含む請求項15
    に記載の装置。
  17. 【請求項17】前記指示提供手段は音声合成装置を含む
    請求項10に記載の方法。
  18. 【請求項18】前記指示提供手段は可視的ディスプレイ
    を含む請求項10に記載の装置。
  19. 【請求項19】前記所定の休止時間は5秒より大きくな
    い請求項10に記載の装置。
  20. 【請求項20】前記訂正手段は前記所定のエラーコマン
    ドキーワードの認識の指示を使用者へ提供するための手
    段を含む請求項10に記載の装置。
  21. 【請求項21】前記訂正手段はさらに前記所定のエラー
    コマンドキーワードの認識に応答して、前記休止信号の
    前に発生した最後の発声ストリングのみに対応する格納
    されたキーワードをメモリからクリアするための手段を
    含む請求項15に記載の装置。
  22. 【請求項22】前記訂正手段はさらに、 連続する発声ストリングに含まれる2つの同じエラーコ
    マンドキーワードを認識するための手段、そして そのような認識に応答してメモリに格納されたすべての
    キーワードをクリアするための手段、 を含む請求項15に記載の装置。
  23. 【請求項23】前記指示提供手段はさらに何らの対応す
    るキーワードの認識なく音声の発声の生じたことの指示
    を使用者へ提供するための手段含む請求項10に記載の装
    置。
  24. 【請求項24】さらに、 発声ストリングに含まれる所定の停止コマンドキーワー
    ドを認識するための手段、そして そのような認識に応答してメモリに格納されたすべての
    キーワードを出力するための手段、 を具備する請求項15に記載の装置。
  25. 【請求項25】複数の可変長発声ストリングからなる全
    シーケンスの音声の発声を前記全シーケンスに含まれる
    キーワードに対応するデータ出力を提供する音声認識コ
    ントローラに入力するための方法であって、各発声スト
    リングには休止時間インターバルが続き、かつ各発声ス
    トリングは少なくとも1つのキーワードを含み、前記方
    法は (a)最初のキーワードセットに対応する第1の発声ス
    トリングを認識する段階、 (b)前記第1の認識されたキーワードセットを読取り
    /書込みメモリに格納する段階、 (c)前記第1の発声ストリングが所定の休止期間の間
    停止した後休止信号を提供する段階、 (d)前記休止信号に応答して前記第1の格納されたキ
    ーワードセットをメモリから取出す段階、 (e)少なくとも前記第1の取出されたキーワードセッ
    トの使用者への指示を提供する段階、 (f)所定のエラーコマンドキーワードに対応する第2
    の発声ストリングを認識する段階、そして (g)前記所定のエラーコマンドキーワードの認識に応
    答して前記第1の格納されたキーワードセットを訂正す
    る段階、 を具備することを特徴とする前記方法。
  26. 【請求項26】前記認識段階は連続ワード音声認識を行
    なう請求項25に記載の方法。
  27. 【請求項27】前記指示提供段階は前記最初のキーワー
    ドセットにのみ対応する音声を合成する段階を含む請求
    項25に記載の方法。
  28. 【請求項28】前記指示提供段階はさらにすべての格納
    されたキーワードを可視的に表示する段階を含む請求項
    25に記載の方法。
  29. 【請求項29】前記所定の休止時間は5秒より大きくな
    い請求項25に記載の方法。
  30. 【請求項30】前記訂正段階はさらに前記所定のエラー
    コマンドキーワードの認識の指示を使用者へ提供する段
    階を含む請求項25に記載の方法。
  31. 【請求項31】前記訂正段階はさらに前記所定のエラー
    コマンドキーワードの認識に応答して前記第1の格納さ
    れたキーワードのみをメモリからクリアする段階を含む
    請求項25に記載の方法。
  32. 【請求項32】前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコ
    マンドキーワードを認識する段階、そして そのような認識に応答してメモリに格納されたすべての
    キーワードをクリアする段階、 を含む請求項25に記載の方法。
  33. 【請求項33】さらに、 発声ストリングに含まれる所定の停止コマンドキーワー
    ドを認識する段階、そして そのような認識に応答してメモリに格納されたすべての
    キーワードを出力する段階、 を具備する請求項25に記載の方法。
  34. 【請求項34】前記指示提供段階はさらに何らの対応す
    るキーワードの認識なく音声の発生が生じたことの指示
    を使用者へ提供する段階を含む請求項25に記載の方法。
JP63508908A 1987-10-19 1988-08-24 音声コマンドによりデジットシーケンスを入力するための方法 Expired - Lifetime JPH0782351B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US07/110,144 US4870686A (en) 1987-10-19 1987-10-19 Method for entering digit sequences by voice command
US110,144 1987-10-19
PCT/US1988/002851 WO1989004035A1 (en) 1987-10-19 1988-08-24 Method for entering digit sequences by voice command

Publications (2)

Publication Number Publication Date
JPH03500693A JPH03500693A (ja) 1991-02-14
JPH0782351B2 true JPH0782351B2 (ja) 1995-09-06

Family

ID=22331440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63508908A Expired - Lifetime JPH0782351B2 (ja) 1987-10-19 1988-08-24 音声コマンドによりデジットシーケンスを入力するための方法

Country Status (9)

Country Link
US (1) US4870686A (ja)
EP (1) EP0389514B1 (ja)
JP (1) JPH0782351B2 (ja)
KR (1) KR0129856B1 (ja)
AT (1) ATE136146T1 (ja)
CA (1) CA1312668C (ja)
DE (1) DE3855164T2 (ja)
MX (1) MX165502B (ja)
WO (1) WO1989004035A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置

Families Citing this family (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02209055A (ja) * 1989-02-09 1990-08-20 Toshiba Corp 電話装置
JP2935519B2 (ja) * 1989-08-28 1999-08-16 シーキンス,ケイ・マイケル 超音波および/またはペルフルオロカーボン液での対流を介する肺癌高熱治療
US5175759A (en) * 1989-11-20 1992-12-29 Metroka Michael P Communications device with movable element control interface
US5095503A (en) * 1989-12-20 1992-03-10 Motorola, Inc. Cellular telephone controller with synthesized voice feedback for directory number confirmation and call status
US5268959A (en) * 1990-06-22 1993-12-07 Hong Inpon D Telephone long distance redialing apparatus and process
WO1992003882A1 (en) * 1990-08-20 1992-03-05 Motorola, Inc. Dialing editing method and apparatus
US6002558A (en) * 1990-09-18 1999-12-14 Rines; Carol Mary Method of and apparatus for expanding functionality of vehicle cassette tape-player decks to permit dictation or other recording and automatic remote station relaying of the same
US5315688A (en) * 1990-09-21 1994-05-24 Theis Peter F System for recognizing or counting spoken itemized expressions
US5201028A (en) * 1990-09-21 1993-04-06 Theis Peter F System for distinguishing or counting spoken itemized expressions
US5155689A (en) * 1991-01-17 1992-10-13 By-Word Technologies, Inc. Vehicle locating and communicating method and apparatus
US5983108A (en) * 1992-01-27 1999-11-09 Highwaymaster Communications, Inc. Method and apparatus for a nation-wide cellular telephone network
US5454027A (en) * 1992-01-27 1995-09-26 Hm Holding Corporation Phantom mobile identification number method and apparatus
US5539810A (en) * 1992-01-27 1996-07-23 Highwaymaster Communications, Inc. Data messaging in a communications network
GB2264209B (en) * 1992-02-06 1995-11-08 Technophone Ltd Cordless telephone arrangement
US5371779A (en) * 1992-03-13 1994-12-06 Nec Corporation Call initiating system for mobile telephone units
US5297183A (en) * 1992-04-13 1994-03-22 Vcs Industries, Inc. Speech recognition system for electronic switches in a cellular telephone or personal communication network
US5350359A (en) * 1992-07-16 1994-09-27 Temple University Of The Commonwealth System Of Higher Education Control, treatment and/or diagnosis of physiological conditions with degassed perfluorocarbon liquid
DE4225475A1 (de) * 1992-08-01 1994-02-03 Philips Patentverwaltung Einrichtung zur Spracherkennung
US5450525A (en) * 1992-11-12 1995-09-12 Russell; Donald P. Vehicle accessory control with manual and voice response
US5717743A (en) * 1992-12-16 1998-02-10 Texas Instruments Incorporated Transparent telephone access system using voice authorization
US5717738A (en) * 1993-01-11 1998-02-10 Texas Instruments Incorporated Method and device for generating user defined spoken speed dial directories
US5668929A (en) * 1993-01-21 1997-09-16 Hirsch Electronics Corporation Speech activated security systems and methods
US5483579A (en) * 1993-02-25 1996-01-09 Digital Acoustics, Inc. Voice recognition dialing system
US5594784A (en) * 1993-04-27 1997-01-14 Southwestern Bell Technology Resources, Inc. Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
SE9304222L (sv) * 1993-12-21 1995-06-22 Telia Ab Metod och anordning vid samtal från mobilstationer
US5481595A (en) * 1994-03-08 1996-01-02 Uniden America Corp. Voice tag in a telephone auto-dialer
FI96082C (fi) * 1994-04-13 1996-04-25 Ne Products Oy Menetelmä valintavälineellä radiolähetinvastaanottimelle annettavan valintasekvenssin valintojen tulkitsemisessa
US5652903A (en) * 1994-11-01 1997-07-29 Motorola, Inc. DSP co-processor for use on an integrated circuit that performs multiple communication tasks
US5913170A (en) * 1994-11-16 1999-06-15 Highwaymaster Communications, Inc. Locating system and method using a mobile communications network
EP0795246A4 (en) * 1994-12-02 2000-04-26 Voice Control Systems Inc INTELLIGENT CALL PROCESSING UNIT FOR HOME TELEPHONE SYSTEM
US5893037A (en) * 1994-12-09 1999-04-06 Eastman Kodak Company Combined electronic/silver-halide image capture system with cellular transmission capability
US5724243A (en) * 1995-02-10 1998-03-03 Highwaymaster Communications, Inc. Method and apparatus for determining expected time of arrival
US5583925A (en) * 1995-03-22 1996-12-10 Lucent Technologies, Inc. Automatic three-way calling feature for a telecommunications system
FI111893B (fi) * 1995-06-02 2003-09-30 Nokia Corp Menetelmä ja laite puhelimen ohjaamiseksi komennoilla
CA2180392C (en) * 1995-07-31 2001-02-13 Paul Wesley Cohrs User selectable multiple threshold criteria for voice recognition
DE19624988A1 (de) * 1996-06-22 1998-01-02 Peter Dr Toma Verfahren zur automatischen Erkennung eines gesprochenen Textes
US5737491A (en) * 1996-06-28 1998-04-07 Eastman Kodak Company Electronic imaging system capable of image capture, local wireless transmission and voice recognition
FI101333B (fi) * 1996-09-02 1998-05-29 Nokia Mobile Phones Ltd Puhekomennoilla ohjattava telepäätelaite
US5899976A (en) * 1996-10-31 1999-05-04 Microsoft Corporation Method and system for buffering recognized words during speech recognition
US5829000A (en) * 1996-10-31 1998-10-27 Microsoft Corporation Method and system for correcting misrecognized spoken words or phrases
US5884258A (en) * 1996-10-31 1999-03-16 Microsoft Corporation Method and system for editing phrases during continuous speech recognition
US5950160A (en) * 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US5926789A (en) * 1996-12-19 1999-07-20 Bell Communications Research, Inc. Audio-based wide area information system
US6377663B1 (en) * 1997-01-03 2002-04-23 Ncr Corporation Call management system and associated method for a local telephone circuit
DE19709990C2 (de) * 1997-03-11 2000-03-02 Philips Corp Intellectual Pty System zur Erkennung gesprochener Ziffernfolgen
FR2761848B1 (fr) * 1997-04-04 2004-09-17 Parrot Sa Dispositif de commande vocale pour radiotelephone, notamment pour utilisation dans un vehicule automobile
US20040157612A1 (en) * 1997-04-25 2004-08-12 Minerva Industries, Inc. Mobile communication and stethoscope system
FI111673B (fi) * 1997-05-06 2003-08-29 Nokia Corp Menetelmä puhelinnumeron valitsemiseksi puhekomennoilla ja puhekomennoilla ohjattava telepäätelaite
US6163596A (en) * 1997-05-23 2000-12-19 Hotas Holdings Ltd. Phonebook
US5930751A (en) * 1997-05-30 1999-07-27 Lucent Technologies Inc. Method of implicit confirmation for automatic speech recognition
US6292675B1 (en) 1997-10-21 2001-09-18 Byard G. Nilsson Wireless mobile telephone system with voice-dialing telephone instruments and DTMF capability
US6049710A (en) 1997-06-19 2000-04-11 Kimberley Nanette Engen Wireless prepaid telephone system with dispensable instruments
US6862463B1 (en) 1997-06-19 2005-03-01 Byard G. Nilsson Wireless telephone system with information service
US6473610B1 (en) 1997-06-19 2002-10-29 Byard G. Nilsson Wireless prepaid telephone system with dispensable instruments
US6298250B1 (en) 1997-06-19 2001-10-02 Kimberly Nanette Engen Wireless prepaid telephone system with extended capability
US6993321B1 (en) 1997-06-19 2006-01-31 Nilsson Byard G Wireless telephone system with mobile instruments for outgoing calls
US6308053B1 (en) 1997-06-19 2001-10-23 Byard G. Nilsson Recyclable wireless telephone unit with a secured activation switch
US6751482B1 (en) 1997-06-19 2004-06-15 Byard G. Nilsson Wireless mobile telephone system with alternative power instruments and DTMF Capability
US6167118A (en) * 1997-12-30 2000-12-26 Dsc Telecom L.P. Method and a system for by-passing a receiver-off-hook timer for voice dialing systems and for supporting spoken digit dialing
KR100259918B1 (ko) * 1998-03-05 2000-06-15 윤종용 핸즈프리키트의 쇼트메시지 음성합성 장치 및 방법
GB9806401D0 (en) * 1998-03-25 1998-05-20 Domain Dynamics Ltd Improvements in voice operated mobile communications
JP4036528B2 (ja) * 1998-04-27 2008-01-23 富士通株式会社 意味認識システム
US6321195B1 (en) * 1998-04-28 2001-11-20 Lg Electronics Inc. Speech recognition method
US6141010A (en) * 1998-07-17 2000-10-31 B. E. Technology, Llc Computer interface method and apparatus with targeted advertising
JP3001000B1 (ja) * 1998-09-08 2000-01-17 セイコーエプソン株式会社 音声認識装置における連続単語認識方法および音声認識装置における連続単語認識処理プログラムを記録した記録媒体
JP2000115330A (ja) * 1998-09-30 2000-04-21 Nec Corp 携帯電話機及びこれと接続されるポータブルオーディオ
US6711536B2 (en) * 1998-10-20 2004-03-23 Canon Kabushiki Kaisha Speech processing apparatus and method
US6249765B1 (en) * 1998-12-22 2001-06-19 Xerox Corporation System and method for extracting data from audio messages
US6643622B2 (en) 1999-02-19 2003-11-04 Robert O. Stuart Data retrieval assistance system and method utilizing a speech recognition system and a live operator
US6243684B1 (en) 1999-02-19 2001-06-05 Usada, Inc. Directory assistance system and method utilizing a speech recognition system and a live operator
US6526292B1 (en) 1999-03-26 2003-02-25 Ericsson Inc. System and method for creating a digit string for use by a portable phone
US6862713B1 (en) * 1999-08-31 2005-03-01 International Business Machines Corporation Interactive process for recognition and evaluation of a partial search query and display of interactive results
DE19942871B4 (de) * 1999-09-08 2013-11-21 Volkswagen Ag Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
JP2001236091A (ja) * 2000-02-23 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> 音声認識結果の誤り訂正方法およびその装置
DE10013879A1 (de) * 2000-03-21 2001-09-27 Bosch Gmbh Robert Verfahren zur Sprachsteuerung eines elektrischen Geräts
US20020042709A1 (en) * 2000-09-29 2002-04-11 Rainer Klisch Method and device for analyzing a spoken sequence of numbers
ATE241195T1 (de) * 2000-09-29 2003-06-15 Ericsson Telefon Ab L M Verfahren und einrichtung zur analyse einer folge von gesprochenen nummern
US6788767B2 (en) * 2000-12-28 2004-09-07 Gateway, Inc. Apparatus and method for providing call return service
US20020137470A1 (en) * 2001-03-23 2002-09-26 Baron Jason C. Method and system for multiple stage dialing using voice recognition
US20030023439A1 (en) * 2001-05-02 2003-01-30 Gregory Ciurpita Method and apparatus for automatic recognition of long sequences of spoken digits
EP1262954A1 (en) * 2001-05-30 2002-12-04 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for verbal entry of digits or commands
US6996528B2 (en) * 2001-08-03 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for efficient, safe and reliable data entry by voice under adverse conditions
WO2003015378A1 (fr) * 2001-08-10 2003-02-20 Zhiying Song Telephone mobile avec composeur vocal, sans touches numeriques
US7366667B2 (en) 2001-12-21 2008-04-29 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for pause limit values in speech recognition
DE10216117A1 (de) * 2002-04-12 2003-10-23 Philips Intellectual Property Verfahren und System zur Spracherkennung von Symbolfolgen
US20040162116A1 (en) * 2003-02-14 2004-08-19 Lucent Technologies Inc. User programmable voice dialing for mobile handset
AU2003231363A1 (en) * 2003-04-17 2004-11-04 Fujitsu Limited Semiconductor device, reset control system, and memory reset method
US7689423B2 (en) * 2005-04-13 2010-03-30 General Motors Llc System and method of providing telematically user-optimized configurable audio
DE102005019028B4 (de) * 2005-04-23 2020-11-12 Volkswagen Ag Telefonsystem und Verfahren zum Betreiben eines Telefonsystems für ein Kraftfahrzeug
EP1880267B1 (en) * 2005-05-13 2019-12-04 Nokia Technologies Oy Method for inputting characters in electronic device
US9818120B2 (en) 2015-02-20 2017-11-14 Innovative Global Systems, Llc Automated at-the-pump system and method for managing vehicle fuel purchases
US8626377B2 (en) 2005-08-15 2014-01-07 Innovative Global Systems, Llc Method for data communication between a vehicle and fuel pump
US20070106506A1 (en) * 2005-11-07 2007-05-10 Ma Changxue C Personal synergic filtering of multimodal inputs
TW200735682A (en) * 2006-03-09 2007-09-16 Action Star Entpr Co Ltd Wireless audio emitting device having automatic channel lock function and method thereof
US7957972B2 (en) * 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
US8055502B2 (en) * 2006-11-28 2011-11-08 General Motors Llc Voice dialing using a rejection reference
US20080221882A1 (en) * 2007-03-06 2008-09-11 Bundock Donald S System for excluding unwanted data from a voice recording
TR201006031A2 (tr) * 2010-07-22 2011-10-21 Sestek Ses Ve İleti̇şi̇m Bi̇lgi̇sayar Teknoloji̇leri̇ Sanayi̇ Ti̇caret Anoni̇m Şi̇rketi̇ Otomatik dikte sistemlerinde konuşma sentezi ile teyit yöntemi ve bu yöntemin uygulanması için sistem
SG189182A1 (en) 2010-10-29 2013-05-31 Anhui Ustc Iflytek Co Ltd Method and system for endpoint automatic detection of audio record
DE102011013755B4 (de) 2010-12-31 2021-07-08 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zur alphanumerischen Spracheingabe in Kraftfahrzeugen
US10140986B2 (en) 2016-03-01 2018-11-27 Microsoft Technology Licensing, Llc Speech recognition
US10192550B2 (en) * 2016-03-01 2019-01-29 Microsoft Technology Licensing, Llc Conversational software agent
US10140988B2 (en) 2016-03-01 2018-11-27 Microsoft Technology Licensing, Llc Speech recognition
JPWO2018043138A1 (ja) * 2016-08-31 2019-06-24 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US10911594B2 (en) 2017-05-16 2021-02-02 Google Llc Handling calls on a shared speech-enabled device
JP7170287B2 (ja) * 2018-05-18 2022-11-14 パナソニックIpマネジメント株式会社 音声認識装置、音声認識方法、及びプログラム
CN111326140B (zh) * 2020-03-12 2023-05-30 科大讯飞股份有限公司 语音识别结果判别方法、纠正方法、装置、设备及存储介质
EP4147232A1 (en) * 2021-05-17 2023-03-15 Google LLC Arranging and/or clearing speech-to-text content without a user providing express instructions

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59225656A (ja) * 1983-06-07 1984-12-18 Fujitsu Ltd 音声ダイヤル電話端末
JPS6054687A (ja) * 1983-07-19 1985-03-29 スロ−ン−ケツタリング インステイテユ−ト フオ− キヤンサ− リサ−チ ヒト モノクロ−ン抗体の製法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB974850A (en) * 1963-06-12 1964-11-11 Standard Telephones Cables Ltd Speech recognition system
US3742143A (en) * 1971-03-01 1973-06-26 Bell Telephone Labor Inc Limited vocabulary speech recognition circuit for machine and telephone control
US3928724A (en) * 1974-10-10 1975-12-23 Andersen Byram Kouma Murphy Lo Voice-actuated telephone directory-assistance system
GB1557286A (en) * 1975-10-31 1979-12-05 Nippon Electric Co Speech recognition
JPS5688503A (en) * 1979-12-21 1981-07-18 Matsushita Electric Ind Co Ltd Heater
US4336421A (en) * 1980-04-08 1982-06-22 Threshold Technology, Inc. Apparatus and method for recognizing spoken words
EP0041195A1 (en) * 1980-05-30 1981-12-09 General Electric Company Improved paging arrangement
US4348550A (en) * 1980-06-09 1982-09-07 Bell Telephone Laboratories, Incorporated Spoken word controlled automatic dialer
CH645501GA3 (ja) * 1981-07-24 1984-10-15
US4528687A (en) * 1981-10-22 1985-07-09 Nissan Motor Company, Limited Spoken-instruction controlled system for an automotive vehicle
JPS5870287A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 音声認識装置
US4525793A (en) * 1982-01-07 1985-06-25 General Electric Company Voice-responsive mobile status unit
US4426733A (en) * 1982-01-28 1984-01-17 General Electric Company Voice-controlled operator-interacting radio transceiver
US4614839A (en) * 1982-08-19 1986-09-30 Aisin Seiki K.K. Road-vehicle telephone apparatus
US4624008A (en) * 1983-03-09 1986-11-18 International Telephone And Telegraph Corporation Apparatus for automatic speech recognition
US4593157A (en) * 1984-09-04 1986-06-03 Usdan Myron S Directory interface and dialer
JPH0774960B2 (ja) * 1984-09-28 1995-08-09 インタ−ナシヨナル・スタンダ−ド・エレクトリツク・コ−ポレイシヨン テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
FR2571191B1 (fr) * 1984-10-02 1986-12-26 Renault Systeme de radiotelephone, notamment pour vehicule automobile
US4644107A (en) * 1984-10-26 1987-02-17 Ttc Voice-controlled telephone using visual display
JP2654942B2 (ja) * 1985-09-03 1997-09-17 モトロ−ラ・インコ−ポレ−テツド 音声通信装置及びその動作方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59225656A (ja) * 1983-06-07 1984-12-18 Fujitsu Ltd 音声ダイヤル電話端末
JPS6054687A (ja) * 1983-07-19 1985-03-29 スロ−ン−ケツタリング インステイテユ−ト フオ− キヤンサ− リサ−チ ヒト モノクロ−ン抗体の製法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置

Also Published As

Publication number Publication date
US4870686A (en) 1989-09-26
CA1312668C (en) 1993-01-12
ATE136146T1 (de) 1996-04-15
KR0129856B1 (ko) 1998-04-11
KR890702177A (ko) 1989-12-23
EP0389514B1 (en) 1996-03-27
MX165502B (es) 1992-11-16
EP0389514A4 (en) 1992-05-20
EP0389514A1 (en) 1990-10-03
DE3855164D1 (de) 1996-05-02
WO1989004035A1 (en) 1989-05-05
JPH03500693A (ja) 1991-02-14
DE3855164T2 (de) 1996-10-10

Similar Documents

Publication Publication Date Title
JPH0782351B2 (ja) 音声コマンドによりデジットシーケンスを入力するための方法
US4945570A (en) Method for terminating a telephone call by voice command
US4737976A (en) Hands-free control system for a radiotelephone
EP0307193B1 (en) Telephone apparatus
US7050550B2 (en) Method for the training or adaptation of a speech recognition device
EP1171870B1 (en) Spoken user interface for speech-enabled devices
KR960004692B1 (ko) 음성 명령에 의한 전화 호출 종료 방법
EP0293258A1 (en) Radio telephone apparatus
KR19990071189A (ko) 음성 인식 데이터 결정 장치 및 방법
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
EP1151431B1 (en) Method and apparatus for testing user interface integrity of speech-enabled devices
KR19990011023A (ko) 기능모드의 음성 인식이 가능한 디지털 휴대용 전화기 및 그 인식방법
JP3278595B2 (ja) 携帯電話
JPH11109987A (ja) 音声認識装置
KR940011237B1 (ko) 음성 다이얼링 장치 및 방법
JPH11298382A (ja) ハンズフリー装置
JP2782850B2 (ja) 自動車用電話
JPS59201141A (ja) 音声情報入力装置
JPH03208448A (ja) 自動ダイヤル装置