JPH03500693A - 音声コマンドによりデジットシーケンスを入力するための方法 - Google Patents

音声コマンドによりデジットシーケンスを入力するための方法

Info

Publication number
JPH03500693A
JPH03500693A JP63508908A JP50890888A JPH03500693A JP H03500693 A JPH03500693 A JP H03500693A JP 63508908 A JP63508908 A JP 63508908A JP 50890888 A JP50890888 A JP 50890888A JP H03500693 A JPH03500693 A JP H03500693A
Authority
JP
Japan
Prior art keywords
keywords
string
recognition
user
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63508908A
Other languages
English (en)
Other versions
JPH0782351B2 (ja
Inventor
ジャーソン・イラ アラン
リンズレイ・ブレット ルイス
Original Assignee
モトローラ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モトローラ・インコーポレーテッド filed Critical モトローラ・インコーポレーテッド
Publication of JPH03500693A publication Critical patent/JPH03500693A/ja
Publication of JPH0782351B2 publication Critical patent/JPH0782351B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Traffic Control Systems (AREA)
  • Selective Calling Equipment (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 立 コマンドによ −ジットシーケンスを るためのり フLヱと チE月Hコる。%LJ艮 2 1、発明の分野 目 本発明は一般的には音声認識制御システムに関する6より特定的には、本発 明は車両無線電話の応用において遍遇するようなノイズの多い環境で使用するの に特に適したハンドフリー音声コマンド自動ダイヤルシステムに間する。
2、従来技術の説明 典型的には、無線および陸線電話システムの双方において、ユーザは該ユーザの 耳に近く配置される、一端にスピーカを、かつ該ユーザの口に近く保持される、 他端にマイクロホンを含むハンドセットにより通信する。動作においては、ユー ザの一方の手がハンドセットをその適正な方向に保持するために占有され、それ によりユーザの自由な手のみが車両を運転するような仕事を達成するために残さ れる。ユーザに対し非常に大きな程度の自由を与えるためには、陸線電話システ ムにおいてはスピーカホンが一般に使用されている。i&近、自動車において使 用するための車両用スピーカホンが開発された0例えば、イーストモンドによる 米国特許第4,378,603号およびビルマーによる米国特許第4.400, 584号は、共に本発明と同じ譲り受け人に譲渡されているが、ハンドフリー動 作を備えた車両用スピーカホンを記述している。
人間の音声に応答する、音声認識制御システムは自動車の応用において使用する ために非常に望ましいものである。
大部分の移動無線送受信tI!(トランシーバ)の機能(例えば、オン/オフ、 送信/受信、ボリュウム、スケルチ、その他)あるいは移動無線電話制御のm能 (例えば、ブツシュボタンダイヤル、音声認識装置トレーニング、電話呼の応答 )は容易に何らのマニュアル動作を要求することなく音声コマンドによって行な うことができる。従って、車両用スピーカホンと共に音声認識を用いることは自 動車の運転手に彼の手をステアリングホイールから放しあるいは彼の目を道路か らそらす事を全く要求することなく完全にハンドフリ・−な電話会話を提供する 可能性を持っている。この特徴はスピーカホンのハンドフリーの可能性を拡張す るのみならず、車両において移動無ti を話を使用する安全性と便宜性を付加 する。
不幸なことに、車両の無線電話に完全にハンドフリーな制御を適用することは幾 つかの重要な障害を引き起こす。
車両環境において音声認識が利用される時、車両において本質的に存在する高度 の環境ノイズが信頼できる音声制御に対しかなりの障害を与える。さらに、車両 用スピーカホンは典型的には、頭上の自動車の日除は板に取付けられるように、 使用者の口から遠いマイクロホンを有している。
その結果、必要とされる高いマイクロホンの感度は音声認識装置に印加される環 境背景ノイズの量を大幅に増大させ、これはその認識の信頼性を劣化させる。
より特定的には、自動ダイヤル式電話における音声認識エラーの問題はシステム の性能をかなり低下させる。自動およびレパートリ−ダイヤルの機能が最近セル ラ電話の用途において利用されてきており、それにより使用者は口頭で電話デジ ット(digits)を入力しあるいは予め規定されたキーワードを用いて予め 格納された番号を口頭で呼出すことができる。もし音声認識ユニットがコマンド キーワードを誤まって認識すれば、音声コマンドコントローラは一般に認証(v erification)の目的で使用者に認識されたコマンドを返送するであ ろう、使用者は従って、正しいキーワードを再入力する。この人力/認証/再入 力のプロセスは通常最小の不都合に過ぎないが、その理由はそれが典型的に大多 数のコマンドに対しほんの数秒しかかからないからである。しかしながら、もし 音声認識装置が電話番号を表す長い−続きのデジットにおける単一のデジットを 誤って検出すれば、入力/認証/再入力のプロセスは非常に時間を消費するもの となりかつ、非常に少なくとも、使用者にとってはかなり不満足なものとなるで あろう。
これらの理由のため、音声コマンドによりデジットを入力するための従来の技術 は非常に限られてきた。幾つかの音声認識制御装置は使用者が所定数、例えば、 電話番号については7または11、のデジットを発するのを待つ、最後の期待さ れたデジットの認識に応じて、該制御装置は音声合成を用いて認識された番号を 認証のため使用者に音声で返答する。使用者は次に所定のエラーコマンドのキー ワードを話すことにより誤って認識された電話番号が入力されることを防止でき る。しかしながら、認識の精度が高くない車両の環境においては、正しい認識の ために完全なデジットのシーケンスを数回繰返すことが必要になる。他のものに おいては、音声コマンドのダイアル装置が認識の直後に各車−のデジットを繰返 す、この別の方法は高いノイズ環境においてはより信頼できることが分かつてい るが、それは、特に認識精度が高い場合に、デジットの長いつながり(stri ng)を入力するためにかなりの量の時間を必要以上に要求する。そのうえ、あ るデジットが誤って認識された時車−デジットの認証プロセスは非常に厄介なも のとなるが、それは使用者がエラーコマンドを話すためにメンタル的に停止し、 正しくない単一の桁を繰返し、正しい応答を聞き、かつ次にその先を続けなけれ ばならない場合に使用者は容易に入力すべき次の桁を忘れることがあるからであ る。全体として、従来技術の行入力/認証手順は使用者にとって親しみ易いもの ではない。
従って、音声認識制御システムにおいて音声コマンドにより一続き(SeQue nCf3)のデジットを入力しかつ認証するための利口な方法に対する必要性が 存在する。
九肌座鳳I 従って、本発明の一般的な目的は音声認識により一続きのキーワードを入力しか つ認証するための改良された方法および装置を提供することにある。
本発明のより特定的な目的は、部分的なシーケンスのデジットのつながり(スト リング)を入力しかつ選択的に編集することにより電話にダイヤルするための改 良された使用者相互作用的音声認識制御システムを提供することにある。
本発明によれば、11桁(デジット)の電話番号のような、使用者が話した発声 の全シーケンスを信頼性よく入力する音声通信装置のための使用者と相互作用す る音声コマンド制御システムが提供される。この音声コマンド制御システムは使 用者の話した発声の複数の部分的シーケンス、可変長ストリングをデジットのよ うな、複数の所定の’r−ワードに対応するものとして認識する音声認識ユニッ トを含む、この制御システムは最初の発声のつながりが所定の休止時間インター バルの開停止した後休止信号を与え、かつ次に該最初の発声のつながりに応答し て認識されたキーワードの使用者への表示を提供する。該制御システムはまた休 止信号に応答してかつ所定のエラーコマンドキーワードに対応する第2の発声の つながりの認識に応答して特定のキーワードを訂正するための機構を提供する。
好ましい実施例においては、ハンドフリー、ユーザ相互作用音声コマンドダイヤ ルシステムが車両用スピーカホンを用いた移動無線電話と共に使用される。−続 きの桁の後所定の休止時間インターバルが認識された時、認識された桁がシステ ムによって返送される。付加的な桁のつながりが次に入力でき、かつ認識された 後続の桁ストリングのみが次の休止の後に返答される。もしくワード「クリア( CLEAR) Jのような)エラーコマンドキーワードが次に認識されると、入 力された最後の桁ストリングのみがクリアされる。もしエラーコマンド語が続け て2回認識されると、桁ストリング全体がクリアされる。もしコントローラがユ ーザが話しをしているがしかし何も認識されないことを検出すると、システムは (多分ワード「リピート(REPEAT) Jによって)応答し使用者に音声認 識装置が先のストリングを認識できなかったことおよびそれが繰返されるべきこ とを指示する。i&後の桁のストリングが入力されると、使用者は(ワード「タ ーミネート(TERHIN^TE) Jのような)停止コマンドを話しかつ認識 された桁の全シーケンスが返答されかつ無線電話に出力される。
このようにして、使用者は環境ノイズ条件に応じて認識処理の認証モードを変更 する柔軟性を有する。高い認識精度が期待できる環境においては、使用者は全デ ジットのシーケンスを休止することなく入力でき、かつシステムは直ちに全シー ケンスを確認しかつ格納するであろう、これに対し、高い背景ノイズの条件下で は使用者は各ストリングが発声された後に休止することにより部分的シーケンス の桁ストリングの認証を要求する選択を行なうことができる。
もし認識エラーがあれば、特定の桁ストリングを全デジットシーケンスを再入力 させることなく訂正できる。各休止の後にキーワードのストリングを認証する本 方法はまた非常に使用者に親しみ易いものであり、それは人間は通常長い桁のシ ーケンス(例えば、長距離電話番号)を桁ストリングの予め規定されたグループ (例えば、1−312−397−1000)として読み、記憶し、かつ話すから である。
区画ぷり11社葭朋 新規であると信じられる本発明の特徴は特に添付の請求の範囲に記載されている 。しかしながら、発明それ自体はそのさらに他の目的および利点と共に添付の図 面を取り入れて以下の説明を参照することにより最も良く理解でき、それらの図 において、 第1図は、本発明に係わるデジット入力方法を用いた音声通信装置のための音声 コマンド制御システムを示すブロック図、そして 第2a図および第2b図は好ましい実施例に係わるデジット入力方法の/ラクテ ィスに従い前記制御システムによって行なわれる特定のシーケンスの動作を示す フローチャートである。
ましい Jの=細f9述 次に添付の図面を参照すると、第1図は、本発明に係わるユーザ相互作用制御シ ステム100の一般的なブロック図を示している。このシステムは基本的には音 声通信装置140に接続されたデバイスコントローラ120かう構成されている 。音声認識装置110が使用者からの音声コマンドをシステムのためのコマンド 信号に翻訳するためにデバイスコントローラに結合されている。デバイスコント ローラは音声認識装置からの情報と共に、タイマ124、アクティビティ検出器 114、およびコントローラメモリ134からの情報を監視する。該コントロー ラは、認識テングレートを選択しかつ音声認識装置110をイネーブルし、タイ マをリセットし、データをコントローラメモリ134に格納しかつそこからデー タを読出し、音声通信装置のダイヤル動作を制御し、かつ使用者へのフィードバ ックを提供するために音声合成装W130に情報を提供する能力を有している1 本システムは使用者の手が他の仕事を行なうために自由になるような、スピーカ ホンと共に使用するのによく適している。スピーカホン150はこのハンドフリ ーの特徴を提供するためにオーディオ経路の方向を制御する。
音声通信装置140は例えば、2方向無線システム、電話システム、インターコ ム(内部通信)システム、音声データエントリシステム、その他のような、任意 の無線または陸線音声通信システムの部分を含むことができる0本実施例におい ては、音声通信装置140はセルラ移動無線電話のような、無線電話送受信11 ()−ランシーバ)である。
そのような無線電話の詳細な説明はモトローラ社のインストラクションマニュア ル第68P81066E40号、rDYNA T、A、C,(登録商標)セルラ 移動電話」に見ることができる。しかしながら、音声制御を必要とする任意の陸 線電話または単信無線送受信機を用いることができる。さらに、ハンドフリーな 使用者相互作用動作を行なう任意の電子装置もまた本発明を利用することができ る。
音声通信装置140は送信経路144および受信経路142を利用し送信/受信 オーディオおよびダイヤル情報を通信チャネルにインタフェースする。移動無線 電話の好ましい実施例においては、これらの経路は二!無線電話動作のための一 対の無線周波数(RF)チャネルにインタフェースすることができる。
音声認識装置110はライン158における入力音声信号に対し音声認識を行な う、認識中は、音声認識装置110は先に格納したワードのテンプレートを入力 音声情報に対し比較する1本実施例における認識アルゴリズムは連続音声認識、 ダイナミック時間ワーピング、エネルギ正規化、そしてテンプレート整合を判定 するためチェビシェフ距離測定法を導入する。音響 ” 、および11ilζ皿 ヱ玉IBEE喝!倉J(1982年5月3日−5日)、第2巻、pp、899− 902、ジェイ・ニス・プライドル、エム・ディ・ブラウンおよびアール・エム ・チェンバレインによる[つながりのあるワードの認識のためのアルゴリズムJ に記載されたような、従来技術の認識アルゴリズム#J、1な用いることができ る。
本実施例においては、8ビツトのマイクロコンピュータが音声認識装置110の 機能を達成する。さらに、第1図の幾つかの他の制御システムのブロックも部分 的にC0DEC/FI LTERおよびDSP (デジタル信号プロセッサ)の 助けにより同じマイクロコンピュータによって実施される。ブロック110の機 能を達成するために用いることができる代表的な音声認識用のハードウェアはジ ェイ・ベカム、ジェイ・グリーン、ジェイ・キャニング、およびビー・スティー ブンズによる「実時間ハードウェア連続音声認識システム」と題する”響 3  および−昇 理にるIEEE国際会−(1982年5月3日−5日)、第2巻、 pp、863−866の論文、およびそこに含まれた参考文献に記載されている 。しかしながら、本発明はいずれの特定のハードウェアにもあるいはいずれの特 定の形式の音声認識にも限定されない、より特定的には、本発明は通話者に依存 するあるいは通話者に依存しない音声認識、分離されたあるいは連続的なワード 認識、そしてソフトウェアベースのあるいはハードウェアベースの実施の使用を 意図するものである。
デバイスコントローラ120は典型的には音声通信装置140、音声認識装置1 10、そして音声合成装置130の間をインタフェースするマイクロプロセッサ である。デバイスコントローラ120は音声認識装置110によって提供される デバイス制御データ112を特定の音声通信装置によって認識し得る制御信号に 翻訳する。これらの制御信号は装置に使用者によって指令された特定の動作機能 を達成するよう指示する0例えば、もし使用者の話した発声が予め規定された電 話番号のシーケンスであれば、デバイスコントローラ120はコントローラバス 148を介して適正なダイヤル信号を生成するであろう、コントローラ1あるい は任意の数の他の動作機能のような、音声通信装置140の他の特徴機能の音声 コマンド制御を行なうことができる。
デバイスコントローラ120はまた音声通信装置140の動作ステータスを表わ す装置ステータスデータ122を提供する。このデータは音声合成装置130に 印加され、スピーカ176を介して出力された時使用者に認識可能な音声に翻訳 される0例えば、使用者の話した発声がデジットシーゲンスを終了させるための 予め規定されたコマンドキーワードに対応する時、音声合成装置130は認識さ れた電話番号を使用者への返答として合成する。ステータスデータ122はまた 名前および電話番号(「オフィス(Office)」、’555−1234」等 ) 、音声認識応答m報(「レディ(Ready) J、「終了? (Ter1 nate?)」等)、あるいは無I!電話ステータス情報(「呼ドロップ(Ca lf Dropped)」、「システムビジィ(systen Busy) J 等)に関する情報を含むことができる。
本実施例においては、音声合成装置130として19チヤネルのボコーダが使用 されている。そのようなボコーダの例はジェイ・エヌ・ホルムズ、rJSRUチ ャネルボコーダJ、IEE紀要、第127巻、パートF、第1号、1980年2 月、pp、53−60に見ることができる。しかしながら、当業者に明らかなよ うに、任意の音声合成装置を利用することができる。さらに、本発明は、使用者 に指示を提供できる任意の手段が音声合成ブロック130の基本的な応答機能を 達成できることを考えている2例えば、任意の可視的表示器(例えば、LED、 LCD、CRT、その他)あるいは可聴表示器(例えば、トーン発生器または他 の可聴信号発生器)に置換えることができる。さらに、好ましい実施例において は、14桁の電話番号ディスプレイが現在認識されている桁の使用者への付加的 な表示を連続的に提供する。
制御メモリ134、これは典型的にはランダムアクセスメモリ(RAM)である が、は音声認識装置110によって認識される複数のキーワードを格納する。メ モリバス136はキーワード入力のプロセス中に制御メモリ134に情報を送り 、かつキーワードの認証プロセスの間にデバイスコントローラ120によって格 納された情報へのアクセスを提供する。もし音声合成装置110または音声通信 装置140がデジット入力格納機能を行なうために内部RAMを導入しておれば 、外部制御メモリ134は省略できる。
音声アクティビティ検出器114は好ましい実施例においてはエネルギを基準と した検出器である。検出器114は音声認識装置からの情報を利用することによ りさらに高度の機構に置換えることができる。いずれの場合においても、音声ア クティビティ検出器114は音声アクティビティに対して入力音声信号158を 監視する機能を達成し、それによりデバイスコントローラ120が認識されるべ き音声が存在するか否かを判定できるように°する。検出器114に用いること ができる代表的な技術については、アール・ジェイ・フローレイおよびエム・エ ル・マルパスによる、「ソフトデシジョンノイズ抑圧フィルタを用いた音声増強 J、IEEB”響 立 およびけ 理に る糸l A S S P −28巻、 第2号(1980年4月)、pp137−145、を参照されたい。
タイマブロック124は最後のキーワードが認識されてから経過した時間を計測 するのみならず、先の音声活動から経過した時間の計測をも与える。これらの時 間インターバルはデータバス126を介してコントローラ120により初期化さ れ、監視され、かつリセットすることができる。
再び、これらのタイマのさらに詳細な説明についてはフローチャートの記述を参 照されたい。
スピーカホン150はハンドフリー制御システムの受信/応答オーディオ多重化 機能のみならず、送信/受信オーディオのスイッチング機能を行なう、使用者の 話した入力音声はマイクロホン152に印加され、このマイクロホン152は典 型的には使用者の口から離れて遠隔的に取付けられる(例えば、自動車の日よけ 板に取付けられる)、マイクロホン152は電気的入力音声信号を発生し、この 信号は次に前置増幅器153によって増幅されてスピーカホン150に入力音声 信号154を提供する。スピーカホン150は154における入力音声信号を入 力信号ライン158を介して音声認識装置110に向ける。
単信システムにおいては、移動無線の使用者が話している時、信号検出装置16 0は検出器出力162を介して正の制御信号を提供し送信オーディオスイッチ1 56を閉じ、かつ検出器出力164を介して負の制御信号を提供し受信オーディ オスイッチ166を開く、逆に、陸線パーティが話している時、信号検出器16 0は受信オーディオスイッチ166を閉じるために逆極性の信号を提供し、一方 送信オーディオスイッチ156を開く、受信オーディオスイッチ166が閉じら れている時、音声通信装置140からの受信機オーディオ146は受信オーディ オスイッチ166を通りスイッチされた受信オーディオ出力168を介してマル チプレクサ170に向けられる。マルチプレクサ170は音声合成装置130か らの音声応答オーディオ132およびスイッチされた受信オーディオ168の間 のオーディオ経路をデバイスコントローラ120からのマルチプレクサ信号信号 128に応じて制御する。デバイスコントローラが情報を音声合成装置に送る時 は常に、マルチプレクサ信号128はマルチプレクサ170を音声応答オーディ オをスピーカに向けるよう指示する。車両用スピーカホンオーディオ172は通 常スピーカ176に印加される前にオーディオ増幅器174により増幅される。
ここに説明された車両用スピーカホンの実施例は多くの可能な構成の内の1つに すぎない0例えば、音声認識装置110は常に、陸線パーティが話しているか否 かに係わらず移動無線の使用者のコマンドに応答することが望まれるであろう、 そのような場合、入力音声信号154は直接音声認識装rIt110に接続され る。さらに幾つかの通信システムにおいては、オーディオスイッチ156および 166を信号検出装置からの制御信号に応答して等しいが逆の減衰を提供する可 変利得装置に置換えることが好都合であるかもしれない、信号検出装置160は またデバイスコント0−5120に陸線パーティまたは移動使用者のいずれが話 しているかを表示するための信号を供給することができ、これは陸線パーティか らの音声を誤って認識することを防止するために使用できる。
今までの説明で明らかであるように、デバイスコントローラ120は使用者相互 作用的ハンドフリー音声コマンド制御システム100の心臓部である。技術上知 られておりかつ本発明に適したデバイスコントローラの一例はマイクロプロセッ サである。デバイスコントローラ120の詳細な動作は引続き制御システム10 0に対するソフトウェアフローチャートによって説明される。しかしながら、発 明を理解するために、以下の例は雑音の多い環境において特定の桁シーケンスを 入力する場合を説明するために使用される。この例は本発明の特徴および利点を 明瞭に示している。
使用者がダイヤルシステムに完全な桁シーゲンス1−2−3−4−5−6−7を 入力することを希望するものと仮定する。ここで用いられているように、完全な キーワード「シーケンス」 (例えば、1−2−3−4−5−6−7 )は1つ またはそれ以上の部分シーケンスのキーワードの「ストリングj (例えば、1 −2−3゜4.5−6.7)で構成され、この場合各ストリングは予め規定され た休止時間インターバル、即ち音声活動のない時間により分離される。v、用者 は最初に[エンター(ENTER) Jのような口頭でのコマンドにより制御シ ステムを行入力モードに向ける。
システムは次にワード「デジット(DIGITS) Jのような合成された応答 で返答する。
自動車の中のような、ノイズの多い環境では、音声認識の精度は背景ノイズによ りしばしば制限される。従って、使用者は完全な桁シーケンスt −2−3−4 −5−6−7を3個の部分的シーケンスの桁ストリング、即ち、1−2−3.4 −5.6−7で入力することを決定できる。各ストリングは任意の長さにするこ とができることに注意を要する。使用者は次に「ワン・ツク・スリー」の発声を 行ない、かつ次に休止する。もしいずれのキーワードも認識されなければ、いず れの桁もディスプレイに現われず、がっ制御システムは合成されたワード「リピ ート(REPE八旬」へ応答するであろう。
従って、使用者は再び「ワン・ツク・スリー」を発声し、これに休止が続く、も しこの桁ストリングが「ワン・スリー・スリー」として誤って認識されれば、表 示装置は1−3−3を表示し、かつ合成装置は音声による確認「ワン・スリー・ スリーJで応答するであろう、これは正しくないから、使用者は次にコマンドワ ード「クリア(CLEAR) Jを発音する。このコマンドキーワードの認識に 応じて、システムは最も最近の桁ストリングをクリアし、全シーケンスがクリア されたことを表示するために2回の「ビープ」を生成し、次に表示装置を消去す る。
再び、使用者は「ワン・ツク・スリー」を発音し、次に3秒の休止期間を続ける 。もし正しい桁ストリングニー2−3が認識されれば、1−2−3がディスプレ イに現れ、合成装置は「ワン・ツク・スリー」と応答する。#l用者は次に「フ ォア・ファイブJの発音を続け、その後他の休止を与える。もしこれらの発声が 背景ノイズのなめに4−6と誤って認識されれば、1−2−3−4−6がディス プレイ上に現れ、かつ合成装置は「フォア・シックスjと応答するであろう、こ のfitIeの桁ストリグを訂正するために、使用者は「クリア」を発音する。
I&後の桁ストリング4−6のみがクリアされ、かつディスプレイは再び1−2 −3を表示する0合成装置は次に単一の[ビープ」をもって応答し使用者に最も 最近の桁ストリングのみがクリアされたこと、および先に入力されたストリング はメモリに残っていることを表示する。ふたたび、使用者は「フォア・ファイブ 」を発声しその後休止を続ける。もし正しく認識されれば、合成装置は「フォア ・ファイブ」と応答し、かつディスプレイは1−2−3−4−5を表示する。
このシーケンスに続き、使用者は「シックス・セブン」を発生し、これに他の休 止期間が続く、もし正しく認識されれば、全シーケンス1−2−3−4−5−6 −7が表示され、かつ合成装置は、認識された最後の桁ストリングを表わす、コ ンファメーション「シックス・セブン」によって応答する。全桁シーケンスが今 や入力されながら、使用者はコマンド「ターミネートJを発生する0次に合成装 置は全シーケンス「ワン・ツク・スリー・フォア・ファイブ・シックス・セブン Jによって応答する0表示1−2−3−4−5−6−7が全桁シーケンスを認証 するため維持される。
第2a図および第2b図は、桁シーゲンス入力手順の量制御システム100によ って行なわれるシ〜ゲンスのステップを記述する。好ましい実施例においては、 コントローラのダイヤルシーケンスはコマンドワードENTERの認識に応じて ステップ202でスタートする。ステップ204においてコントローラメモリ1 34のメモリロケーションを初期化するため、スタートポインタSPおよびエン ドポインタEPがメモリロケーション0(ゼロ)に初期化される。ステップ20 6において応答フラグがリセットされ、そしてタイマブロック124の休止タイ マおよび認識タイマがステップ208においてゼロにリセットされる。
ステップ210においては、コントローラは音声認識装置がOないし9の単−桁 に対応する何らかのキーワードを認識したか否かを判定する。もし単−桁が認識 されておれば、ステップ212において応答フラグがテストされる。
もし応答フラグが先にセットされておれば、使用者の先の桁に未だ返答されてい ない少なくとも1つの桁が格納される。従って、特定の桁ストリングにおける最 初に格納された桁のメモリロケーションを示す、スタートポインタSPが合せら れるべきではない、しなしながら、もし応答フラグがセットされておらなければ 、認識された現在の桁はストリングの最初の桁を表わす、その場合、ステップネ 14はスタートポインタSPを現在の桁が格納される場所に対応するメモリロケ ーションに更新する。
ステップ216においては、認識された桁(デジット)がコントローラメモリ1 34のエンドポインタにEPに対応するメモリロケーションに格納される。エン ドポインタEPは次にステップ218において増分され次に利用可能なメモリロ ケーションを指示するようにされる0両方のタイマが次にステップ220におい てリセットされる。応答フラグがステップ221においてセットされるが、これ はデジットが今や格納されているからである。制御は次にステップ210に戻り 認識されるべき次のデジットを待機する。
もしステップ210において何らの桁キーワードも認識されなければ、制御はス テップ222に進み停止コマンドキーワードが認識されたか否かをチェックする 。好ましい実施例においては、行入力手順の終了を表わすために使用されるコマ ンドキーワードとしてワードTERM I NATEが選択された。もしTER MINATEが認識されれば、ステップ224において全桁シーケンスが音声合 成装W、130により返送される0合成されるべき桁シーゲンスはメモリロケー ションZERO(ゼロ)で始まりかつメモリロケーションEP−1で終わる、メ モリ134を読取ることによって得られる6次に、この完全な桁シーケンスがス テップ226において音声通信装置140に出力される0桁入力手順はステップ 228において終了する。
TERMINATEコマンドが認識された後は何らの桁編集手順も行なわれない ことに注意を要する。音声合成による桁シーケンスの確認のみが与えられ、かっ 全桁シーケンスが可視的ディスプレイに残る0例えば、もし使用者がその直後に ワードTERMINATEが続く全桁シーケンスを発声すれば、システムは認識 されたシーケンスが正しいものと仮定する。この入力モードは認識精度が高いも のと期待されている場合に使用される。しかしながら、使用者はステップ202 において行入力手順を再スタートすることにより何らかのエラーを修正すること を希望できるため、ステップ228の後でエラーが訂正できないということを意 味するものではない、一層重要なことには、使用者は常にTERMINATEの ワードの前に休止(ボーズ)を挿入することにより丁度入力した桁ストリングを 訂正するオプションを常に有している。従って、使用者は訂正手順を相互作用的 に用い、あるいはキーワードシーケンスを迅速に入力しかつ確認するために柔軟 性を有している。
もしコマンドキーワードTERMI NATEがステップ222において認識さ れなければ、コントローラはコマンドキーワードCLEARがステップ230に おいて認識されたか否かを見るためにチェックを行なう、もしCLEARコマン ドが認識されておれば、ステップ232において音声合成装置によりオーディオ 返答信号が出力される。好ましい実施例においては、音声合成装置は単一の「ビ ープトーンを発生ずるよう指令される。しかしながら、数多くの他の確認信号を 選択することもできる。ステップ234において、コントローラはOまなは1つ の桁ストリングが入力されたか否かを、スタートポインタSPがゼロか否かをチ ェックすることによって、判定する。もし1つのストリングのみが入力されてお れば、単一のストリングをクリアすることが全桁シーケンスをクリアすることと 等価である。従って、第2のビープトーンがステップ244において指示され使 用者に、最後のストリングだけでなく、全シーケンスがクリアされた事を通知す る。もし何らの桁ストリングも入力されておらなければ、ステップ234におけ るテストはまたステップ244に移行する結果となり、これはスタートポインタ SPが依然としてゼロであるからである。もし1個より多くのストリングが入力 されておれば、コントローラはステップ236において連続的なCLEARコマ ンドキーワードが認識された2回目である、即ちこれは使用者が全シーケンスを クリアすることを希望している状態を意味する、場合であるかを見るためチェッ クを行なう、2番目の連続するCLEARはスタートポインタSPがエンドポイ ンタEPに等しいかどうかチェックすることにより容易に判定することができる 。もし第2の連続的CLEARキーワードが認識されておれば、コントローラは 再びステップ244に進み音声合成装置により第2のビープトーンを出力する。
CLEARコマンドが認識された最初の時である場合、かつもし1つより多くの ストリングが入力されておれば、制御はステップ238に進み最後に入力された 桁ストリングのみをクリアする。メモリポインタに関しては、桁ストリングはエ ンドポインタEPをスタートポインタSPのロケーションに等しくセットするこ とによりクリアされる。応答フラグがステップ240においてリセットされるが 、これは応答されていない桁ストリングは何ら残っていないからである。ステッ プ242はタイマをリセットし、かつ制御は次にステップ210において次の桁 を認識するために戻る。
先に述べたように、もし1つのストリングのみが入力されておれば、あるいはも し2つの連続するCLEARコマンドが認識されておれば、第2のビープトーン がステップ244において出力される。全桁シーケンスが次にステップ246に おいてクリアされる0桁シーケンスをクリアするため、スタートポインタSPお よびエンドポインタEPが共にステップ204においてなされたようにメモリロ ケーションO(ゼロ)に等しくセットされる。ステップ248は応答フラグをリ セットするが、これはメモリに何らの桁ストリングも残っていないからである。
ステップ250はタイマをリセットする。制御は再びステップ210において次 のキーワードを捜すために戻る。
もしステップ210において何らの桁キーワードも認識されなければ、ステップ 222においてTERMINATEは認識されず、かつCLEARがステップ2 30において認識され、次に制御はステップ252に進み音声アクティビティ検 出器114からのアクティビティライン116をチェックする。もし音声活動( アクティビティ)があれば、休止タイマのみがステップ254においてリセット され、かつ制御はステップ210において次の桁を捜すために戻る。
逆に、音声活動がなければ、休止タイマがステップ256においてチェックされ それが経過したか否がが判定される。好ましい実施例においては、休止タイマは 音声活動が3秒間なかった後に経過する。もし休止タイマが経過しておらなけれ ば、制御は再びステップ210に戻る。しかしながら、もし3秒の休止が検出さ れれば、ステップ258において応答フラグが試験され桁ストリングが返答され るべきか否かが判定される。もし応答フラグが先にステップ221においてセッ トされておれば、ステップ258は制御をステップ260に移しそこで最後に入 力された桁ストリングが音声合成を介して使用者に返答される。再び、メモリポ インタに介しては、最後に入力された桁ストリングがメモリロケーションSPで 始まり、かつメモリロケーションEP−1に続く、応答フラグがステップ262 においてリセットされかつタイマがステップ264においてリセットされ、その 後制御は再びステップ210に移される。
今だ返答されていない何らの桁も認識されていないことを意味する、応答フラグ がセットされていない状態であれば、認識タイマがステップ268においてテス トされる。
認識タイマは今だ認識されていない音声活動が生じたか否かを判定するために使 用される。ステップ268は単に認識タイマが休止タイマより大きいか否かを判 定する。双方のタイマは常に、音声活動が認識なしに生じている、ステップ25 4の場合を除き共にリセットされるから、認識タイマを休止タイマと比較するこ とが適切になる。休止タイマが経過したから、ステップ268において休止タイ マの値は丁度3秒になる。これは最後の音声活動から3秒が経過したことを示す 、もしキーワードが認識されてから3秒より多くが生じておれば、認識タイマは 休止タイマを越えるであろう0例えば、もし使用者が2秒間話し、次に3秒間休 止したが、何も認識されなかった場合には、認識タイマは少なくとも5秒の値を 有し、一方体止タイマは3秒となっているであろう、この場合、制御はステップ 270に進みそこで合成装置はワードREPEATを使用者に返送するよう指示 される。ステップ272において双方のタイマがリセットされ、制御は次に桁認 識ステップ210に戻る。
しかしながら、もしステップ268においてタイマが等しければ、何らの音声活 動も3秒より長く生じていないこととなる。この場合、制御はステップ276に 進みそこで認識タイマがテストされる。好ましい実施例においては、認識タイマ は何らの音声認識もない6秒の後に経過する。
もしそのような場合であれば、合成装置はステップ278においてワードTIM EOUTを返送して使用者に行入力手順がステップ280において終了したこと を通知するよう指令される。もし認識タイマがまだ経過しておらなければ、制御 は再び戻りステップ210において音声活動を監視し続ける。
以上要するに、本発明は音声コマンドにより一連のキーワードを入力しかつ認証 するための高度に相互作用的でありかつ使用者に親しみ易い方法を提供すること が理解できる。上述のように、本制御システムは可変長の桁ストリングを入力す る場合、および桁ストリングの間で選択的に休止することにより認証プロセスを 制御する場合に使用者に大きな柔軟性を許容する。もし高い認識精度が期待され る場合には、使用者は休止することなく全桁シーケンスを迅速に入力できる。こ れに対し、認識精度が劣化している条件下では、使用者は任意の桁数が話された 後に休止することにより部分的なシーケンスの桁ストリングにつき認証を要求す るオプションを有している。
本発明の特定の実施例が示されかつ説明されたが、当業者により他の変形および 改良を成すことができる。特に、コマンドワードCLEARおよびTERMI  NATE、または応答ワードBEER,REPEAT、およびTIMEOUTは 好ましい実施例においては特定の用途に対し代表的な英語ワードとしてのみ選択 されたことを認識すべきである。しかしながら、他のコマンドワードおよび応答 ワードももし望むなら、特に異なる言語と共に使用するために、選択することが できる。数多くのハードウェアおよびソフトウェア的な修正もまた本キーワード 入力方法を種々の他の応用に適応させるなめに行なうことができる。ここに開示 されかつ請求された基本的な内にある原理を保持するすべてのそのような変更は 本発明の範囲内にあるものである。
r− 補正書の写しく翻訳文)提出書く特許法第184条の8)平成2年4月11日 特許庁長官 吉 1)文 毅 殿 PCT/US88102851 、発明の名称 音声コマンドによりデジットシーゲンスを入力するための方法3、特許出願人 住 所 アメリカ合衆国イリノイ州60196、シャンバーブ、イースト・アル ゴンフィン・ロード1303名 称 モトローラ・インコーホレーテッド代表者  ギルマン・ジエームズ ダブリュ4、代理人 住 所 〒231神奈川県横浜市中区本町1丁目7番地東ビル 電話045 ( 211)27955、補正書の提出年月日 1989年12月12日請求の範囲 1(補正)、1!イン −パルによって されt・之mユ9可変長の音声の発声 ストリングに含まれるキーワードを認識する段階、 発声ストリングが所定の休止期間の開停止した後休止信号を提供する段階、 前記休止信号に応答して、使用者に前記休止信号の前に生じた発声ストリングに 対応する認識された特定のキーワードの表示を使用者に提供する段階、そして前 記休止信号に応答してかつ前記休止信号の後に生じた発声ストリングに含まれる 所定のエラーコマンドキーワードの認識に応答して特定のキーワードを訂正する 段階、を具備することを特徴とする電子的装置を制御するためのユーザ相互作用 的方法。
2、前記認識[tは特定の認識されたキーワードをメモリに格納する段階を含む 請求項1に記載の方法。
3、前記表示提供段階は前記の格納されたキーワードをメモリから読出す段階を 含む請求項2に記載の方法。
4、前記訂正段階は前記所定のエラーコマンドキーワードの認識の使用者に対す る表示を提供する段階を含む請求項1に記載の方法。
5、前記訂正段階は前記所定のエラーコマンドキーワードの認識に応答して、前 記休止信号の前に生じた最後の発声ストリングのみに対応する格納されたキーワ ードをメモリからクリアする段階を含む請求項2に記載の方法。
6、前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ ードをクリアする段階、 を含む請求項2に記載の方法。
7、さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし て そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段 階、 を具備する請求項2に記載の方法。
8、前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声 の生じたことの使用者への表示を提供する段階を含む請求項1に記載の方法。
9、前記所定の休止時間は5秒より大きくない請求項1に記載の方法。
10、休止時間インターバルによって分離された少なくとも2つの可変長音声発 声ストリングに含まれるキーワードを認識するための手段、 発声ストリングが所定の休止期間の開停止した後休止信号を提供するための手段 、 前記休止信号に応答して、前記休止信号の前に生じた最後の発声ストリングに対 応する認識された特定のキーワードの使用者に対する表示を提供するための手段 、そして前記休止信号にさらに応答し、前記休止信号の後に生じた次の発声スト リングに含まれる所定のエラーコマンドキーワードの認識に応答して前記特定の キーワードを訂正するための手段、 を具備することを特徴とする使用者相互作用的音声認識制御装置。
11、前記制御装置は電話通信装置のための自動ダイヤル装置である請求項10 に記載の装置。
12、前記電話通信装置は無線電話装置である請求項11に記載の装置。
13、前記電話通信装置はスピーカホンを含む請求項11に記載の装置。
14、前記認識手段は連続ワード音声認識を実施する請求項10に記載の装置。
15、前記認識手段は特定の認識されたキーワードをメモリに格納するための手 段を含む請求項10に記載の装置。
16、前記表示提供手段は前記の格納されたキーワードをメモリから読取るため の手段を含む請求項15に記載の装置。
17、前記表示提供手段は音声合成装置を含む請求項10に記載の方法。
18、前記表示提供手段は可視的ディスプレイを含む請求項10に記載の装置。
19、前記所定の休止時間は5秒より大きくない請求項10に記載の装置。
20、前記訂正手段は前記所定のエラーコマンドキーワードの認識の使用者への 表示を提供するための手段を含む請求項10に記載の装置。
21、前記訂正手段はさらに前記所定のエラーコマンドキーワードの認識に応答 して、前記休止信号の前に発生した最後の発声ストリングのみに対応する格納さ れたキーワードをメモリからクリアするための手段を含む請求項15に記載の装 置。
22、前記訂正手段はさらに、 連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 するための手段、そしてそのような認識に応答してメモリに格納されたすべての キーワードをクリアするための手段、 を含む請求項15に記載の装置。
23゜前記表示提供手段はさらに何らの対応するキーワードの認識なく音声の発 声の生じたことの使用者への表示を提供するための手段含む請求項10に記載の 装置。
24、さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識するための手段 、そして そのような認識に応答してメモリに格納されたすべてのキーワードを出力するた めの手段、 を具備する請求項15に記載の装置。
25、複数の可変長発声ストリングからなる全シーケンスの音声の発声を前記全 シーケンスに含まれるキーワードに対応するデータ出力を提供する音声認識コン トローラに入力するための方法であって、各発声ストリングには休止時間インタ ーバルが続き、かつ各発声ストリングは少なくとも1つのキーワードを含み、前 記方法は(a)fi初のキーワードセットに対応する第1の発声ストリングを認 識する段階、 (b)前記第1の認識されたキーワードセットを読取り/書込みメモリに格納す る段階、 (c)前記第1の発声ストリングが所定の休止期間の開停止した後休止信号を提 供する段階、 (d)前記休止信号に応答して前記第1の格納されたキーワードセットをメモリ から取出す段階、(e)少なくとも前記第1の取出されたキーワードセットの使 用者への表示を提供する段階、 (f>所定のエラーコマンドキーワードに対応する第2の発声ストリングを認識 する段階、そして(g)前記所定のエラーコマンドキーワードの認識に応答して 前記第1の格納されたキーワードセットを訂正する段階、 を具備することを特徴とする前記方法。
26、前記認識段階は連続ワード音声認識を行なう請求項25に記載の方法。
27、前記表示提供段階は前記最初のキーワードセットにのみ対応する音声を合 成する段階を含む請求項25に記載の方法。
28、前記表示提供段階はさらにすべての格納されたキーワードを可視的に表示 する段階を含む請求項25に記載の方法。
29、前記所定の休止時間は5秒より大きくない請求項25に記載の方法。
30、前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識の使用 者への表示を提供する段階を含む請求項25に記載の方法。
31、前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識に応答 して前記第1の格納されたキーワードのみをメモリからクリアする段階を含む請 求項25に記載の方法。
32、前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ ードをクリアする段階、 を含む請求項25に記載の方法。
33、さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし て そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段 階、 を具備する請求項25に記載の方法。
34、前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発 声が生じたことの使用者への表示を提供する段階を含む請求項25に記載の方法 。
国際調査報告

Claims (34)

    【特許請求の範囲】
  1. 1.1つまたはそれ以上の可変長の音声の発声ストリングに含まれるキーワード を認識する段階であって、各発声ストリングには休止時間インターバルが続くも の、発声ストリングが所定の休止期間の間停止した後休止信号を提供する段階、 前記休止信号に応答して、使用者に前記休止信号の前に生じた発声ストリングに 対応する認識された特定のキーワードの表示を使用者に提供する段階、そして前 記休止信号に応答してかつ前記休止信号の後に生じた発声ストリングに含まれる 所定のエラーコマンドキーワードの認識に応答して特定のキーワードを訂正する 段階、を具備することを特徴とする電子的装置を制御するためのユーザ相互作用 的方法。
  2. 2.前記認識段階は特定の認識されたキーワードをメモリに格納する段階を含む 請求項1に記載の方法。
  3. 3.前記表示提供段階は前記の格納されたキーワードをメモリから読出す段階を 含む請求項2に記載の方法。
  4. 4.前記訂正段階は前記所定のエラーコマンドキーワードの認識の使用者に対す る表示を提供する段階を含む請求項1に記載の方法。
  5. 5.前記訂正段階は前記所定のエラーコマンドキーワードの認識に応答して、前 記休止信号の前に生じた最後の発声ストリングのみに対応する格納されたキーワ ードをメモリからクリアする段階を含む請求項2に記載の方法。
  6. 6.前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ ードをクリアする段階、 を含む請求項2に記載の方法。
  7. 7.さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし て そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段 階、 を具備する請求項2に記載の方法。
  8. 8.前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発声 の生じたことの使用者への表示を提供する段階を含む請求項1に記載の方法。
  9. 9.前記所定の休止時間は5秒より大きくない請求項1に記載の方法。
  10. 10.休止時間インターバルによって分離された少なくとも2つの可変長音声発 声ストリングに含まれるキーワードを認識するための手段、 発声ストリングが所定の休止期間の間停止した後休止信号を提供するための手段 、 前記休止信号に応答して、前記休止信号の前に生じた最後の発声ストリングに対 応する認識された特定のキーワードの使用者に対する表示を提供するための手段 、そして前記休止信号にさらに応答し、前記休止信号の後に生じた次の発声スト リングに含まれる所定のエラーコマンドキーワードの認識に応答して前記特定の キーワードを訂正するための手段、 を具備することを特徴とする使用者相互作用的音声認識制御装置。
  11. 11.前記制御装置は電話通信装置のための自動ダイヤル装置である請求項10 に記載の装置。
  12. 12.前記電話通信装置は無線電話装置である請求項11に記載の装置。
  13. 13.前記電話通信装置はスピーカホンを含む請求項11に記載の装置。
  14. 14.前記認識手段は連続ワード音声認識を実施する請求項10に記載の装置。
  15. 15.前記認識手段は特定の認識されたキーワードをメモリに格納するための手 段を含む請求項10に記載の装置。
  16. 16.前記表示提供手段は前記の格納されたキーワードをメモリから読取るため の手段を含む請求項15に記載の装置。
  17. 17.前記表示提供手段は音声合成装置を含む請求項10に記載の方法。
  18. 18.前記表示提供手段は可視的デイスプレイを含む請求項10に記載の装置。
  19. 19.前記所定の休止時間は5秒より大きくない請求項10に記載の装置。
  20. 20.前記訂正手段は前記所定のエラーコマンドキーワードの認識の使用者への 表示を提供するための手段を含む請求項10に記載の装置。
  21. 21.前記訂正手段はさらに前記所定のエラーコマンドキーワードの認識に応答 して、前記休止信号の前に発生した最後の発声ストリングのみに対応する格納さ れたキーワードをメモリからクリアするための手段を含む請求項15に記載の装 置。
  22. 22.前記訂正手段はさらに、 連携する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 するための手段、そしてそのような認識に応答してメモリに格納されたすべての キーワードをクリアするための手段、 を含む請求項15に記載の装置。
  23. 23.前記表示提供手段はさらに何らの対応するキーワードの認識なく音声の発 声の生じたことの使用者への表示を提供するための手段含む請求項10に記載の 装置。
  24. 24.さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識するための手段 、そして そのような認識に応答してメモリに格納されたすべてのキーワードを出力するた めの手段、 を具備する請求項15に記載の装置。
  25. 25.複数の可変長発声ストリングからなる全シーケンスの音声の発声を前記全 シーケンスに含まれるキーワードに対応するデータ出力を提供する音声認識コン トローラに入力するための方法であって、各発声ストリングには休止時間インタ ーバルが続き、かつ各発声ストリングは少なくとも1つのキーワードを含み、前 記方法は(a)最初のキーワードセットに対応する第1の発声ストリングを認識 する段階、 (b)前記第1の認識されたキーワードセットを読取り/書込みメモリに格納す る段階、 (c)前記第1の発声ストリングが所定の休止期間の間停止した後休止信号を提 供する段階、 (d)前記休止信号に応答して前記第1の格納されたキーワードセットをメモリ から取出す段階、(e)少なくとも前記第1の取出されたキーワードセットの使 用者への表示を提供する段階、 (f)所定のエラーコマンドキーワードに対応する第2の発声ストリングを認識 する段階、そして(g)前記所定のエラーコマンドキーワードの認識に応答して 前記第1の格納されたキーワードセットを訂正する段階、 を具備することを特徴とする前記方法。
  26. 26.前記認識段階は連続ワード音声認識を行なう請求項25に記載の方法。
  27. 27.前記表示提供段階は前記最初のキーワードセットにのみ対応する音声を合 成する段階を含む請求項25に記載の方法。
  28. 28.前記表示提供段階はさらにすべての格納されたキーワードを可視的に表示 する段階を含む請求項25に記載の方法。
  29. 29.前記所定の休止時間は5秒より大きくない請求項25に記載の方法。
  30. 30.前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識の使用 者への表示を提供する段階を含む請求項25に記載の方法。
  31. 31.前記訂正段階はさらに前記所定のエラーコマンドキーワードの認識に応答 して前記第1の格納されたキーワードのみをメモリからクリアする段階を含む請 求項25に記載の方法。
  32. 32.前記訂正段階はさらに、 連続する発声ストリングに含まれる2つの同じエラーコマンドキーワードを認識 する段階、そしてそのような認識に応答してメモリに格納されたすべてのキーワ ードをクリアする段階、 を含む請求項25に記載の方法。
  33. 33.さらに、 発声ストリングに含まれる所定の停止コマンドキーワードを認識する段階、そし て そのような認識に応答してメモリに格納されたすべてのキーワードを出力する段 階、 を具備する請求項25に記載の方法。
  34. 34.前記表示提供段階はさらに何らの対応するキーワードの認識なく音声の発 声が生じたことの使用者への表示を提供する段階を含む請求項25に記載の方法 。
JP63508908A 1987-10-19 1988-08-24 音声コマンドによりデジットシーケンスを入力するための方法 Expired - Lifetime JPH0782351B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US07/110,144 US4870686A (en) 1987-10-19 1987-10-19 Method for entering digit sequences by voice command
PCT/US1988/002851 WO1989004035A1 (en) 1987-10-19 1988-08-24 Method for entering digit sequences by voice command
US110,144 1993-08-20

Publications (2)

Publication Number Publication Date
JPH03500693A true JPH03500693A (ja) 1991-02-14
JPH0782351B2 JPH0782351B2 (ja) 1995-09-06

Family

ID=22331440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63508908A Expired - Lifetime JPH0782351B2 (ja) 1987-10-19 1988-08-24 音声コマンドによりデジットシーケンスを入力するための方法

Country Status (9)

Country Link
US (1) US4870686A (ja)
EP (1) EP0389514B1 (ja)
JP (1) JPH0782351B2 (ja)
KR (1) KR0129856B1 (ja)
AT (1) ATE136146T1 (ja)
CA (1) CA1312668C (ja)
DE (1) DE3855164T2 (ja)
MX (1) MX165502B (ja)
WO (1) WO1989004035A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236091A (ja) * 2000-02-23 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> 音声認識結果の誤り訂正方法およびその装置

Families Citing this family (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02209055A (ja) * 1989-02-09 1990-08-20 Toshiba Corp 電話装置
AU650845B2 (en) * 1989-08-28 1994-07-07 K. Michael Sekins Lung cancer hyperthermia via ultrasound and/or convection with perfluorocarbon liquids
US5175759A (en) * 1989-11-20 1992-12-29 Metroka Michael P Communications device with movable element control interface
US5095503A (en) * 1989-12-20 1992-03-10 Motorola, Inc. Cellular telephone controller with synthesized voice feedback for directory number confirmation and call status
US5268959A (en) * 1990-06-22 1993-12-07 Hong Inpon D Telephone long distance redialing apparatus and process
WO1992003882A1 (en) * 1990-08-20 1992-03-05 Motorola, Inc. Dialing editing method and apparatus
US6002558A (en) * 1990-09-18 1999-12-14 Rines; Carol Mary Method of and apparatus for expanding functionality of vehicle cassette tape-player decks to permit dictation or other recording and automatic remote station relaying of the same
US5201028A (en) * 1990-09-21 1993-04-06 Theis Peter F System for distinguishing or counting spoken itemized expressions
US5315688A (en) * 1990-09-21 1994-05-24 Theis Peter F System for recognizing or counting spoken itemized expressions
US5155689A (en) * 1991-01-17 1992-10-13 By-Word Technologies, Inc. Vehicle locating and communicating method and apparatus
US5539810A (en) * 1992-01-27 1996-07-23 Highwaymaster Communications, Inc. Data messaging in a communications network
US5983108A (en) * 1992-01-27 1999-11-09 Highwaymaster Communications, Inc. Method and apparatus for a nation-wide cellular telephone network
US5454027A (en) * 1992-01-27 1995-09-26 Hm Holding Corporation Phantom mobile identification number method and apparatus
GB2264209B (en) * 1992-02-06 1995-11-08 Technophone Ltd Cordless telephone arrangement
US5371779A (en) * 1992-03-13 1994-12-06 Nec Corporation Call initiating system for mobile telephone units
US5297183A (en) * 1992-04-13 1994-03-22 Vcs Industries, Inc. Speech recognition system for electronic switches in a cellular telephone or personal communication network
US5350359A (en) * 1992-07-16 1994-09-27 Temple University Of The Commonwealth System Of Higher Education Control, treatment and/or diagnosis of physiological conditions with degassed perfluorocarbon liquid
DE4225475A1 (de) * 1992-08-01 1994-02-03 Philips Patentverwaltung Einrichtung zur Spracherkennung
US5450525A (en) * 1992-11-12 1995-09-12 Russell; Donald P. Vehicle accessory control with manual and voice response
US5717743A (en) * 1992-12-16 1998-02-10 Texas Instruments Incorporated Transparent telephone access system using voice authorization
US5717738A (en) * 1993-01-11 1998-02-10 Texas Instruments Incorporated Method and device for generating user defined spoken speed dial directories
US5668929A (en) * 1993-01-21 1997-09-16 Hirsch Electronics Corporation Speech activated security systems and methods
US5483579A (en) * 1993-02-25 1996-01-09 Digital Acoustics, Inc. Voice recognition dialing system
US5594784A (en) * 1993-04-27 1997-01-14 Southwestern Bell Technology Resources, Inc. Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
SE9304222L (sv) * 1993-12-21 1995-06-22 Telia Ab Metod och anordning vid samtal från mobilstationer
US5481595A (en) * 1994-03-08 1996-01-02 Uniden America Corp. Voice tag in a telephone auto-dialer
FI96082C (fi) * 1994-04-13 1996-04-25 Ne Products Oy Menetelmä valintavälineellä radiolähetinvastaanottimelle annettavan valintasekvenssin valintojen tulkitsemisessa
US5652903A (en) * 1994-11-01 1997-07-29 Motorola, Inc. DSP co-processor for use on an integrated circuit that performs multiple communication tasks
US5913170A (en) 1994-11-16 1999-06-15 Highwaymaster Communications, Inc. Locating system and method using a mobile communications network
AU705525B2 (en) * 1994-12-02 1999-05-27 Voice Control Systems, Inc. Intelligent call processing platform for home telephone system
US5893037A (en) * 1994-12-09 1999-04-06 Eastman Kodak Company Combined electronic/silver-halide image capture system with cellular transmission capability
US5724243A (en) * 1995-02-10 1998-03-03 Highwaymaster Communications, Inc. Method and apparatus for determining expected time of arrival
US5583925A (en) * 1995-03-22 1996-12-10 Lucent Technologies, Inc. Automatic three-way calling feature for a telecommunications system
FI111893B (fi) * 1995-06-02 2003-09-30 Nokia Corp Menetelmä ja laite puhelimen ohjaamiseksi komennoilla
CA2180392C (en) * 1995-07-31 2001-02-13 Paul Wesley Cohrs User selectable multiple threshold criteria for voice recognition
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens
DE19624988A1 (de) * 1996-06-22 1998-01-02 Peter Dr Toma Verfahren zur automatischen Erkennung eines gesprochenen Textes
US5737491A (en) * 1996-06-28 1998-04-07 Eastman Kodak Company Electronic imaging system capable of image capture, local wireless transmission and voice recognition
FI101333B (fi) * 1996-09-02 1998-05-29 Nokia Mobile Phones Ltd Puhekomennoilla ohjattava telepäätelaite
US5950160A (en) * 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US5899976A (en) * 1996-10-31 1999-05-04 Microsoft Corporation Method and system for buffering recognized words during speech recognition
US5829000A (en) * 1996-10-31 1998-10-27 Microsoft Corporation Method and system for correcting misrecognized spoken words or phrases
US5884258A (en) * 1996-10-31 1999-03-16 Microsoft Corporation Method and system for editing phrases during continuous speech recognition
US5926789A (en) * 1996-12-19 1999-07-20 Bell Communications Research, Inc. Audio-based wide area information system
US6377663B1 (en) * 1997-01-03 2002-04-23 Ncr Corporation Call management system and associated method for a local telephone circuit
DE19709990C2 (de) * 1997-03-11 2000-03-02 Philips Corp Intellectual Pty System zur Erkennung gesprochener Ziffernfolgen
FR2761848B1 (fr) * 1997-04-04 2004-09-17 Parrot Sa Dispositif de commande vocale pour radiotelephone, notamment pour utilisation dans un vehicule automobile
US20040157612A1 (en) * 1997-04-25 2004-08-12 Minerva Industries, Inc. Mobile communication and stethoscope system
FI111673B (fi) * 1997-05-06 2003-08-29 Nokia Corp Menetelmä puhelinnumeron valitsemiseksi puhekomennoilla ja puhekomennoilla ohjattava telepäätelaite
US6163596A (en) * 1997-05-23 2000-12-19 Hotas Holdings Ltd. Phonebook
US5930751A (en) * 1997-05-30 1999-07-27 Lucent Technologies Inc. Method of implicit confirmation for automatic speech recognition
US6473610B1 (en) 1997-06-19 2002-10-29 Byard G. Nilsson Wireless prepaid telephone system with dispensable instruments
US6308053B1 (en) 1997-06-19 2001-10-23 Byard G. Nilsson Recyclable wireless telephone unit with a secured activation switch
US6298250B1 (en) 1997-06-19 2001-10-02 Kimberly Nanette Engen Wireless prepaid telephone system with extended capability
US6751482B1 (en) 1997-06-19 2004-06-15 Byard G. Nilsson Wireless mobile telephone system with alternative power instruments and DTMF Capability
US6862463B1 (en) 1997-06-19 2005-03-01 Byard G. Nilsson Wireless telephone system with information service
US6049710A (en) 1997-06-19 2000-04-11 Kimberley Nanette Engen Wireless prepaid telephone system with dispensable instruments
US6292675B1 (en) 1997-10-21 2001-09-18 Byard G. Nilsson Wireless mobile telephone system with voice-dialing telephone instruments and DTMF capability
US6993321B1 (en) 1997-06-19 2006-01-31 Nilsson Byard G Wireless telephone system with mobile instruments for outgoing calls
US6167118A (en) * 1997-12-30 2000-12-26 Dsc Telecom L.P. Method and a system for by-passing a receiver-off-hook timer for voice dialing systems and for supporting spoken digit dialing
KR100259918B1 (ko) * 1998-03-05 2000-06-15 윤종용 핸즈프리키트의 쇼트메시지 음성합성 장치 및 방법
GB9806401D0 (en) * 1998-03-25 1998-05-20 Domain Dynamics Ltd Improvements in voice operated mobile communications
JP4036528B2 (ja) * 1998-04-27 2008-01-23 富士通株式会社 意味認識システム
US6321195B1 (en) * 1998-04-28 2001-11-20 Lg Electronics Inc. Speech recognition method
US6141010A (en) * 1998-07-17 2000-10-31 B. E. Technology, Llc Computer interface method and apparatus with targeted advertising
JP3001000B1 (ja) * 1998-09-08 2000-01-17 セイコーエプソン株式会社 音声認識装置における連続単語認識方法および音声認識装置における連続単語認識処理プログラムを記録した記録媒体
JP2000115330A (ja) * 1998-09-30 2000-04-21 Nec Corp 携帯電話機及びこれと接続されるポータブルオーディオ
US6711536B2 (en) * 1998-10-20 2004-03-23 Canon Kabushiki Kaisha Speech processing apparatus and method
US6249765B1 (en) * 1998-12-22 2001-06-19 Xerox Corporation System and method for extracting data from audio messages
US6643622B2 (en) 1999-02-19 2003-11-04 Robert O. Stuart Data retrieval assistance system and method utilizing a speech recognition system and a live operator
US6243684B1 (en) 1999-02-19 2001-06-05 Usada, Inc. Directory assistance system and method utilizing a speech recognition system and a live operator
US6526292B1 (en) 1999-03-26 2003-02-25 Ericsson Inc. System and method for creating a digit string for use by a portable phone
US6862713B1 (en) * 1999-08-31 2005-03-01 International Business Machines Corporation Interactive process for recognition and evaluation of a partial search query and display of interactive results
DE19942871B4 (de) 1999-09-08 2013-11-21 Volkswagen Ag Verfahren zum Betrieb einer sprachgesteuerten Befehlseingabeeinheit in einem Kraftfahrzeug
DE10013879A1 (de) * 2000-03-21 2001-09-27 Bosch Gmbh Robert Verfahren zur Sprachsteuerung eines elektrischen Geräts
ATE241195T1 (de) * 2000-09-29 2003-06-15 Ericsson Telefon Ab L M Verfahren und einrichtung zur analyse einer folge von gesprochenen nummern
US20020042709A1 (en) * 2000-09-29 2002-04-11 Rainer Klisch Method and device for analyzing a spoken sequence of numbers
US6788767B2 (en) * 2000-12-28 2004-09-07 Gateway, Inc. Apparatus and method for providing call return service
US20020137470A1 (en) * 2001-03-23 2002-09-26 Baron Jason C. Method and system for multiple stage dialing using voice recognition
US20030023439A1 (en) * 2001-05-02 2003-01-30 Gregory Ciurpita Method and apparatus for automatic recognition of long sequences of spoken digits
EP1262954A1 (en) * 2001-05-30 2002-12-04 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for verbal entry of digits or commands
US6996528B2 (en) * 2001-08-03 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for efficient, safe and reliable data entry by voice under adverse conditions
WO2003015378A1 (fr) * 2001-08-10 2003-02-20 Zhiying Song Telephone mobile avec composeur vocal, sans touches numeriques
WO2003054856A1 (de) * 2001-12-21 2003-07-03 Telefonaktiebolaget Lm Ericsson (Publ) Verfahren und vorrichtung zur spracherkennung
DE10216117A1 (de) * 2002-04-12 2003-10-23 Philips Intellectual Property Verfahren und System zur Spracherkennung von Symbolfolgen
US20040162116A1 (en) * 2003-02-14 2004-08-19 Lucent Technologies Inc. User programmable voice dialing for mobile handset
WO2004092962A1 (ja) * 2003-04-17 2004-10-28 Fujitsu Limited 半導体装置、リセット制御システム及びメモリリセット方法
US7689423B2 (en) * 2005-04-13 2010-03-30 General Motors Llc System and method of providing telematically user-optimized configurable audio
DE102005019028B4 (de) * 2005-04-23 2020-11-12 Volkswagen Ag Telefonsystem und Verfahren zum Betreiben eines Telefonsystems für ein Kraftfahrzeug
KR100907974B1 (ko) * 2005-05-13 2009-07-16 노키아 코포레이션 전자 장치에 캐릭터를 입력하는 방법
US9818120B2 (en) 2015-02-20 2017-11-14 Innovative Global Systems, Llc Automated at-the-pump system and method for managing vehicle fuel purchases
US8626377B2 (en) 2005-08-15 2014-01-07 Innovative Global Systems, Llc Method for data communication between a vehicle and fuel pump
US20070106506A1 (en) * 2005-11-07 2007-05-10 Ma Changxue C Personal synergic filtering of multimodal inputs
TW200735682A (en) * 2006-03-09 2007-09-16 Action Star Entpr Co Ltd Wireless audio emitting device having automatic channel lock function and method thereof
US7957972B2 (en) * 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
US8055502B2 (en) * 2006-11-28 2011-11-08 General Motors Llc Voice dialing using a rejection reference
US20080221882A1 (en) * 2007-03-06 2008-09-11 Bundock Donald S System for excluding unwanted data from a voice recording
TR201006031A2 (tr) * 2010-07-22 2011-10-21 Sestek Ses Ve İleti̇şi̇m Bi̇lgi̇sayar Teknoloji̇leri̇ Sanayi̇ Ti̇caret Anoni̇m Şi̇rketi̇ Otomatik dikte sistemlerinde konuşma sentezi ile teyit yöntemi ve bu yöntemin uygulanması için sistem
SG189182A1 (en) * 2010-10-29 2013-05-31 Anhui Ustc Iflytek Co Ltd Method and system for endpoint automatic detection of audio record
DE102011013755B4 (de) 2010-12-31 2021-07-08 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zur alphanumerischen Spracheingabe in Kraftfahrzeugen
US10192550B2 (en) * 2016-03-01 2019-01-29 Microsoft Technology Licensing, Llc Conversational software agent
US10140986B2 (en) 2016-03-01 2018-11-27 Microsoft Technology Licensing, Llc Speech recognition
US10140988B2 (en) 2016-03-01 2018-11-27 Microsoft Technology Licensing, Llc Speech recognition
EP3509062B1 (en) * 2016-08-31 2020-05-27 Sony Corporation Audio recognition device, audio recognition method, and program
KR102223017B1 (ko) 2017-05-16 2021-03-04 구글 엘엘씨 공유된 음성 작동 디바이스상의 호출 핸들링
WO2019220725A1 (ja) * 2018-05-18 2019-11-21 パナソニックIpマネジメント株式会社 音声認識装置、音声認識方法、及びプログラム
CN111326140B (zh) * 2020-03-12 2023-05-30 科大讯飞股份有限公司 语音识别结果判别方法、纠正方法、装置、设备及存储介质
WO2022245396A1 (en) * 2021-05-17 2022-11-24 Google Llc Arranging and/or clearing speech-to-text content without a user providing express instructions

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB974850A (en) * 1963-06-12 1964-11-11 Standard Telephones Cables Ltd Speech recognition system
US3742143A (en) * 1971-03-01 1973-06-26 Bell Telephone Labor Inc Limited vocabulary speech recognition circuit for machine and telephone control
US3928724A (en) * 1974-10-10 1975-12-23 Andersen Byram Kouma Murphy Lo Voice-actuated telephone directory-assistance system
GB1557286A (en) * 1975-10-31 1979-12-05 Nippon Electric Co Speech recognition
JPS5688503A (en) * 1979-12-21 1981-07-18 Matsushita Electric Ind Co Ltd Heater
US4336421A (en) * 1980-04-08 1982-06-22 Threshold Technology, Inc. Apparatus and method for recognizing spoken words
EP0041195A1 (en) * 1980-05-30 1981-12-09 General Electric Company Improved paging arrangement
US4348550A (en) * 1980-06-09 1982-09-07 Bell Telephone Laboratories, Incorporated Spoken word controlled automatic dialer
CH645501GA3 (ja) * 1981-07-24 1984-10-15
JPS5870287A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 音声認識装置
US4528687A (en) * 1981-10-22 1985-07-09 Nissan Motor Company, Limited Spoken-instruction controlled system for an automotive vehicle
US4525793A (en) * 1982-01-07 1985-06-25 General Electric Company Voice-responsive mobile status unit
US4426733A (en) * 1982-01-28 1984-01-17 General Electric Company Voice-controlled operator-interacting radio transceiver
US4614839A (en) * 1982-08-19 1986-09-30 Aisin Seiki K.K. Road-vehicle telephone apparatus
US4624008A (en) * 1983-03-09 1986-11-18 International Telephone And Telegraph Corporation Apparatus for automatic speech recognition
JPS59225656A (ja) * 1983-06-07 1984-12-18 Fujitsu Ltd 音声ダイヤル電話端末
JPS6054687A (ja) * 1983-07-19 1985-03-29 スロ−ン−ケツタリング インステイテユ−ト フオ− キヤンサ− リサ−チ ヒト モノクロ−ン抗体の製法
US4593157A (en) * 1984-09-04 1986-06-03 Usdan Myron S Directory interface and dialer
DE3574640D1 (de) * 1984-09-28 1990-01-11 Int Standard Electric Corp Schluesselworterkennungssystem unter anwendung eines sprachmusterverkettungsmodels.
FR2571191B1 (fr) * 1984-10-02 1986-12-26 Renault Systeme de radiotelephone, notamment pour vehicule automobile
US4644107A (en) * 1984-10-26 1987-02-17 Ttc Voice-controlled telephone using visual display
EP0235127B2 (en) * 1985-09-03 1993-05-05 Motorola, Inc. Hands-free control system for a radiotelephone

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236091A (ja) * 2000-02-23 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> 音声認識結果の誤り訂正方法およびその装置

Also Published As

Publication number Publication date
CA1312668C (en) 1993-01-12
KR890702177A (ko) 1989-12-23
KR0129856B1 (ko) 1998-04-11
MX165502B (es) 1992-11-16
EP0389514A1 (en) 1990-10-03
WO1989004035A1 (en) 1989-05-05
DE3855164D1 (de) 1996-05-02
US4870686A (en) 1989-09-26
DE3855164T2 (de) 1996-10-10
ATE136146T1 (de) 1996-04-15
JPH0782351B2 (ja) 1995-09-06
EP0389514A4 (en) 1992-05-20
EP0389514B1 (en) 1996-03-27

Similar Documents

Publication Publication Date Title
JPH03500693A (ja) 音声コマンドによりデジットシーケンスを入力するための方法
US7203651B2 (en) Voice control system with multiple voice recognition engines
US5651056A (en) Apparatus and methods for conveying telephone numbers and other information via communication devices
ES2295025T3 (es) Interfaz de usuario hablada para dispositivos habilitados mediante la voz.
KR100984528B1 (ko) 분산형 음성 인식 시스템에서 음성 인식을 위한 시스템 및방법
EP1286330B1 (en) Method and apparatus for data entry by voice under adverse conditions
US20050125235A1 (en) Method and apparatus for using earcons in mobile communication devices
US20070005206A1 (en) Automobile interface
KR960004692B1 (ko) 음성 명령에 의한 전화 호출 종료 방법
JP2004248248A (ja) ユーザがプログラム可能な移動局ハンドセット用の音声ダイヤル入力
EP1352389B1 (en) System and method for storage of speech recognition models
JPH08307509A (ja) 手を使わずに電話機のダイアル操作を行う方法および装置
ES2244499T3 (es) Procedimiento para el reconocimiento de manifestaciones verbales de oradores que no hablan su propio idioma en un sistema de procesamiento de voz.
EP1151431A1 (en) Method and apparatus for testing user interface integrity of speech-enabled devices
US20020198721A1 (en) Device having speech-control means and having test-means for testing a function of the speech-control means
US20070129945A1 (en) Voice quality control for high quality speech reconstruction
JPH06252997A (ja) 電話、音声認識装置および音声認識方法
JP2000101705A (ja) 無線電話機
JP3519259B2 (ja) 音声認識作動装置
JP2002101204A (ja) 通話仲介システム及び聴覚障害者用電話機
JP3069150B2 (ja) 音声ダイヤル装置
JPH11298382A (ja) ハンズフリー装置
JPH11112633A (ja) 携帯電話
JPS61158253A (ja) 音声電話制御方法およびその装置
JPH0329548A (ja) 音声認識電話機