JP4437119B2 - 話者に依存する音声認識方法および音声認識システム - Google Patents

話者に依存する音声認識方法および音声認識システム Download PDF

Info

Publication number
JP4437119B2
JP4437119B2 JP2005518261A JP2005518261A JP4437119B2 JP 4437119 B2 JP4437119 B2 JP 4437119B2 JP 2005518261 A JP2005518261 A JP 2005518261A JP 2005518261 A JP2005518261 A JP 2005518261A JP 4437119 B2 JP4437119 B2 JP 4437119B2
Authority
JP
Japan
Prior art keywords
speech
recognition system
utterance
pattern
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005518261A
Other languages
English (en)
Other versions
JP2006514753A (ja
Inventor
アウバウアー ローラント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2006514753A publication Critical patent/JP2006514753A/ja
Application granted granted Critical
Publication of JP4437119B2 publication Critical patent/JP4437119B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Description

本発明は、ユーザの発話がトレーニングされ、トレーニングされた発話に命令が割り当てられる音声認識システムを用い話者に依存して音声を認識する方法、ならびにこの方法を実施するための音声認識システムに関する。
この種の方法は、従来技術によれば音声認識モジュールとトレーニングモジュールとに分けられている。この場合、音声認識モジュールによりユーザの発話が捕捉され、それに基づきデータベースにおいてその発話に割り当てられた命令が見つけ出され、これはその発話がその命令に属しており先行する時点で記録され格納されていた発話と十分な一致がみられたときに行われる。この音声認識モジュールの場合、新しい発話と新しい命令との対応づけは不可能である。そうではなくこのようなプロセスはトレーニングモジュールにおいて行われ、そこにおいてユーザは発話を自身によって与えておき、個々の発話に対しそれらの記録後に各々1つの命令を割り当てる。取得された割り当てはデータベース内に格納される。割り当てられた命令はたとえば、通信ネットワークの加入者に対する選択プロセスや音声制御命令とすることができる。
従来技術による方法の欠点は、音声認識モジュールからトレーニングモジュールへユーザが毎回能動的に切り替えなければならならず、新しい命令のトレーニングが煩雑なことである。このことは、市場での音声認識システムの受け入れに対し思わしくない影響も及ぼしている。
このことから出発して本発明の基礎とする課題は、話者に依存する音声認識方法ならびに該方法のための音声認識システムにおいて、新しい命令のトレーニングを時間を節約し実施できるようにすることである。
この課題は、冒頭で述べた形式の方法に関しては、音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによって発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てることをユーザに提示し、該新しい命令に即座に割り当てることには、認識されなかった発話に対応する発話をユーザに発生されて該発話を記録するステップと、記録された該発話から新たな音声パターンを生成するステップと、該新たな音声パターンと認識されなかった発話から形成されていた音声パターンとの類似性をチェックするステップと、類似性があれば、前記認識されなかった発話から形成されていた音声パターンと前記新たな音声パターンとを結合したものを、認識されなかった発話に新たな命令として割り当てるステップが含まれていることによって解決される。
本発明による方法の実施にあたり音声認識システムは常に音声認識モードにあるが、これによればオプションが設けられていて、発話が認識されないときには即座に新しい命令の割り当てが行われる。このようにして、新たな命令のトレーニングが音声認識自体に組み込まれ、発話が認識されなかった場合にはトレーニングを行うことができる。たとえばユーザが現在、音声認識システムのために新しい命令をトレーニングしたい状況にあるならば、これまで利用されていなかった発話を明瞭に発音すれば十分であり、それに応じて音声認識システムはこの新たな発話が認識されないことを確認し、ついでこの新たな発話を新しい命令に割り当てるというオプションを提示する。割り当てが行われた後、その命令を即座に実行させることができる。
1つの有利な実施形態によれば、音声認識システムによっても発話が認識されないとき、オプションとして音声認識システムはユーザに対し発話の反復を指示することができるし、あるいはその発話に新しい命令を割り当てることができる。この実施形態によって考慮されるのは、ある発話が現在のところ、すでに所望の命令が割り当てられている発話に対する類似範囲外にある可能性がある点である。このような事例では、新しい命令に対する新たな発話の割り当ては意図されない。むしろ、すでにトレーニングされた命令と結び付けるためにその発話を繰り返す必要がある。
音声認識システムの初期状態に関して本発明による方法にとって有利であるのは、まだいかなる発話にも新しい命令が割り当てられていないとき、音声認識システムはその起動後、新しい命令のトレーニングの実施を即座に提示することである。音声認識システムが最初の発話をそのままでは認識せず、新しい命令をトレーニングするオプションを提示するようにすれば、このことは自動的に行われる。
別の有利な実施形態によれば、すでにトレーニング済みの命令に対する発話が音声認識システムによっても認識されないとき、音声認識システムはユーザに対しその命令を提示し、ユーザにより選択された命令に上述の発話割り当てることができる。このことが該当するのは、発話とそれらに属するトレーニングされた命令との対応づけが格納されているデータベース内に、その発話の「悪い」バージョンが存在していて、音声認識が頻繁に失敗するケースである。そのようなケースでは、すでにトレーニング済みの命令に対し新たな発話を割り当てることができる。
有利には、発話の認識のために、発話に割り当てられている音声パターンが生成される。この場合、発話の基本的な音声特徴抽出の基礎を成すこの種の音声パターンもデータベースにおいて利用され、このケースではそのデータベース内に、音声パターンとトレーニングされた命令との対応づけが格納されている。それらが記録された後、音声認識システムにより発話各々が音声パターンに変換され、ついでこの音声パターンが引き続き処理され、たとえばそれが認識可能であるか否かの判定すなわちデータベース内における音声パターンの類似範囲内にすでにあるか否かの判定を行うために処理される。
これに関連して有利であるとみなされるのは、命令の割り当て前に、発話が事前に記憶されている発話と類似しているか否かをチェックすることである。このようにすれば、それぞれ対応する発話が互いに類似しすぎている理由から音声認識にあたり様々な命令が存在する中で取り違いが発生してしまうのが回避される。この目的で、たとえば音声パターンに対する抽出特徴を利用して、信頼性の高い類似範囲を定義することができる。
上述の課題は音声認識システムに関しては、話者に依存して音声を認識するための以下の構成を備えた音声認識システムによって解決される。すなわち、音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによって発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てることをユーザに提示し該新しい命令に即座に割り当てる際に音声認識システムは、認識されなかった発話に対応する新たな発話をユーザに発生させて該発話を記録し、記録された発話から新たな音声パターンを生成し、該新たな音声パターンと認識されなかった発話から形成されていた音声パターンとの類似性をチェックし、類似性があれば前記認識されなかった発話から形成されていた音声パターンと前記新たな音声パターンとの結合により形成された音声パターンに新たな命令を割り当てる。
このように構成された音声認識システムにより上述の方法を実施することができ、公知の音声認識システムとは異なり、音声認識モード中に新しい命令のトレーニングを行うことができる点で優れている。
音声記録装置は記憶装置と接続されているのが有利であって、この記憶装置内に発話が一時的に記憶され、この記憶装置はデータベースへ発話を読み込ませるためにデータベースと接続されている。これは公知の音声認識システムにはあてはまらないことであって、それというのも公知のシステムの場合にはトレーニングモードにあればデータベースにそのままアクセスされるのに対し、音声認識モード中はサーチマシンを機能させるために発話が一時的に記憶されるとはいえ、その場合に利用される記憶装置は発話をデータベースに読み込むようには構成されていないし、あるいはそれと接続されていないからである。
有利であるのは、音声認識システムのユーザが発話したとき、該発話から音声パターンを生成するための特徴抽出装置を音声記録装置と記憶装置との間に設けることであって、これにより発話が音声パターンと置き換えられる。
音声認識システムのさらに別の利点ならびに特徴は、話者に依存する音声認識方法に関する上述の記載のところですでに説明されている。
次に、図面を参照しながら本発明実施例についてさらに詳しく説明する。ただ1つの図面には、話者に依存する音声認識方法のフローチャートが示されている。
次に、音声認識システムを用いた話者に依存する音声認識方法について図1を参照しながら説明する。たとえば表示装置を備えたコンピュータシステムとして実現されている音声認識システムのスタート後、ユーザに対しまずは適切なユーザインタフェースが表示され、これには発話記録用の起動手段("Push-to-Talk"起動手段)も含まれている。第1のステップ1においてユーザ/話者の発話ないしは音声表現が記録され、これは適切な音声記録装置を用いて行われる。特徴抽出装置を用いることで第2のステップ2において発話の音声パターンが生成され、その際、音声パターンは特性を表す抽出された音声特徴の組み合わせによって定義されている。音声パターンは記憶装置に一時的に記憶される。
第3のステップ3においてサーチマシンを用いることで、音声パターンと命令との対応づけが収容されているデータベース内に生成された音声パターンが含まれているか否かの問い合わせが行われる。このデータベースには音声認識システムのトレーニングモード中に内容が与えられ、この場合、トレーニングモードは音声認識のプロセスと一体化されている。生成された音声パターンがデータベース内にすでに存在しているものと識別されて、対応する命令が見つけ出されると、第4のステップ4においてその命令が実行され、その後、音声認識システムのオペレーションプロセスが終了する。この実施例の場合、ステップ1からステップ4までの流れは自動的に行われる。
第3のステップ3において、生成された音声パターンが認識されないのであれば、ユーザはコンピュータシステムのユーザインタフェースを介して、認識されない音声パターンもしくは認識されない発話に対し新しい命令を割り当てるオプションを受け取る。これはこの方法の第5のステップ5において行われる。新しい命令の割り当てが望まれるならば、あるいはそれが自動的に実施されるならば、この個所で音声認識システムはトレーニングモードに切り替えられる。第5のステップ5に対する代案として、ユーザはユーザインタフェースを用いて新たな発話の記録をトリガすることもでき、これによれば発話を繰り返す目的でこの方法は第1のステップ1へ戻る。
認識されなかった音声パターンに対する新しい命令の割り当てが選択された場合には第6のステップ6において、第1のステップによる認識されなかった発話に対応する発話の記録が行われる。これに続いて第7のステップ7において、第6のステップ6において記録された発話から音声パターンが生成され、これは上述の第2のステップ2と同じやり方で行われる。
第8のステップ8において、第7のステップ7による新たな音声パターンと第2のステップ2による音声パターンとの類似性チェックが実行される。
これら両方の音声パターンの間に望ましい程度に一致がみられないのであれば、第2のステップ2と第7のステップ7とにおいて生成された音声パターンの類似性について満足できる結果が得られるまで、この方法が新たに始められる。この場合、第3のステップ3と第5のステップ5は飛び越えることができる。
第8のステップ8においても、新たに記録された発話の音声パターンがすでにデータベース内に存在している音声パターンに対し十分な距離を維持しているか否かについて、類似性チェックを行うことができる。このチェックの結果が否定であれば、新しい命令に対する割り当てのために別の発話を使用するようユーザに求めることができる。この新たな発話に対して、この方法が最初から始められる。
これに続いて第9のステップ9において、第2のステップ2で生成された音声パターンに1つの命令が割り当てられ、これは音声認識システムのユーザインタフェースを用いてユーザが適切な選択を行うことによって実施される。この目的で、第2のステップで一時的に記憶されていた音声パターンが記憶装置から読み出され、ステップ7で生成された音声パターンと適切に結合され、これはたとえば両方の音声パターンの個々の特性の平均値形成などにより行われ、新しい命令とともにデータベースに書き込まれる。
最後のステップ10において、新たに割り当てられた命令が実行され、その後、トレーニングモードと一体化された音声認識プロセスが終了する。
ここで強調しておくと、第4のステップと最後のステップとで行われる命令の実行は、命令変換用の命令変換装置を用いて実行される。ここで命令をたとえば、通信ネットワークにおける加入者番号の選択とすることができるし、あるいはネットワークに接続された機器を制御する音声命令とすることができる。
当然ながら、本発明による方法の簡略化された1つの実施形態において、命令の割り当てに際し先行するステップ6〜8の実行を省くことができる。このようにすると、命令の割り当てが第5のステップ5の問い合わせに応答してただちに行われる。また、本発明による方法の実施にあたり、新たにトレーニングされた命令の即座の実行(第10のステップ)を行わないようにすることも可能である。
本発明による音声認識システムを用いた話者に依存する音声認方法の流れを示すフローチャート

Claims (6)

  1. ユーザの発話がトレーニングされ、トレーニングされた発話に命令が割り当てられる形式の、音声認識システムを用いた話者に依存する音声認識方法において、
    該音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによって発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てることをユーザに提示し、該新しい命令に即座に割り当てることには、認識されなかった発話に対応する新たな発話をユーザに発生させて該発話を記録するステップと、記録された該発話から新たな音声パターンを生成するステップと、該新たな音声パターンと認識されなかった発話から形成されていた音声パターンとの類似性をチェックするステップと、類似性があれば、前記認識されなかった発話から形成されていた音声パターンと前記新たな音声パターンとを結合したものを、認識されなかった発話に新たな命令として割り当てるステップが含まれていることを特徴とする、
    音声認識方法。
  2. 請求項記載の方法において、
    まだいかなる発話にも新しい命令が割り当てられていないとき、音声認識システムは該システムの起動後、新しい命令のトレーニングの実施を提示することを特徴とする方法。
  3. 請求項記載の方法において、
    前記音声認識システムが発話を認識するために、該音声認識システムは前記発話から、音声特徴の組み合わせから成る音声パターンを生成することを特徴とする方法。
  4. 音声認識システムのユーザが発話したときに該発話を記録するための音声記録装置と、
    前記発話に割り当てられる命令を見つけ出すために発話と命令との対応づけが格納されているデータベースへのアクセスを行うサーチマシンと、
    前記発話に基づき見つけ出された命令を実行可能な命令に変換する変換装置が設けられている、
    話者に依存して音声を認識するための音声認識システムにおいて、
    該音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによって発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てることをユーザに提示し
    該新しい命令に即座に割り当てる際に音声認識システムは、認識されなかった発話に対応する新たな発話をユーザに発生させて該発話を記録し、記録された発話から新たな音声パターンを生成し、該新たな音声パターンと認識されなかった発話から形成されていた音声パターンとの類似性をチェックし、類似性があれば前記認識されなかった発話から形成されていた音声パターンと前記新たな音声パターンとの結合により形成された音声パターンに新たな命令を割り当てることを特徴とする、
    音声認識システム。
  5. 請求項記載の音声認識システムにおいて、
    前記音声記録装置は記憶装置と接続されており、音声認識システムのユーザが発話したとき前記記憶装置内に該発話が一時的に記憶され、該記憶装置はデータベースへ前記発話を読み込ませるためにデータベースと接続されていることを特徴とする音声認識システム。
  6. 請求項記載の音声認識システムにおいて、
    音声認識システムのユーザが発話したとき、該発話から音声パターンを生成するため、前記音声記録装置と前記記憶装置との間に特徴抽出装置が設けられており、該特徴抽出装置は前記発話を音声パターンと置き換えることを特徴とする音声認識システム。
JP2005518261A 2003-03-25 2004-03-03 話者に依存する音声認識方法および音声認識システム Expired - Fee Related JP4437119B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10313310A DE10313310A1 (de) 2003-03-25 2003-03-25 Verfahren zur sprecherabhängigen Spracherkennung und Spracherkennungssystem dafür
PCT/EP2004/002137 WO2004086360A1 (de) 2003-03-25 2004-03-03 Verfahren zur sprecherabhängigen spracherkennung und spracherkennungssystem

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009149711A Division JP2009211103A (ja) 2003-03-25 2009-06-24 話者に依存して音声を認識する方法および音声認識システム

Publications (2)

Publication Number Publication Date
JP2006514753A JP2006514753A (ja) 2006-05-11
JP4437119B2 true JP4437119B2 (ja) 2010-03-24

Family

ID=33015971

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005518261A Expired - Fee Related JP4437119B2 (ja) 2003-03-25 2004-03-03 話者に依存する音声認識方法および音声認識システム
JP2009149711A Pending JP2009211103A (ja) 2003-03-25 2009-06-24 話者に依存して音声を認識する方法および音声認識システム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2009149711A Pending JP2009211103A (ja) 2003-03-25 2009-06-24 話者に依存して音声を認識する方法および音声認識システム

Country Status (8)

Country Link
US (1) US7835913B2 (ja)
EP (1) EP1606794B1 (ja)
JP (2) JP4437119B2 (ja)
KR (1) KR100742408B1 (ja)
CN (1) CN100559464C (ja)
DE (2) DE10313310A1 (ja)
ES (1) ES2278308T3 (ja)
WO (1) WO2004086360A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4639094B2 (ja) * 2005-02-04 2011-02-23 株式会社日立製作所 音声認識システム、音声認識装置及び音声認識プログラム
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
DE602007004620D1 (de) 2007-10-01 2010-03-18 Harman Becker Automotive Sys Sprachgesteuerte Einstellung von Fahrzeugteilen
US8374872B2 (en) * 2008-11-04 2013-02-12 Verizon Patent And Licensing Inc. Dynamic update of grammar for interactive voice response
KR101556594B1 (ko) * 2009-01-14 2015-10-01 삼성전자 주식회사 신호처리장치 및 신호처리장치에서의 음성 인식 방법
CN102301419B (zh) * 2009-01-30 2013-06-12 三菱电机株式会社 声音识别装置
CN102347060A (zh) * 2010-08-04 2012-02-08 鸿富锦精密工业(深圳)有限公司 电子记录装置及方法
CN102682767B (zh) * 2011-03-18 2015-04-08 株式公司Cs 一种应用于家庭网络的语音识别方法
US8818810B2 (en) 2011-12-29 2014-08-26 Robert Bosch Gmbh Speaker verification in a health monitoring system
KR101284594B1 (ko) * 2012-10-26 2013-07-10 삼성전자주식회사 영상처리장치 및 그 제어방법, 영상처리 시스템
CN104238379B (zh) * 2013-06-07 2017-07-28 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法
KR101427528B1 (ko) 2013-06-10 2014-08-07 이장호 외국어 동영상 컨텐츠를 이용한 대화형 외국어 학습 방법 및 그것을 위한 장치
TWI536366B (zh) * 2014-03-18 2016-06-01 財團法人工業技術研究院 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體
KR102371697B1 (ko) * 2015-02-11 2022-03-08 삼성전자주식회사 음성 기능 운용 방법 및 이를 지원하는 전자 장치
DE102018103965A1 (de) * 2018-02-22 2019-08-22 Schuler Pressen Gmbh Verfahren zur Mensch-Maschine-Kommunikation mittels einer Mensch-Maschine-Schnittstelle und Vorrichtung hierfür
RU2744063C1 (ru) * 2018-12-18 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения говорящего пользователя управляемого голосом устройства

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5764800A (en) * 1980-10-09 1982-04-20 Sanyo Electric Co Voice recognizing device
JPS57102699A (en) 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS584198A (ja) 1981-06-30 1983-01-11 株式会社日立製作所 音声認識装置における標準パタ−ン登録方式
JPS61133996A (ja) * 1984-12-05 1986-06-21 株式会社リコー 音声認識装置
JPS62206596A (ja) * 1986-03-07 1987-09-11 株式会社東芝 音声認識システム
JP2838848B2 (ja) * 1989-02-10 1998-12-16 株式会社リコー 標準パターン登録方式
JPH07109560B2 (ja) * 1990-11-30 1995-11-22 富士通テン株式会社 音声認識装置
JP3314481B2 (ja) * 1993-10-12 2002-08-12 松下電器産業株式会社 構内交換電話装置
JPH0749697A (ja) * 1994-06-03 1995-02-21 Fujitsu Ten Ltd 音声認識装置
US5774841A (en) 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US5852801A (en) * 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
US5832429A (en) * 1996-09-11 1998-11-03 Texas Instruments Incorporated Method and system for enrolling addresses in a speech recognition database
US6295391B1 (en) * 1998-02-19 2001-09-25 Hewlett-Packard Company Automatic data routing via voice command annotation
DE19825760A1 (de) * 1998-06-09 1999-12-16 Nokia Mobile Phones Ltd Verfahren zum Zuweisen einer auswählbaren Möglichkeit zu einem Stellmittel
JP2000029585A (ja) * 1998-07-08 2000-01-28 Canon Inc 音声コマンド認識画像処理装置
US6185530B1 (en) * 1998-08-14 2001-02-06 International Business Machines Corporation Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system
US6208972B1 (en) * 1998-12-23 2001-03-27 Richard Grant Method for integrating computer processes with an interface controlled by voice actuated grammars
US6233560B1 (en) * 1998-12-16 2001-05-15 International Business Machines Corporation Method and apparatus for presenting proximal feedback in voice command systems
JP2000259172A (ja) 1999-03-11 2000-09-22 Canon Inc 音声認識装置と音声データの認識方法
US6487530B1 (en) * 1999-03-30 2002-11-26 Nortel Networks Limited Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models
US6327566B1 (en) * 1999-06-16 2001-12-04 International Business Machines Corporation Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
JP4314680B2 (ja) * 1999-07-27 2009-08-19 ソニー株式会社 音声認識制御システム及び音声認識制御方法
DE19942869A1 (de) 1999-09-08 2001-03-15 Volkswagen Ag Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen
KR100633228B1 (ko) * 1999-12-31 2006-10-11 주식회사 케이티 가우시안 확률밀도 표현 방법 및 그를 얻기 위한 음성인식 훈련 방법
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
DE10122828A1 (de) * 2001-05-11 2002-11-14 Philips Corp Intellectual Pty Verfahren zum Training oder zur Adaption eines Spracherkenners
JP2003241790A (ja) * 2002-02-13 2003-08-29 Internatl Business Mach Corp <Ibm> 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム

Also Published As

Publication number Publication date
CN1764943A (zh) 2006-04-26
EP1606794B1 (de) 2006-12-13
KR20060014369A (ko) 2006-02-15
JP2006514753A (ja) 2006-05-11
DE10313310A1 (de) 2004-10-21
US7835913B2 (en) 2010-11-16
JP2009211103A (ja) 2009-09-17
DE502004002300D1 (de) 2007-01-25
WO2004086360A1 (de) 2004-10-07
CN100559464C (zh) 2009-11-11
US20070100632A1 (en) 2007-05-03
KR100742408B1 (ko) 2007-07-24
ES2278308T3 (es) 2007-08-01
EP1606794A1 (de) 2005-12-21

Similar Documents

Publication Publication Date Title
JP2009211103A (ja) 話者に依存して音声を認識する方法および音声認識システム
US8428944B2 (en) System and method for performing compensated speech recognition
JP5233989B2 (ja) 音声認識システム、音声認識方法、および音声認識処理プログラム
JP2002304190A (ja) 発音変化形生成方法及び音声認識方法
EP1525577B1 (en) Method for automatic speech recognition
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
CN111192585A (zh) 一种音乐播放控制系统、控制方法及智能家电
CN105047196A (zh) 语音识别系统中的语音假象补偿系统和方法
US20170270923A1 (en) Voice processing device and voice processing method
CN1217314C (zh) 由有限的用户圈用语音控制启动可在设备内执行的动作的方法
WO2018088534A1 (ja) 電子機器、電子機器の制御方法及び電子機器の制御プログラム
US7587322B2 (en) Robust speech recognition with data bank accession organized by semantic attribute
KR101945190B1 (ko) 음성인식 작동 시스템 및 방법
KR102417899B1 (ko) 차량의 음성인식 시스템 및 방법
WO2000022609A1 (en) Speech recognition and control system and telephone
JP5519126B2 (ja) 音声認識装置及び音声認識方法
JP6811865B2 (ja) 音声認識装置および音声認識方法
JP2003177788A (ja) 音声対話システムおよびその方法
KR100994930B1 (ko) 음성인식 기반 홈네트워크 시스템의 적응화 음성 인식 제어방법 및 그 시스템
KR102279319B1 (ko) 음성분석장치 및 음성분석장치의 동작 방법
KR20170135098A (ko) 모바일용 녹음장치
JP2020085942A (ja) 情報処理装置、情報処理方法、およびプログラム
US20060080097A1 (en) Voice acknowledgement independent of a speaker while dialling by name
JPH07210193A (ja) 音声対話装置
JP2020034832A (ja) 辞書生成装置、音声認識システムおよび辞書生成方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080206

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080310

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080317

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080407

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080414

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080730

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081028

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081128

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090624

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091204

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100104

R150 Certificate of patent or registration of utility model

Ref document number: 4437119

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees