JP2009211103A - 話者に依存して音声を認識する方法および音声認識システム - Google Patents

話者に依存して音声を認識する方法および音声認識システム Download PDF

Info

Publication number
JP2009211103A
JP2009211103A JP2009149711A JP2009149711A JP2009211103A JP 2009211103 A JP2009211103 A JP 2009211103A JP 2009149711 A JP2009149711 A JP 2009149711A JP 2009149711 A JP2009149711 A JP 2009149711A JP 2009211103 A JP2009211103 A JP 2009211103A
Authority
JP
Japan
Prior art keywords
recognition system
speech
speech recognition
utterance
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009149711A
Other languages
English (en)
Inventor
Roland Aubauer
アウバウアー ローラント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2009211103A publication Critical patent/JP2009211103A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Abstract

【課題】話者に依存する音声認識方法ならびに該方法のための音声認識システムにおいて、新しい命令のトレーニングを、時間を節約し実施できるようにする。
【解決手段】音声認識システムは音声認識モードにあり、ユーザの発話を記録し、この発話から第1の音声パターンを生成する。音声認識システム内で、第1の音声パターンに対応する命令が見つけ出されると、その命令が実行される。音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、音声認識システムによっても発話が認識されないとき、音声認識システムは、その発話を新しい命令に即座に割り当てるためのトレーニングモードへの切り替えをユーザに提示する。
【選択図】図1

Description

本発明は、ユーザの発話ないしは発話がトレーニングされ、トレーニングされた発話に命令が割り当てられる音声認識システムを用い話者に依存して音声を認識する方法、ならびにこの方法を実施するための音声認識システムに関する。
この種の方法は、従来技術によれば音声認識モジュールとトレーニングモジュールとに分けられている。この場合、音声認識モジュールによりユーザの発話ないしは発話が捕捉され、それに基づきデータベースにおいてその発話に割り当てられた命令が見つけ出され、これはその発話がその命令に属しており先行する時点で記録され格納されていた発話と十分な一致がみられたときに行われる。この音声認識モジュールの場合、新しい発話と新しい命令との対応づけは不可能である。そうではなくこのようなプロセスはトレーニングモジュールにおいて行われ、そこにおいてユーザは発話を自身によって与えておき、個々の発話に対しそれらの記録後に各々1つの命令を割り当てる。取得された割り当てはデータベース内に格納される。割り当てられた命令はたとえば、通信ネットワークの加入者に対する選択プロセスや音声制御命令とすることができる。
従来技術による方法の欠点は、音声認識モジュールからトレーニングモジュールへユーザが毎回能動的に切り替えなければならならず、新しい命令のトレーニングが煩雑なことである。このことは、市場での音声認識システムの受け入れに対し思わしくない影響も及ぼしている。
このことから出発して本発明の基礎とする課題は、話者に依存する音声認識方法ならびに該方法のための音声認識システムにおいて、新しい命令のトレーニングを、時間を節約し実施できるようにすることである。
本発明によればこの課題は、音声認識システムは音声認識モードにあり、該音声認識システムはユーザの発話を記録し、該発話から第1の音声パターンを生成し、該音声認識システム内で、第1の音声パターンに対応する命令が見つけ出されると、前記音声認識システムにより該命令が実行され、該音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによっても発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てるためのトレーニングモードへの切り替えをユーザに提示することによって解決される。
本発明による方法の実施にあたり音声認識システムは常に音声認識モードにあるが、これによればオプションが設けられていて、発話が認識されないときには即座に新しい命令の割り当てが行われる。このようにして、新たな命令のトレーニングが音声認識自体に組み込まれ、発話が認識されなかった場合にはトレーニングを行うことができる。たとえばユーザが現在、音声認識システムのために新しい命令をトレーニングしたい状況にあるならば、これまで利用されていなかった発話を明瞭に発音すれば十分であり、それに応じて音声認識システムはこの新たな発話が認識されないことを確認し、ついでこの新たな発話を新しい命令に割り当てるというオプションを提示する。割り当てが行われた後、その命令を即座に実行させることができる。
1つの有利な実施形態によれば、音声認識システムによっても発話が認識されないとき、オプションとしてユーザはその発話を繰り返すことができるし、あるいはその発話に新しい命令を割り当てることができる。この実施形態によって考慮されるのは、ある発話が現在のところ、すでに所望の命令が割り当てられている発話に対する類似範囲外にある可能性がある点である。このような事例では、新しい命令に対する新たな発話の割り当ては意図されない。むしろ、すでにトレーニングされた命令と結び付けるためにその発話を繰り返す必要がある。
音声認識システムの初期状態に関して本発明による方法にとって有利であるのは、まだいかなる発話にも新しい命令が割り当てられていないとき、音声認識システムはその起動後、新しい命令のトレーニングの実施を即座に提示することである。音声認識システムが最初の発話をそのままでは認識せず、新しい命令をトレーニングするオプションを提示するようにすれば、このことは自動的に行われる。
別の有利な実施形態によれば、すでにトレーニング済みの命令に対する発話が音声認識システムによっても認識されないとき、ユーザはその命令を選択し、それを上述の発話に割り当てることができる。このことが該当するのは、発話とそれらに属するトレーニングされた命令との対応づけが格納されているデータベース内に、その発話の「悪い」バージョンが存在していて、音声認識が頻繁に失敗するケースである。そのようなケースでは、すでにトレーニング済みの命令に対し新たな発話を割り当てることができる。
有利には、発話の認識のために、発話に割り当てられている音声パターンが生成される。この場合、発話の基本的な音声特徴抽出の基礎を成すこの種の音声パターンもデータベースにおいて利用され、このケースではそのデータベース内に、音声パターンとトレーニングされた命令との対応づけが格納されている。それらが記録された後、発話各々が音声パターンに変換され、ついでこの音声パターンが引き続き処理され、たとえばそれが認識可能であるか否かの判定すなわちデータベース内における音声パターンの類似範囲内にすでにあるか否かの判定を行うために処理される。
これに関連して有利であるとみなされるのは、命令の割り当て前に、発話が事前に記憶されている発話と類似しているか否かをチェックすることである。このようにすれば、それぞれ対応する発話が互いに類似しすぎている理由から音声認識にあたり様々な命令が存在する中で取り違いが発生してしまうのが回避される。この目的で、たとえば音声パターンに対する抽出特徴を利用して、信頼性の高い類似範囲を定義することができる。
上述の課題は音声認識システムに関しては、話者に依存して音声を認識するための以下の構成を備えた音声認識システムによって解決される。すなわち、音声認識システムのユーザによる発話を記録するための音声記録装置と、発話に割り当てられる命令を見つけ出すために発話と命令との対応づけが格納されているデータベースへのアクセスを行うサーチマシンと、上記の発話に基づき見つけ出された命令を変換する変換装置が設けられていて、この音声認識システムによっても発話が認識されないとき、発話を新しい命令に即座に割り当てることがユーザに提示される。
このように構成された音声認識システムにより上述の方法を実施することができ、公知の音声認識システムとは異なり、音声認識モード中に新しい命令のトレーニングを行うことができる点で優れている。
音声記録装置は記憶装置と接続されているのが有利であって、この記憶装置内に発話が一時的に記憶され、この記憶装置はデータベースへ発話を書き込むためにデータベースと接続されている。これは公知の音声認識システムにはあてはまらないことであって、それというのも公知のシステムの場合にはトレーニングモードにあればデータベースにそのままアクセスされるのに対し、音声認識モード中はサーチマシンを機能させるために発話が一時的に記憶されるとはいえ、その場合に利用される記憶装置は発話をデータベースに書き込むようには構成されていないし、あるいはそれと接続されていないからである。
有利であるのは、発話から音声パターンを生成するための特徴抽出装置を音声記録装置と記憶装置との間に設けることであって、これにより発話が音声パターンと置き換えられる。
音声認識システムのさらに別の利点ならびに特徴は、話者に依存する音声認識方法に関する上述の記載のところですでに説明されている。
本発明による音声認識システムを用いた話者に依存する音声認方法の流れを示すフローチャート
次に、音声認識システムを用いた話者に依存する音声認識方法について図1を参照しながら説明する。たとえば表示装置を備えたコンピュータシステムとして実現されている音声認識システムのスタート後、ユーザに対しまずは適切なユーザインタフェースが表示され、これには発話記録用の起動手段("Push-to-Talk"起動手段)も含まれている。第1のステップ1においてユーザ/話者の発話ないしは音声表現が記録され、これは適切な音声記録装置を用いて行われる。特徴抽出装置を用いることで第2のステップ2において発話の音声パターンが生成され、その際、音声パターンは特性を表す抽出された音声特徴の組み合わせによって定義されている。音声パターンは記憶装置に一時的に記憶される。
第3のステップ3においてサーチマシンを用いることで、音声パターンと命令との対応づけが収容されているデータベース内に生成された音声パターンが含まれているか否かの問い合わせが行われる。このデータベースには音声認識システムのトレーニングモード中に内容が与えられ、この場合、トレーニングモードは音声認識のプロセスと一体化されている。生成された音声パターンがデータベース内にすでに存在しているものと識別されて、対応する命令が見つけ出されると、第4のステップ4においてその命令が実行され、その後、音声認識システムのオペレーションプロセスが終了する。この実施例の場合、ステップ1からステップ4までの流れは自動的に行われる。
第3のステップ3において、生成された音声パターンが認識されないのであれば、ユーザはコンピュータシステムのユーザインタフェースを介して、認識されない音声パターンもしくは認識されない発話に対し新しい命令を割り当てるオプションを受け取る。これはこの方法の第5のステップ5において行われる。新しい命令の割り当てが望まれるならば、あるいはそれが自動的に実施されるならば、この個所で音声認識システムはトレーニングモードに切り替えられる。第5のステップ5に対する代案として、ユーザはユーザインタフェースを用いて新たな発話の記録をトリガすることもでき、これによれば発話を繰り返す目的でこの方法は第1のステップ1へ戻る。
認識されなかった音声パターンに対する新しい命令の割り当てが選択された場合には第6のステップ6において、第1のステップによる認識されなかった発話に対応する発話の記録が行われる。これに続いて第7のステップ7において、第6のステップ6において記録された発話から音声パターンが生成され、これは上述の第2のステップ2と同じやり方で行われる。
第8のステップ8において、第7のステップ7による新たな音声パターンと第2のステップ2による音声パターンとの類似性チェックが実行される。
これら両方の音声パターンの間に望ましい程度に一致がみられないのであれば、第2のステップ2と第7のステップ7とにおいて生成された音声パターンの類似性について満足できる結果が得られるまで、この方法が新たに始められる。この場合、第3のステップ3と第5のステップ5は飛び越えることができる。
第8のステップ8においても、新たに記録された発話の音声パターンがすでにデータベース内に存在している音声パターンに対し十分な距離を維持しているか否かについて、類似性チェックを行うことができる。このチェックの結果が否定であれば、新しい命令に対する割り当てのために別の発話を使用するようユーザに求めることができる。この新たな発話に対して、この方法が最初から始められる。
これに続いて第9のステップ9において、第2のステップ2で生成された音声パターンに1つの命令が割り当てられ、これは音声認識システムのユーザインタフェースを用いてユーザが適切な選択を行うことによって実施される。この目的で、第2のステップで一時的に記憶されていた音声パターンが記憶装置から読み出され、ステップ7で生成された音声パターンと適切に結合され、これはたとえば両方の音声パターンの個々の特性の平均値形成などにより行われ、新しい命令とともにデータベースに書き込まれる。
最後のステップ10において、新たに割り当てられた命令が実行され、その後、トレーニングモードと一体化された音声認識プロセスが終了する。
ここで強調しておくと、第4のステップと最後のステップとで行われる命令の実行は、命令変換用の命令変換装置を用いて実行される。ここで命令をたとえば、通信ネットワークにおける加入者番号の選択とすることができるし、あるいはネットワークに接続された機器を制御する音声命令とすることができる。
当然ながら、本発明による方法の簡略化された1つの実施形態において、命令の割り当てに際し先行するステップ6〜8の実行を省くことができる。このようにすると、命令の割り当てが第5のステップ5の問い合わせに応答してただちに行われる。また、本発明による方法の実施にあたり、新たにトレーニングされた命令の即座の実行(第10のステップ)を行わないようにすることも可能である。

Claims (12)

  1. ユーザの発話がトレーニングされ、トレーニングされた発話に命令が割り当てられる形式の、音声認識システムを用いた話者に依存する音声認識方法において、
    前記音声認識システムは音声認識モードにあり、
    該音声認識システムはユーザの発話を記録し、該発話から第1の音声パターンを生成し、
    該音声認識システム内で、第1の音声パターンに対応する命令が見つけ出されると、前記音声認識システムにより該命令が実行され、
    該音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによっても発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てるためのトレーニングモードへの切り替えをユーザに提示することを特徴とする、
    音声認識方法。
  2. 請求項1記載の方法において、
    前記トレーニングモードにおいて前記音声認識システムは、
    認識されなかった発話の新たな記録を行い、
    該新たな記録に基づき第2の音声パターンを新たに生成することを特徴とする、
    音声認識方法。
  3. 請求項2記載の方法において、
    前記トレーニングモードにおいて前記音声認識システムは、前記第1の音声パターンと前記第2の音声パターンとの類似性をチェックし、類似性があれば認識されなかった発話に新たな命令を割り当て、該新たな命令を実行することを特徴とする、
    音声認識方法。
  4. 請求項1記載の方法において、
    前記音声認識システムによっても発話が認識されないとき、該音声認識システムはオプションとしてユーザに対し該発話の反復を指示し、または該発話に新しい命令を割り当てることを特徴とする方法。
  5. 請求項1から4のいずれか1項記載の方法において、
    まだいかなる発話にも新しい命令が割り当てられていないとき、音声認識システムは該システムの起動後、新しい命令のトレーニングの実施を提示することを特徴とする方法。
  6. 請求項1から5のいずれか1項記載の方法において、
    すでにトレーニングされている命令に対する発話が音声認識システムによっても認識されないとき、該音声認識システムは、ユーザに対し該すでにトレーニングされている命令を提示し、ユーザにより選択された命令に前記発話を割り当てることを特徴とする方法。
  7. 請求項1から6のいずれか1項記載の方法において、
    前記音声認識システムが発話を認識するために、該音声認識システムは前記発話から、音声特徴の組み合わせから成る音声パターンを生成することを特徴とする方法。
  8. 音声認識システムのユーザが発話したときに該発話を記録するための音声記録装置と、
    前記発話に割り当てられる命令を見つけ出すために発話と命令との対応づけが格納されているデータベースへのアクセスを行うサーチマシンと、
    前記発話に基づき見つけ出された命令を実行可能な命令に変換する変換装置が設けられている、
    話者に依存して音声を認識するための音声認識システムにおいて、
    該音声認識システムは音声認識モードにあり、
    該音声認識システムは、ユーザの発話を記録し、該発話から第1の音声パターンを生成し、
    該音声認識システム内で、第1の音声パターンに対応する命令が見つけ出されると、前記音声認識システムは該命令を実行し、
    該音声認識システム内で類似した音声パターンを見つけ出せず、または十分な類似度をもつ音声パターンを見つけ出せず、該音声認識システムによっても発話が認識されないとき、該音声認識システムは、該発話を新しい命令に即座に割り当てるためのトレーニングモードへの切り替えをユーザに提示することを特徴とする、
    音声認識システム。
  9. 請求項8記載の音声認識システムにおいて、
    前記トレーニングモードにおいて前記音声認識システムは、
    認識されなかった発話の新たな記録を行い、
    該新たな記録に基づき第2の音声パターンを新たに生成することを特徴とする、
    音声認識システム
  10. 請求項9記載の音声認識システムにおいて、
    前記トレーニングモードにおいて前記音声認識システムは、前記第1の音声パターンと前記第2の音声パターンとの類似性をチェックし、類似性があれば認識されなかった発話に新たな命令を割り当て、該新たな命令を実行することを特徴とする、
    音声認識システム。
  11. 請求項8記載の音声認識システムにおいて、
    前記音声記録装置は記憶装置と接続されており、音声認識システムのユーザが発話したとき前記記憶装置内に該発話が一時的に記憶され、該記憶装置はデータベースへ前記発話を読み込ませるためにデータベースと接続されていることを特徴とする音声認識システム。
  12. 請求項11記載の音声認識システムにおいて、
    音声認識システムのユーザが発話したとき、該発話から音声パターンを生成するため、前記音声記録装置と前記記憶装置との間に特徴抽出装置が設けられており、該特徴抽出装置は前記発話を音声パターンと置き換えることを特徴とする音声認識システム。
JP2009149711A 2003-03-25 2009-06-24 話者に依存して音声を認識する方法および音声認識システム Pending JP2009211103A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10313310A DE10313310A1 (de) 2003-03-25 2003-03-25 Verfahren zur sprecherabhängigen Spracherkennung und Spracherkennungssystem dafür

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005518261A Division JP4437119B2 (ja) 2003-03-25 2004-03-03 話者に依存する音声認識方法および音声認識システム

Publications (1)

Publication Number Publication Date
JP2009211103A true JP2009211103A (ja) 2009-09-17

Family

ID=33015971

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005518261A Expired - Fee Related JP4437119B2 (ja) 2003-03-25 2004-03-03 話者に依存する音声認識方法および音声認識システム
JP2009149711A Pending JP2009211103A (ja) 2003-03-25 2009-06-24 話者に依存して音声を認識する方法および音声認識システム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2005518261A Expired - Fee Related JP4437119B2 (ja) 2003-03-25 2004-03-03 話者に依存する音声認識方法および音声認識システム

Country Status (8)

Country Link
US (1) US7835913B2 (ja)
EP (1) EP1606794B1 (ja)
JP (2) JP4437119B2 (ja)
KR (1) KR100742408B1 (ja)
CN (1) CN100559464C (ja)
DE (2) DE10313310A1 (ja)
ES (1) ES2278308T3 (ja)
WO (1) WO2004086360A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4639094B2 (ja) * 2005-02-04 2011-02-23 株式会社日立製作所 音声認識システム、音声認識装置及び音声認識プログラム
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
DE602007004620D1 (de) 2007-10-01 2010-03-18 Harman Becker Automotive Sys Sprachgesteuerte Einstellung von Fahrzeugteilen
US8374872B2 (en) * 2008-11-04 2013-02-12 Verizon Patent And Licensing Inc. Dynamic update of grammar for interactive voice response
KR101556594B1 (ko) * 2009-01-14 2015-10-01 삼성전자 주식회사 신호처리장치 및 신호처리장치에서의 음성 인식 방법
CN102301419B (zh) * 2009-01-30 2013-06-12 三菱电机株式会社 声音识别装置
CN102347060A (zh) * 2010-08-04 2012-02-08 鸿富锦精密工业(深圳)有限公司 电子记录装置及方法
CN102682767B (zh) * 2011-03-18 2015-04-08 株式公司Cs 一种应用于家庭网络的语音识别方法
US8818810B2 (en) 2011-12-29 2014-08-26 Robert Bosch Gmbh Speaker verification in a health monitoring system
KR101284594B1 (ko) * 2012-10-26 2013-07-10 삼성전자주식회사 영상처리장치 및 그 제어방법, 영상처리 시스템
CN104238379B (zh) * 2013-06-07 2017-07-28 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法
KR101427528B1 (ko) 2013-06-10 2014-08-07 이장호 외국어 동영상 컨텐츠를 이용한 대화형 외국어 학습 방법 및 그것을 위한 장치
TWI536366B (zh) * 2014-03-18 2016-06-01 財團法人工業技術研究院 新增口說語彙的語音辨識系統與方法及電腦可讀取媒體
KR102371697B1 (ko) * 2015-02-11 2022-03-08 삼성전자주식회사 음성 기능 운용 방법 및 이를 지원하는 전자 장치
DE102018103965A1 (de) * 2018-02-22 2019-08-22 Schuler Pressen Gmbh Verfahren zur Mensch-Maschine-Kommunikation mittels einer Mensch-Maschine-Schnittstelle und Vorrichtung hierfür
RU2744063C1 (ru) * 2018-12-18 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения говорящего пользователя управляемого голосом устройства

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5764800A (en) * 1980-10-09 1982-04-20 Sanyo Electric Co Voice recognizing device
JPS57102699A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS584198A (ja) * 1981-06-30 1983-01-11 株式会社日立製作所 音声認識装置における標準パタ−ン登録方式
JPS61133996A (ja) * 1984-12-05 1986-06-21 株式会社リコー 音声認識装置
JPS62206596A (ja) * 1986-03-07 1987-09-11 株式会社東芝 音声認識システム
JPH02210500A (ja) * 1989-02-10 1990-08-21 Ricoh Co Ltd 標準パターン登録方式
JPH04204700A (ja) * 1990-11-30 1992-07-27 Fujitsu Ten Ltd 音声認識装置
JPH07111532A (ja) * 1993-10-12 1995-04-25 Matsushita Electric Ind Co Ltd 構内交換電話装置
JP2000029585A (ja) * 1998-07-08 2000-01-28 Canon Inc 音声コマンド認識画像処理装置
JP2000259172A (ja) * 1999-03-11 2000-09-22 Canon Inc 音声認識装置と音声データの認識方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0749697A (ja) * 1994-06-03 1995-02-21 Fujitsu Ten Ltd 音声認識装置
US5774841A (en) 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US5852801A (en) * 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
US5832429A (en) * 1996-09-11 1998-11-03 Texas Instruments Incorporated Method and system for enrolling addresses in a speech recognition database
US6295391B1 (en) * 1998-02-19 2001-09-25 Hewlett-Packard Company Automatic data routing via voice command annotation
DE19825760A1 (de) * 1998-06-09 1999-12-16 Nokia Mobile Phones Ltd Verfahren zum Zuweisen einer auswählbaren Möglichkeit zu einem Stellmittel
US6185530B1 (en) * 1998-08-14 2001-02-06 International Business Machines Corporation Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system
US6208972B1 (en) * 1998-12-23 2001-03-27 Richard Grant Method for integrating computer processes with an interface controlled by voice actuated grammars
US6233560B1 (en) * 1998-12-16 2001-05-15 International Business Machines Corporation Method and apparatus for presenting proximal feedback in voice command systems
US6487530B1 (en) * 1999-03-30 2002-11-26 Nortel Networks Limited Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models
US6327566B1 (en) * 1999-06-16 2001-12-04 International Business Machines Corporation Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
JP4314680B2 (ja) * 1999-07-27 2009-08-19 ソニー株式会社 音声認識制御システム及び音声認識制御方法
DE19942869A1 (de) 1999-09-08 2001-03-15 Volkswagen Ag Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen
KR100633228B1 (ko) * 1999-12-31 2006-10-11 주식회사 케이티 가우시안 확률밀도 표현 방법 및 그를 얻기 위한 음성인식 훈련 방법
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
DE10122828A1 (de) * 2001-05-11 2002-11-14 Philips Corp Intellectual Pty Verfahren zum Training oder zur Adaption eines Spracherkenners
JP2003241790A (ja) * 2002-02-13 2003-08-29 Internatl Business Mach Corp <Ibm> 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5764800A (en) * 1980-10-09 1982-04-20 Sanyo Electric Co Voice recognizing device
JPS57102699A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS584198A (ja) * 1981-06-30 1983-01-11 株式会社日立製作所 音声認識装置における標準パタ−ン登録方式
JPS61133996A (ja) * 1984-12-05 1986-06-21 株式会社リコー 音声認識装置
JPS62206596A (ja) * 1986-03-07 1987-09-11 株式会社東芝 音声認識システム
JPH02210500A (ja) * 1989-02-10 1990-08-21 Ricoh Co Ltd 標準パターン登録方式
JPH04204700A (ja) * 1990-11-30 1992-07-27 Fujitsu Ten Ltd 音声認識装置
JPH07111532A (ja) * 1993-10-12 1995-04-25 Matsushita Electric Ind Co Ltd 構内交換電話装置
JP2000029585A (ja) * 1998-07-08 2000-01-28 Canon Inc 音声コマンド認識画像処理装置
JP2000259172A (ja) * 1999-03-11 2000-09-22 Canon Inc 音声認識装置と音声データの認識方法

Also Published As

Publication number Publication date
CN1764943A (zh) 2006-04-26
EP1606794B1 (de) 2006-12-13
KR20060014369A (ko) 2006-02-15
JP2006514753A (ja) 2006-05-11
DE10313310A1 (de) 2004-10-21
US7835913B2 (en) 2010-11-16
DE502004002300D1 (de) 2007-01-25
WO2004086360A1 (de) 2004-10-07
CN100559464C (zh) 2009-11-11
US20070100632A1 (en) 2007-05-03
KR100742408B1 (ko) 2007-07-24
ES2278308T3 (es) 2007-08-01
EP1606794A1 (de) 2005-12-21
JP4437119B2 (ja) 2010-03-24

Similar Documents

Publication Publication Date Title
JP2009211103A (ja) 話者に依存して音声を認識する方法および音声認識システム
US8428944B2 (en) System and method for performing compensated speech recognition
US9984679B2 (en) System and method for optimizing speech recognition and natural language parameters with user feedback
US20120290298A1 (en) System and method for optimizing speech recognition and natural language parameters with user feedback
JP2018054790A (ja) 音声対話システムおよび音声対話方法
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
JP4408490B2 (ja) データベース照会を実行する方法及びその装置
US20050273334A1 (en) Method for automatic speech recognition
JPWO2011121649A1 (ja) 音声認識装置
CN111739506B (zh) 一种应答方法、终端及存储介质
CN105047196A (zh) 语音识别系统中的语音假象补偿系统和方法
US20170270923A1 (en) Voice processing device and voice processing method
JP2000347681A (ja) テキスト・ベースの音声合成を利用した音声制御システム用の再生方法
CN1217314C (zh) 由有限的用户圈用语音控制启动可在设备内执行的动作的方法
US20040148167A1 (en) Robust voice recognition with data bank organisation
KR101945190B1 (ko) 음성인식 작동 시스템 및 방법
JP2004226698A (ja) 音声認識装置
JP2016180918A (ja) 音声認識システム、音声認識方法、プログラム
CN110890089A (zh) 语音识别方法及装置
JP6811865B2 (ja) 音声認識装置および音声認識方法
JP5519126B2 (ja) 音声認識装置及び音声認識方法
KR102417899B1 (ko) 차량의 음성인식 시스템 및 방법
JP3614116B2 (ja) トランスクリプション装置、トランスクリプション方法、トランスクリプションプログラム、およびそのプログラムを記録した記録媒体
JP6124844B2 (ja) サーバ、データベースを利用する方法、プログラム、システム、端末、端末プログラムおよび音声データ出力装置
JP2012128240A (ja) 音声認識システム及び辞書生成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090624

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130111