JP3720595B2 - 音声認識装置及びその方法、コンピュータ可読メモリ - Google Patents
音声認識装置及びその方法、コンピュータ可読メモリ Download PDFInfo
- Publication number
- JP3720595B2 JP3720595B2 JP26355298A JP26355298A JP3720595B2 JP 3720595 B2 JP3720595 B2 JP 3720595B2 JP 26355298 A JP26355298 A JP 26355298A JP 26355298 A JP26355298 A JP 26355298A JP 3720595 B2 JP3720595 B2 JP 3720595B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- score
- voice
- speech
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/027—Syllables being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Description
【発明の属する技術分野】
本発明は、入力された音声を認識する音声認識装置及びその方法、コンピュータ可読メモリに関するものである。
【0002】
【従来の技術】
音声認識技術では、あらかじめ標準音声の標準パターン(単語や文)を何らかの形式で登録し、その登録された標準パターンと入力された音声を比較することで音声認識を行う。登録の形式としては、例えば、音素表現や生成文法を利用した形式などがある。そして、音声認識を行う際には、入力された音声と標準パターンとを比較することによって得られる一致度を示すスコアを定め、スコアの最も良い標準パターンを音声認識結果とする。
【0003】
音声認識対象の音声入力の方法としては、ユーザが単音節に区切った音声を発声して入力する方法がある。例えば、「カナガワ」と入力する場合は、「カ,ナ,ガ,ワ」と音節毎に区切った音声を発声して入力する。この入力を単音節発声と呼ぶことにする。
【0004】
この単音節発声で入力された音声に対する音声認識では、従来、以下の2つの方法が用いられている。
【0005】
1.入力された音声のうち、無音と思われる部分を取り除いた音声に対して音声認識を行う。
【0006】
2.単音節発声のパターンも音声認識対象として登録し、各パターンの音声認識を含む音声認識を行う。
【0007】
1の方法は、入力された音声のうち、無音と思われる部分を取り除き、残った音声を接続して得られる音声に対し音声認識を行う(図7)。
【0008】
2の方法は、入力された音声が「カナガワ」である場合、「カナガワ」だけでなく、「カ(無音)ナ(無音)ガ(無音)ワ」というパターンも標準パターンとして登録する。そして、入力された音声と「カ(無音)ナ(無音)ガ(無音)ワ」と登録された標準パターンとのスコアが最も良かった場合には、「カナガワ」を音声認識結果として採用するというものである。
【0009】
【発明が解決しようとする課題】
しかしながら、上記従来の音声認識では、以下の問題点があった。
【0010】
まず、1の方法では、無音かどうかの判定を誤ると認識結果に悪影響を与えるという問題点があった。一方、無音かどうかを精度良く判定するためには、音声認識と同様の処理が必要となり、この場合には、以下に述べる2の方法における問題点と同様の問題点が生じていた。
【0011】
2の方法では、登録しておく各標準パターンについて、単音節発声で音声が入力された場合とそうでない場合の2通りの標準パターンを用意しておかなければならず、処理量の増加を招く。また、一般に、語頭の環境(無音の直後)では認識率が悪い場合が多く、単音節発声では全ての音節が語頭の環境となるため、認識結果の信頼性が低下する。さらに、次のような問題がある。多くの場合、音声認識は発声の開始点と終了点を自動的に検出する音声切出処理と併用されて実行される。そして、単音節発声の場合、音節と音節との間に無音があるため、単語中に挿入された無音を発声終了と誤って認識する音声切出の誤りが生じやすい。この音声切出の誤りが生じた場合、切り出された音声に対して音声認識を行っても正確な音声認識結果を得られる確率は低いものであった。
【0012】
本発明は上記の問題点に鑑みてなされたものであり、音声を効率良く、かつ精度良く認識することができる音声認識装置及びその方法、コンピュータ可読メモリを提供することを目的とする。
【0013】
【課題を解決するための手段】
上記の目的を達成するための本発明による音声認識装置は以下の構成を備える。即ち、
入力された音声を認識する音声認識装置であって、
前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する判定手段と、
前記判定手段により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する報知手段と
を備える。
【0014】
また、好ましくは、前記入力された音声の単音節系列に対する第1スコアを計算する計算手段と、
前記入力された音声全体を予め登録されている音声認識用パターンと比較することにより音声認識を行い、音声認識結果とそのスコアを第2スコアとして計算する認識手段とを更に備え、
前記判定手段は、前記第1スコアと前記第2スコアの大きさを比較し、前記第2スコアが前記第1スコアより大きいか否かに基づいて、前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する。
【0016】
また、好ましくは、前記判定手段は、前記第1スコアに所定数を乗じたスコアと前記第2スコアを比較し、その比較結果に基づいて、前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する。
【0017】
また、好ましくは、前記判定手段は、前記第1スコアに所定数を減じたスコアと前記第2スコアを比較し、その比較結果に基づいて、前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する。
【0018】
また、好ましくは、前記計算手段は、任意の単音節と無音との組を任意数組み合わせた単音節連鎖を用いて、前記入力された音声の単音節系列に対する第1スコアを計算する。
【0019】
また、好ましくは、前記計算手段は、無音を挟んだ2音節連鎖を用いて、前記入力された音声の単音節系列に対する第1スコアを計算する。
【0020】
また、好ましくは、前記報知手段は、表示装置を用いてユーザに音声の再入力を促す旨を報知する。
【0021】
また、好ましくは、前記報知手段は、音声を用いてユーザに音声の再入力を促す旨を報知する。
【0022】
上記の目的を達成するための本発明による音声認識方法は以下の構成を備える。即ち、
入力された音声を認識する音声認識方法であって、
前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する判定工程と、
前記判定工程により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する報知工程と
を備える。
【0023】
上記の目的を達成するための本発明によるコンピュータ可読メモリは以下の構成を備える。即ち、
入力された音声を認識する音声認識のプログラムコードが格納されたコンピュータ可読メモリであって、
前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する判定工程のプログラムコードと、
前記判定工程により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する報知工程のプログラムコードと
を備える。
【0024】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
【0025】
図1は本発明の実施形態の音声認識装置のハードウェア構成を示す図である。H1は数値演算・制御等の処理を行う中央処理装置であり、本実施形態で実行される処理手順にしたがって演算を行う。H2はRAM・ROM等の記憶装置であり、本実施形態で実行される処理手順や処理に必要な一時データが格納される。H3はハードディスク装置等の外部記憶装置であり、音声認識用の標準パターン(テンプレート)や音韻モデル等が格納される。
【0026】
H4はディスプレイ等の出力装置であり、音声認識結果、あるいは音声認識結果を処理することによって得られた情報を出力する。但し、本実施形態では、他の装置・プログラムの一部として組み込まれることも可能であり、この場合には出力は他の装置・プログラムの入力に接続されるものとなる。H5はマイクロホン等の入力装置であり、ユーザが発声した音声を入力する。但し、本実施形態では、他の装置・プログラムの一部として組み込まれることも可能であり、この場合には入力は他の装置・プログラムを通じて間接的に行われることになる。H6はバスであり、上記中央処理装置H1〜入力装置H5の各種装置を相互に接続する。
【0027】
以上のハードウェア構成を踏まえて、本実施形態で実行される処理について、図2を用いて説明する。
【0028】
図2は本発明の実施形態で実行される処理を示すフローチャートである。
【0029】
まず、ステップS1において、ユーザの発声した音声を入力する。次に、ステップS2において、ステップS1で入力された音声に対してLPC分析やケプストラム分析等の信号処理を行い、音声認識の際の標準パターンと入力された音声とを比較するスコア計算に用いるパラメータを計算する。
【0030】
次に、ステップS3において、ステップS2で計算されたパラメータの単音節系列に対するスコアs0を計算する。単音節系列に対するスコアは、任意の単音節系列を認識候補として入力された音声と比較する音声認識アルゴリズムを適用し、その結果によって得られた第1位候補に対するスコアを単音節系列に対するスコアとする。ここで、任意の単音節系列を認識対象とした場合の認識対象の表現方法の一例について、図3を用いて説明する。
【0031】
図3は本発明の実施形態の認識対象の表現方法の一例を示す図である。
【0032】
図3中、ア〜ンは対応する各音節の発声を受理し、「無音」は適当な時間長の無音を受理する。これらの受理を任意数実行して得られる単音節と無音の組を組み合わせた単音節連鎖が認識対象となる。◎は図を見やすくするために設けられたNULLノードであり、入力無しで次の状態に遷移する。
【0033】
次に、ステップS4において、ステップS2で計算されたパラメータを用いて音声認識を行う。音声認識の結果、1〜複数個の認識結果文字列ri(i=1,2,…)及びそのスコアsiが求められる。その例を図4に示す。
【0034】
次に、ステップS5において、ステップS3で計算されたスコアs0と、ステップS4で計算された第1位候補の音声認識結果のスコアs1とを比較する。比較の結果、s1(認識スコア)>s0(単音節スコア)(スコアが大きいほど認識結果としてもっともらしいものとする)の場合(ステップS5でYES)、ステップS6に進み、ステップS4で得られた音声認識結果を出力し処理を終了する。一方、s1(認識スコア)>s0(単音節スコア)でない場合(ステップS5でNO)、ステップS7に進み、単音節発声が検出されたことをユーザに知らせるメッセージ、あるいは図5に示すような連続発声を促す等のメッセージを出力装置H4に出力し、ステップS1に戻る。
【0035】
以上説明したように、本実施形態によれば、計算量をあまり増加させることなくユーザの単音節発声に対応することが可能となる。また、単音節発声か否かという情報のみを用いることで、単音節発声の内容の認識結果(何という音節系列が発声されたかという音声認識結果)には依存しないので、単音節に対する音声認識率に影響されない。また、単音節発声の途中で音声切出部が発声終了を誤検出し発声が途中で区切られたとしても、正常に動作することができる。また、最終的な音声認識の入力として単音節発声による入力を排除することが可能となり、良好な認識率を確保することが可能となる。
【0036】
上記実施形態では、ステップS3及びステップS4を明示的に処理がわかれているものとして説明したが、ステップS3及びステップS4が1つのステップで実行することも可能である。
【0037】
即ち、図6に示すような認識文法を用いて音声認識を行い、第1位候補の音声認識結果が単音節系列であった場合に、ユーザから入力された音声が単音節発声であると見做すことにより、上記実施形態と等価な処理を行うことが可能である。この場合、ステップS3及びステップS5は、ステップS4に含まれることになる。
【0038】
また、単音節系列に対するスコアを計算する際に、任意の単音節と無音の組を組み合わせた単音節連鎖を用いるものとしたが、ユーザが発声すると予想される単音節系列のみを用いても良い。例えば、認識対象語に含まれる2音節連鎖の組のみを用いてもよい。
【0039】
また、単音節系列に対するスコアs0に対してペナルティを課した後、音声認識結果のスコアs1と比較しても良い。例えば、正数となるスコアを用いた場合、乗数α(0<α<1)を用いてαs0とs1を比較しても良い。あるいは、β(β>0)を用いてs0−βとs1を比較してもよい。
【0040】
また、ステップS7では、出力装置H4にヘルプメッセージを表示することで、音声の再入力をユーザに促すようにしていたが、出力装置H4に音声出力装置を用いて、音声によるヘルプメッセージを出力することで、音声の再入力をユーザに促すようにしても良い。
【0041】
尚、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0042】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0043】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0044】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0045】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0046】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0047】
【発明の効果】
以上説明したように、本発明によれば、音声を効率良く、かつ精度良く認識することができる音声認識装置及びその方法、コンピュータ可読メモリを提供できる。
【0048】
【図面の簡単な説明】
【図1】本発明の実施形態の音声認識装置のハードウェア構成を示す図である。
【図2】本発明の実施形態で実行される処理を示すフローチャートである。
【図3】本発明の実施形態の認識対象の表現方法の一例を示す図である。
【図4】本発明の実施形態の音声認識結果及びそのスコアの一例を示す図である。
【図5】本発明の実施形態のヘルプメッセージの一例を示す図である。
【図6】本発明の実施形態の他の音声認識方法を示す図である。
【図7】従来の音声認識方法の一例を示す図である。
【符号の説明】
H1 中央処理装置
H2 記憶装置
H3 外部記憶装置
H4 出力装置
H5 入力装置
H6 バス
Claims (15)
- 入力された音声を認識する音声認識装置であって、
前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する判定手段と、
前記判定手段により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する報知手段と
を備えることを特徴とする音声認識装置。 - 前記入力された音声の単音節系列に対する第1スコアを計算する計算手段と、
前記入力された音声全体を予め登録されている音声認識用パターンと比較することにより音声認識を行い、音声認識結果とそのスコアを第2スコアとして計算する認識手段とを更に備え、
前記判定手段は、前記第1スコアと前記第2スコアの大きさを比較し、前記第2スコアが前記第1スコアより大きいか否かに基づいて、前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する
ことを特徴とする請求項1に記載の音声認識装置。 - 前記判定手段は、前記第1スコアに所定数を乗じたスコア又は前記第1スコアから所定数を減じたスコアと前記第2スコアの大きさを比較し、前記第2スコアが前記第1スコアより大きいか否かに基づいて、前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する
ことを特徴とする請求項2に記載の音声認識装置。 - 前記計算手段は、任意の単音節と無音との組を任意数組み合わせた単音節連鎖を用いて、前記入力された音声の単音節系列に対する第1スコアを計算する
ことを特徴とする請求項2に記載の音声認識装置。 - 前記計算手段は、無音を挟んだ2音節連鎖を用いて、前記入力された音声の単音節系列に対する第1スコアを計算する
ことを特徴とする請求項2に記載の音声認識装置。 - 前記報知手段は、前記判定手段により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、表示装置を用いて、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する
ことを特徴とする請求項1に記載の音声認識装置。 - 前記報知手段は、前記判定手段により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、音声を用いて、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する
ことを特徴とする請求項1に記載の音声認識装置。 - 入力された音声を認識する音声認識方法であって、
前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する判定工程と、
前記判定工程により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する報知工程と
を備えることを特徴とする音声認識方法。 - 前記入力された音声の単音節系列に対する第1スコアを計算する計算工程と、
前記入力された音声全体を予め登録されている音声認識用パターンと比較することにより音声認識を行い、音声認識結果とそのスコアを第2スコアとして計算する認識工程とを更に備え、
前記判定工程は、前記第1スコアと前記第2スコアの大きさを比較し、前記第2スコアが前記第1スコアより大きいか否かに基づいて、前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する
ことを特徴とする請求項8に記載の音声認識方法。 - 前記判定工程は、前記第1スコアに所定数を乗じたスコア又は前記第1スコアから所定数を減じたスコアと前記第2のスコアの大きさを比較し、前記第2スコアが前記第1スコアより大きいか否かに基づいて、前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する
ことを特徴とする請求項9に記載の音声認識方法。 - 前記計算工程は、任意の単音節と無音との組を任意数組み合わせた単音節連鎖を用いて、前記入力された音声の単音節系列に対する第1スコアを計算する
ことを特徴する請求項9に記載の音声認識方法。 - 前記計算工程は、無音を挟んだ2音節連鎖を用いて、前記入力された音声の単音節系列に対する第1スコアを計算する
ことを特徴とする請求項9に記載の音声認識方法。 - 前記報知工程は、前記判定工程により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、表示装置に、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を表示する
ことを特徴とする請求項8に記載の音声認識方法。 - 前記報知工程は、前記判定工程により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、音声で、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する
ことを特徴とする請求項8に記載の音声認識方法。 - 入力された音声を認識する音声認識のプログラムコードが格納されるコンピュータ可読メモリであって、
前記入力された音声に単音節に区切られた音声が含まれるか否かを判定する判定工程のプログラムコードと、
前記判定工程により、前記入力された音声に単音節に区切られた音声が含まれると判定された場合に、ユーザに、該入力された音声を連続発声で再入力させることを促す旨を報知する報知工程のプログラムコードと
を備えることを特徴とするコンピュータ可読メモリ。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26355298A JP3720595B2 (ja) | 1998-09-17 | 1998-09-17 | 音声認識装置及びその方法、コンピュータ可読メモリ |
US09/396,863 US6438521B1 (en) | 1998-09-17 | 1999-09-15 | Speech recognition method and apparatus and computer-readable memory |
DE69905668T DE69905668T2 (de) | 1998-09-17 | 1999-09-16 | Verfahren und Vorrichtung zur Spracherkennung |
EP99307355A EP0987681B1 (en) | 1998-09-17 | 1999-09-16 | Speech recognition method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26355298A JP3720595B2 (ja) | 1998-09-17 | 1998-09-17 | 音声認識装置及びその方法、コンピュータ可読メモリ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000099070A JP2000099070A (ja) | 2000-04-07 |
JP3720595B2 true JP3720595B2 (ja) | 2005-11-30 |
Family
ID=17391140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26355298A Expired - Fee Related JP3720595B2 (ja) | 1998-09-17 | 1998-09-17 | 音声認識装置及びその方法、コンピュータ可読メモリ |
Country Status (4)
Country | Link |
---|---|
US (1) | US6438521B1 (ja) |
EP (1) | EP0987681B1 (ja) |
JP (1) | JP3720595B2 (ja) |
DE (1) | DE69905668T2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3720595B2 (ja) * | 1998-09-17 | 2005-11-30 | キヤノン株式会社 | 音声認識装置及びその方法、コンピュータ可読メモリ |
FR2881867A1 (fr) * | 2005-02-04 | 2006-08-11 | France Telecom | Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole |
JP4986028B2 (ja) * | 2007-01-19 | 2012-07-25 | Kddi株式会社 | 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体 |
US9595205B2 (en) * | 2012-12-18 | 2017-03-14 | Neuron Fuel, Inc. | Systems and methods for goal-based programming instruction |
US10510264B2 (en) | 2013-03-21 | 2019-12-17 | Neuron Fuel, Inc. | Systems and methods for customized lesson creation and application |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3646576A (en) * | 1970-01-09 | 1972-02-29 | David Thurston Griggs | Speech controlled phonetic typewriter |
DE3931638A1 (de) | 1989-09-22 | 1991-04-04 | Standard Elektrik Lorenz Ag | Verfahren zur sprecheradaptiven erkennung von sprache |
US5689616A (en) * | 1993-11-19 | 1997-11-18 | Itt Corporation | Automatic language identification/verification system |
US5794196A (en) | 1995-06-30 | 1998-08-11 | Kurzweil Applied Intelligence, Inc. | Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules |
JP3720595B2 (ja) * | 1998-09-17 | 2005-11-30 | キヤノン株式会社 | 音声認識装置及びその方法、コンピュータ可読メモリ |
US6057520A (en) * | 1999-06-30 | 2000-05-02 | Mcnc | Arc resistant high voltage micromachined electrostatic switch |
-
1998
- 1998-09-17 JP JP26355298A patent/JP3720595B2/ja not_active Expired - Fee Related
-
1999
- 1999-09-15 US US09/396,863 patent/US6438521B1/en not_active Expired - Lifetime
- 1999-09-16 EP EP99307355A patent/EP0987681B1/en not_active Expired - Lifetime
- 1999-09-16 DE DE69905668T patent/DE69905668T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69905668T2 (de) | 2003-09-25 |
DE69905668D1 (de) | 2003-04-10 |
EP0987681A2 (en) | 2000-03-22 |
EP0987681B1 (en) | 2003-03-05 |
US6438521B1 (en) | 2002-08-20 |
EP0987681A3 (en) | 2001-03-28 |
JP2000099070A (ja) | 2000-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
US6535849B1 (en) | Method and system for generating semi-literal transcripts for speech recognition systems | |
US5333275A (en) | System and method for time aligning speech | |
KR101183344B1 (ko) | 사용자 정정들을 이용한 자동 음성 인식 학습 | |
US6826531B2 (en) | Speech information processing method and apparatus and storage medium using a segment pitch pattern model | |
US7010489B1 (en) | Method for guiding text-to-speech output timing using speech recognition markers | |
CN110265028B (zh) | 语音合成语料库的构建方法、装置及设备 | |
JPH0850498A (ja) | 音声をテキストに変換するための方法および装置 | |
US8015008B2 (en) | System and method of using acoustic models for automatic speech recognition which distinguish pre- and post-vocalic consonants | |
JP2002132287A (ja) | 音声収録方法および音声収録装置および記憶媒体 | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
JP3720595B2 (ja) | 音声認識装置及びその方法、コンピュータ可読メモリ | |
JP2007322757A (ja) | 音声対話装置 | |
JP4296290B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP2745562B2 (ja) | ノイズ適応形音声認識装置 | |
CN110992986B (zh) | 单词音节重读检错方法、装置、电子设备和存储介质 | |
US6772116B2 (en) | Method of decoding telegraphic speech | |
JP2006243213A (ja) | 言語モデル変換装置、音響モデル変換装置、及びコンピュータプログラム | |
Levow | Adaptations in spoken corrections: Implications for models of conversational speech | |
JP2005283646A (ja) | 音声認識率推定装置 | |
JP2006018028A (ja) | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 | |
JP2975542B2 (ja) | 音声認識装置 | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 | |
JP3110025B2 (ja) | 発声変形検出装置 | |
JPH0634175B2 (ja) | 文章読上げ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050908 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090916 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090916 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100916 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100916 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110916 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110916 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120916 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120916 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130916 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |