JP3439602B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3439602B2
JP3439602B2 JP14558796A JP14558796A JP3439602B2 JP 3439602 B2 JP3439602 B2 JP 3439602B2 JP 14558796 A JP14558796 A JP 14558796A JP 14558796 A JP14558796 A JP 14558796A JP 3439602 B2 JP3439602 B2 JP 3439602B2
Authority
JP
Japan
Prior art keywords
similarity
peak value
result output
value
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14558796A
Other languages
English (en)
Other versions
JPH09325792A (ja
Inventor
章次 栗木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP14558796A priority Critical patent/JP3439602B2/ja
Publication of JPH09325792A publication Critical patent/JPH09325792A/ja
Application granted granted Critical
Publication of JP3439602B2 publication Critical patent/JP3439602B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声の特徴量
を抽出し、その抽出された特徴量に基く入力音声パター
ンと所定の標準パターンとを比較することにより音声を
認識する音声認識装置に関する。
【0002】
【従来の技術】計算機に対して、人間の発した音声によ
り情報を入力することは、有効な入力手段の1つであ
る。従来より、このような音声認識技術や、音声認識装
置に対して、様々な研究や開発が行われてきており、実
用化もされている。
【0003】一般に音声認識装置は、入力音声の開始点
と終了点とを検出して音声区間とし、この音声区間に対
して入力音声から特徴量を抽出し、この抽出された特徴
量により示される入力音声パターンと複数の所定の標準
パターンとを比較することにより、類似度を計算し、最
大の類似度が得られた標準パターンを認識結果として出
力する。しかし、このような音声区間を特定する方法に
おいては、語頭や語尾における発声が不明瞭であるため
音声区間を正確に決められない場合や、音声以外の区間
を誤って検出する場合が多々ある。
【0004】一方、ワードスポッティング法による認識
では、音声区間を特定する必要がなく、所定時間毎に入
力音声の最初から順次、入力音声パターンと複数の基準
となる標準パターンとをマッチングすることにより類似
度を計算する。このようにすると、入力音声パターン中
に標準パターンと同一のパターンが含まれている場合の
類似度は、基準となる標準パターンが入力音声パターン
中の同一パターン部分に近づくにつれ上昇し、パターン
が一致する点で類似度がピークとなり、それ以降は下降
する。従って、類似度の最大値(ピーク値)を検出する
ことで、入力音声に対する正しい標準パターンを特定で
きる。
【0005】この方法を応用したものに、例えば、特開
昭62−111293号公報に開示された発明がある。
この発明では、認識すべき音声とその前後の騒音を含む
十分長い区間を入力信号区間とし、この区間内でワード
スポッティング法により、類似度が最大となる標準パタ
ーンを認識結果として判断し出力することにより、音声
区間検出を行うことなく、騒音環境下で発声された音声
を認識対象音声とその前後に騒音を含んだ十分長い入力
の中から検出し認識する。図5を用いてその動作を説明
する。図5は、3つの標準パターンa、b、cについ
て、類似度の時間変化を表したものである。ここで、標
準パターンaが正しい認識対象であるとする。音声入力
がなく、かつ雑音の多い騒音区間では、正しくない標準
パターンの類似度が大きくなることがあり、図5では最
初の騒音区間で正しくない標準パターンbに対しピーク
P1が得られる。音声区間において音声が入力される
と、標準パターンaに対する類似度が大きくなりピーク
P2が得られ、次の騒音区間では、標準パターンcに対
しピークP3が得られる。標準パターンaのピークP2
が、標準パターンbのピークP1および標準パターンc
のピークP3よりも高いため、認識結果としてピークP2
が得られた標準パターンaが出力される。
【0006】
【発明が解決しようとする課題】しかし、上記発明にお
いては、十分長い入力音声区間が終了しなければ認識結
果が出力されないため、応答時間が長くなるという問題
がある。この問題を解決する方法として、入力音声区間
の終了を待たずに、類似度のピーク値を検出し、所定時
間(図5では、t1)の間、現在のピーク値を越えるピ
ーク値が他に検出されなければ、ピーク値が得られた標
準パターンを認識結果として出力するという方法があ
る。しかしこの方法では、入力音声がなく雑音が多い騒
音区間において、図5に示すように正しくない標準パタ
ーンbのピークP1および標準パターンcのピークP3が
検出された時、所定時間t1経過後に、誤った認識結果
が出力されるという問題がある。この問題に対しては、
類似度が所定の閾値以下の場合に、認識結果をリジェク
ト(棄却)するためのリジェクト閾値を設定することで
誤認識結果の出力を防止できる。すなわち、図5に示す
ようにリジェクト閾値を設定することで、ピークP1お
よびピークP3をリジェクトすることができる。しか
し、騒音区間において、環境が変化すると誤認識となる
標準パターンの類似度が変化するため、固定されたリジ
ェクト閾値では、効率的に誤認識をリジェクトすること
は不可能である。
【0007】この問題を解決するため、特公昭60−6
0080号公報に開示された、リジェクト閾値を周囲騒
音レベルにより変化させる方法や、特開平01−321
499号公報に開示された、入力音声のS/Nによりリ
ジェクト閾値を変化させる方法がある。
【0008】しかし、これらの方法では、リジェクト閾
値を決定するための騒音レベルを検出する必要がある。
騒音レベルの検出には、非音声区間の検出が必要であ
り、非音声区間はパワー情報を使用して検出されるが、
騒音が大きくなり、音声とのパワー差がなくなると非音
声区間の検出が不可能となる。このため、騒音レベルの
検出も不可能となる。従って、高騒音下では、リジェク
ト閾値の設定は不可能となり、誤認識結果をリジェクト
できないという問題がある。
【0009】本発明は、上記問題を解決すべくなされた
ものであり、その目的とするところは、静かな環境下に
おける応答性を向上させ、騒音環境下における誤認識を
防止する音声認識装置を提供することにある。
【0010】
【課題を解決するための手段】本発明に係る音声認識装
置は、入力音声信号から特徴量を抽出する特徴抽出手段
と、認識対象とする所定の標準パターンを複数種類格納
する標準パターン格納手段と、前記特徴量により示され
る入力音声パターンと複数の前記標準パターンとを比較
することにより、各標準パターンに対する類似度を計算
する類似度計算手段と、前記類似度計算手段により計算
された類似度のピーク値を検出するピーク値検出手段と
を備え、該ピーク値に基づいて複数の前記標準パターン
のうちいずれか1つのパターンを認識結果として出力す
る音声認識装置において、前記ピーク値を検出した時
に、前記ピーク値が検出された標準パターン以外の標準
パターンに対する類似度の平均値を計算する類似度平均
値計算手段と、前記ピーク値と前記類似度の平均値との
差を計算し、該差に基づいて、前記ピーク値が得られて
から前記認識結果を出力するまでの結果出力時間を決定
する結果出力時間決定手段と、前記結果出力時間決定手
段により決定された前記結果出力時間内に、新たにピー
ク値が検出される標準パターンがない場合に、ピーク値
が検出された標準パターンを認識結果として出力する認
識結果出力手段とを設ける。
【0011】前記音声認識装置において、前記結果出力
時間決定手段は、前記ピーク値と前記類似度の平均値と
の比に基づいて前記結果出力時間を決定してもよい。
【0012】前記音声認識装置において、前記結果出力
時間決定手段は、前記類似度の平均値に基づいて結果出
力時間を決定してもよい。
【0013】
【発明の効果】本発明の音声認識装置によれば、前記結
果出力時間決定手段において、前記ピーク値と前記類似
度の平均値との差もしくは比、または前記類似度の平均
値により、前記出力時間を決定する。これにより、静か
な環境下における応答性を向上させ、騒音環境下におけ
る誤認識を防止した音声認識装置、すなわち環境の変化
に応じた音声認識を行う音声認識装置を実現することが
できる。
【0014】
【発明の実施の形態】以下に添付の図面を用いて、本発
明の実施の形態の詳細な説明を行う。図1は、本実施形
態の音声認識装置の構成を示す機能ブロック図である。
音声認識装置はマイク5と、A/D変換部7と、特徴抽
出部11と、類似度計算部13と、標準パターン格納部
15と、類似度格納部17と、ピーク値格納部19と、
類似度平均値計算部21と、結果出力時間決定部23
と、リジェクト判断部25と、認識結果出力部27とか
ら構成される。これらの機能ブロックのうち、特徴抽出
部11と類似度計算部13と標準パターン格納部15と
類似度格納部17とピーク値格納部19と類似度平均値
計算部21と結果出力時間決定部23とリジェクト判断
部25と認識結果出力部27とは、パーソナルコンピュ
ータ等の電子計算機においてメモリ(主記憶部)に格納
された所定のプログラムをCPU(中央演算処置装置)
が実行することにより実現される。以下に各機能ブロッ
クについて説明する。
【0015】A/D変換部7は、マイク5を介して入力
された音声をデジタル信号に変換する。特徴抽出部11
は、A/D変換部7から出力された音声信号からその特
徴を抽出し、音声特徴抽出値に変換する。標準パターン
格納部15は、複数種類の予め用意された基準となる音
声のパターン(標準パターン)を格納している。
【0016】類似度計算部13は、特徴抽出部11によ
り変換された音声特徴抽出値により示される入力音声パ
ターンと、標準パターン格納部15に格納されている認
識対象である各標準パターンとを比較することにより、
類似度を計算する。本実施形態においては、前述したよ
うにワードスポッティング法により入力音声パターンと
複数の標準パターンとを所定時間毎に入力音声の最初か
ら順次にマッチングすることにより類似度を計算する。
類似度格納部17は、このようにして得られた類似度を
格納する。
【0017】ピーク値格納部19は、その時点の類似度
の最大値を格納する格納部であり、ピーク値格納部19
に格納している値と、類似度格納部17に格納している
値との間で大小を比較し、類似度格納部17の値が大き
い場合は、類似度格納部17の値でピーク値格納部19
の値を更新し、一方、ピーク値格納部19に格納してい
る値が大きい場合は、ピーク値格納部19の値を更新し
ない。これにより、ピーク値格納部19は、常にその時
点での最大値を格納する。類似度は時間と共に連続的に
変化するため、類似度の最大値は最終的には類似度の変
化におけるピーク値と等しくなる。そこで、本実施形態
においては、類似度のその時点の最大値を類似度のピー
ク値とみなし、以下では、ピーク値格納部19に格納さ
れている値をピーク値として説明を進める。また、ピー
ク値格納部19の値が更新されたか否かを確認すること
により、ピーク値が検出されたか否かを判断する。
【0018】類似度平均値計算部21は、ピーク値が検
出されたと判断された時点で、ピーク値が得られた標準
パターン以外の標準パターンに対する類似度の平均値を
計算する。
【0019】結果出力時間決定部23は、ピーク値格納
部19に格納されるピーク値と類似度平均値計算部21
により計算される類似度の平均値とから、結果出力時間
を決定する。ここで、結果出力時間とは、ピーク値を検
出してから、そのピーク値を認識結果として出力するま
での時間をいう。静かな環境下においては、正しい標準
パターンのピーク値は、それ以外の標準パターンの平均
の類似度と比較して高くなる。騒音環境下においては、
正しくない標準パターンの類似度が高くなったり、騒音
が入力音声に付加されることにより音声特徴抽出値が歪
められるため、正しい標準パターンのピーク値が下が
る。従って、騒音環境下においては、正しい標準パター
ンのピーク値と、それ以外の標準パターンの類似度の平
均値との差が、静かな環境下の場合と比較して小さくな
る。このため、類似度のピーク値と類似度の平均値との
差が所定値より小さい場合、正しい標準パターンが得ら
れている確率が低くなるので、結果出力時間を長く設定
する。一方、その差が所定値以上の場合は、正しい標準
パターンが得られている確率が高くなるので、短く設定
する。この結果出力時間の適切な値は実験により求め
る。本実施形態においては、騒音環境下では約1[se
c]、静かな環境下では100〜200[msec]に設定して
いる。この結果出力時間の長さを状況に応じて変化させ
ることにより、静かな環境下における応答性を良くし、
騒音環境下における誤認識を防止することができる。
【0020】リジェクト判断部25は、ピーク値が所定
のリジェクト閾値より大きいか否かを判断する。認識結
果出力部27は、結果出力時間経過後、リジェクト判断
部25からの判断結果に基づき、ピーク値がリジェクト
閾値以下の場合は、認識結果をリジェクトし、リジェク
ト閾値よりも大きい場合は、認識結果を出力する。
【0021】以下に、図2のフローチャートを用いて本
実施形態の音声認識装置の動作について説明する。
【0022】入力音声に対して、特徴抽出部11で特徴
が抽出され、音声特徴抽出値に変換される(S10
1)。類似度計算部13において、音声特徴抽出値に基
づいて標準パターン格納部15に格納された標準パター
ンの類似度が計算される(S102)。計算された類似
度は、類似度格納部17に格納される。次に、計算され
た類似度と、ピーク値格納部19に格納されている値を
比較することにより、ピーク値の検出を行う(S10
3)。すなわち、ステップS102で計算された類似度
がピーク値格納部19の値よりも大きい時に、新たにピ
ーク値が検出されたとして、ピーク値格納部19の値を
ステップS102で計算された類似度で置き換えること
により、その時点でのピーク値を更新する。ステップS
104でピーク値格納部19に格納される値が更新され
たかどうかの判断が行われる。ピーク値が更新されてい
ない場合すなわちピーク値が検出されなかった場合は、
ステップS101に戻る。ピーク値が更新されている場
合すなわちピーク値が検出された場合は、類似度平均値
計算部21において、ピーク値が得られた標準パターン
以外の標準パターンについて類似度の平均値が計算され
る(S105)。
【0023】結果出力時間決定部23で、前述したよう
に、類似度平均値計算部21において計算された類似度
の平均値とピーク値格納部19に格納されているピーク
値とから結果出力時間が決定される(S106)。結果
出力時間が決定された後、この結果出力時間の間、特徴
量の抽出(S107)、類似度の計算(S108)、ピ
ーク値の検出(S109)、ピーク値更新の有無の判断
(S110)が行われる。ステップS110において、
ピーク値が更新されたと判断された時は、ステップS1
05に進む。ステップS105で、類似度の平均値が計
算され、結果出力時間決定部23において新たに結果出
力時間が決定され(S104)、結果出力時間が更新さ
れる。ステップS110において、ピーク値が更新され
ていないと判断された時は、前のピーク値が更新されて
からの時間が、結果出力時間以上経過したかどうか判断
される(S111)。
【0024】結果出力時間以上経過していない場合は、
ステップS107に戻り、結果出力時間以上経過するま
で、ステップS107からステップS111が繰り返さ
れる。結果出力時間以上経過している場合は、ステップ
S112に進む。ステップS112においては、リジェ
クト判断部25でピーク値がリジェクト閾値より大きい
かどうか判断され、認識結果出力部27で、リジェクト
判断部25の判断結果に基づき、ピーク値がリジェクト
閾値より大きい場合に、ピーク値が得られた標準パター
ンが認識結果として出力され(S113)、ピーク値が
リジェクト閾値以下の場合は、リジェクトされる。
【0025】以下に、本実施形態の音声認識装置の、低
騒音環境下と高騒音環境下での音声入力に対するそれぞ
れの動作を示す。
【0026】図3は、静かな環境下すなわち低騒音環境
下での類似度の時間変化を表したものである。前述のよ
うに、静かな環境下においては、騒音の付加による入力
音声の特徴抽出値の歪みがないため、正しい標準パター
ンに対する類似度のピーク値と、それ以外の標準パター
ンの類似度の平均値との差が大きくなる。以下、図3に
示す音声入力に対する本実施形態の音声認識装置の動作
を説明する。
【0027】最初の低騒音区間において、特徴抽出部1
1と類似度計算部13により、標準パターンa、b、c
の類似度が算出される。低騒音区間において標準パター
ンbまたはcでピークが検出されるが、それらのピーク
値がリジェクト閾値より小さいため出力されることはな
い。音声区間に入ると、標準パターンaに対応した音声
が入力されるため標準パターンaの類似度が上昇し、標
準パターンaに対して最大類似度が得られるようにな
る。標準パターンaの類似度が上昇する間は、ピーク値
が更新されなくなるまで、類似度平均値計算部21で、
標準パターンa以外の標準パターンb、cに対する類似
度の平均値が計算され、結果出力時間決定部23で、ピ
ーク値と類似度の平均値とが比較され、結果出力時間が
決定される。音声区間終了付近で標準パターンaのピー
クP4が得られ、結果出力時間が設定されるが、この場
合、ピークP4の値と類似度平均値との差は大きいの
で、結果出力時間t2は、比較的短い時間、例えば10
0〜200[msec]の間に決定される。以後、結果出力時
間t2が経過する間、特徴量の抽出、類似度の計算、ピ
ーク値検出、ピーク値更新の監視が行われる。図3にお
いては、その後、さらなるピークは検出されないため、
結果出力時間(t2)経過後、認識結果出力部27で、
ピークP4を検出した標準パターンaが認識結果として
出力される。
【0028】図4は、高騒音環境下での類似度の時間変
化を表したものである。高騒音環境下では、騒音の付加
による入力音声の特徴抽出値の歪みによる正しい標準パ
ターンの類似度のピーク値の低下、または、正しくない
標準パターンの類似度の増大により、誤った認識結果が
出力されるという問題がある。以下、図4のような音声
入力に対する本実施形態の音声認識装置の動作を説明す
る。
【0029】最初の騒音区間において、特徴抽出部11
と類似度計算部13により、特徴が抽出され、標準パタ
ーンa、b、cの類似度が算出される。時点T1で標準
パターンbに対してピークP5が得られ、標準パターン
a、cに対する類似度の平均値が計算される。結果出力
時間決定部23において、結果出力時間(t3)が決定
されるが、この時、ピークP5の値と類似度の平均値と
の差が小さいため、結果出力時間(t3)は、比較的長
い時間、例えば1秒に設定される。その後、類似度の計
算、ピーク値更新の監視が結果出力時間(t3)の間行
われる。さらに時点T2を越えた時点で、標準パターン
aの類似度がピークP5の値を越えるため、ピーク値格
納部19の値が更新される。これにより、標準パターン
b、cに対し類似度の平均値が計算され、新たに結果出
力時間が計算される。さらに結果出力時間の間、類似度
の計算、ピーク値更新の監視が行われるが、この時、標
準パターンaの類似度は、時点T3まで上昇し続ける。
この間、ピーク値格納部19の値が更新され、新たに結
果出力時間が計算され、更新される。時点T3でピーク
P6が得られた後、結果出力時間(t4)の間、さらに
類似度の計算、ピーク値更新の監視が行われる。時点T
4で標準パターンcに対しピークP7が得られるが、その
値はピークP6の値より小さいため、ピーク値格納部1
9の値は更新されない。従って、結果出力時間(t4)
経過後、認識結果出力部27で、最大のピーク値を検出
した標準パターンaが認識結果として出力される。
【0030】このようにして、本実施形態の音声認識装
置では、入力された音声に対し、複数の標準パターンの
類似度が計算され、そのピーク値の検出が行われる。あ
る標準パターンに対して新たにピーク値が検出される
と、それ以外の標準パターンに対して類似度の平均値が
計算される。このようにして得られたピーク値と類似度
の平均値とが比較されることにより、ピーク値が検出さ
れてから結果出力するまでの結果出力時間が決定される
ため、静かな環境下における応答性が改善され、騒音環
境下における誤認識が防止される。すなわち、環境の変
化に追従する音声認識が可能となる。
【0031】尚、上記説明においては、結果出力時間の
決定は、「類似度のピーク値」と「類似度の平均値」の
差を所定の基準値と比較することにより決定したが、
「類似度のピーク値」を「類似度の平均値」で除算した
値を所定の基準値と比較することにより結果出力時間を
決定しても同様の効果が得られ、また類似度の平均値の
大きさにより結果出力時間を決定しても同様の効果が得
られることは明らかである。
【0032】また既述のように、本実施形態の音声認識
装置の主要部を構成する各機能ブロックは、パーソナル
コンピュータ等の電子計算機において、CPUがメモリ
に格納されたプログラムを実行することにより実現され
るが、専用のハードウェアで構成されてもよい。
【図面の簡単な説明】
【図1】 本発明の実施形態の音声認識装置の構成を示
すブロック図。
【図2】 本発明の実施形態の音声認識装置の動作を示
すフローチャート。
【図3】 静かな環境下での類似度の時間変化を示す
図。
【図4】 騒音環境下での類似度の時間変化を示す図。
【図5】 音声認識対象の類似度の時間変化を示す図。
【符号の説明】
5…マイク、7…A/D変換部、11…特徴抽出部、1
3…類似度計算部、15…標準パターン格納部、17…
類似度格納部、19…ピーク値格納部、21…類似度平
均値格納部、23…結果出力時間決定部、25…リジェ
クト判断部、27…認識結果出力部、P1〜P7…類似度
のピーク、t1〜t4…結果出力時間、T1〜T4…時点。
フロントページの続き (56)参考文献 特開 昭59−199399(JP,A) 特開 平2−125299(JP,A) 特開 平6−43895(JP,A) 特開 平8−115093(JP,A) 特開 昭62−134699(JP,A) 特開 平1−156800(JP,A) 特開 昭63−306499(JP,A) 特許2627745(JP,B2) 特許3360978(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声信号から特徴量を抽出する特徴
    抽出手段と、認識対象とする所定の標準パターンを複数
    種類格納する標準パターン格納手段と、前記特徴量によ
    り示される入力音声パターンと複数の前記標準パターン
    とを比較することにより、各標準パターンに対する類似
    度を計算する類似度計算手段と、前記類似度計算手段に
    より計算された類似度のピーク値を検出するピーク値検
    出手段とを備え、該ピーク値に基づいて複数の前記標準
    パターンのうちいずれか1つのパターンを認識結果とし
    て出力する音声認識装置において、 前記ピーク値を検出した時に、前記ピーク値が検出され
    た標準パターン以外の標準パターンに対する類似度の平
    均値を計算する類似度平均値計算手段と、 前記ピーク値と前記類似度の平均値との差を計算し、該
    差に基づいて、前記ピーク値が得られてから前記認識結
    果を出力するまでの結果出力時間を決定する結果出力時
    間決定手段と、 前記結果出力時間決定手段により決定された前記結果出
    力時間内に新たにピーク値が検出される標準パターンが
    ない場合に、ピーク値が検出された標準パターンを認識
    結果として出力する認識結果出力手段とを設けたことを
    特徴とする音声認識装置。
  2. 【請求項2】 請求項1に記載の音声認識装置におい
    て、前記結果出力時間決定手段は、前記差の代わりに、
    前記ピーク値と前記類似度の平均値との比に基づいて前
    記結果出力時間を決定することを特徴とする音声認識装
    置。
  3. 【請求項3】 請求項1に記載の音声認識装置におい
    て、前記結果出力時間決定手段は、前記差の代わりに、
    前記類似度の平均値に基づいて前記結果出力時間を決定
    することを特徴とする音声認識装置。
JP14558796A 1996-06-07 1996-06-07 音声認識装置 Expired - Fee Related JP3439602B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14558796A JP3439602B2 (ja) 1996-06-07 1996-06-07 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14558796A JP3439602B2 (ja) 1996-06-07 1996-06-07 音声認識装置

Publications (2)

Publication Number Publication Date
JPH09325792A JPH09325792A (ja) 1997-12-16
JP3439602B2 true JP3439602B2 (ja) 2003-08-25

Family

ID=15388544

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14558796A Expired - Fee Related JP3439602B2 (ja) 1996-06-07 1996-06-07 音声認識装置

Country Status (1)

Country Link
JP (1) JP3439602B2 (ja)

Also Published As

Publication number Publication date
JPH09325792A (ja) 1997-12-16

Similar Documents

Publication Publication Date Title
JP3789246B2 (ja) 音声区間検出装置、音声区間検出方法、音声認識装置、音声認識方法および記録媒体
US6134527A (en) Method of testing a vocabulary word being enrolled in a speech recognition system
JPH10319988A (ja) 話者識別方法および話者認識装置
JP2003202887A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US6230129B1 (en) Segment-based similarity method for low complexity speech recognizer
EP1023718B1 (en) Pattern recognition using multiple reference models
JP3069531B2 (ja) 音声認識方法
CN109065026B (zh) 一种录音控制方法及装置
CN114155839A (zh) 一种语音端点检测方法、装置、设备及存储介质
JP3496706B2 (ja) 音声認識方法及びそのプログラム記録媒体
JP3439602B2 (ja) 音声認識装置
JP2975772B2 (ja) 音声認識装置
JP3114757B2 (ja) 音声認識装置
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
US20040102974A1 (en) Method for computer-supported speech recognition, speech recognition sytem and control device for controlling a technical sytem and telecommunications device
JP3484559B2 (ja) 音声認識装置および音声認識方法
JP3360978B2 (ja) 音声認識装置
JP3135594B2 (ja) パターン認識装置およびパターン認識方法
KR100449912B1 (ko) 음성인식시스템의 핵심어 검출을 위한 후처리방법
JP4391031B2 (ja) 音声認識装置
JPH0997095A (ja) 音声認識装置
JP3031081B2 (ja) 音声認識装置
KR101195742B1 (ko) 키워드별 필러 모델을 구비하는 키워드 검출 시스템 및 키워드별 필러 모델 구현 방법
JP3533773B2 (ja) 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置
JP2901976B2 (ja) パターン照合予備選択方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080613

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090613

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090613

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100613

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees