JPH0635495A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0635495A
JPH0635495A JP21201392A JP21201392A JPH0635495A JP H0635495 A JPH0635495 A JP H0635495A JP 21201392 A JP21201392 A JP 21201392A JP 21201392 A JP21201392 A JP 21201392A JP H0635495 A JPH0635495 A JP H0635495A
Authority
JP
Japan
Prior art keywords
voice
standard pattern
feature vector
input
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP21201392A
Other languages
English (en)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP21201392A priority Critical patent/JPH0635495A/ja
Publication of JPH0635495A publication Critical patent/JPH0635495A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 無音区間やパワ−の小さい子音区間のよう
に、騒音の影響を大きく受ける区間においても騒音によ
る誤認識,誤動作を低減することができ、高精度の認識
結果を得ることが可能である。 【構成】 標準パターン記憶部3に記憶される特徴ベク
トルに、音声の大きさを表わす特徴量をも付加し、類似
度計算部4において、標準パターンの特徴ベクトルと入
力信号の特徴ベクトルとの距離を求める際に、標準パタ
ーン記憶部3に記憶されている音声の大きさを表わす特
徴量で重み付けをする。無音区間やパワ−の小さい子音
区間のように、騒音の影響を大きく受ける区間について
は重みを小さく設定すれば、騒音下においても音声パタ
−ンの照合精度を高めることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声の入力パターンと
標準パターンとの類似度を求めて、音声認識処理を行な
う音声認識装置に関する。
【0002】
【従来の技術】一般に、音声認識装置では、音声の入力
パターンと標準パターンとを照合し、その類似度に基づ
いて音声認識結果を出力するようになっている。入力パ
ターンと標準パターンとの類似度を求めるのに、従来で
は、DPマッチング法が良く知られている。このDPマ
ッチング法は、標準パターンと入力パターンの局所距離
(i番目の入力ベクトルとj番目の標準ベクトルとの距
離)から、標準パターンと入力パターンの累積距離が最
小となる最適累積距離を見つけ、この最適累積距離が最
小となる標準パターンを照合結果として出力するもので
あり、局所距離としては、例えば、ユークリッド距離,
マハラノビスの距離などを用いることができる。例え
ば、i番目の入力パターンのfチャンネル目のデータを
X(i,f)、i番目の標準パターンのfチャンネル目
の特徴量をY(j,f)とした場合に、ユークリッド距
離de(i,j)は、次式によって求められる。
【0003】
【数1】
【0004】
【発明が解決しようとする課題】このようにして求めた
局所距離は、周囲の騒音が小さい場合は、非常に有効で
あるが、例えば工場や自動車内等において周囲の騒音が
大きい場合、音声のパワ−の小さな音や無音区間では、
騒音の影響を大きく受け、上記局所距離に基づき音声認
識処理を行なうと、誤認識,誤動作が生じるという問題
があった。
【0005】本発明は、無音区間やパワ−の小さい子音
区間のように、騒音の影響を大きく受ける区間において
も騒音による誤認識,誤動作を低減することができ、高
精度の認識結果を得ることの可能な音声認識装置を提供
することを目的としている。
【0006】
【課題を解決するための手段および作用】上記目的を達
成するために、請求項1記載の発明は、音声を入力する
音声入力手段と、音声入力手段より入力された入力信号
を特徴ベクトルの時系列に変換する入力パターン生成手
段と、予め登録された音声を1つ以上の状態に分け、各
状態毎の特徴ベクトルで構成される標準パターンを記憶
する標準パターン記憶手段と、入力パターン生成手段で
生成された特徴ベクトルの時系列と標準パターン記憶部
に記憶されている標準パターンとの類似度を求める類似
度計算手段と、類似度計算手段で求めた類似度結果を用
いて認識処理を行なう認識処理手段とを有し、標準パタ
ーン記憶手段に記憶される特徴ベクトルには、音声の大
きさを表わす特徴量も付加されており、類似度計算手段
において、標準パターンの特徴ベクトルと入力信号の特
徴ベクトルとの距離を求める際に、標準パターン記憶手
段に記憶されている音声の大きさを表わす特徴量で重み
付けをすることを特徴としている。これにより、無音区
間やパワ−の小さい子音区間のように、騒音の影響を大
きく受ける区間については重みを小さく設定すれば、騒
音下においても音声パタ−ンの照合精度を高めることが
できる。
【0007】また、請求項2記載の発明では、類似度計
算手段は、標準パターンの状態毎の特徴ベクトルと入力
信号の特徴ベクトルとの距離を求める際に、標準パター
ン記憶手段に記憶されている音声の大きさを表わす特徴
量と入力音声の大きさを表わす特徴量との差の絶対値の
逆数で重み付けをすることを特徴としている。これによ
り、無音区間やパワ−の小さい子音区間のように、騒音
の影響を大きく受ける区間については、重みは自動的に
小さくすることができ、騒音下においても音声パタ−ン
の照合精度を高めることができる。
【0008】また、請求項3記載の発明では、標準パタ
ーン記憶手段には、標準パターンを複数の状態に分け、
各状態毎の特徴ベクトルと継続時間長とが記憶されてお
り、類似度計算手段は、各状態毎の特徴ベクトルと継続
時間長から求めた状態遷移重みを用いて類似度計算を行
なう場合、距離計算を行なう際の音声の大きさによる重
み付けが大きいときには状態遷移重みを軽く、また重み
付けが小さいときには状態遷移重みを重くして、類似度
計算を行なうことを特徴としている。これにより、類似
度計算を行なう際に、無音区間や子音区間での局所距離
が小さくなるように重み付けがなされる場合にも、無音
区間や子音区間の状態に継続している時間が長くなるこ
とを防止できる。
【0009】また、請求項4,5記載の発明では、類似
度計算手段は、周囲騒音の大きさに応じて重み付けをす
る割合いを適合的に変化させることを特徴としている。
特に、請求項5記載の発明では、周囲騒音が小さい場合
には、重み付けを行なわないことを特徴としている。こ
れにより、低騒音時の認識精度を低下させることなく、
音声パタ−ンの照合精度を高めることができる。
【0010】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明に係る音声認識装置の第1の実施例
のブロック図である。図1を参照すると、この音声認識
装置は、音声を入力する音声入力部1と、音声入力部1
より入力された入力信号を特徴ベクトルの時系列に変換
する入力パターン生成部2と、予め登録された音声を1
つ以上の状態に分割し、各状態毎の特徴ベクトルで構成
される標準パターンを記憶する標準パターン記憶部3
と、入力パターン生成部2で生成された特徴ベクトルの
時系列と標準パターン記憶部3に記憶されている標準パ
ターンとの類似度を求める類似度計算部4と、類似度計
算部4で求めた類似度結果を用いて認識処理を行なう認
識処理部5とを有している。ここで、標準パターン記憶
部3に記憶されている特徴パタ−ンには、音声の大きさ
を表わす特徴量も付加されている。また、類似度計算部
4は、例えば特開昭64−23299号に開示されてい
るような仕方で、標準パターンの状態毎の特徴ベクトル
と入力信号の特徴ベクトルとの距離を求めるが、本発明
では、その際に、標準パターン記憶部3に記憶されてい
る音声の大きさを表わす特徴量で距離に対する重み付け
を行なうようになっている。
【0011】次に、このような構成の音声認識装置の処
理動作を図2のフローチャートを用いて説明する。実際
の音声認識処理を行なうに先立って、標準パターン記憶
部3には、認識対象語を1つ以上の状態に分け、各状態
毎に求めた特徴ベクトルY(j,f)(j:状態番号、
f:分析チャンネル)と、状態内のパワ−Pd(j)と
を記憶しておく。なお、この特徴ベクトルY(j,f)
には、入力パターン生成部2で使用される特徴ベクトル
と同じ種類の特徴ベクトルを用い、また、パワ−Pd
(j)には、状態内の音声信号の自乗値の短時間平均を
用いることができる。
【0012】標準パターンの生成方法としては、認識対
象語を一定の状態数J個に分け、各状態毎に、状態内の
全フレームの特徴ベクトルの平均ベクトルを求める方法
や、全音素の特徴ベクトルを記憶しておき、認識対象語
の音素記号列に応じて、標準パターンを生成する方法な
どがある。例えば、“さっぽろ”の場合、/saqpo
ro/という音素記号列で表わすことができるので、/
s/,/a/,/q/,/p/,/o/,/r/,/o
/の各音素の特徴ベクトルから標準パターンを生成する
ことができる。
【0013】このようにして、標準パターン記憶部3に
標準パターンを予め記憶した後、先づ、音声入力部1で
は、マイクロホンのような音響/電気信号変換器を用い
て、入力音を電気信号X(t)に変換する(ステップS
1)。次いで、入力パターン生成部2では、音声入力部
1で得られた入力信号X(t)を10m秒程度のフレー
ム単位に分析を行ない、特徴ベクトルの時系列X(i,
f)(i:フレーム番号、f:分析チャンネル)を求め
る(ステップS2)。なお、フレーム単位の分析方法と
しては、バンドパスフィルタ群を用いて、入力信号X
(t)のスペクトラムを得る方法や、入力信号X(t)
をデジタル信号に変換した後、LPC分析を行ない、線
形予測係数,LPCケプストラムを求める方法などがあ
る。
【0014】次いで、類似度計算部4では、入力パター
ン生成部2で生成された入力パターンの特徴ベクトルX
(i,f)と、標準パターン記憶部3に記憶されている
標準パターンの特徴ベクトルY(j,f)との距離,例
えばユ−クリッド距離を標準パタ−ンの状態内パワ−P
d(j)で重み付けし、入力パタ−ンと標準パタ−ンと
の局所距離d(i,j)を次式により求める(ステップ
S3)。
【0015】
【数2】
【0016】しかる後、類似度計算部4は、この局所距
離d(i,j)に基づき例えば後述のような既知の仕方
で類似度Dを求め、認識処理を行なうことができる(ス
テップS4)。
【0017】このように図2の処理例では、入力パタ−
ンの特徴ベクトルX(i,f)と標準パタ−ンの特徴ベ
クトルY(j,f)との距離を状態内パワ−Pd(j)
で重み付けして、局所距離d(i,j)を求めている。
従って、無音区間やパワ−の小さい子音区間のように、
騒音の影響を大きく受ける区間については重みを小さく
設定すれば、この区間における騒音の影響を小さくする
ことができ、騒音下においても音声パタ−ンの照合精度
を高めることができ、誤認識を低減することができる。
【0018】図3は他の音声認識処理例を示すフローチ
ャートである。図3において、ステップS11,S14
の処理は、図2のステップS1,S4の処理と同じであ
り、ステップS12,S13の入力パタ−ン生成部2,
類似度計算部4における処理だけが図2の処理と異なっ
ている。すなわち、図3の処理では、入力パタ−ン生成
部2は、入力音声の特徴ベクトルの時系列X(i,f)
の他に、入力音声パワ−の時系列Pr(i)をも生成す
る(ステップS12)。また、類似度計算部4は、入力
パタ−ンの特徴ベクトルX(i,f)と標準パタ−ンの
特徴ベクトルY(j,f)との距離を、入力音声パワ−
Pr(i)と標準パタ−ンの状態内パワ−Pd(j)と
の差の絶対値の逆数で重み付けし、局所距離d(i,
j)を次式のように求める(ステップS13)。
【0019】
【数3】
【0020】しかる後、この局所距離d(i,j)に基
づき、例えば後述のような既知の仕方で類似度Dを求
め、認識処理を行なうことができる(ステップS1
4)。
【0021】このように、図3の処理では、標準パタ−
ンの特徴ベクトルと入力パタ−ンの特徴ベクトルとの距
離を求める際に、標準パタ−ンの音声のパワ−Pd
(j)と入力音声のパワ−Pr(i)との差で重み付け
を行なっており、数5から入力音声のパワ−Pr(i)
が小さいときには、|Pr(i)−Pd(j)|が大き
くなり、従って、重みが小さくなるので、無音区間やパ
ワ−の小さい子音区間のように騒音の影響を大きく受け
る区間の重みを自動的に小さくすることができ、図2の
処理に比べて、より確実に騒音下での音声パターンの照
合精度を高め、誤認識を低減することができる。
【0022】上述の各例において、類似度Dは、例えば
特開昭64−23299号に開示されているような動的
計画法や山登り法等を用いたパターンマッチングにより
局所距離d(i,j)から求めることができる。具体的
には、動的計画法を用いたパターンマッチングでは、D
(i,j)を格子点(i,j)に到達する最適累積距
離、Iを入力音声のフレーム数、Nを状態数とすると、
D(i,j)をD(1,1)=d(1,1)のように初
期設定した後、状態番号jが1であり、入力フレーム番
号iが2≦i≦Iの場合、D(i,1)は、次式により
d(i,1)から求まる。
【0023】
【数4】 D(i,1)=D(i−1,1)+d(i,1)
【0024】また、状態番号jが2≦j≦Jで入力フレ
ーム番号iが2≦i≦Iの場合には、D(i,j)は、
次式によりd(i,j)から求まる。
【0025】
【数5】
【0026】数5において、Wは状態遷移の重みであ
り、この状態遷移の重みWは入力パターンと標準パター
ンとの対応において極端な時間伸縮を防止するために,
すなわち時間長制御のために設けられている。この時間
長制御を行うため(重みWを決定するため)、特開昭6
4−23299号では、標準パターンは、各状態毎に、
状態を代表する特徴ベクトルとともに状態の継続時間L
d(j)をも有しており、標準パタ−ンの状態jに対応
する入力パタ−ンの継続時間がLr(j)であるとき、
状態遷移の重みWを{Lr(j)−Ld(j)}2で定
義している。このようにして、数4,数5により、D
(i,j)を求め、最終的に類似度Dを累積距離D
(I,J)として求めることができる。従って、特開昭
64−23299号に開示の仕方で類似度Dを計算しよ
うとする場合には、標準パターン記憶部3に記憶する特
徴ベクトルに、各状態の継続時間も加えておく必要があ
る。
【0027】類似度Dの計算に特開昭64−23299
号に示されているような手法が用いられるとき、図2の
処理において、さらに、状態遷移重みWに標準パタ−ン
の状態内パワ−Pd(j)で重み付けをして、類似度計
算を行なうこともできる。図4は図2の処理にさらに状
態遷移重みの重み付けを行なう場合の処理例を示すフロ
−チャ−トである。なお、図4において、ステップS2
1乃至23およびステップS25の処理は、図2のステ
ップS1乃至3およびステップS4の処理と同じであ
り、ステップS24の処理が図2の処理と異なってい
る。すなわち、図4の処理において、ステップS24で
は、状態遷移を行なう際に加えられる状態遷移重みW=
{Lr(j)−Ld(j)}2を状態内パワ−Pd
(j)の逆数で重み付けして、W’=(1/Pd
(j))×{Lr(j)−Ld(j)}2とした上で、
類似度計算を行なう。
【0028】図2の処理あるいは図3の処理では無音区
間や子音区間での局所距離が小さくなるように重み付け
をしているので、この結果、上述のような手法で類似度
計算が行なわれる際、無音区間,子音区間の状態に継続
している時間が長くなるという問題が生ずる。これに対
して、図4の処理がなされる場合には、音声の大きさに
よる重み付けの重みPd(j)が重いときには、状態遷
移重みW’は軽くなり、また、音声の大きさによる重み
付けの重みPd(j)が軽いときには、状態遷移重み
W’は重くなるので、無音区間や子音区間での局所距離
が小さくなるように重み付けがなされる場合にも、無音
区間,子音区間の状態に継続している時間が長くなるの
を抑えることができる。
【0029】図5は本発明に係る音声認識装置の第2の
実施例のブロック図である。なお、図5において、図1
と同様の箇所には同じ符号を付している。この第2の実
施例の音声認識装置では、騒音の大小を判定する騒音大
小判定部6が設けられており、類似度計算部4は、騒音
大小判定部6で判定された騒音の大小に応じて重み付け
をするか否かを判断し、類似度Dを計算するようになっ
ている。例えば、周囲騒音が小さいと判定されたときに
は、類似度計算部4は、距離に重み付けをせず、数1で
定まる距離de(i,j)だけにより類似度Dを計算す
るようになっている。
【0030】次にこのような構成の音声認識装置の動作
を図6のフローチャートを用いて説明する。なお、図6
において、ステップS31,S32の処理およびステッ
プS36の処理は、図2のステップS1,S2およびス
テップS4の処理と同じであり、ステップS33乃至S
35の処理が図2の処理と異なっている。すなわち、こ
の第2の実施例の音声認識装置では、騒音大小判定部6
は、例えば、音声を入力していない状態での音声入力部
1からの入力信号X(t)の2乗値の短時間平均値を求
め、この短時間平均値が予め定められている基準値以上
となったか否かにより、周囲騒音の大小を判定する(ス
テップS33)。この判定の結果、騒音が大きいと判定
された場合には、図2のステップS3と同様の処理を行
なう。すなわち、類似度計算部4は、入力パターン生成
部2で生成された特徴ベクトルX(i,f)と、標準パ
ターン記憶部3に記憶されている標準パターンの特徴ベ
クトルY(j,f)との距離を状態内パワ−Pd(j)
で重み付けし、入力パターンと標準パターンとの局所距
離d(i,j)を数2に従って求め(ステップS3
5)、これに基づき例えば前述したと同様の仕方で類似
度Dを求め、認識処理を行なうことができる(ステップ
S36)。
【0031】これに対し、ステップS33において、騒
音が小さいと判定された場合には、距離に重み付けをせ
ず、数1により求まる距離成分de(i,j)を局所距
離d(i,j)として用い(ステップS34)、これに
より類似度Dを求め、認識処理を行なう(ステップS3
6)。前述の第1の実施例では、高騒音下での認識精度
についてはこれを向上させることができるが、低騒音下
での認識時、特に、母音部が同じで子音部のみが違う音
声(/nemuro/,/meguroなど)の認識時
には、重み付けをすることで、かえって精度が低下する
場合がある。これに対し、上述の第2の実施例では、周
囲騒音が小さい場合には、標準パターンの特徴ベクトル
と入力パターンの特徴ベクトルの距離を求める際の重み
付けを行なわないので、低騒音時の認識精度を低下させ
ることなく、騒音下での音声パターン照合の精度を高め
ることができる。
【0032】なお、上記例では、騒音大小判定部6は、
音声を入力していない状態での入力信号の2乗値の短時
間平均値が、予め定めておいた基準値以上になった場合
に、周囲騒音が大きいと判定するようになっているが、
他の方法により騒音の大小を判定することも可能であ
る。
【0033】図7は本発明に係る音声認識装置の第3の
実施例のブロック図である。この第3の実施例の音声認
識装置では、第1の実施例の音声認識装置に、さらに、
騒音レベルを検出する騒音レベル検出部7が設けられて
おり、類似度計算部4は、騒音レベル検出部7で検出さ
れた騒音のレベル(大きさ)に応じて、重み付けをする
割合を適合的に変化させるようになっている。
【0034】次にこのような構成の音声認識装置の動作
を図8のフローチャートを用いて説明する。なお、図8
において、ステップS41,S42およびステップS4
4の処理は、図2のステップS1,S2およびステップ
S4の処理と同じであり、ステップS43における処理
が図2の処理と異なっている。すなわち、この第3の実
施例では、騒音レベル検出部7は、例えば、音声を入力
していない状態での音声入力部1からの入力信号X
(t)の2乗値の短時間平均値を求め、これが十分大き
い場合には騒音レベルNを“1.0”として検出し、短
時間平均値が小さい場合には騒音レベルNを“0.0”
として検出する。すなわち、騒音の大きさに応じて、騒
音レベルNを“0.0”から“1.0”の範囲内で検出
する。類似度計算部4は、入力パターンの特徴ベクトル
X(i,f)と標準パターンの特徴ベクトルY(j,
f)の距離に、標準パターンの状態内パワーPd(j)
と騒音レベル検出部7で検出した騒音レベルNとを考慮
して、次式のようの、入力パターンと標準パターンとの
局所距離d(i,j)を求める(ステップS43)。
【0035】
【数6】
【0036】数6に従って、局所距離d(i,j)を求
めた後、これに基づき、例えば前述したと同様の仕方で
類似度Dを求め、認識処理を行なうことができる(ステ
ップS44)。
【0037】第3の実施例では、数6からわかるよう
に、騒音が小さく騒音レベルNが“0.0”であるとき
には、局所距離d(i,j)は数1のように求まり、重
み付けを行なわない。これに対し、騒音が十分大きく、
騒音レベルNが“1.0”であるときには、局所距離d
(i,j)は数2のように求まり、状態内パワーPd
(j)での重み付けがなされる。また、騒音が十分大き
くないが、十分小さくもない場合には、騒音レベルNは
“0.0”と“1.0”との間の値となり、この間の値
で状態内パワーPd(j)の重み付けがなされる。
【0038】このように、第3の実施例は、第2の実施
例を一般化したものとなっており、第2の実施例は、第
3の実施例の特別な場合となっている。第3の実施例の
ように、一般化し、騒音の大きさに応じて重み付けをす
る割合を適合的に変化させることによって、より高精度
の音声パターン照合が可能となる。
【0039】なお、上述の例では、騒音レベルNを
“0.0”から“1.0”までの値で表わしているが、
騒音レベルNを他の仕方で定義することも可能である。
また、騒音レベルNに応じた重み付けを数6で表わされ
る仕方以外の方法で行なうこともできる。
【0040】
【発明の効果】以上に説明したように、請求項1記載の
発明によれば、標準パターン記憶手段に記憶される特徴
ベクトルに、音声の大きさを表わす特徴量をも付加し、
類似度計算手段において、標準パターンの特徴ベクトル
と入力信号の特徴ベクトルとの距離を求める際に、標準
パターン記憶手段に記憶されている音声の大きさを表わ
す特徴量で重み付けをするようにしているので、無音区
間やパワ−の小さい子音区間のように、騒音の影響を大
きく受ける区間については重みを小さく設定すれば、騒
音下においても音声パタ−ンの照合精度を高めることが
できる。
【0041】また、請求項2記載の発明によれば、類似
度計算手段は、標準パターンの状態毎の特徴ベクトルと
入力信号の特徴ベクトルとの距離を求める際に、標準パ
ターン記憶手段に記憶されている音声の大きさを表わす
特徴量と入力音声の大きさを表わす特徴量との差の絶対
値の逆数で重み付けをするので、無音区間やパワ−の小
さい子音区間のように、騒音の影響を大きく受ける区間
については、重みは自動的に小さくすることができ、騒
音下においても音声パタ−ンの照合精度を高めることが
できる。
【0042】また、請求項3記載の発明によれば、標準
パターン記憶手段には、標準パターンを複数の状態に分
け、各状態毎の特徴ベクトルと継続時間長とが記憶され
ており、類似度計算手段は、各状態毎の特徴ベクトルと
継続時間長から求めた状態遷移重みを用いて類似度計算
を行なう場合、距離計算を行なう際の音声の大きさによ
る重み付けが大きいときには状態遷移重みを軽く、また
重み付けが小さいときには状態遷移重みを重くして、類
似度計算を行なうので、類似度計算を行なう際に、無音
区間や子音区間での局所距離が小さくなるように重み付
けがなされる場合にも、無音区間や子音区間の状態に継
続している時間が長くなることを防止できる。
【0043】また、請求項4,5記載の発明によれば、
類似度計算手段は、周囲騒音の大きさに応じて重み付け
をする割合いを適合的に変化させ、特に、請求項5記載
の発明では、周囲騒音が小さい場合には、重み付けを行
なわないので、低騒音時の認識精度を低下させることな
く、音声パタ−ンの照合精度を高めることができる。
【図面の簡単な説明】
【図1】本発明に係る音声認識装置の第1の実施例のブ
ロック図である。
【図2】図1の音声認識装置の処理動作の一例を示すフ
ローチャートである。
【図3】図1の音声認識装置の処理動作の一例を示すフ
ローチャートである。
【図4】図1の音声認識装置の処理動作の一例を示すフ
ローチャートである。
【図5】本発明に係る音声認識装置の第2の実施例のブ
ロック図である。
【図6】図5の音声認識装置の処理動作の一例を示すフ
ローチャートである。
【図7】本発明に係る音声認識装置の第3の実施例のブ
ロック図である。
【図8】図7の音声認識装置の処理動作の一例を示すフ
ローチャートである。
【符号の説明】
1 音声入力部 2 入力パタ−ン生成部 3 標準パターン記憶部 4 類似度計算部 5 認識処理部 6 騒音大小判定部 7 騒音レベル検出部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する音声入力手段と、前記音
    声入力手段より入力された入力信号を特徴ベクトルの時
    系列に変換する入力パターン生成手段と、予め登録され
    た音声を1つ以上の状態に分け、各状態毎の特徴ベクト
    ルで構成される標準パターンを記憶する標準パターン記
    憶手段と、前記入力パターン生成手段で生成された特徴
    ベクトルの時系列と前記標準パターン記憶部に記憶され
    ている標準パターンとの類似度を求める類似度計算手段
    と、前記類似度計算手段で求めた類似度結果を用いて認
    識処理を行なう認識処理手段とを有し、前記標準パター
    ン記憶手段に記憶される特徴ベクトルには、音声の大き
    さを表わす特徴量も付加されており、前記類似度計算手
    段において、標準パターンの特徴ベクトルと入力信号の
    特徴ベクトルとの距離を求める際に、標準パターン記憶
    手段に記憶されている音声の大きさを表わす特徴量で重
    み付けをすることを特徴とする音声認識装置。
  2. 【請求項2】 請求項1記載の音声認識装置において、
    前記類似度計算手段は、標準パターンの状態毎の特徴ベ
    クトルと入力信号の特徴ベクトルとの距離を求める際
    に、標準パターン記憶手段に記憶されている音声の大き
    さを表わす特徴量と入力音声の大きさを表わす特徴量と
    の差の絶対値の逆数で重み付けをすることを特徴とする
    音声認識装置。
  3. 【請求項3】 請求項1または2記載の音声認識装置に
    おいて、前記標準パターン記憶手段には、標準パターン
    を複数の状態に分け、各状態毎の特徴ベクトルと継続時
    間長とが記憶されており、前記類似度計算手段は、各状
    態毎の特徴ベクトルと継続時間長から求めた状態遷移重
    みを用いて類似度計算を行なう場合、距離計算を行なう
    際の音声の大きさによる重み付けが大きいときには状態
    遷移重みを軽く、また重み付けが小さいときには状態遷
    移重みを重くして、類似度計算を行なうことを特徴とす
    る音声認識装置。
  4. 【請求項4】 請求項1,2または3記載の音声認識装
    置において、前記類似度計算手段は、周囲騒音の大きさ
    に応じて重み付けをする割合いを適合的に変化させるこ
    とを特徴とする音声認識装置。
  5. 【請求項5】 請求項4記載の音声認識装置において、
    周囲騒音が小さい場合には、重み付けを行なわないこと
    を特徴とする音声認識装置。
JP21201392A 1992-07-16 1992-07-16 音声認識装置 Pending JPH0635495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21201392A JPH0635495A (ja) 1992-07-16 1992-07-16 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21201392A JPH0635495A (ja) 1992-07-16 1992-07-16 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0635495A true JPH0635495A (ja) 1994-02-10

Family

ID=16615440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21201392A Pending JPH0635495A (ja) 1992-07-16 1992-07-16 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0635495A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007023660A1 (ja) * 2005-08-24 2007-03-01 Matsushita Electric Industrial Co., Ltd. 音識別装置
JP2008249807A (ja) * 2007-03-29 2008-10-16 Kddi Corp 音声認識方法および装置ならびに音声認識プログラムおよびその記録媒体
JP2019035935A (ja) * 2017-08-10 2019-03-07 トヨタ自動車株式会社 音声認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007023660A1 (ja) * 2005-08-24 2007-03-01 Matsushita Electric Industrial Co., Ltd. 音識別装置
US7473838B2 (en) 2005-08-24 2009-01-06 Matsushita Electric Industrial Co., Ltd. Sound identification apparatus
JP2008249807A (ja) * 2007-03-29 2008-10-16 Kddi Corp 音声認識方法および装置ならびに音声認識プログラムおよびその記録媒体
JP2019035935A (ja) * 2017-08-10 2019-03-07 トヨタ自動車株式会社 音声認識装置

Similar Documents

Publication Publication Date Title
US5732394A (en) Method and apparatus for word speech recognition by pattern matching
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
KR100697961B1 (ko) 반-지시된 화자 적응
EP1355296B1 (en) Keyword detection in a speech signal
EP1058925B1 (en) System and method for noise-compensated speech recognition
US8271283B2 (en) Method and apparatus for recognizing speech by measuring confidence levels of respective frames
JPS62231997A (ja) 音声認識システム及びその方法
JP4246703B2 (ja) 自動音声認識の方法
CN112750445B (zh) 语音转换方法、装置和系统及存储介质
US6029130A (en) Integrated endpoint detection for improved speech recognition method and system
US20030220792A1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
JP2007316330A (ja) 韻律識別装置及び方法、並びに音声認識装置及び方法
JPH08211897A (ja) 音声認識装置
JP4839970B2 (ja) 韻律識別装置及び方法、並びに音声認識装置及び方法
JPH0635495A (ja) 音声認識装置
JPH06214596A (ja) 音声認識装置および話者適応化方法
KR100940641B1 (ko) 음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법
JP2002091468A (ja) 音声認識システム
JP3400474B2 (ja) 音声認識装置および音声認識方法
JP4749990B2 (ja) 音声認識装置
JP2001005483A (ja) 単語音声認識方法及び単語音声認識装置
KR100322731B1 (ko) 음성인식방법및이에적합한음성패턴의시간정규화방법
JPH0772899A (ja) 音声認識装置
JPH1097269A (ja) 音声検出装置及び方法
JP2574242B2 (ja) 音声入力装置