JPH0635495A

JPH0635495A - 音声認識装置

Info

Publication number: JPH0635495A
Application number: JP21201392A
Authority: JP
Inventors: Mitsugi Matsushita; 貢松下
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1992-07-16
Filing date: 1992-07-16
Publication date: 1994-02-10

Abstract

(57)【要約】【目的】無音区間やパワ−の小さい子音区間のよう
に、騒音の影響を大きく受ける区間においても騒音によ
る誤認識，誤動作を低減することができ、高精度の認識
結果を得ることが可能である。【構成】標準パターン記憶部３に記憶される特徴ベク
トルに、音声の大きさを表わす特徴量をも付加し、類似
度計算部４において、標準パターンの特徴ベクトルと入
力信号の特徴ベクトルとの距離を求める際に、標準パタ
ーン記憶部３に記憶されている音声の大きさを表わす特
徴量で重み付けをする。無音区間やパワ−の小さい子音
区間のように、騒音の影響を大きく受ける区間について
は重みを小さく設定すれば、騒音下においても音声パタ
−ンの照合精度を高めることができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声の入力パターンと
標準パターンとの類似度を求めて、音声認識処理を行な
う音声認識装置に関する。

【０００２】

【従来の技術】一般に、音声認識装置では、音声の入力
パターンと標準パターンとを照合し、その類似度に基づ
いて音声認識結果を出力するようになっている。入力パ
ターンと標準パターンとの類似度を求めるのに、従来で
は、ＤＰマッチング法が良く知られている。このＤＰマ
ッチング法は、標準パターンと入力パターンの局所距離
（ｉ番目の入力ベクトルとｊ番目の標準ベクトルとの距
離）から、標準パターンと入力パターンの累積距離が最
小となる最適累積距離を見つけ、この最適累積距離が最
小となる標準パターンを照合結果として出力するもので
あり、局所距離としては、例えば、ユークリッド距離，
マハラノビスの距離などを用いることができる。例え
ば、ｉ番目の入力パターンのｆチャンネル目のデータを
Ｘ（ｉ，ｆ）、ｉ番目の標準パターンのｆチャンネル目
の特徴量をＹ（ｊ，ｆ）とした場合に、ユークリッド距
離ｄｅ（ｉ，ｊ）は、次式によって求められる。

【０００３】

【数１】

【０００４】

【発明が解決しようとする課題】このようにして求めた
局所距離は、周囲の騒音が小さい場合は、非常に有効で
あるが、例えば工場や自動車内等において周囲の騒音が
大きい場合、音声のパワ−の小さな音や無音区間では、
騒音の影響を大きく受け、上記局所距離に基づき音声認
識処理を行なうと、誤認識，誤動作が生じるという問題
があった。

【０００５】本発明は、無音区間やパワ−の小さい子音
区間のように、騒音の影響を大きく受ける区間において
も騒音による誤認識，誤動作を低減することができ、高
精度の認識結果を得ることの可能な音声認識装置を提供
することを目的としている。

【０００６】

【課題を解決するための手段および作用】上記目的を達
成するために、請求項１記載の発明は、音声を入力する
音声入力手段と、音声入力手段より入力された入力信号
を特徴ベクトルの時系列に変換する入力パターン生成手
段と、予め登録された音声を１つ以上の状態に分け、各
状態毎の特徴ベクトルで構成される標準パターンを記憶
する標準パターン記憶手段と、入力パターン生成手段で
生成された特徴ベクトルの時系列と標準パターン記憶部
に記憶されている標準パターンとの類似度を求める類似
度計算手段と、類似度計算手段で求めた類似度結果を用
いて認識処理を行なう認識処理手段とを有し、標準パタ
ーン記憶手段に記憶される特徴ベクトルには、音声の大
きさを表わす特徴量も付加されており、類似度計算手段
において、標準パターンの特徴ベクトルと入力信号の特
徴ベクトルとの距離を求める際に、標準パターン記憶手
段に記憶されている音声の大きさを表わす特徴量で重み
付けをすることを特徴としている。これにより、無音区
間やパワ−の小さい子音区間のように、騒音の影響を大
きく受ける区間については重みを小さく設定すれば、騒
音下においても音声パタ−ンの照合精度を高めることが
できる。

【０００７】また、請求項２記載の発明では、類似度計
算手段は、標準パターンの状態毎の特徴ベクトルと入力
信号の特徴ベクトルとの距離を求める際に、標準パター
ン記憶手段に記憶されている音声の大きさを表わす特徴
量と入力音声の大きさを表わす特徴量との差の絶対値の
逆数で重み付けをすることを特徴としている。これによ
り、無音区間やパワ−の小さい子音区間のように、騒音
の影響を大きく受ける区間については、重みは自動的に
小さくすることができ、騒音下においても音声パタ−ン
の照合精度を高めることができる。

【０００８】また、請求項３記載の発明では、標準パタ
ーン記憶手段には、標準パターンを複数の状態に分け、
各状態毎の特徴ベクトルと継続時間長とが記憶されてお
り、類似度計算手段は、各状態毎の特徴ベクトルと継続
時間長から求めた状態遷移重みを用いて類似度計算を行
なう場合、距離計算を行なう際の音声の大きさによる重
み付けが大きいときには状態遷移重みを軽く、また重み
付けが小さいときには状態遷移重みを重くして、類似度
計算を行なうことを特徴としている。これにより、類似
度計算を行なう際に、無音区間や子音区間での局所距離
が小さくなるように重み付けがなされる場合にも、無音
区間や子音区間の状態に継続している時間が長くなるこ
とを防止できる。

【０００９】また、請求項４，５記載の発明では、類似
度計算手段は、周囲騒音の大きさに応じて重み付けをす
る割合いを適合的に変化させることを特徴としている。
特に、請求項５記載の発明では、周囲騒音が小さい場合
には、重み付けを行なわないことを特徴としている。こ
れにより、低騒音時の認識精度を低下させることなく、
音声パタ−ンの照合精度を高めることができる。

【００１０】

【実施例】以下、本発明の実施例を図面に基づいて説明
する。図１は本発明に係る音声認識装置の第１の実施例
のブロック図である。図１を参照すると、この音声認識
装置は、音声を入力する音声入力部１と、音声入力部１
より入力された入力信号を特徴ベクトルの時系列に変換
する入力パターン生成部２と、予め登録された音声を１
つ以上の状態に分割し、各状態毎の特徴ベクトルで構成
される標準パターンを記憶する標準パターン記憶部３
と、入力パターン生成部２で生成された特徴ベクトルの
時系列と標準パターン記憶部３に記憶されている標準パ
ターンとの類似度を求める類似度計算部４と、類似度計
算部４で求めた類似度結果を用いて認識処理を行なう認
識処理部５とを有している。ここで、標準パターン記憶
部３に記憶されている特徴パタ−ンには、音声の大きさ
を表わす特徴量も付加されている。また、類似度計算部
４は、例えば特開昭６４−２３２９９号に開示されてい
るような仕方で、標準パターンの状態毎の特徴ベクトル
と入力信号の特徴ベクトルとの距離を求めるが、本発明
では、その際に、標準パターン記憶部３に記憶されてい
る音声の大きさを表わす特徴量で距離に対する重み付け
を行なうようになっている。

【００１１】次に、このような構成の音声認識装置の処
理動作を図２のフローチャートを用いて説明する。実際
の音声認識処理を行なうに先立って、標準パターン記憶
部３には、認識対象語を１つ以上の状態に分け、各状態
毎に求めた特徴ベクトルＹ（ｊ，ｆ）（ｊ：状態番号、
ｆ：分析チャンネル）と、状態内のパワ−Ｐｄ（ｊ）と
を記憶しておく。なお、この特徴ベクトルＹ（ｊ，ｆ）
には、入力パターン生成部２で使用される特徴ベクトル
と同じ種類の特徴ベクトルを用い、また、パワ−Ｐｄ
（ｊ）には、状態内の音声信号の自乗値の短時間平均を
用いることができる。

【００１２】標準パターンの生成方法としては、認識対
象語を一定の状態数Ｊ個に分け、各状態毎に、状態内の
全フレームの特徴ベクトルの平均ベクトルを求める方法
や、全音素の特徴ベクトルを記憶しておき、認識対象語
の音素記号列に応じて、標準パターンを生成する方法な
どがある。例えば、“さっぽろ”の場合、／ｓａｑｐｏ
ｒｏ／という音素記号列で表わすことができるので、／
ｓ／，／ａ／，／ｑ／，／ｐ／，／ｏ／，／ｒ／，／ｏ
／の各音素の特徴ベクトルから標準パターンを生成する
ことができる。

【００１３】このようにして、標準パターン記憶部３に
標準パターンを予め記憶した後、先づ、音声入力部１で
は、マイクロホンのような音響／電気信号変換器を用い
て、入力音を電気信号Ｘ（ｔ）に変換する（ステップＳ
１）。次いで、入力パターン生成部２では、音声入力部
１で得られた入力信号Ｘ（ｔ）を１０ｍ秒程度のフレー
ム単位に分析を行ない、特徴ベクトルの時系列Ｘ（ｉ，
ｆ）（ｉ：フレーム番号、ｆ：分析チャンネル）を求め
る（ステップＳ２）。なお、フレーム単位の分析方法と
しては、バンドパスフィルタ群を用いて、入力信号Ｘ
（ｔ）のスペクトラムを得る方法や、入力信号Ｘ（ｔ）
をデジタル信号に変換した後、ＬＰＣ分析を行ない、線
形予測係数，ＬＰＣケプストラムを求める方法などがあ
る。

【００１４】次いで、類似度計算部４では、入力パター
ン生成部２で生成された入力パターンの特徴ベクトルＸ
（ｉ，ｆ）と、標準パターン記憶部３に記憶されている
標準パターンの特徴ベクトルＹ（ｊ，ｆ）との距離，例
えばユ−クリッド距離を標準パタ−ンの状態内パワ−Ｐ
ｄ（ｊ）で重み付けし、入力パタ−ンと標準パタ−ンと
の局所距離ｄ（ｉ，ｊ）を次式により求める（ステップ
Ｓ３）。

【００１５】

【数２】

【００１６】しかる後、類似度計算部４は、この局所距
離ｄ（ｉ，ｊ）に基づき例えば後述のような既知の仕方
で類似度Ｄを求め、認識処理を行なうことができる（ス
テップＳ４）。

【００１７】このように図２の処理例では、入力パタ−
ンの特徴ベクトルＸ（ｉ，ｆ）と標準パタ−ンの特徴ベ
クトルＹ（ｊ，ｆ）との距離を状態内パワ−Ｐｄ（ｊ）
で重み付けして、局所距離ｄ（ｉ，ｊ）を求めている。
従って、無音区間やパワ−の小さい子音区間のように、
騒音の影響を大きく受ける区間については重みを小さく
設定すれば、この区間における騒音の影響を小さくする
ことができ、騒音下においても音声パタ−ンの照合精度
を高めることができ、誤認識を低減することができる。

【００１８】図３は他の音声認識処理例を示すフローチ
ャートである。図３において、ステップＳ１１，Ｓ１４
の処理は、図２のステップＳ１，Ｓ４の処理と同じであ
り、ステップＳ１２，Ｓ１３の入力パタ−ン生成部２，
類似度計算部４における処理だけが図２の処理と異なっ
ている。すなわち、図３の処理では、入力パタ−ン生成
部２は、入力音声の特徴ベクトルの時系列Ｘ（ｉ，ｆ）
の他に、入力音声パワ−の時系列Ｐｒ（ｉ）をも生成す
る（ステップＳ１２）。また、類似度計算部４は、入力
パタ−ンの特徴ベクトルＸ（ｉ，ｆ）と標準パタ−ンの
特徴ベクトルＹ（ｊ，ｆ）との距離を、入力音声パワ−
Ｐｒ（ｉ）と標準パタ−ンの状態内パワ−Ｐｄ（ｊ）と
の差の絶対値の逆数で重み付けし、局所距離ｄ（ｉ，
ｊ）を次式のように求める（ステップＳ１３）。

【００１９】

【数３】

【００２０】しかる後、この局所距離ｄ（ｉ，ｊ）に基
づき、例えば後述のような既知の仕方で類似度Ｄを求
め、認識処理を行なうことができる（ステップＳ１
４）。

【００２１】このように、図３の処理では、標準パタ−
ンの特徴ベクトルと入力パタ−ンの特徴ベクトルとの距
離を求める際に、標準パタ−ンの音声のパワ−Ｐｄ
（ｊ）と入力音声のパワ−Ｐｒ（ｉ）との差で重み付け
を行なっており、数５から入力音声のパワ−Ｐｒ（ｉ）
が小さいときには、｜Ｐｒ（ｉ）−Ｐｄ（ｊ）｜が大き
くなり、従って、重みが小さくなるので、無音区間やパ
ワ−の小さい子音区間のように騒音の影響を大きく受け
る区間の重みを自動的に小さくすることができ、図２の
処理に比べて、より確実に騒音下での音声パターンの照
合精度を高め、誤認識を低減することができる。

【００２２】上述の各例において、類似度Ｄは、例えば
特開昭６４−２３２９９号に開示されているような動的
計画法や山登り法等を用いたパターンマッチングにより
局所距離ｄ（ｉ，ｊ）から求めることができる。具体的
には、動的計画法を用いたパターンマッチングでは、Ｄ
（ｉ，ｊ）を格子点（ｉ，ｊ）に到達する最適累積距
離、Ｉを入力音声のフレーム数、Ｎを状態数とすると、
Ｄ（ｉ，ｊ）をＤ（１，１）＝ｄ（１，１）のように初
期設定した後、状態番号ｊが１であり、入力フレーム番
号ｉが２≦ｉ≦Ｉの場合、Ｄ（ｉ，１）は、次式により
ｄ（ｉ，１）から求まる。

【００２３】

【数４】Ｄ（ｉ，１）＝Ｄ（ｉ−１，１）＋ｄ（ｉ，１）

【００２４】また、状態番号ｊが２≦ｊ≦Ｊで入力フレ
ーム番号ｉが２≦ｉ≦Ｉの場合には、Ｄ（ｉ，ｊ）は、
次式によりｄ（ｉ，ｊ）から求まる。

【００２５】

【数５】

【００２６】数５において、Ｗは状態遷移の重みであ
り、この状態遷移の重みＷは入力パターンと標準パター
ンとの対応において極端な時間伸縮を防止するために，
すなわち時間長制御のために設けられている。この時間
長制御を行うため（重みＷを決定するため）、特開昭６
４−２３２９９号では、標準パターンは、各状態毎に、
状態を代表する特徴ベクトルとともに状態の継続時間Ｌ
ｄ（ｊ）をも有しており、標準パタ−ンの状態ｊに対応
する入力パタ−ンの継続時間がＬｒ（ｊ）であるとき、
状態遷移の重みＷを｛Ｌｒ（ｊ）−Ｌｄ（ｊ）｝²で定
義している。このようにして、数４，数５により、Ｄ
（ｉ，ｊ）を求め、最終的に類似度Ｄを累積距離Ｄ
（Ｉ，Ｊ）として求めることができる。従って、特開昭
６４−２３２９９号に開示の仕方で類似度Ｄを計算しよ
うとする場合には、標準パターン記憶部３に記憶する特
徴ベクトルに、各状態の継続時間も加えておく必要があ
る。

【００２７】類似度Ｄの計算に特開昭６４−２３２９９
号に示されているような手法が用いられるとき、図２の
処理において、さらに、状態遷移重みＷに標準パタ−ン
の状態内パワ−Ｐｄ（ｊ）で重み付けをして、類似度計
算を行なうこともできる。図４は図２の処理にさらに状
態遷移重みの重み付けを行なう場合の処理例を示すフロ
−チャ−トである。なお、図４において、ステップＳ２
１乃至２３およびステップＳ２５の処理は、図２のステ
ップＳ１乃至３およびステップＳ４の処理と同じであ
り、ステップＳ２４の処理が図２の処理と異なってい
る。すなわち、図４の処理において、ステップＳ２４で
は、状態遷移を行なう際に加えられる状態遷移重みＷ＝
｛Ｌｒ（ｊ）−Ｌｄ（ｊ）｝²を状態内パワ−Ｐｄ
（ｊ）の逆数で重み付けして、Ｗ’＝（１／Ｐｄ
（ｊ））×｛Ｌｒ（ｊ）−Ｌｄ（ｊ）｝²とした上で、
類似度計算を行なう。

【００２８】図２の処理あるいは図３の処理では無音区
間や子音区間での局所距離が小さくなるように重み付け
をしているので、この結果、上述のような手法で類似度
計算が行なわれる際、無音区間，子音区間の状態に継続
している時間が長くなるという問題が生ずる。これに対
して、図４の処理がなされる場合には、音声の大きさに
よる重み付けの重みＰｄ（ｊ）が重いときには、状態遷
移重みＷ’は軽くなり、また、音声の大きさによる重み
付けの重みＰｄ（ｊ）が軽いときには、状態遷移重み
Ｗ’は重くなるので、無音区間や子音区間での局所距離
が小さくなるように重み付けがなされる場合にも、無音
区間，子音区間の状態に継続している時間が長くなるの
を抑えることができる。

【００２９】図５は本発明に係る音声認識装置の第２の
実施例のブロック図である。なお、図５において、図１
と同様の箇所には同じ符号を付している。この第２の実
施例の音声認識装置では、騒音の大小を判定する騒音大
小判定部６が設けられており、類似度計算部４は、騒音
大小判定部６で判定された騒音の大小に応じて重み付け
をするか否かを判断し、類似度Ｄを計算するようになっ
ている。例えば、周囲騒音が小さいと判定されたときに
は、類似度計算部４は、距離に重み付けをせず、数１で
定まる距離ｄｅ（ｉ，ｊ）だけにより類似度Ｄを計算す
るようになっている。

【００３０】次にこのような構成の音声認識装置の動作
を図６のフローチャートを用いて説明する。なお、図６
において、ステップＳ３１，Ｓ３２の処理およびステッ
プＳ３６の処理は、図２のステップＳ１，Ｓ２およびス
テップＳ４の処理と同じであり、ステップＳ３３乃至Ｓ
３５の処理が図２の処理と異なっている。すなわち、こ
の第２の実施例の音声認識装置では、騒音大小判定部６
は、例えば、音声を入力していない状態での音声入力部
１からの入力信号Ｘ（ｔ）の２乗値の短時間平均値を求
め、この短時間平均値が予め定められている基準値以上
となったか否かにより、周囲騒音の大小を判定する（ス
テップＳ３３）。この判定の結果、騒音が大きいと判定
された場合には、図２のステップＳ３と同様の処理を行
なう。すなわち、類似度計算部４は、入力パターン生成
部２で生成された特徴ベクトルＸ（ｉ，ｆ）と、標準パ
ターン記憶部３に記憶されている標準パターンの特徴ベ
クトルＹ（ｊ，ｆ）との距離を状態内パワ−Ｐｄ（ｊ）
で重み付けし、入力パターンと標準パターンとの局所距
離ｄ（ｉ，ｊ）を数２に従って求め（ステップＳ３
５）、これに基づき例えば前述したと同様の仕方で類似
度Ｄを求め、認識処理を行なうことができる（ステップ
Ｓ３６）。

【００３１】これに対し、ステップＳ３３において、騒
音が小さいと判定された場合には、距離に重み付けをせ
ず、数１により求まる距離成分ｄｅ（ｉ，ｊ）を局所距
離ｄ（ｉ，ｊ）として用い（ステップＳ３４）、これに
より類似度Ｄを求め、認識処理を行なう（ステップＳ３
６）。前述の第１の実施例では、高騒音下での認識精度
についてはこれを向上させることができるが、低騒音下
での認識時、特に、母音部が同じで子音部のみが違う音
声（／ｎｅｍｕｒｏ／，／ｍｅｇｕｒｏなど）の認識時
には、重み付けをすることで、かえって精度が低下する
場合がある。これに対し、上述の第２の実施例では、周
囲騒音が小さい場合には、標準パターンの特徴ベクトル
と入力パターンの特徴ベクトルの距離を求める際の重み
付けを行なわないので、低騒音時の認識精度を低下させ
ることなく、騒音下での音声パターン照合の精度を高め
ることができる。

【００３２】なお、上記例では、騒音大小判定部６は、
音声を入力していない状態での入力信号の２乗値の短時
間平均値が、予め定めておいた基準値以上になった場合
に、周囲騒音が大きいと判定するようになっているが、
他の方法により騒音の大小を判定することも可能であ
る。

【００３３】図７は本発明に係る音声認識装置の第３の
実施例のブロック図である。この第３の実施例の音声認
識装置では、第１の実施例の音声認識装置に、さらに、
騒音レベルを検出する騒音レベル検出部７が設けられて
おり、類似度計算部４は、騒音レベル検出部７で検出さ
れた騒音のレベル（大きさ）に応じて、重み付けをする
割合を適合的に変化させるようになっている。

【００３４】次にこのような構成の音声認識装置の動作
を図８のフローチャートを用いて説明する。なお、図８
において、ステップＳ４１，Ｓ４２およびステップＳ４
４の処理は、図２のステップＳ１，Ｓ２およびステップ
Ｓ４の処理と同じであり、ステップＳ４３における処理
が図２の処理と異なっている。すなわち、この第３の実
施例では、騒音レベル検出部７は、例えば、音声を入力
していない状態での音声入力部１からの入力信号Ｘ
（ｔ）の２乗値の短時間平均値を求め、これが十分大き
い場合には騒音レベルＮを“１．０”として検出し、短
時間平均値が小さい場合には騒音レベルＮを“０．０”
として検出する。すなわち、騒音の大きさに応じて、騒
音レベルＮを“０．０”から“１．０”の範囲内で検出
する。類似度計算部４は、入力パターンの特徴ベクトル
Ｘ（ｉ，ｆ）と標準パターンの特徴ベクトルＹ（ｊ，
ｆ）の距離に、標準パターンの状態内パワーＰｄ（ｊ）
と騒音レベル検出部７で検出した騒音レベルＮとを考慮
して、次式のようの、入力パターンと標準パターンとの
局所距離ｄ（ｉ，ｊ）を求める（ステップＳ４３）。

【００３５】

【数６】

【００３６】数６に従って、局所距離ｄ（ｉ，ｊ）を求
めた後、これに基づき、例えば前述したと同様の仕方で
類似度Ｄを求め、認識処理を行なうことができる（ステ
ップＳ４４）。

【００３７】第３の実施例では、数６からわかるよう
に、騒音が小さく騒音レベルＮが“０．０”であるとき
には、局所距離ｄ（ｉ，ｊ）は数１のように求まり、重
み付けを行なわない。これに対し、騒音が十分大きく、
騒音レベルＮが“１．０”であるときには、局所距離ｄ
（ｉ，ｊ）は数２のように求まり、状態内パワーＰｄ
（ｊ）での重み付けがなされる。また、騒音が十分大き
くないが、十分小さくもない場合には、騒音レベルＮは
“０．０”と“１．０”との間の値となり、この間の値
で状態内パワーＰｄ（ｊ）の重み付けがなされる。

【００３８】このように、第３の実施例は、第２の実施
例を一般化したものとなっており、第２の実施例は、第
３の実施例の特別な場合となっている。第３の実施例の
ように、一般化し、騒音の大きさに応じて重み付けをす
る割合を適合的に変化させることによって、より高精度
の音声パターン照合が可能となる。

【００３９】なお、上述の例では、騒音レベルＮを
“０．０”から“１．０”までの値で表わしているが、
騒音レベルＮを他の仕方で定義することも可能である。
また、騒音レベルＮに応じた重み付けを数６で表わされ
る仕方以外の方法で行なうこともできる。

【００４０】

【発明の効果】以上に説明したように、請求項１記載の
発明によれば、標準パターン記憶手段に記憶される特徴
ベクトルに、音声の大きさを表わす特徴量をも付加し、
類似度計算手段において、標準パターンの特徴ベクトル
と入力信号の特徴ベクトルとの距離を求める際に、標準
パターン記憶手段に記憶されている音声の大きさを表わ
す特徴量で重み付けをするようにしているので、無音区
間やパワ−の小さい子音区間のように、騒音の影響を大
きく受ける区間については重みを小さく設定すれば、騒
音下においても音声パタ−ンの照合精度を高めることが
できる。

【００４１】また、請求項２記載の発明によれば、類似
度計算手段は、標準パターンの状態毎の特徴ベクトルと
入力信号の特徴ベクトルとの距離を求める際に、標準パ
ターン記憶手段に記憶されている音声の大きさを表わす
特徴量と入力音声の大きさを表わす特徴量との差の絶対
値の逆数で重み付けをするので、無音区間やパワ−の小
さい子音区間のように、騒音の影響を大きく受ける区間
については、重みは自動的に小さくすることができ、騒
音下においても音声パタ−ンの照合精度を高めることが
できる。

【００４２】また、請求項３記載の発明によれば、標準
パターン記憶手段には、標準パターンを複数の状態に分
け、各状態毎の特徴ベクトルと継続時間長とが記憶され
ており、類似度計算手段は、各状態毎の特徴ベクトルと
継続時間長から求めた状態遷移重みを用いて類似度計算
を行なう場合、距離計算を行なう際の音声の大きさによ
る重み付けが大きいときには状態遷移重みを軽く、また
重み付けが小さいときには状態遷移重みを重くして、類
似度計算を行なうので、類似度計算を行なう際に、無音
区間や子音区間での局所距離が小さくなるように重み付
けがなされる場合にも、無音区間や子音区間の状態に継
続している時間が長くなることを防止できる。

【００４３】また、請求項４，５記載の発明によれば、
類似度計算手段は、周囲騒音の大きさに応じて重み付け
をする割合いを適合的に変化させ、特に、請求項５記載
の発明では、周囲騒音が小さい場合には、重み付けを行
なわないので、低騒音時の認識精度を低下させることな
く、音声パタ−ンの照合精度を高めることができる。

【図面の簡単な説明】

【図１】本発明に係る音声認識装置の第１の実施例のブ
ロック図である。

【図２】図１の音声認識装置の処理動作の一例を示すフ
ローチャートである。

【図３】図１の音声認識装置の処理動作の一例を示すフ
ローチャートである。

【図４】図１の音声認識装置の処理動作の一例を示すフ
ローチャートである。

【図５】本発明に係る音声認識装置の第２の実施例のブ
ロック図である。

【図６】図５の音声認識装置の処理動作の一例を示すフ
ローチャートである。

【図７】本発明に係る音声認識装置の第３の実施例のブ
ロック図である。

【図８】図７の音声認識装置の処理動作の一例を示すフ
ローチャートである。

【符号の説明】

１音声入力部２入力パタ−ン生成部３標準パターン記憶部４類似度計算部５認識処理部６騒音大小判定部７騒音レベル検出部

Claims

【特許請求の範囲】

【請求項１】音声を入力する音声入力手段と、前記音
声入力手段より入力された入力信号を特徴ベクトルの時
系列に変換する入力パターン生成手段と、予め登録され
た音声を１つ以上の状態に分け、各状態毎の特徴ベクト
ルで構成される標準パターンを記憶する標準パターン記
憶手段と、前記入力パターン生成手段で生成された特徴
ベクトルの時系列と前記標準パターン記憶部に記憶され
ている標準パターンとの類似度を求める類似度計算手段
と、前記類似度計算手段で求めた類似度結果を用いて認
識処理を行なう認識処理手段とを有し、前記標準パター
ン記憶手段に記憶される特徴ベクトルには、音声の大き
さを表わす特徴量も付加されており、前記類似度計算手
段において、標準パターンの特徴ベクトルと入力信号の
特徴ベクトルとの距離を求める際に、標準パターン記憶
手段に記憶されている音声の大きさを表わす特徴量で重
み付けをすることを特徴とする音声認識装置。
【請求項２】請求項１記載の音声認識装置において、
前記類似度計算手段は、標準パターンの状態毎の特徴ベ
クトルと入力信号の特徴ベクトルとの距離を求める際
に、標準パターン記憶手段に記憶されている音声の大き
さを表わす特徴量と入力音声の大きさを表わす特徴量と
の差の絶対値の逆数で重み付けをすることを特徴とする
音声認識装置。
【請求項３】請求項１または２記載の音声認識装置に
おいて、前記標準パターン記憶手段には、標準パターン
を複数の状態に分け、各状態毎の特徴ベクトルと継続時
間長とが記憶されており、前記類似度計算手段は、各状
態毎の特徴ベクトルと継続時間長から求めた状態遷移重
みを用いて類似度計算を行なう場合、距離計算を行なう
際の音声の大きさによる重み付けが大きいときには状態
遷移重みを軽く、また重み付けが小さいときには状態遷
移重みを重くして、類似度計算を行なうことを特徴とす
る音声認識装置。
【請求項４】請求項１，２または３記載の音声認識装
置において、前記類似度計算手段は、周囲騒音の大きさ
に応じて重み付けをする割合いを適合的に変化させるこ
とを特徴とする音声認識装置。
【請求項５】請求項４記載の音声認識装置において、
周囲騒音が小さい場合には、重み付けを行なわないこと
を特徴とする音声認識装置。