JPH03206499A

JPH03206499A - 音声認識装置

Info

Publication number: JPH03206499A
Application number: JP2212831A
Authority: JP
Inventors: Yumi Takizawa; 滝沢　由実; Masahiro Hamada; 正宏浜田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1989-10-04
Filing date: 1990-08-10
Publication date: 1991-09-09
Anticipated expiration: 2014-11-02
Also published as: US5361324A; JP2969862B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明＆友　音声認識装置に関するものであも従来の技
術近紙　音声認識技術の発達と共に　音声認識装置が様々
の分野で実用化されようとしており、実用化するために
Ｃヨ　　認識装置を実用する上での様々の問題点を解決
する必要があも実用下でＧＥＬ　　装置の使用状況が様々に変化しこの
変化によって発声が変動する（例えば　周囲騒音が大き
くなると大声で発声するために発声が変動ずん　長時間
装置を使用していると発声者が疲労してくるために発声
が変動すん　発声者が代わると発声が変動ずん　など）
。そのために　装置が標準音声を学習した時と使用する
時との状況が異なると、標準音声が上記変動を吸収でき
哄誤認識してしまうという点が大きな問題点の１つであ
も上記問題点を解決するために　あらかじめ予測できる全
ての変動パターンを装置に学習させておく方法がとられ
ている爪　全ての発声変動を学習させるために（よ　学
習時阻　装置の容監　使用者の手間が膨大となり実用的
ではな（ちそこで、発声変動を使用する度に計算し　音声の特徴パ
ラメータを分析する際に　変動に対応して分析条件を変
化させる方法が近年提案されていも　この方法により、
学習時限　装置の容量　使用者の手間が少なく、しかも
発声の変動を吸収することができるようになん以不　図面を参照しなが転　上述したような従来の音声
認識装置について説明を行う。ここでζ戴標準音声を登
録することで上記学習を行う登録型音声認識装置におい
て、発声が標準音声登録時と認識時で変化する１つの例
として、環境騒音の変化により発声状態が変動する場合
を説明すも第５図は　従来の単語音声認識装置のブロッ
ク図であも　１は信号入力端＋，　２０はパワー測定ａ
　２１は分析（２）敵　２２は母音判定臥　２３は分析
（３）Ｋ　　８は照合敵　９は認識結果出力端子、　１
０は標準音声保管用バッファ、　２４、２５、　２６は
スイッチであも　以上のように構威された音声認識装置
について以下その動作について説明すもまず標準音声登録時にＣ上　　音声入力直前の環境騒音
が信号入力端子ｌより人力され　入力パワー測定部２０
で環境騒音のパワーが算出され　パワーが一定閾値Ｐ１
以上の場合（上　周囲状況が登録時にふさわしくないと
みなし　登録を中断ずん環境騒音のパワーが一定閾値Ｐ
１以下の場合には　信号声入力端子ｌより入力された標
準音声用信号は分析（２）部２ｌに入力され　特徴パラ
メータが算出されも　この際に分析（２）部で（よまず
入力信号をＦｌ（ｚ）＝１−０．９３７５ｘＺ−１　　・・・式（
２）で表されるフィルタＦ１に通し　周波数の高域戒分
を強調した後分析を行う。分析方法としてたとえばＬＰ
Ｃケプストラム法を用いれば所定の個数のＬＰＣケプス
トラム係数が特徴パラメータとして算出されも　そして
パワーが所定の音声区間検出閾値以上の場色　相当する
特徴パラメータを標準音声とみなしバッファｌＯに保管
すも標準音声用信号が入力されてからの上記の処理を認
識すべき全単語について行い、　登緑を終了する。

次に認識時にＣ上　　まず登録時と同様に環境騒音のパ
ワーが測定された眞　信号入力端子ｌより音声信号が入
力されも環境騒音パワーが一定閾値Ｐｌ以下の場合にｊ！登録時
と同様に分析（２）部２１で特徴パラメータが算出され
　パラメータは照合部８に入力されも　照合部８で標準
音声と入力音声との照合を行八　最短距離を示す単語を
認識結果として認識結果出力端子９より出力すも環境騒音パワーが一定閾値Ｐ１以上の場合に（上バヮー
測定部２でフレームごとの信号のパワーが算出され　騒
音パワーと信号パワーは母音判定部２２に入力されも　
母音判定部２２で（上　次の２つの条件で母音判定を行
う。

［１１信号レベルは雑音レベルに一定値Ｃを加えたレベ
ル以上であも［２］上記条件［１１を満たすフレームが５フレーム以
上継続していも上記［１１　　［２］の条件を満足するフレームを母音
部と判断し　母音部の場合は入力信号を分析（３）部２
３に　母音部以外の場合には分析（２）部２ｌに入力す
も母音部以外のフレームに対して｛よ　登録時と同棟　上
記〔ｌ〕式で表されるフィルタで高域強調を行い特徴パ
ラメータを算出すも　母音部と判定されたフレームに対
して（友　分析（３）部２３″′ＱＳ下記式（３〉で表
されるフィルタを用いて高域強調を行う。

Ｆ２（ｚ）＝１−０．　　６３７５ｘＺ−１　　−・・
式（３）上記フィルタＦ２はフィルタＦｌに比べて高域
強調の度合が少なく、傾きの緩やかなものであも環境騒
音が大きくなると話者の発声状態が変化し音声の高域周
波数或分が強くなも　そのため上記高域強調フィルタの
傾き（よ　雑音の小さい場合に比べて緩やかにする必要
があも　フィルタ通過後、登録時同様特徴パラメータを
算出すも上記特徴パラメータは照合部８に入力され　環境騒音パ
ワーが一定閾値ｐｔ以上の場合と同様に認識結果が出力
端子９より出力されもなおスイッチ２４（上　環境騒音パワーが一定閾値Ｐ１
以上の場合には母音判定部２２！．，　　一定閾値Ｐ１
以下の場合には分析（２）部２ｌに信号を入力するよう
に動作し　音声入力時以外の時は切断されていも　スイ
ッチ２６は母音の場合には分析（３）部２３に　母音以
外の場合には分析（２）部２ｌに信号を入力するように
動作すも　またスイッチ２５は登録時には標準音声保管
バッファｌＯに　認識時には照合部８にパラメータを入
力するように動作すム発明が解決しようとする課題しかしなか板　上記のような構戒では　まず発声変動に
よるスペクトルの傾きの変動を補正した後に　認識に使
用されるパラメータを分析しているために　分析処理を
行うことで補正内容がパラメータに忠実に反映され哄　
補正効率が悪くなり、場合によっては上記補正が認識率
に全く寄与しないことがあるという課題を有していナも
また　上記のような構或で１上　スペクトルの傾きの変
動は吸収できる八　発声変動による音韻特有の共振周波
数（以後ホルマント周波数と呼ぶ）の変動の補正はでき
哄　認識率の改善率が悪いという課題を有していｔら本発明！よ　雑音下で発声した場合の発声変動を認識パ
ラメータ上で補正することにより、補正効率を高くし　
補正結果が忠実に認識率の向上につながる音声認識装置
を提供することを目的とすもまた　従来補正されていな
かった発声変動によるホルマント周波数の変動を、直接
認識パラメータ上で効率よく補正し　従来にない認識率
向上を得ることを目的とすム課題を解決するための手段第１の発明【よ　入力信号の単位時間毎の特徴パラメー
タを分析する分析部と、特徴パラメータを補正するパラ
メータ補正部と、標準信号と人力信号とを照合し認識結
果を出力する照合部を具備し前記分析部で特徴パラメー
タを分析し　その分析されたスペクトルを直交展開した
ものを認識パラメータとして算出し　前記パラメータ補
正部で装置使用時の環境騒音レベルの違いによる発声変
動に対応して前記認識パラメータを補正し　前記照合部
で前記補正されたパラメータを認識パラメータとして標
準音声と人力音声との照合を行うよう音声認識装置を構
戒するものであム第２の発明は　人力信号の単位時間毎の特徴パラメータ
を分析する分析部と、共振周波数（以後ホルマント周波
数と呼ぶ）を検出するホルマント周波数検出部と、パラ
メータ補正値を検出する補正値算出部と、前記特徴パラ
メータを補正するパラメータ補正部と、標準信号と入力
信号とを照合し認識結果を出力する照合部を具ｉＩｉＬ
Ａ　　前記分析部でスペクトル分析を行い、　その分析
されたスペクトルを直交展開したものを認識パラメータ
として算出し　前記ホルマント周波数検出部で入力信号
のホルマント周波数を検出し　前記補正値算出部で前記
ホルマント周波数を利用してパラメータ補正値を算出し
　前記パラメータ補正部で入力音声の変動に対応して前
記パラメータ補正値にてパラメータを補正し　その補正
されたパラメータを認識パラメータとして前記照合部で
標準音声と入力音声との照合を行うよう音声認識装置を
構或するものであも作用上記の構或によれ（戴　補正内容が認識パラメータに忠
実に反映され　補正効率が向上すもまた発声変動による
ホルマント周波数の変動の補正が可能となり、認識率を
向上させることができも実施例以下　本発明の実施例について図を参照しながら説明す
も第１図（友　請求項１〜７に記載の発明の実施例を含む
単語音声認識装置のブロック図であムｌは信号入力端予
　２はパワー測定臥　３は分析（１）ｆｆｌＬ　　４は
母音判定餓　５はホルマント周波数検出臥　６は補正値
算出ａ　７はパラメータ補正ａ　８は照合畝　９は認識
結果出力端子、　１０は標準音声保管バッファ、　ＩＬ
１２、　１３、ｌ４はスイッチであり、前記従来例と同
じものは同一の番号を付与していも以上のように構戒された音声認識装置について以下その
動作について説明すもまず標準音声登録時にＣ友　　音声入力直前の環境騒音
が信号入力端子１より入力され　パワー測定部２で環境
騒音のパワーが算出され　パワーが一定閾値Ｐ１以上の
場合Ｃヨ　　周囲状況が登録時にふさわしくないとみな
し　登録を中断ずん環境騒音のパワーが一定閾値ＰＩ以
下の場合に（上　信号声入力端子ｌより入力された標準
音声用信号はパワー測定部２に入力されフレーム毎の信
号のパワーが算出され＆　　−Ｘ　　入力音声は分析（
１）部３にも入力され　特徴パラメータが算出されも　
分析方法は従来例と同様であり、認識パラメータとして
所定の次数のＬＰＣケブストラム係数が算出されも　そ
してパワーが所定の音声区間検出閾値以上のフレームに
おける特徴パラメータが標準音声保管バッファＩＯに保
管されも標準音声用信号が入力されてからの上記の処理
を認識すべき全単語について行Ｌ＼　登緑を終了すも次に認識時に４ｉ　　まず登録時と同様に環境騒音のパ
ワーが測定された微　信号入力端子ｌより認識されるべ
き信号が入力され　登録時同檄　分析（１）部３にてＬ
ＰＣケプストラム係数が算出されも環境騒音パワーが一定閾値Ｐ１以下の場合にはパラメー
タは照合部８に入力されも　照合部８で照合を行い、　
最短距離を示す単語を認識結果として認識結果出力端子
９より出力すム環境騒音パワーが一定閾値ＰＩ以上の場合にはパワー測
定部２でフレームごとの信号のパワーが算出され　雑音
パワーと信号パワーは母音判定部４に入力されも　母音
判定部４で４Ｌ　　次の２つの条件で母音判定を行う。

［１］信号レベルは雑音レベルに一定値Ｃを加えたレベ
ル以上であも［２］上記条件［１］を満たすフレームが５フレーム以
上継続していも上記［１］　　［２］の条件を満足するフレームを母音
部と判断し　母音部の場合は入力信号をホルマント周波
数検出部５に　母音部以外の場合には照合部８に人力す
も母音部の場合にζ友　パラメータを補正するために　ま
ずホルマント周波数検出部５で信号のホルマント周波数
を検出すム　ホルマント周波数は次のように求めも　本
実施例の認識パラメータであるＬＰＣケブストラムを算
出する過程玄　ＬＰＧパラメータａ（ｉ）が求められて
おり、このパラメー夕を用いて音声のスペクトルはＮＳ　＝　１　／Ａ（ｚ）＝　１　／　（　１＋Σａ　（
ｉ）Ｘ　Ｚ　−’）ＩＩｌ１但し　Ｓ：　音声のスペクトルＮ：　分析次数で表されも　このＡ　（ｚ）の複素根の実数部Ｒ　ｅ　
（ｚ）と虚数部Ｉｍ（ｚ）か板　ホルマント周波数はｆ
＝　（ｆｓ／２π）ｔａｎ−’　［Ｉｍ（ｚ）／Ｒｅ（
ｚ）］但し　ｆ　：　ホルマント周波数ｆＳ：サンプリング周波数となり、　ＬＰＧパラメータか転　ホルマント周波数を
求めることができも次に　補正値算出部６玄　上記ホルマント周波数とＬＰ
Ｃケプストラムをホルマント周波数で微分した値との積
値を用いてＬＰＣケブストラムの補正値を算出すも　算
出式は特許請求の範囲第６項の式（１）の通りであも　
たとえば　式（１）において △ｆ＋　（第ｉホルマント周波数の変動量）＝　１２０
Ｈｚｂ＋　　（第ｉホルマントの八０ント１幅）　　＝　　
１５０Ｈｚｆｓ　　（サン７゜リンク２周波数）　　＝
　　１０ＫＨｚとし　発声変動により変動が大きかった
周波数範囲（３００Ｈｚ〜１５００Ｈｚ　）に含まれる
ホルマントに対してのみ補正を行うと式（１）は式（４
）となんＨ　（ｆ＋，ｎ）＝　−　２０．　１５ｘ　ｅ
ｘｐ（−０．０４７ｎ）Ｘ１（−　ｓｉｎ　（　２ｙｒ　ｆａｎ／　１００００）　
）・・・式（４）但　し　　（　　　３００Ｈｚ　　　＜　　　ｆ＋　　
　＜　　　１５００Ｈｚ　　　）式（４）にて算出され
た補正値はパラメータ補正部７に入力され　下記式（５
）のようにＬＰＣケブストラムＣｎ　　が補正されも　
補正されたパラメータは照合部８で環境騒音パワーが一
定閾値Ｐ１以下の場合と同様に照合され　認識結果出力
端子９より認識結果が出力されもＣｎ　＝Ｃｎ＋Ｈ（ｆ＋，ｎ）　　　　　　・・・式（
５）以上のように　本実施例によれ＆戴　分析部で認識
パラメータとしてケプストラム係数を算出しホルマント
周波数検出部で入力信号のホルマント周波数を検出し　
補正値算出部で式（１）に従って補正値を算出し　パラ
メータ補正部で入方音声のホルマント周波数変動に対応
して、上記補正値を認識パラメータに加算してパラメー
タを補正すること玄　補正内容が認識パラメータに忠実
に反映され　補正効率が向上すも　また発声変動にょる
ホルマント周波数の変動の補正が可能となり、認識率を
向上させることができもな抵　スイッチ１１は音声入力直前の環境騒音パワーを
測定する場合にはパワー測定部２に　おんせいを入力す
る場合には分析（１）部３に信号を入力するように動作
すも　スイッチ１２は登録時には標準音声保管バッファ
１ｏに　認識時には照合部８もしくは母音判定部４に認
識パラメータを入力するように動作すも　また　スイッ
チｌ３は入力音声のパワーが閾値Ｐ１以下の場合には照
合部８に　閾値Ｐ１以上の場合は母音判定部４にパラメ
ータを入力するように動作すも　スイッチ１４は母音の
場合にはホルマント周波数検出部５に　母音以外の場合
には照合部８に信号を入力するように動作すもなお本実施例で１上　騒音環境にて発声した場合の発声
変動について説明したパ　それ以外の発声変動において
ｋ　ホルマント周波数が変動するような発声変動の補正
にζ上　本方法は有効であも但し　式（１）を用いた補
正は　限られたホルマント周波数のみがある規則をもっ
て変動する場合に最も補正効果が大きい力丈　騒音環境
にて発声した場合ζよ　約３００Ｈｚ〜約１５００Ｈｚ
にあるホルマント周波数のみ上昇する事実があり、上記
の補正効果が最も大きい条件に当てはまも　そのたへ　
本補正は特に騒音環境においての発声変動に有効であも
な耘　請求項３に記載の発明のように　分析（１〉部３
で認識パラメータとしてケプスドラム係数を算出し　パ
ラメータ補正部で入力音声の変動に対応してパラメータ
補正値にてケプストラム係数を補正し　その補正された
ケブストラム係数にて照合部で標準音声と入力音声との
照合を行うことにより、特に高い補正効果を得ることが
できもまた　請求項４に記載の発明のように　ホルマン
ト周波数の変動を、ホルマント周波数の変動量と認識パ
ラメータの変換核もしくは変換核と同周期かつ同位相に
て同符号の周期関数とを用いて補正すること玄　従来補
正できなかったホルマント周波数の変動を補正Ｌ　　認
識率を向上させることができも更に請求項５に記載の発明のように　ホルマント周波数
変動を、ホルマント周波数の変動量と認識パラメータの
ホルマント周波数に対する傾きとを用いて補正すること
玄　従来補正されなかったホルマント周波数の変動を補
正し　認識率を向上させることができも更に請求項６に記載の発明のように　ホルマント周波数
変動を、ホルマント周波数の変動量と認識パラメータを
ホルマント周波数で微分した値とを用いて補正すること
玄　従来補正されなかったホルマント周波数の変動を補
正し　認識率を向上させるこ・とができも更に請求項７に記載の発明のように　ホルマント周波数
変動を、ホルマント周波数の変動量と認識パラメータで
あるケプスドラム係数をホルマント周波数で微分した値
との積を補正量とし　左記補正量をケプストラム係数に
加算または減算することで、従来補正されなかったホル
マント周波数の変動を補正し認識率を向上させることが
でき瓜な耘　本実施例では騒音環境にて発声した場合の
発声変動について説明した力ｔ　それ以外の発声変動に
おいても有効であも次に　本発明の他の実施例について図を参照しながら説
明すも第２図は請求項８に記載の発明の一実施例における単語
音声認識装置のブロック図であ，４１は信号入力端＋，
　１５はパワー測定Ｋ　　１６は変動量推定％３は分析
（１）敵　４は母音判定敵５はホルマント周波数検出餓
　１７は補正値算出敵　７はパラメータ補正餓　８は照
合敵　９は認識結果出力端子、　１０は標準音声保管バ
ッファ、１１，１２、　１３、　１４はスイッチであり
、前記従来例と同じものは　同一の番号を付与していも
以上のように構威された音声認識装置について以下その
動作について説明すもまず標準音声登録時にζよ　音声入力直前の環境騒音が
信号人力端子１より入力され　パワー測定部１５で環境
騒音のパワーが算出され　パワーが一定閾値Ｐｉ以上の
場合（よ　周囲状況が登録時にふさわしくないとみなし
　登録を中断ずん環境騒音のパワーが一定ＭｉＰ　１以
下の場合に１１　　信号声入力端子１より入力された標
準音声用音声信号は分析（１）部３に入力され　特徴パ
ラメータが算出されも　分析方法は従来例と同様であり
、認識パラメータとして所定の次数のＬＰＣケプストラ
ム係数が算出されも　そしてパワーが所定の音声区間検
出閾値以上のフレームにおける特徴パラメータが標準音
声保管バッファ１０に保管されも標準音声用信号が入力されてからの上記の処理を認識す
べき全単語について行い、　登録を終了すん次に認識時には　まず登録時と同様に環境騒音のパワー
がパワー測定部２にて測定された後、信号入力端子ｌよ
り認識されるべき信号が入力され分析（１）部３で登録
時と同様に認識パラメータが算出されも環境騒音パワーが一定閾値Ｐ１以下の場合にζ′！，認
識パラメータは照合部８に入力され　照合を行った眞　
最短距離を示す単語を認識結果として認識結果出力端子
９より出力すも環境騒音パワーが一定閾値Ｐ１以上の場合にＣＬ騒音パ
ワー値は変動量推定部ｌ６に入力される。

変動量推定部ｌ６でζよ　環境騒音のパワー値Ｐｎより
次式を用いて騒音下での発声変形によるホルマント変動
量△ｆを推定すも　この場合、パワーＰＴ′Ｌ．Ｐ１の
単位はｄ＆　△ｆの単位はＨｚであムΔｆ＝　ＩＯＸ　
（Ｐ　ｎ−　Ｐ　Ｌ）　　　・・・　　式（６）式（６
）　ｇ１　　環境騒音が小さい場合Ｃヨ　　発声変動が
少ないためホルマント周波数の変動量が小さく、環境騒
音が大きい場合ζよ　発声変動が大きいためホルマント
周波数の変動量も大きいという事実を反映しているもの
であも　次に　音声が入力され上記の環境騒音パワーと
分析（１）部でバラメー夕と共に算出された音声信号パ
ワーとは母音判定部４に入力されも　母音判定部４でＣ
ヨ　　次の２つの条件で母音判定を行う。

［１］信号レベルは雑音レベルに一定値Ｃを加えたレベ
ル以上であも［２］上記条件［１コを満たすフレームが５フレーム以
上継続していも上記［１］　　［２］の条件を満足するフレームを母音
部と判断し　母音部の場合は入力信号をホルマント周波
数検出部５に　母音部以外の場合には照合部８に入力す
も母音部の場合に（表　パラメータを補正するために　ま
ずホルマント周波数検出部５で音声信号のホルマント周
波数を投出すも　ホルマント周波数は次のように求めも
　本実施例の認識パラメータであるＬＰＣケプストラム
を算出する過程で、ＬＰＣパラメータａ　（ｉ）が求め
られており、このパラメータを用いて音声のスペクトル
はＮ但し　Ｓ：　音声のスペクトルＮ：　分析次数で表されも　このＡ　（ｚ）の複素根の実数部Ｒ　ｅ　
（ｚ）ト虚数部Ｉ　ｍ（ｚ）か転　ホルマント周波数は
ｆ　＝　（ｆｓ／２　π）　　ｔ　ａ　ｎ−’　［Ｉｍ
（ｚ）／Ｒ　ｅ（ｚ）］但し　ｆ　：　ホルマント周波
数ｆ８：サンプリング周波数となり、ＬＰＧパラメータかペ　ホルマント周波数を求
めることができも次に　補正値算出部６で、上記ホルマント周波数とＬＰ
Ｃケブストラムをホルマント周波数で微分した値との積
値を用いてＬＰＣケブストラムの補正値を算出すム　算
出式は特許請求の範囲第６項の式（１）の通りである。

この際に　式ク１）のホルマント周波数の変動量は上記
式（６）で求めた値を用いも　他の変数は式（１〉にお
いてｂ＋　　（第ｉホルマントの八１７ド幅）　　＝　
　１５０Ｈｚｆｓ　　（サン７゜リンクゝ周波数）　　
＝　　１０ＫＨｚとし　発声変動により変動が大きかっ
た周波数範囲（３００Ｈｚ−１５００Ｈｚ　）に含まれ
るホルマントに対してのみ補正を行うと式（１）は式（
４）となんＨ（ｆ＋，ｎ）＝−Σ１．２６Ｘ　１０−”
　ｘ△ｆ　ｘ　ｅｘｐ（　−０．　０４７ｎ）　ｘｉ（−ｓｉｎ　　（２ｙｒｆ＋ｎ／１００００）　　）　
　−　　式（４）但　し　　（　　　３００Ｈｚ　　　
＜　　　ｆｉ　　　＜　　　１５００ＨＺ　　　）式（
４）にて算出された補正値はパラメータ補正部７に入力
され　下記式（５）のようにＬＰＣケプストラムＣｎが
補正されも　補正されたパラメータは照合部８で環境騒
音パワーが一定閾値Ｐ１以下の場合と同様に照合され　
認識結果出力端子９より認識結果が出力されもＣｎ　＝Ｃｎ＋Ｈ（ｆ＋，ｎ）　　　　−・・式（５）
以上のように　本実施例によれば　パワー測定部で環境
騒音パワーを測定し　変動量推定部で発声変動によるホ
ルマント周波数の変動量を環境騒音パワーを用いて式（
６）のように推定し　分析部で認識パラメータとしてケ
プストラム係数を算出し　ホルマント周波数検出部で入
力信号のホルマント周波数を検出レ　補正値算出部で上
記で推定されたホルマント周波数の変動量を用いて式（
４）にて補正値を算出し　パラメータ補正部で入力音声
の変動に対応して上記補正値を認識パラメータに加算し
てパラメータを補正すること玄　騒音下で発声したこと
によるホルマント周波数の変動の補正が可能となり、認
識率を向上させることができも　まｔ−認識パラメータ
自身を補正することで、補正内容が認識パラメータに忠
実に反映され補正効率が向上すも　また　ホルマント周
波数の変動量を騒音パワーより推定し　環境騒音の大き
さに適した補正値を用いること玄　より補正効果を向上
させることができもな抵　スイッチｌ１は音声入力直前の環境騒音パワーを
測定する場合はパワー測定部２に　音声入力の際には分
析（１）部に信号を入力するように動作する。またスイ
ッチｌ２ＥＬ　　登録時には標準音声保管バッファ１０
に　認識時には照合部８または母音判定部４にパラメー
タを入力するように動作すも　スイッチ１３は環境騒音
パワーが一定閾値Ｐ１以上の場合には母音判定部４に　
一定閾値ＰＩ以下の場合には照合部８にパラメータを入
力するように動作すら　スイッチ１４は母音の場合には
ホルマント周波数検出部５に　母音以外の場合には照合
部８に信号を入力するように動作すも次をへ　請求項９に記載の発明の実施例について図を参
照しながら説明すも第３図は同実施例における単語音声認識装置のブロック
図であもｌは信号入力端る　２はパワー測定敵　１８はＬＰＦ部
，３は分析（１）餓　４は母音判定敵５はホルマント周
波数検出臥　６は補正値算出ａ７はパラメータ補正訊　
８は照合敵　９は認識結果出力端子、　ｌＯは標準音声
保管バッファ、　１９、ｌ２、　１３、　１４はスイッ
チであり、前記従来例と同じもの｛上　同一の番号を付
与していも以上のように構或された音声認識装置につい
て以下その動作について説明すもまず標準音声登録時に！友　音声人力遣前の環境騒音が
信号入力端子１より入力され　入力信号レベル測定部２
で環境騒音のパワーが算出され　バワーが一定閾値Ｐ１
以上の場合ζよ　周囲状況が登録時にふさわしくないと
みなし　登録を中断ずん環境騒音のパワーが一定閾値Ｐ
１以下の場合に（上　信号声入力端子１より入力された
標準音声用音声信号はＬＰＦ部１８に入力され　カット
オフ周波数が２．５ＫＨｚＬ　Ｐ　Ｆを通過した後分析
（１）部３に入力され　分析（１）部３にて認識パラメ
ータとして所定の個数のＬＰＣケブストラム係数が算出
されも　分析方法は上記実施例と同様であａそしてパワ
ーが所定の音声区間検出閾値以上の特徴パラメータが標
準音声保管バッファ１０に保管されも標準音声用信号が入力されてからの上記の処理を認識す
べき全単語について行（＼　登録を終了すん次に認識時に番ヨ　　まず音声入力直前に登録時と同様
に環境騒音のパワーがパワー測定部２で測定された後、
信号入力端子１より認識されるべき信号が入力されも　
入力信号は登録時と同様にＬＰＦ部ｌ８を通過した後、
分析部３に入力され　分析部にてＬＰＣケプストラム係
数がパラメータとして算出されも環境騒音パワーが一定閾値Ｐ１以下の場合にＣ友上記パ
ラメータは照合部８に入力され　照合部８で照合を行（
＼　最短距離を示す単語を認識結果として認識結果出力
端子９より出力すも環境騒音パワーが一定閾値Ｐ１以上の場合にζよ騒音パ
ワーと分析の際にパラメータと共に算出された音声信号
パワーは母音判定部４に入力されも母音判定部４で（よ
　次の２つの条件で母音判定を行う。

［１コ信号レベルは雑音レベルに一定値Ｃを加えたレベ
ル以上である。

［２］上記条件［１］を満たすフレームが５フレーム以
上継続していも上記［ｌ］　［２コの条件を満足するフレームを母音部
と判断し　母音部の場合は入力信号のパラメータをホル
マント周波数検出部５に　母音部以外の場合には照合部
８に入力すも母音部の場合には　パラメータを補正するために　まず
ホルマント周波数検出部５で信号のホルマント周波数を
検出すも　ホルマント周波数は次のように求めも　本実
施例の認識パラメータであるＬＰＣケプストラムを算出
する過程で、ＬＰＧパラメータａ（ｉ）が求められてお
り、このパラメータを用いて音声のスペクトルは但し　Ｓ：　音声のスペクトルＭ：　分析次数で表されも　このＡ　（ｚ）の複素根の実数部Ｒ　ｅ　
（ｚ）と虚数部Ｉｍ（ｚ）か板　ホルマント周波数はＦ
＝　（Ｎ／　２　ｙｒ）　　ｔ　ａ　ｎ−’　［Ｉ　ｍ
（ｚ）／Ｒ　ｅ（ｚ）］但し　Ｆ：　ホルマント周波数Ｎ：　サンプリング周波数となり、ＬＰＧパラメータか板　ホルマント周波数を求
めることができも次に　補正値算出部６で、上記ホルマント周波数とＬＰ
Ｃケプストラムをホルマント周波数で微分した値との積
値を用いてＬＰＣケブストラムの補正値を算出すも　算
出式は特許請求の範囲の式（１）の通りであも　他の変
数は式（１）において△ｆ＋　　（第ｉホルマントのホ
ルマント周波数の変動量）＝　　１２０Ｈｚｂ１　（第ｉホルマントの八ゝ冫ド幅）　　＝　　１５
０Ｈｚｆｓ　　（サン７゜リンクゝ周波数）　　＝　　
１０ＫＨｚとし　発声変動により変動が大きかった周波
数範囲（３００Ｈｚ−１５００Ｈｚ　）に含まれるホル
マントに対してのみ補正を行うと式（１）は式（４）と
なんＨ（ｆＩ，ｎ）＝一Σ０．　１５ｘ　ｅｘｐ（−０
．０４７ｎ）ｘｉ（−ｓｉｎ　（２ｙｒ　ｆａｎ／　１００００）　）・
・・式（４）但　し　　（　　　３００Ｈｚ　　　＜　　　ｆ＋　　
　＜　　　１５００Ｈｚ　　　）式（４）にて算出され
た補正値はパラメータ補正部７に入力され　下記式（５
）のようにＬＰＣケプストラムＣｎが補正されも　補正
されたパラメータは照合部８で環境騒音パワーが一定閾
値Ｐｉ以下の場合と同様に照合され　認識結果出カ端子
９より認識結果が出力されもＣｎ　＝Ｃｎ＋Ｈ（ｆ＋，ｎ）　　　　　　　・・・　
式（５）以上のようほ　本実施例によれば　発声変形に
よってスペクトル変形が著しくしかもホルマントパワー
が上昇している高域スペクトルをＬＰＦ部で除去し　分
析部で線形予測係数及びケプストラム係数を算出し　ホ
ルマント周波数検出部で低次ホルマント周波数を検出し
　補正値算出部で式（ｌ）にて補正値を算出し　パラメ
ータ補正部で入力信号のパターン変動に対応して上記補
正値にてパラメータを補正し　照合部で補正されたパラ
メータを認識パラメータして照合を行うことにより、低
次ホルマント周波数を確実に検出し　検出されたホルマ
ント周波数を用いて、発声変形の大きな要因であるホル
マント周波数の変動を入力音声毎に確実に補正すること
が可能となんまた上記ＬＰＦの使用により、発声変形の著しい高域ス
ペクトルを除去するたム　発声の違いによる認識パラメ
ータのずれをも吸収できも　すなわ板　上記発声変動が
環境騒音によるものである場合、発声変動が高域周波数
のスペクトルに太きく影響を及ぼす事実があり、高域周
波数のノくワーを減衰させることζ戴　上記の高域スペ
クトルの変形をも除去することとなも　従って、騒音環
境における認識率を向上させることができもな耘　スイ
ッチ１９は音声入力直前の環境騒音測定時にはパワー測
定部２に音声入力の際にはＬＰＦ部１８に信号を入力す
るように動作すも　スイッチ１２は登録時には標準音声
保管ノくツファ１０に　認識時には照合部８または母音
判定部４にパラメータを入力するように動作すも　スイ
・ソチ１３は環境騒音パワーが一定閾値Ｐｉ以上の場合
には母音判定部４に　一定閾値Ｐ１以下の場合には照合
部８にパラメータを入力するように動作すも　スイッチ
１３ｉ１　　スイッチ１４は母音の場合にはホルマント
周波数検出部５！，−　母音以外の場合には照合部８に
信号を入力するように動作すも次に　請求項１０に記載
の発明の一実施例について図を参照しながら説明すも第４図は同実施例における単語音声認識装置のブロック
図であも　１は信号入力端子　２０はノ｛ワー測定敵　
２１は分析（２）ｆｆｌｉ　　２２は母音判定ｆｆｌＬ
　　２３は分析＜３）Ｋ５はホルマント周波数検出鰍　
６は補正値算出敵　７はパラメータ補正１！Ｌ　８は照
合臥　９は認識結果出力端子、　１０は標準音声保管バ
ッファ、　２４、　２５、２６はスイッチであり、前記
従来例と同じものは　同一の番号を付与していも以上のように構或された音声認識装置について以下その
動作について説明すもまず標準音声登録時に（友　音声入力直前の環境騒音が
信号入力端子１より入力され　パワー測定部２で環境騒
音のパワーが算出され　パワーが一定閾値ＰＩ以上の場
合は　周囲状況が登録時にふさわしくないとみなし　登
録を中断ずん環境騒音のパワーが一定閾値Ｐ１以下の場
合には　信号声入力端子ｌより入力された標準音声用信
号は分析（２）部２ｌに入力され　認識パラメータとし
てＬＰＣケプストラム係数が算出されもこの際に分析（
２）部でＣヨ　　通露　まず入力信号を下記式（２）で
示されるフィルタに通し　高域スベクトルを強調した後
分析を行う。これは従来例に示したフィルタＦ１と同様
のフィルタであもＦｌ　　（ｚ）＝１−０．　　９３７
５ｘＺ−１・・・式（２〉そしてパワーが所定の音声区間検出閾値以上の場合、相
当する特徴パラメータを標準音声とみなしバッファｌＯ
に保管すａ標準音声用信号が入力されてからの上記の処理を認識す
べき全単語について行い、　登録を終了すん次に認識時に｛よ　まず登録時と同様にパワー測定部２
で環境騒音のパワーが測定された抵　信号入力端子ｌよ
り認識されるべき信号が入力されも環境騒音パワーが一
定閾値Ｐ１以下の場合に＆よ登録時と同様に式（２）の
Ｆ１で表されるフィルタを通過徽　分析（２〉部２１で
特徴パラメータが算出され　パラメータは照合部８に入
力されも照合部８で標準音声と入力音声との照合を行（
＼最短距離を示す単語を認識結果として認識結果出力端
子９より出力すも環境騒音パワーが一定閾値Ｐｉ以上の場合にζよパワー
測定部２０で音声信号のパワーがフレームごとに算出さ
れ　先に測定された騒音パワーと音声信号パワーは母音
判定部２ｌに入力されも　母音判定部２２では　次の２
つの条件で母音判定を行う。

［１］信号レベルは雑音レベルに一定値Ｃを加えたレベ
ル以上であも［２］上記条件［１］を満たすフレームが５フレーム以
上継続していも上記［１］　　［２］の条件を満足するフレームを母音
部と判断し　母音部の場合は入力信号を分析（３）部２
３！，−　母音部以外の場合には分析（２）部２１に入
力すａ母音部以外のフレームに対して（；Ｌ　標準音声入力時
と同檄　上記式（２）で表されるフィルタで高域強調を
行い特徴パラメータを算出すも母音部と判定されたフレ
ームに対して（上　分析（３）部２３で、下記式（３）
で示されるフィルタＦ２を用いて高域強調を行う。この
フィルタは従来例のフィルタＦ２と同様のものであもＦ
２　　（ｚ）＝１−０．　　６３７５ｘＺ−１・・・式
（３）上記式（３）のフィルタは式（２）のフィルタに比べて
、高域強調の度合が少なく、傾きの緩やかなものであも
　環境騒音が大きくなると話者の発声状態が変化し　音
声の高域スペクトル戒分が強くなもそのため上記高域強
調フィルタの傾き【上　雑音の小さい場合に比べて緩や
かにする必要があも　フィルタ通過後、登録時同様特徴
パラメータを算出すも次に　ホルマント周波数検出部５で信号のホルマント周
波数を検出すも　ホルマント周波数は次のように求めも
　本実施例の認識パラメータであるＬＰＣケプストラム
を算出する過程玄　ＬＰＣパラメータａ（ｉ）が求めら
れており、このパラメータを用いて音声のスペクトルは但し　Ｓ：　音声のスペクトルＭ：　分析次数で表されも　このＡ　（ｚ）の複素根の実数部Ｒ　ｅ　
（ｚ）と虚数部Ｉｍ（ｚ）か板　ホルマント周波数はＦ
＝　（Ｎ／　２　π）　　ｔ　ａ　ｎ−’　［Ｉ　ｍ（
ｚ）／Ｒ　ｅ（ｚ）］但し　Ｆ：　ホルマント周波数Ｎ：　サンプリング周波数となり、ＬＰＧパラメータか板　ホルマント周波数を求
めることができも次に　補正値算出部６で、上記ホルマント周波数とＬＰ
Ｃケプストラムをホルマント周波数で微分した値との積
値を用いてＬＰＣケプストラムの補正値を算出すも　算
出式は式（１）の通りであも他の変数は式（１）におい
て △ｆ＋　　（第ｉホルマントの本ルマント周波数の変動
量〉＝　　１２０Ｈｚｂ＋　　（第ｉホルマントの八１７ド幅）　　＝　　１
５０Ｈｚｆｓ　　（サン７゜り冫クゝ周波数）　　＝　
　１０ＫＨｚとし　発声変動により変動が大きかった周
波数範囲（３００Ｈｚ−１５００Ｈｚ　）に含まれるホ
ルマントに対してのみ補正を行うと式（１）は式（４）
となんＨ　（ｆ＋．ｎ）＝−Σ０，　１５　ｘ　ｅｘｐ
（−０．０４７ｎ）　Ｘｌ（−ｓｉｎ　（２ｙｒ　ｆａｎ／１００００））・・・
式（４）但　し　　（　　　３００Ｈｚ　　　＜　　　ｆ＋　　
　＜　　　１５００Ｈｚ　　　）式（４）にて算出され
た補正値はパラメータ補正部７に入力され　下記式（５
）のようにＬＰＣケプストラムＣｎが補正されも　補正
されたパラメータは照合部８で環境騒音パワーが一定閾
値ＰＩ以下の場合と同様に照合され　認識結果出力端子
９より認識結果が出力されもＣｎ　＝Ｃｎ＋Ｈ（ｆ＋，ｎ）　　　　　　　−　　式
（５）以上のように　本実施例によれ（；ＣＳ／Ｈの低
い騒音下で発声された発声変動の大きい音声に対しての
ム　分析（３）部２３で高域強調フィルタのｌ次係数を
変化させ高域強調度合を小さくした後、線形予測係数及
びケプストラムパラメータを算出し　ホルマント周波数
検出部で低次ホルマント周波数を検出し　補正値算出部
で各パラメータのホルマント周波数と変換核とを用いて
補正値を算出し　パラメータ補正部で入力信号のホルマ
ント変動に対応して上記補値にてパラメータを補正し　
照合部で補正されたパラメータを認識パラメータして照
合を行うことにより、高次ホルマントビークレベルが抑
えられ　結果として低次ホルマント周波数を確実に検出
でき、検出されたホルマント周波数を用いて、発声変形
の大きな要因であるホルマント周波数の変動を入力音声
毎に確実に補正することが可能となる。また高域強調度
合を小さくすることで、発声変形により上昇した高域ス
ペクトルパワーを抑えるたム　発声の違いによる認識パ
ラメータのずれを吸収できる。以上の理由により騒音環
境における認識率を向上させることができる。

な耘　スイッチ２４は環境騒音パワーが一定閾値Ｐ１以
上の場合には母音判定部４ζへ　一定閾値Ｐｉ以下の場
合には分析（２）部２１に信号を入力するように動作す
も　スイッチ２　５　４；Ｌ　　登録時には標準音声保
管バッファｌＯに　認識時には照合部８にパラメータを
入力するように動作する。

スイッチ２６は母音の場合には分析（３）部２３に　母
音以外の場合には分析（２）部２１に信号を入力するよ
うに動作すも発明の効果本発明によれば　補正内容が認識パラメータに忠実に反
映され　補正効率が向上すムまた　従来補正できなかった音声の変動によるホルマン
ト周波数の変動の補正が認識パラメータ上で可能となり
、補正内容が認識パラメータに忠実に反映され　補正効
率を向上させることができも

【図面の簡単な説明】

第１図〜第４図ζよ　本発明の実施例における音声認識
装置のブロック＠　第５図は従来例における音声認識装
置のブロック図である。１・・・音声入力端子、２・・・パワー測定ｆｆｌｋ３
・・・分析（１）Ｋ　　４・・・母音判定敵　５・・・
ホルマント周波数算出臥　６・・・補正値算出臥　７・
・・パラメータ補正畝　８・・・照合＠９・・・認識結
果出力端子、　１０・・・標準音声保管バッファ、　１
１、　１２、　ｌ３、■ ４・・・スイッチ。

Claims

【特許請求の範囲】

（１）入力信号の単位時間毎の特徴パラメータを分析す
る分析部と、特徴パラメータを補正するパラメータ補正
部と、標準信号と入力信号とを照合し認識結果を出力す
る照合部を具備し、前記分析部で特徴パラメータを分析
し、その分析されたスペクトルを直交展開したものを認
識パラメータとして算出し、前記パラメータ補正部で装
置使用時の環境騒音レベルの違いによる発声変動に対応
して前記認識パラメータを補正し、前記照合部で前記補
正されたパラメータを認識パラメータとして標準音声と
入力音声との照合を行うことを特徴とする音声認識装置
。
（２）入力信号の単位時間毎の特徴パラメータを分析す
る分析部と、共振周波数（以後ホルマント周波数と呼ぶ
）を検出するホルマント周波数検出部と、パラメータ補
正値を検出する補正値算出部と、前記特徴パラメータを
補正するパラメータ補正部と、標準信号と入力信号とを
照合し認識結果を出力する照合部を具備し、前記分析部
でスペクトル分析を行い、その分析されたスペクトルを
直交展開したものを認識パラメータとして算出し、前記
ホルマント周波数検出部で入力信号のホルマント周波数
を検出し、前記補正値算出部で前記ホルマント周波数を
利用してパラメータ補正値を算出し、前記パラメータ補
正部で入力音声の変動に対応して前記パラメータ補正値
にてパラメータを補正し、その補正されたパラメータを
認識パラメータとして前記照合部で標準音声と入力音声
との照合を行うことを特徴とする音声認識装置。
（３）分析部で認識パラメータとしてケプストラム係数
を算出し、パラメータ補正部で入力音声の変動に対応し
てパラメータ補正値にてケプストラム係数を補正し、そ
の補正されたケプストラム係数により照合部で標準音声
と入力音声との照合を行うことを特徴とする請求項２に
記載の音声認識装置。
（４）補正値算出部で音声の変動によるホルマント周波
数の変動量と認識パラメータの変換核もしくは変換核と
同周期かつ同位相にて同符号の周期関数を用いて補正値
を算出することを特徴とする請求項２に記載の音声認識
装置。
（５）補正値算出部で音声の変動によるホルマント周波
数の変動量と認識パラメータのホルマント周波数に対す
る傾きとを用いて補正値を算出することを特徴とする請
求項２に記載の音声認識装置。
（６）補正値算出部で音声の変動によるホルマント周波
数の変動量と認識パラメータをホルマント周波数で微分
した値とを用いて補正値を算出することを特徴とする請
求項２に記載の音声認識装置。
（７）補正値算出部で下記式（１）に従って補正値を算
出することを特徴とする請求項２に記載の音声認識装置
。 ▲数式、化学式、表等があります▼・・・（１）Ｈ（ｆ＿ｉ、ｎ）：ホルマント周波数がｆ＿ｉＨｚの時
の第ｎ次ケプストラム係数の補正量 Δｆ＿ｉ：発声変形の有無によるホルマント周波数の差 ▲数式、化学式、表等があります▼ ∂Ｃｎ／∂ｆｉ＝（−４π／ｆｓ）ｅｘｐ（−ｎπｂ＿
ｉ／ｆｓ）×ｓｉｎ（２πｆ＿ｉｎ／ｆｓ）Ｃｎ：第ｎ次ケプストラム係数ｂ＿ｉ：第ｉホルマントのバンド幅ｆ＿ｉ：第ｉホルマント周波数ｆｓ：サンプリング周波数Ｍ／２：ホルマントの個数
（８）環境騒音のパワーを測定するパワー測定部と、パ
ワーの大きさからホルマント周波数の変動量を推定する
変動量推定部と、入力信号の単位時間毎の特徴パラメー
タを分析する分析部と、ホルマント周波数を検出するホ
ルマント周波数検出部と、パラメータ補正値を検出する
補正値算出部と、特徴パラメータを補正するパラメータ
補正部と　標準信号と入力信号とを照合し認識結果を出
力する照合部を具備し、前記パワー測定部で環境騒音パ
ワーを測定し、前記変動量推定部で上記で測定された騒
音パワーを用いて発声変形によるホルマント周波数変動
量を推定し、前記分析部でスペクトル分析を行い、その
分析されたスペクトルを直交展開したものを認識パラメ
ータとして算出し、前記ホルマント周波数検出部で入力
信号のホルマント周波数を検出し、前記補正値算出部で
前記変動量推定部にて推定されたホルマント周波数の変
動量と上記認識パラメータの変換核もしくは変換核と同
周期かつ同位相にて同符号の周期関数とを用いて補正値
を算出し、前記パラメータ補正部で騒音下で発声した場
合の入力音声の発声変動に対応して上記補正値にてパラ
メータを補正し、その補正されたパラメータを認識パラ
メータして前記照合部で標準音声と入力音声との照合を
行うことを特徴とする音声認識装置。
（９）高域周波数のパワーを減衰させる特定帯域パワー
減衰部を具備し、その特定帯域パワー減衰部で音声の高
域周波数パワーを減衰させた後、分析部でスペクトル分
析を行うことを特徴とする請求項２に記載の音声認識装
置。
（１０）スペクトルの概形を補正する概形補正部を具備
し、その概形補正部で標準音声と入力音声とのスペクト
ルの概形が等しくなるようにスペクトル概形を補正し、
分析部でスペクトル分析を行うことを特徴とする請求項
２に記載の音声認識装置。