JPH0146078B2

JPH0146078B2 -

Info

Publication number: JPH0146078B2
Application number: JP58054386A
Authority: JP
Inventors: Yasuo Sato; Takayuki Fujimoto
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-03-30
Filing date: 1983-03-30
Publication date: 1989-10-05
Also published as: JPS59178500A

Description

【発明の詳細な説明】発明の技術分野本発明は、音声認識用の特徴パラメータ（音声
パラメータ）の抽出方法に関する。

従来技術と問題点一般に音声を認識するには入力音声を多数の周
波数帯に区分する多数のバンドパスフイルタ
（BPF）に通し、各フイルタの出力を整流、積分
し、更にその対数をとつて特徴パラメータ群を作
り、同様な手法で予め得ておいた各種音声の特徴
パラメータ群と比較し、最も近い特徴パラメータ
群を選択してそれに対応する言葉を認識結果とし
て出力するという方法をとる。即ち周波数分析し
てそのスペクトル情報を音声の特徴パラメータと
する音声認識方式では、予め各音声の特徴パラメ
ータを作成、保存しておき、認識時には入力音声
の特徴パラメータを同様に抽出し、保存されてい
るものと比較し、同一もしくは最も類似している
特徴パラメータが見い出されたら、その音声の言
葉が入力されたと判断する。

この場合、入力音声のパワーは大きな又は小さ
な声で話した、マイクから離して又は接近して話
した等によりその都度変動することが予測される
ので、通常はこのパワー変動が認識結果に影響を
与えないように音声（特徴）パラメータを正規化
する。例えば認識対象とする入力音声をＮチヤネ
ルのバンドパスフイルタを通して分析する場合に
は、各特徴パラメータから、入力音声の全帯域電
力を１／Ｎした平均値を差引いて正規化する。

ところが、このように各特徴パラメータから入
力音声の全帯域電力（パワー）の平均値を引いて
しまうと全くパワー情報が残らなくなるので、パ
ワーの大小で区別すると都合のよい母音（パワー
大）と子音（パワー小）の認識率が低下するなど
の問題が生じる。

発明の目的本発明は、発声パワーに左右されないように音
声パラメータを正規化する際に、パワー情報の一
部を残すことによつて母音と子音の認識率を向上
などを図ろうとするものである。

発明の構成音声周波数分析し、そのスペクトル情報を音声
の特徴パラメータとする音声パラメータ抽出方法
に於て、該スペクトル情報の全帯域電力の０より
大きい１未満のベキ乗を用いて該スペクトル情報
を正規化することによつて、得られる音声パラメ
ータにパワー情報を付加することを特徴とする
が、以下図示の実施例を参照しながらこれを詳細
に説明する。

発明の実施例図面は本発明の一実施例を示すブロツク図で、
１１〜１Ｎは入力音声を周波数分析するＮチヤネ
ルのバンドパスフイルタ（BPF）、２１〜２Ｎは
それらの出力を整流して積分するＮ個の整流積分
回路である。これらの出力（スペクトル情報）
P′₁〜P′_Nはそのままでも音声パラメータの形態を
とるが、本例では対数変換回路３１〜３Ｎでこれ
を対数P₁〜P_N（＝logP′₁〜logP′_N）に変換する。
そして、減算器４１〜４Ｎによつて出力P₁〜P_N
から平均値AV＝１／ＮΣPiを差し引いた値X₁〜X_N （＝P₁−AV〜P_N−AV）を最終的な音声パラメー
タとして認識部５に与えるが、本発明ではこの平
均値AVを次の様にして変更する。

先ず加算回路６で全ての音声パラメータP₁〜
P_Nを加算する点は従来と同様であるが、図示の
例ではこれを平均化する際に１／Ｎではない定数
Ｃを用いる。７は該定数Ｃを与える定数部、８は
加算値ΣPiに定数Ｃを乗じて平均値AVを求める
乗算部である。

従来は定数Ｃの代りに１／Ｎが用いられたの
で、 Xi＝（ｎ）logP′i（ｎ）−AV（ｎ） …(1) AV（ｎ）＝１／Ｎ_N 〓ⁱ⁼¹ Pi（ｎ） …(2) 但しｉ＝１，２，……Ｎであつたが、本例によると Xi（ｎ）＝logP′i（ｎ）−AV′（ｎ） …(3) AV′（ｎ）＝Ｃ_N 〓ⁱ⁼¹ Pi（ｘ） …(4) （但しＣ≠１／Ｎ）となる。一例を挙げるとＮ＝16のとき、Ｃ＝１／
20に設定する。このようにすれば不充分な平均値
の差引きとなつて個々のパラメータX₁〜Xnにパ
ワー情報の一部が付加される（残る）。

尚、対数変換回路３１〜３Ｎを省略する、従つ
て積分回路２１〜２Ｎの出力P′₁〜P′_Nを直接除算
器４１〜４Ｎ（減算器を除算器にする）及び加算
回路６へ入力する場合は、全帯域電力Pwのベキ
乗Pw^aを平均値AVの代りに用いる。つまり、 Pw（ｎ）＝_N 〓ⁱ⁼¹ P′i（ｎ） …(5) Xi（ｎ）＝P′i（ｎ）／Pw^a（ｎ） …(6) とする。従来方式ではａ＝１であるが本発明では
例えばａ＝0.5とする。このようにするとやはり
不充分な平均パワーの除去となり、パワーの一部
が残つて母音、子音の識別などに有効である。定
数Ｃ，ａは１より小さく、０より大きくし、これ
で不充分な平均パワーの除去を行なう。

発明の効果以上述べたように本発明によれば、音声パラメ
ータにパワー情報が一部付加されているので、音
声パワーの変動に対して認識率を低下させず、し
かも母音と子音との誤認識を防止できる利点があ
る。また平均値差引きでベース分を除去したりす
るのでパラメータ量の節減にもつながる。

【図面の簡単な説明】

図面は本発明の一実施例を示すブロツク図であ
る。図中、１１〜１Ｎは周波数分析用のフイルタ、
２１〜２Ｎはスペクトル情報を抽出する整流積分
回路、３１〜３Ｎは対数変換回路、４１〜４Ｎは
正規化用の減算器、６は全帯域電力の加算回路、
６は定数部、７は平均値を求める乗算部である。

Claims

【特許請求の範囲】１音声周波数分析し、そのスペクトル情報を音
声の特徴パラメータとする音声パラメータ抽出方
法に於て、該スペクトル情報の全帯域電力の０よ
り大きい１未満のベキ乗を用いて該スペクトル情
報を正規化することによつて、得られる音声パラ
メータにパワー情報を付加することを特徴とする
音声パラメータ抽出方法。２音声周波数分析し、そのスペクトル情報を音
声の特徴パラメータとする音声パラメータ抽出方
法に於て、該スペクトル情報を対数変換した後、
該スペクトル情報の平均値に０より大きく１より
小さい一定係数を乗じた値を各スペクトル情報の
対数値から減じて該スペクトル情報を正規化する
ことによつて、得られる音声パラメータにパワー
情報を付加することを特徴とする音声パラメータ
抽出方法。