JPS59132000A

JPS59132000A - 音声の標準パタ−ン作成法

Info

Publication number: JPS59132000A
Application number: JP58007782A
Authority: JP
Inventors: 二矢田　勝行; 藤井　諭; 森井　秀司
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1983-01-19
Filing date: 1983-01-19
Publication date: 1984-07-28
Also published as: JPH0449715B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は音声認識における音声の標準パターン作成法に
関するものである。

２ページ従来例の構成とその問題点話者を限定しない音声認識装置において、音声を認識す
る前段階として音素の認識を行なうのが有効である。第
１図に音素認識を行なう部分のブロック図を示す。１は
比較部、２は音素標準パターン格納部である。音素標準
パターン格納部２には各音素に対応する標準的な特徴ノ
（ラメータが音素の数たけ入っている。入力特徴パラメ
ータが比較部１で各音素の標準パターンと比較され、最
も類似度の大きい音素の記号または番号が結果として出
力される。

不特定話者を対象とするシステムでは、標準バター７は
多くの人（Ｄ７−ｌを使用し１・あら力゛じめ作成して
おく必要がある。すなわち、使用環境のもとで作成する
ことはできない。一方、入力音声は環境の影響やマイク
ロホンの特性の影響を受けるため、必ずしも標準パター
ンを作成した環境と同じ条件で使用されるとは限らない
。このために、入力音声と標準パターンとのマツチング
がうまくゆかず、誤認識となる場合がある。

３ページ環境やマイクロホン特性の影響に起因する。この種の誤
認識に対して、従来の方法では対処がなされていない。

発明の目的本発明の目的は、騒音やマイクロホンの特性を考慮した
標準パターンを作成し、それを使用することによって、
上記問題点を解決することである。

発明の構成本発明は上記目的を達成するもので、音声認識に卦ける
標準パターン作成法に関して、環境騒音をモデル騒音と
し、またマイクロホンの音声に対する特性とマイクロホ
ンの騒音に対する特性をそれぞれフィルタの周波数特性
で近似し、音声に対しては前記音声用の近似フィルタを
適用してマイクロホン特性を考慮した音声データを作成
し、モデル騒音に対しては前記騒音用のフィルタを適用
してマイクロホン特性を考慮した騒音データを作成する
。次に前記マイクロホン特性を考慮した音声データと前
記マイクロホン特性を考慮した騒音データを信号対雑音
比が一定になるように加えてノイズが付加した音声デー
タを作成し、このデータを使用して音声標準パターンを
作成することを特徴とする音声の標準パターン作成法を
提供するものである。

実施例の説明本発明による標準パターン作成法について述べる。

■　騒音をモデル騒音（たとえばＨＯＴＩ（スペクトル
騒音）と仮定し、騒音データを用意する。

■　マイクロホンの騒音に対する周波数特性（遠距離特
性）を近似するフィルタを設計する。

■　マイクロホンの音声に対する周波数特性（近距離特
性）を近似するフィルタを設計する。

■　上記■に対して■のフィルタを適用し、マイクロホ
ン特性を考慮した騒音データを作成する。

■　防音室内で周波数特性が平坦なマイクロホンを使用
して収録した音声データ（クリーンデータ）に対して、
■のフィルタを適用し、マイクロホン特性を考慮した音
声データを作成する。

■　■で作成した音声データと■で作成した騒音６ベー
ジデータを、音声区間での信号対雑音比（Ｓ／Ｎ比）が一
定となるように加え合わせ、騒音大シのデータを作成す
る。

■　騒音入りデータを使って標準パターンを作る。

上記の手順で作成した標準パターンを使用すれば、騒音
の統計的な性質とマイクロホンの特性が考慮されている
ため、これらの影響を少なくすることができ、誤認識が
少なくなる。

具体的実施例についてさらに詳しく説明する。

騒音のスペクトル特性は音声認識装置が使用される環境
によって差異があるが、統計的に環境騒音はＨＯＴ）ｉ
スペクトル特性を示すことが知られている。第２図に実
線３でＨＯＴＨスペクトル特性を示す。モデル騒音とし
てＨＯＴＨスペクトル騒音を用いれば、それは環境騒音
の特性を最もよく代表している。本実施例では−ｅｄＢ
１０ａｔの周波数特性の騒音（第２図の破線４）でＨＯ
ＴＨスペクトル特性を近似する・次にマイクロホンの周波数特性を近似する方法を述べる
。ここでは例として接話型マイクロホン６ページを使用した場合について説明する。

第３図は代表的な接話型マイクロホンの周波数特性を示
したものである。細実線６は近距離特性であり、入力音
声に対する特性である。太実線６は遠距離特性であシ、
環境騒音に対する特性でるる。第３図の例では近距離特
性６は１００〜２００゜ｌ′Ｉｚまでは平坦であり、５
ｏｏｏＩＴｚ付近でも３　ｄＢ高くなっている程度なの
で、音声帯域においてほぼ平坦な特性と考えてもよい。

このため、近距離特性を近似するフィルタを設計する必
要がない。

遠距離特性６は低域から２ｏｏｏＨｚ近辺まで大体６６
Ｂ１０ａｔで上昇し、それ以上は飽和曲線の形状となっ
ている。この形状は１次のバイパスフィルターで近似す
ることができる。第４図は遠距離特性６をカットオフ周
波数１９００Ｈｚの１次のバイパスフィルタで近似した
ものである。（破線７ｘ図から明らかなように、１００
〜８０００　Ｈｚの領域（音声帯域）では、実によく近
似されている。

マイクの特性が複雑な場合でも、同様な考え方でフィル
タを設計することが可能である。また、も７ページし必要ならば、近距離特性に対しても近似フィルタを設
計することができる。

次には、モデル騒音（白色騒音を積分して一６ｄＢ１０
ａｔ　騒音を発声させる）に対して、上記のフィルタを
適用し、マイクロホン特性を考慮した騒音を作る。

そして、この騒音を音声データ（クリーンデータまたは
クリーンデータにマイクロホンの近距離特性を考慮した
もの）に、Ｓ／Ｎ比が一定となるように加え、騒音入り
の音声データを作る。次にこの音声データを使用して標
準パターンを作成する。標準パターンを作成する手順は
クリーンデータで作成する場合と全く同様であるので説
明を省略する。

マイクロホンは用途が決まれば固定されてしまうので、
せいぜい２〜３種類の機種を考慮しておけばよい。また
騒音は環境によってその性質が異なるが、ここで使用し
ているのは統計的な性質のみである。したがって、本実
施例で述べた方法は一般性のある方法である。また１つ
のマイクロホンに対して１度作成しておけばよい。標準
パターンを作成する一連の手順は、計算機を使って行な
うことができ、人手を煩わせる必要がないなどの利点が
ある。

前記実施例による効果を音素認識率で評価する。

音素認識率は、正しく認識された音素の数（正確にはフ
レームの数：１フレームは１０ｍ５ｅｅ長の音声データ
）の全音素数（全フレーム数）に対する割合で定義され
る。

第６図は、６母音と鼻音（／１１／、／ｎ／、はつ音）
に対する評価結果である。実線８が本実施例による標準
パターンを使用した場合の結果であり、破線９は従来の
標準パターンを使用した場合の結果である。平均認識率
で３．６％の向上が認められ、鼻音では２６％も向上し
た。したがって、本実施例の効果は大きいと言える。な
お第６図は男性１０名が発声した２１２単語の中の音素
を対象として評価したもので、各音素とも約１５０００
フレーム程度のデータ量があり、十分信頼のできる結果
である。

９ペーミ゛このように本実施例は一般性のある方法であり、人手を
要せず、しかも音素認識率の改善に対する効果が大きく
有効である。

発明の効果以上のように本発明は環境騒音をモデル騒音と仮定し、
マイクロホンの音声に対する周波数特性を近似する音声
用近似フィルタとマイクロホンの騒音に対する周波数特
性を近似する騒音用近似フィルタとを準備し、音声に対
して前記音声用近似フィルタを適用して音声データを作
成し、モデル騒音に対しては前記騒音用近似フィルタを
適用して騒音データを作成し、音声データと騒音データ
を信号対雑音比が一定になるように加え合わせて騒音付
加音声データを作成し、前記騒音付加音声データを用い
て標準パターンを作成するもので。

騒音やマイクロホンの特性による影響を防止し、認識率
の向上がはかれる。

【図面の簡単な説明】

第１図は、パターンマツチングによって音素認識を行な
う方法のブロック図、第２図はモデル騒１０ページ音の周波数特性を示した図、第３図は接話型マイクロホ
ンの特性図、第４図は遠距離特性をフィルタの特性で近
似した図、第６図は本発明の効果を示す音素認識率を示
す図である。１・・・・・・比較部、２・・・・・・音素標準パター
ン格納部。

Claims

【特許請求の範囲】環境騒音をモデル騒音と仮定し、マイクロホンの音声に
対する周波数特性を近似する音声用近似フィルタとマイ
クロホンの騒音に対する周波液特性を近似する騒音用近
似フィルタとを準備し、音声に対して前記音声用近似フ
ィルタを適用して音声データを作成し、モデル騒音に対
しては前記騒音用近似フィルタを適用して騒音データを
作成し。音声データと騒音データを信号対雑音比が一定になるよ
うに加え合わせて騒音付加音声データを作成し、前記騒
音付加音声データを用いて標準パターンを作成すること
を特徴とする音声の標準パターン作成法。