JPS59195290A

JPS59195290A - 音声認識装置

Info

Publication number: JPS59195290A
Application number: JP58068832A
Authority: JP
Inventors: 中谷　奉文
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1983-04-19
Filing date: 1983-04-19
Publication date: 1984-11-06

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】炎森次Ｉ本発明は、音声認識装置、より詳細には、音声認識装置
における特徴抽出に関する。

側米韮遺 −・般に、音声認識装置においては、音ル信号からその
特徴因子を抽出する際に、音声の生成過程の特徴である
母音の高域周波数成分の減衰を補正し、子音や抽出のむ
ずかしい促　Ｃ／Ｑ１つまり／ツ／）や破裂音（／ｂ／
　、／ｐ／　、／ｌ／）の特徴を強調するため抽出の前
処理として周波数補正回路（プリエンファシス回路とも
呼ぶ）を使用する。この回路の特性は約ＩＫＨｚ伺近か
ら約６ｄ　Ｂ　／　ｏ　ｃ　ｔで高域周波数成分を強調
する特性が−・般的であるが必らずしも聴感特性とは一
致してない。どちらかと２゛えば抽出の容易さはハート
側からの意味合いの強い処理法である。

−力、人間は音の大きさを全可聴周波数帯域に亘′）て
均一に感じているわけではなく、周波数によって感じか
たが異なり、低域周波数と高域周波数では感度が低く２
０００〜４０００Ｈｚ＋１近で最も耳の感度が高くなる
所謂等感曲線といわれる特性で受聴している。従って、
認識システムにおいて、特徴抽出部にこの人間の聴感特
性を反映した等感曲線特性を持つ抽出部を使用した方が
より精度よく特徴抽出を行うことができる。

目　　　　　　的本発明は、上述の観点よりなされたもので、特に、従来
の周波数補正回路に代って人間の聴感曲線にマツチした
補正回路を用いて、音声の特徴抽出をより人間の聴感特
性を反映して行うことを目的としてなされてものである
。

先−−１ここでもう少し人間の耳の周波数特性について説明する
。第１図は、フレツチャーマンソンの曲線に代って１９
５５年にロヒンソンとダツドソンによって発表され国際
的に認められ広く利用されている耳の周波数特性図であ
る。この１木の曲線上の音は全て等しい大きさに聴こえ
ることを表わしており１ｏｏＯＨｚでの音圧レベルをそ
のままフォーンで大きさを表わすことになっている。こ
の曲線から判るように、低曹では中域音に対して大きな
音でないと聴こえず、２０００〜４０００Ｈ２で最も良
く聴こえ、高音でまた曲線はｌニー　Ｂ　して聴こえに
くくなる。

第２図は、第１図の耳の周波数特性をもとに決定された
聴感補正特性（所謂Ａ　＃、１ｆｆｉｌとＢ特性と呼ば
れる曲線）を示している。この曲線は概略４０フオーン
の周波数特性に対するミラー４￥性で会話タイプの音声
レベルを反映している。つまり人間は音声を大凡第２図
の周波数特性を持って受聴している。

以ド、に記聴感補正特性を用いて音声の特徴抽出を行う
本発明の実施例について説明する。

第３図は、本発明の一実施例を説明するための図で、図
中、１は音声信号の入力端子で、１（声イ菖ぢをマイク
ロホン等で収音し適当なレベルに増幅した信号を入力す
る。２は従来のプリエンファシス回路に代る回路で、第
２図に示した聴感補ｉＪＥ　４￥徴を実現する補正回路
である。３は音声信号からスペクトル包１ｔｉ等の特徴
パラメータを抽出する特徴抽出部、４はスイッチ、５は
標憎パラメータを格納する辞書用メモリ一部、６は入力
の特徴パラメータと辞占５に格納された標準パラメータ
との一致度を測定する照合部、７は照合結果に基づいて
入力音声か何であるかを判定する判定部、８は判定結果
の出力端ｒ−で、スイッチ４を辞書５側にして或いは照
合部６側にして人カバターンを辞書に格納し或いは人カ
バターンを認識する。なお。

第３図において、３乃至８は単語認識を想定して構成し
たものであるが、これらを音素、単音節のレベル、更に
は、特定、不特定話者に対する認識を行うよう構成する
ことも０工能で、そのようにしても、補正回路２の有効
性が変るものでないことは容易に理解できよう。

第４図は、本発明の他の実施例を示す図で、図中、第３
図と同様の作用をする部分には第３図と場合と同一の参
照番号が伺しである。またスイッチ４以降は第３図と回
しであるので、省略しである。この第４図に示した実施
例は、第３図に示した実施例においては補正回路２が前
処理回路として挿入されていたのに対して、特徴抽出部
が／ヘンドパスフィルタ群で構成されている場合の例で
ある。この第４図に示した実施例おいて、入力音−丁信
号は入力端子１から夫々通過帯域の異なるバンドパスフ
ィルタ９．９・・・に供給され、次段の爪み伺は回路１
０．１０・・・で第２図に示した補正特性を持つよう夫
々のフィルタ出力に重み伺けをする。この出力は次段の
マルチプレクサ−及びアナログデジタルコンバータ１１
で量子化されて特徴パラメータとされ、以ド、第３図の
場合と同様にして処理される。なお、ここではハードで
構成する例を示したが／へ７トパスフイルタ群をデジタ
ルフィルタで構成する際に各フィルタの重み付は関１１
１！（ゲイン関数）としても良いことは容易に理解でき
よう。

倭−−−ヌ以にの説明から明らかなように、本発明によると、従来
の音声の生成モデルから高音の減衰分を補正するといっ
たプリエンファシス補正に変って人間の聴感特性に一致
しだ補正特性をもつ補正をするようにしたので、音声の
認識システムをより人間の聴感の判別能力に近い形で実
現することができ、特徴パラメータの抽出精度を向上さ
せることかできる。

【図面の簡単な説明】

第１図は、耳の周波数特性図、第２図は、聴感補正特性
図、第３図及び第４図は、それぞれ本発明の実施例を示
す構成図である。 ■・・・入力端子、２・・・補正回路、３・・・特徴抽
出部、４・・・スイッチ、５・・・辞書部、６・・・照
合部、７・・・判定部、８・・・出力端子、９・・・バ
ンドパスフィルタ、１０・・・重み利は回路、１１・・
・マルチプレクサ及びＡ／Ｄ変換器。

Claims

【特許請求の範囲】

（１）音ル信号からその特徴パラメータを抽出して辞書
を構成し、入力音声の入力パラメータと該辞書に格納さ
れた特徴パラメータとを照合して入力音声を認識する音
声認識装置において、人間の聴感補正特性に合致した補
正特性を有する補正手段を用いて音声の特徴パラメータ
を抽出することを特徴とする音声認識装置。
（２）上記補止手段を特徴抽出の前処理部で構成したこ
とを特徴とする特許請求の範囲第（１）項に記載の音声
認識装置。
（３）上記補正手段を各バンドバスフィルタの重み付は
関数として特徴抽出部を構成したことを４４Ｆ徴とする
特許請求の範囲第（１）項に記載の音声認識装置。