JPS5837695A

JPS5837695A - 音声認識装置

Info

Publication number: JPS5837695A
Application number: JP13095881A
Authority: JP
Inventors: 伊奈　康信; 塩野　一彦
Original assignee: Sanyo Electric Co Ltd; Sanyo Denki Co Ltd
Current assignee: Sanyo Electric Co Ltd; Sanyo Denki Co Ltd
Priority date: 1981-08-20
Filing date: 1981-08-20
Publication date: 1983-03-04

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は音声認識装置に関する。

近年１人間の音声を識別してその音声に対応する動作を
実行する音声認識装置の開発が進み、各棟の装置が実現
されている。

人間の音声は多数の周波数成分から成り立ち、この周波
数成分を示す周波数スペクトルをみると。

いくつかの山や谷があり、特定の周波数帯域にエネルギ
ーが集中しているのがわかる。このエネルギーが集中し
ている帯域をホルマント周波数と云い、音声の）＊類に
依９てこのホルマント周波数が異なるｉｆが知らね、て
いる。

上述の如き周波数スペクトルを音声から抽出して、この
スペクトルを音声認識に用いる音声認識装置が現在最も
一般的である。

第１図に所様な従来の音声認識装置を示す。同図に於て
、（１）は音声な電気信号に変換°ｒるマイクロフォン
、（２）は該マイクロフォン（１）からの信号を増ｒｌ
Ｊするマイクアンプ、（３）・・・は該マイクアンプで
増巾さね、た音声信号から特定周波数成分を抽出する複
数のバンドパスフィルタであって１例えば１６個の各バ
ンドパスフィルタ（３）・・・の通過帯域の犬々の間隔
が１／４　　オクターブ程度になる様に低音域側から順
次配列構成きね、ている。（４）・・・は該バンドパス
フィルタ（３）・・・から得られる音声（１の各周波数
成分を整流して、その短時間平均値を導出する少数の整
ｐ、平均器、（５）は該り）４流平均器（４）・・・か
ら得られる。ｉ！５−周波数成分値を順次選択出力する
アナログ・マルチプレクサ・、　ｉ６］は該アナログ・
マルチプレクサ（５）から出力さね、る周波数成分１向
をディジタル置に変換するＡ／Ｄ変換滞であって、　　
Ｊ＋１＋常８ビットのディジタル信号に変換される。（
７）は認識処理部であり、該Ａ／Ｄ変換詣（６）から得
らノ１．るディジタル匿の音声力周波数成分値からなる
入力音声パターンと、予めメモリ（８）に貯えられてい
る多数の診照音声パターンとを比較演算し、峡も類似の
診照音声パターンが示す音声を人力音声と−ｒ　Ｚ＋認
識がなされる。

第６図（ａ）に上述の音声認識装置に依って音声信号か
ら抽出される音声パターンケ示す。図中ｆ１〜ｆ１ｓは
１６個のバンドパスフィルタ（３）・・・の犬々の通過
周波数である。この様な音声パターンは音声の周波数ス
ペクトルをよく表わしており、音声を識別するに充分な
ものである。しかしながら所４・求な音声パターンを扱
う為には、こカ棟音声認識装置は、−音声当りの１１−
ンブル数す′Ｉ′−１６、バンドパスフィルタにす・・
・の数をｎ−１６、−サンプル当りのビット数ｆｗ〜８
、とすると、−音声当ｖｍｎＴ−２０４８ビットもの大
情報駄の音声パターンとｌる。７に−りて、ｔ１ｕ識処
理部（７）に於ける認識の為の演詐［１１が大きくなり
、多数の認識音声を対象とする１局合には、実時間での
認識応答が困難になる恐）１、かあった。この為、更に
圧縮された音声パターンな扱う！１ｆのでさる音声認識
装置の開発が望まノ１でいる。

第２図に不発ＩＪ、Ｊの箱声８ｇ識装置カー実施例の構
成な示し、第３図ｆｔ１％　（ＯＪのａ号図に基づいて
本分ｔｉｌｌ実施例を説［ｙＪする。第２図に於いて、
（１）〜（４）は第１図に示した従来の音声認識装置と
同様にマイクロフォン〜−Ｉｊ′−流平均器を示してお
り、そのｉ＋Ｄ過帯域が低音域側から１１１１１次配列
した１６個のバンドパスフィルタ（３）・・・とこね、
等に連結した整流平均器（４）・・・とに依ってマイク
ロフォンｆｌ）　Ｋ人力さ１１．た音声の第４図（ａＪ
　Ｋ示す如き１ｇ６波数スペクトルを検出する為のスペ
クトル検出器が構成δれている。（９）・・・は１５個
の第１比較器であり、隣接する２つの上記バンドパスフ
ィルタ（３１（３１間の出力が夫々Ｍ、、ｆ流平均藷（
４１ＦＪを介し−Ｃ大小比較される。即ち、この第１比
較器（９）・・・からは、第４図（ｂ）に示すＩＡＩ　
＜　ｓそノ周波数が隣１妾した２つのスペクトル値の内
、高周波数のその１直が低周波数のその値よシ大きい時
に・８１７４〜号が、その逆の時′″Ｌ“イｔ：ｔｕが
・１（；らハ。

る。ａα・・・は１４個の第２比較器であり、隣接ｊ−
る２つの上ｒ＋ｃ！、第１比較ぺ胆９バ９）間の出力が
大小比較される。即ち、この第２比較ｉＬｔ　１１α・
・・からは、第４図（Ｃ）　Ｋ示す如く、低周波数側の
第１比較器（９）の出力か１Ｈ″であると共に高周波数
側の第１比較と旧９）の出力がＳＬ／／である時にＨ“
イ目冒が得られ、これ以外の時には１Ｌ“１６Ｍりとな
る。従って、この第２比較器１１．０１・・・から得ら
れた１Ｈ“（？’ｆυ箇所が音声力筒波数スペクトルの
極大点、即ちホルマントの位置を示す事となる。Ｕυは
ホルマント周波数検出回路であり、１４個の上記第２比
較器０α・・・から得ら１１．る１Ｈ″信”Ｊ［基づい
て、その””　”ａす１：う１所、即ちポルマントに対
応したホルマント周波数のＦへ、低音域１則から第１、
第２、及び第６ホルーｒント周波数Ｆ１、Ｆｔｒ、　Ｆ
ｓな出力する。（１３は第１割゛卿器であり、」−４ホ
ルマント周波数検出回路カリ）イＵらノ１．る第１及び
第２ホルマント周波数の比Ｆｎ／Ｆ１がｎ’ｌ葬：　ｄ
　１１．　、コれか音声バラメー９Ｒ１＝Ｆ’Ｒ／Ｆ１
として出力さね、る。０３は第２割′ＩＡ−器てあ：　
リ、上記第１の却ｊτ＋”　ｌ”Ｉ　ｌｌ’ｌ’？と向
しく、第２及び第３ホルマント１４１波数の比Ｆｓ／Ｆ
’１１が’ＦＴｔ　ＴＡ−され、これが凸点パラメータ
Ｒ２・−１”３／Ｆ２として出力される。

（１−ＩＪ＆；ｔ、人力１−１ｎｊパターンメモリであ
り、上記第１、及び第２割鈷ピ’１０２１．　ｆＵから
イ（Ｉらｔｌ、る−組の汁声パラノータＲ１，Ｒｅの１
１り１・系列か入力音声パターンとして貯えら７−１て
いる。ｉｌＪは参照活用パターンメモリであり、１・し
め、多数色認識音声についての８化［５声パターンが（
？ｉ納きれている。（１ωは誌昌処理　　。

部であり、」二記入力音声パターンメモリ（１４Ｊから
の人力ｆ；−Ｊ’ｌパターンどｆＩＫＪ　Ｌ声パターン
メモリ０ωの各参照音声パターンとを比較演算し、最も
類以の参照音声パターンが示す音声を入力音声とする認
識がなされる。

新様な構成の音声認識装置は、入力音声から、第１．第
２、及び第３ホルマント周波数Ｆ１．Ｆ’ｓ、Ｆｓを検
出して、この等ホルマント周波数の相対比率ＹＲ７Ｆ１
．　ｉｚ／Ｆ鷹　　を音声パラメータとして用いるもの
である。こ９事は、音声のｌｌ！Ｊは＋１に依２てホル
マント周波数が異なる事に起因したものであシ、少なく
とも６つのホルマント周波数１１．Ｆｍ、Ｆ３を用いｎ
、は音声の種類が識別できる事に基づいている。その上
、同−音声を数回発声した時に、音声の各ホルマント周
波数には多少の変動があるが、これ等の相対的位置、即
ち相対比率Ｆｍ／Ｆ１、Ｆ　３７’Ｆ　麿はほとんど変
動しない事が明らかになっているので、これ等音声パラ
メータＲ１ｍＦ１／Ｆｌ。

Ｒ２二Ｆｓ／Ｆｍ　は、第１図に示した如き従来装置に
用いられていた音声パラメータ（周波数スペクトル値）
と同程度の音声識別能力を備えたパラメータである事が
わかる。

所る音声パラメータ・Ｒ１，ＲＱの情報上は一音声当り
のサンプル数をＴ　−１６，−サンプル当シのビット数
をｍ社８、とすると、２ｍ’！！−２５６ビツトとなり
、従来装置の音声パラメータの情報μ（２０４８ビツト
）の１７．に低減されている。

ｆ＋’＋↑、以コニＶこ説す」シた本発明の実施例に於
いては、必鼎最小限の２つの音声パラメータＲ１ｗＦ　
ｘ／　Ｆ　ｌ　。

Ｒ２〜Ｆ３／Ｆｌ、　　な用いているが、第１〜第４及
び第５ホルマント周波数Ｆｌ、〜、ＦＢを求め、これ等
の相対比率Ｆｌ！／Ｆｌ、Ｆ　３　／　Ｆ　１　％　Ｆ
　４７　Ｆ　３　％　Ｆ　６乙１を、音声パラメータと
して用いｒ、ば、情報上を従来品の１／、にして、音声
の識別能力を更に高める事が可能となる。

不発ＩＪＪの音声認識装置は、以上の説明から明らかな
如く、音声のスペクトル値が極大となる極大周波数の内
、少なくとも低周波数側から第１．第２、及び第６の（
板大周波数を選出し、こね１等栖大周波数の相対的な化
率からなる音声パターンをパターン認識するものである
ので、即ち、従来装置で処理さｔｌ、でいた音声パター
ンを音声の特徴な保存しながら、大巾に１王縮した音声
パターンな月４いているので、従来装置に比べ、認識処
理の為の８１算駄が低減され、多数の認識音声に対しで
も、実時間でのＭ声認識を容易に実現する東ができる。

又、上記極大周波数の相対的な比率として、第１及び第
２の極大周波数の比率と、第２及び第６の極大周波数の
比率と、を用いているので、これ等

【図面の簡単な説明】

第１図は従来の音声認識装置の構成を示すブロック図、
第２図は不発ｌ−１ｌ（の音声認識装置の構成を示すブ
ロック図、第３図（＆）、（ｂＪ、（（ＩＪは従来装置
１１１及び本発明装置を説り１する為の信り図、である
。（１１・・・マイクロフォン、　Ｃ３）・・・バンドパ
スフィルタ、（９）・・・第１比較器、（ｌト・・第２
比較器、ａｕ・・・ホルマント周波数検出回路、０２１
・・・第１割算藩、ａ３１・・・第２割算器、ｔｌ（１
）・・・入力音声パターンメモ！Ｉｌｌ晃・・・参照音
声パターンメモリ、１ｌｆｉｌ・・・認識処］１１！　
ｒ’ｍ。出願人　三洋電ｍ株式会社、□）、ノ。代理人弁理士佐野　静　犬６２７

Claims

【特許請求の範囲】１）音声の周波数スペクトル崎を検出するスペクトル検
出器と、該スペクトル検出器から得られるスペクトル値
が極大となる極大周波数の内、少なくとも低周波数側か
ら第１、第２．及び第３の極大周波数を選出する極大周
波数検出回路と、該極大周波数検出回路から得られる少
なくとも第」、第２、及び第３の相対的な比率を算出す
る比率算出回路と、該比率算出回路から得らカ、る比率
からなる音声パターンをパターン認識する認識処理部と
、からなる事を特徴とした音声認識装置。２）上記比率算出回路に依って算出される比率として、
第１の極大周波数に対する第２の極大周波数の比率、及
び第２の極大周波数に対する第３の極大周波数の比率、
を用いた特ｔｆＦ請求の範囲第１項記載の音声認識装置
。