JPS5837695A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS5837695A JPS5837695A JP13095881A JP13095881A JPS5837695A JP S5837695 A JPS5837695 A JP S5837695A JP 13095881 A JP13095881 A JP 13095881A JP 13095881 A JP13095881 A JP 13095881A JP S5837695 A JPS5837695 A JP S5837695A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- frequency
- maximum frequency
- ratio
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は音声認識装置に関する。
近年1人間の音声を識別してその音声に対応する動作を
実行する音声認識装置の開発が進み、各棟の装置が実現
されている。
実行する音声認識装置の開発が進み、各棟の装置が実現
されている。
人間の音声は多数の周波数成分から成り立ち、この周波
数成分を示す周波数スペクトルをみると。
数成分を示す周波数スペクトルをみると。
いくつかの山や谷があり、特定の周波数帯域にエネルギ
ーが集中しているのがわかる。このエネルギーが集中し
ている帯域をホルマント周波数と云い、音声の)*類に
依9てこのホルマント周波数が異なるifが知らね、て
いる。
ーが集中しているのがわかる。このエネルギーが集中し
ている帯域をホルマント周波数と云い、音声の)*類に
依9てこのホルマント周波数が異なるifが知らね、て
いる。
上述の如き周波数スペクトルを音声から抽出して、この
スペクトルを音声認識に用いる音声認識装置が現在最も
一般的である。
スペクトルを音声認識に用いる音声認識装置が現在最も
一般的である。
第1図に所様な従来の音声認識装置を示す。同図に於て
、(1)は音声な電気信号に変換°rるマイクロフォン
、(2)は該マイクロフォン(1)からの信号を増rl
Jするマイクアンプ、(3)・・・は該マイクアンプで
増巾さね、た音声信号から特定周波数成分を抽出する複
数のバンドパスフィルタであって1例えば16個の各バ
ンドパスフィルタ(3)・・・の通過帯域の犬々の間隔
が1/4 オクターブ程度になる様に低音域側から順
次配列構成きね、ている。(4)・・・は該バンドパス
フィルタ(3)・・・から得られる音声(1の各周波数
成分を整流して、その短時間平均値を導出する少数の整
p、平均器、(5)は該り)4流平均器(4)・・・か
ら得られる。i!5−周波数成分値を順次選択出力する
アナログ・マルチプレクサ・、 i6]は該アナログ・
マルチプレクサ(5)から出力さね、る周波数成分1向
をディジタル置に変換するA/D変換滞であって、
J+1+常8ビットのディジタル信号に変換される。(
7)は認識処理部であり、該A/D変換詣(6)から得
らノ1.るディジタル匿の音声力周波数成分値からなる
入力音声パターンと、予めメモリ(8)に貯えられてい
る多数の診照音声パターンとを比較演算し、峡も類似の
診照音声パターンが示す音声を人力音声と−r Z+認
識がなされる。
、(1)は音声な電気信号に変換°rるマイクロフォン
、(2)は該マイクロフォン(1)からの信号を増rl
Jするマイクアンプ、(3)・・・は該マイクアンプで
増巾さね、た音声信号から特定周波数成分を抽出する複
数のバンドパスフィルタであって1例えば16個の各バ
ンドパスフィルタ(3)・・・の通過帯域の犬々の間隔
が1/4 オクターブ程度になる様に低音域側から順
次配列構成きね、ている。(4)・・・は該バンドパス
フィルタ(3)・・・から得られる音声(1の各周波数
成分を整流して、その短時間平均値を導出する少数の整
p、平均器、(5)は該り)4流平均器(4)・・・か
ら得られる。i!5−周波数成分値を順次選択出力する
アナログ・マルチプレクサ・、 i6]は該アナログ・
マルチプレクサ(5)から出力さね、る周波数成分1向
をディジタル置に変換するA/D変換滞であって、
J+1+常8ビットのディジタル信号に変換される。(
7)は認識処理部であり、該A/D変換詣(6)から得
らノ1.るディジタル匿の音声力周波数成分値からなる
入力音声パターンと、予めメモリ(8)に貯えられてい
る多数の診照音声パターンとを比較演算し、峡も類似の
診照音声パターンが示す音声を人力音声と−r Z+認
識がなされる。
第6図(a)に上述の音声認識装置に依って音声信号か
ら抽出される音声パターンケ示す。図中f1〜f1sは
16個のバンドパスフィルタ(3)・・・の犬々の通過
周波数である。この様な音声パターンは音声の周波数ス
ペクトルをよく表わしており、音声を識別するに充分な
ものである。しかしながら所4・求な音声パターンを扱
う為には、こカ棟音声認識装置は、−音声当りの11−
ンブル数す′I′−16、バンドパスフィルタにす・・
・の数をn−16、−サンプル当りのビット数fw〜8
、とすると、−音声当vmnT−2048ビットもの大
情報駄の音声パターンとlる。7に−りて、t1u識処
理部(7)に於ける認識の為の演詐[11が大きくなり
、多数の認識音声を対象とする1局合には、実時間での
認識応答が困難になる恐)1、かあった。この為、更に
圧縮された音声パターンな扱う!1fのでさる音声認識
装置の開発が望まノ1でいる。
ら抽出される音声パターンケ示す。図中f1〜f1sは
16個のバンドパスフィルタ(3)・・・の犬々の通過
周波数である。この様な音声パターンは音声の周波数ス
ペクトルをよく表わしており、音声を識別するに充分な
ものである。しかしながら所4・求な音声パターンを扱
う為には、こカ棟音声認識装置は、−音声当りの11−
ンブル数す′I′−16、バンドパスフィルタにす・・
・の数をn−16、−サンプル当りのビット数fw〜8
、とすると、−音声当vmnT−2048ビットもの大
情報駄の音声パターンとlる。7に−りて、t1u識処
理部(7)に於ける認識の為の演詐[11が大きくなり
、多数の認識音声を対象とする1局合には、実時間での
認識応答が困難になる恐)1、かあった。この為、更に
圧縮された音声パターンな扱う!1fのでさる音声認識
装置の開発が望まノ1でいる。
第2図に不発IJ、Jの箱声8g識装置カー実施例の構
成な示し、第3図ft1% (OJのa号図に基づいて
本分till実施例を説[yJする。第2図に於いて、
(1)〜(4)は第1図に示した従来の音声認識装置と
同様にマイクロフォン〜−Ij′−流平均器を示してお
り、そのi+D過帯域が低音域側から11111次配列
した16個のバンドパスフィルタ(3)・・・とこね、
等に連結した整流平均器(4)・・・とに依ってマイク
ロフォンfl) K人力さ11.た音声の第4図(aJ
K示す如き1g6波数スペクトルを検出する為のスペ
クトル検出器が構成δれている。(9)・・・は15個
の第1比較器であり、隣接する2つの上記バンドパスフ
ィルタ(31(31間の出力が夫々M、、f流平均藷(
41FJを介し−C大小比較される。即ち、この第1比
較器(9)・・・からは、第4図(b)に示すIAI
< sそノ周波数が隣1妾した2つのスペクトル値の内
、高周波数のその1直が低周波数のその値よシ大きい時
に・8174〜号が、その逆の時′″L“イt:tuが
・1(;らハ。
成な示し、第3図ft1% (OJのa号図に基づいて
本分till実施例を説[yJする。第2図に於いて、
(1)〜(4)は第1図に示した従来の音声認識装置と
同様にマイクロフォン〜−Ij′−流平均器を示してお
り、そのi+D過帯域が低音域側から11111次配列
した16個のバンドパスフィルタ(3)・・・とこね、
等に連結した整流平均器(4)・・・とに依ってマイク
ロフォンfl) K人力さ11.た音声の第4図(aJ
K示す如き1g6波数スペクトルを検出する為のスペ
クトル検出器が構成δれている。(9)・・・は15個
の第1比較器であり、隣接する2つの上記バンドパスフ
ィルタ(31(31間の出力が夫々M、、f流平均藷(
41FJを介し−C大小比較される。即ち、この第1比
較器(9)・・・からは、第4図(b)に示すIAI
< sそノ周波数が隣1妾した2つのスペクトル値の内
、高周波数のその1直が低周波数のその値よシ大きい時
に・8174〜号が、その逆の時′″L“イt:tuが
・1(;らハ。
る。aα・・・は14個の第2比較器であり、隣接j−
る2つの上r+c!、第1比較ぺ胆9バ9)間の出力が
大小比較される。即ち、この第2比較iLt 11α・
・・からは、第4図(C) K示す如く、低周波数側の
第1比較器(9)の出力か1H″であると共に高周波数
側の第1比較と旧9)の出力がSL//である時にH“
イ目冒が得られ、これ以外の時には1L“16Mりとな
る。従って、この第2比較器11.01・・・から得ら
れた1H“(?’fυ箇所が音声力筒波数スペクトルの
極大点、即ちホルマントの位置を示す事となる。Uυは
ホルマント周波数検出回路であり、14個の上記第2比
較器0α・・・から得ら11.る1H″信”J[基づい
て、その”” ”aす1:う1所、即ちポルマントに対
応したホルマント周波数のFへ、低音域1則から第1、
第2、及び第6ホルーrント周波数F1、Ftr、 F
sな出力する。(13は第1割゛卿器であり、」−4ホ
ルマント周波数検出回路カリ)イUらノ1.る第1及び
第2ホルマント周波数の比Fn/F1がn’l葬: d
11. 、コれか音声バラメー9R1=F’R/F1
として出力さね、る。03は第2割′IA−器てあ:
リ、上記第1の却jτ+” l”I ll’l’?と向
しく、第2及び第3ホルマント141波数の比Fs/F
’11が’FTt TA−され、これが凸点パラメータ
R2・−1”3/F2として出力される。
る2つの上r+c!、第1比較ぺ胆9バ9)間の出力が
大小比較される。即ち、この第2比較iLt 11α・
・・からは、第4図(C) K示す如く、低周波数側の
第1比較器(9)の出力か1H″であると共に高周波数
側の第1比較と旧9)の出力がSL//である時にH“
イ目冒が得られ、これ以外の時には1L“16Mりとな
る。従って、この第2比較器11.01・・・から得ら
れた1H“(?’fυ箇所が音声力筒波数スペクトルの
極大点、即ちホルマントの位置を示す事となる。Uυは
ホルマント周波数検出回路であり、14個の上記第2比
較器0α・・・から得ら11.る1H″信”J[基づい
て、その”” ”aす1:う1所、即ちポルマントに対
応したホルマント周波数のFへ、低音域1則から第1、
第2、及び第6ホルーrント周波数F1、Ftr、 F
sな出力する。(13は第1割゛卿器であり、」−4ホ
ルマント周波数検出回路カリ)イUらノ1.る第1及び
第2ホルマント周波数の比Fn/F1がn’l葬: d
11. 、コれか音声バラメー9R1=F’R/F1
として出力さね、る。03は第2割′IA−器てあ:
リ、上記第1の却jτ+” l”I ll’l’?と向
しく、第2及び第3ホルマント141波数の比Fs/F
’11が’FTt TA−され、これが凸点パラメータ
R2・−1”3/F2として出力される。
(1−IJ&;t、人力1−1njパターンメモリであ
り、上記第1、及び第2割鈷ピ’1021. fUから
イ(Iらtl、る−組の汁声パラノータR1,Reの1
1り1・系列か入力音声パターンとして貯えら7−1て
いる。ilJは参照活用パターンメモリであり、1・し
め、多数色認識音声についての8化[5声パターンが(
?i納きれている。(1ωは誌昌処理 。
り、上記第1、及び第2割鈷ピ’1021. fUから
イ(Iらtl、る−組の汁声パラノータR1,Reの1
1り1・系列か入力音声パターンとして貯えら7−1て
いる。ilJは参照活用パターンメモリであり、1・し
め、多数色認識音声についての8化[5声パターンが(
?i納きれている。(1ωは誌昌処理 。
部であり、」二記入力音声パターンメモリ(14Jから
の人力f;−J’lパターンどfIKJ L声パターン
メモリ0ωの各参照音声パターンとを比較演算し、最も
類以の参照音声パターンが示す音声を入力音声とする認
識がなされる。
の人力f;−J’lパターンどfIKJ L声パターン
メモリ0ωの各参照音声パターンとを比較演算し、最も
類以の参照音声パターンが示す音声を入力音声とする認
識がなされる。
新様な構成の音声認識装置は、入力音声から、第1.第
2、及び第3ホルマント周波数F1.F’s、Fsを検
出して、この等ホルマント周波数の相対比率YR7F1
. iz/F鷹 を音声パラメータとして用いるもの
である。こ9事は、音声のll!Jは+1に依2てホル
マント周波数が異なる事に起因したものであシ、少なく
とも6つのホルマント周波数11.Fm、F3を用いn
、は音声の種類が識別できる事に基づいている。その上
、同−音声を数回発声した時に、音声の各ホルマント周
波数には多少の変動があるが、これ等の相対的位置、即
ち相対比率Fm/F1、F 37’F 麿はほとんど変
動しない事が明らかになっているので、これ等音声パラ
メータR1mF1/Fl。
2、及び第3ホルマント周波数F1.F’s、Fsを検
出して、この等ホルマント周波数の相対比率YR7F1
. iz/F鷹 を音声パラメータとして用いるもの
である。こ9事は、音声のll!Jは+1に依2てホル
マント周波数が異なる事に起因したものであシ、少なく
とも6つのホルマント周波数11.Fm、F3を用いn
、は音声の種類が識別できる事に基づいている。その上
、同−音声を数回発声した時に、音声の各ホルマント周
波数には多少の変動があるが、これ等の相対的位置、即
ち相対比率Fm/F1、F 37’F 麿はほとんど変
動しない事が明らかになっているので、これ等音声パラ
メータR1mF1/Fl。
R2二Fs/Fm は、第1図に示した如き従来装置に
用いられていた音声パラメータ(周波数スペクトル値)
と同程度の音声識別能力を備えたパラメータである事が
わかる。
用いられていた音声パラメータ(周波数スペクトル値)
と同程度の音声識別能力を備えたパラメータである事が
わかる。
所る音声パラメータ・R1,RQの情報上は一音声当り
のサンプル数をT −16,−サンプル当シのビット数
をm社8、とすると、2m’!!−256ビツトとなり
、従来装置の音声パラメータの情報μ(2048ビツト
)の17.に低減されている。
のサンプル数をT −16,−サンプル当シのビット数
をm社8、とすると、2m’!!−256ビツトとなり
、従来装置の音声パラメータの情報μ(2048ビツト
)の17.に低減されている。
f+’+↑、以コニVこ説す」シた本発明の実施例に於
いては、必鼎最小限の2つの音声パラメータR1wF
x/ F l 。
いては、必鼎最小限の2つの音声パラメータR1wF
x/ F l 。
R2〜F3/Fl、 な用いているが、第1〜第4及
び第5ホルマント周波数Fl、〜、FBを求め、これ等
の相対比率Fl!/Fl、F 3 / F 1 % F
47 F 3 % F 6乙1を、音声パラメータと
して用いr、ば、情報上を従来品の1/、にして、音声
の識別能力を更に高める事が可能となる。
び第5ホルマント周波数Fl、〜、FBを求め、これ等
の相対比率Fl!/Fl、F 3 / F 1 % F
47 F 3 % F 6乙1を、音声パラメータと
して用いr、ば、情報上を従来品の1/、にして、音声
の識別能力を更に高める事が可能となる。
不発IJJの音声認識装置は、以上の説明から明らかな
如く、音声のスペクトル値が極大となる極大周波数の内
、少なくとも低周波数側から第1.第2、及び第6の(
板大周波数を選出し、こね1等栖大周波数の相対的な化
率からなる音声パターンをパターン認識するものである
ので、即ち、従来装置で処理さtl、でいた音声パター
ンを音声の特徴な保存しながら、大巾に1王縮した音声
パターンな月4いているので、従来装置に比べ、認識処
理の為の81算駄が低減され、多数の認識音声に対しで
も、実時間でのM声認識を容易に実現する東ができる。
如く、音声のスペクトル値が極大となる極大周波数の内
、少なくとも低周波数側から第1.第2、及び第6の(
板大周波数を選出し、こね1等栖大周波数の相対的な化
率からなる音声パターンをパターン認識するものである
ので、即ち、従来装置で処理さtl、でいた音声パター
ンを音声の特徴な保存しながら、大巾に1王縮した音声
パターンな月4いているので、従来装置に比べ、認識処
理の為の81算駄が低減され、多数の認識音声に対しで
も、実時間でのM声認識を容易に実現する東ができる。
又、上記極大周波数の相対的な比率として、第1及び第
2の極大周波数の比率と、第2及び第6の極大周波数の
比率と、を用いているので、これ等
2の極大周波数の比率と、第2及び第6の極大周波数の
比率と、を用いているので、これ等
第1図は従来の音声認識装置の構成を示すブロック図、
第2図は不発l−1l(の音声認識装置の構成を示すブ
ロック図、第3図(&)、(bJ、((IJは従来装置
111及び本発明装置を説り1する為の信り図、である
。 (11・・・マイクロフォン、 C3)・・・バンドパ
スフィルタ、(9)・・・第1比較器、(lト・・第2
比較器、au・・・ホルマント周波数検出回路、021
・・・第1割算藩、a31・・・第2割算器、tl(1
)・・・入力音声パターンメモ!Ill晃・・・参照音
声パターンメモリ、1lfil・・・認識処]11!
r’m。 出願人 三洋電m株式会社、□)、ノ。 代理人弁理士佐野 静 犬 627
第2図は不発l−1l(の音声認識装置の構成を示すブ
ロック図、第3図(&)、(bJ、((IJは従来装置
111及び本発明装置を説り1する為の信り図、である
。 (11・・・マイクロフォン、 C3)・・・バンドパ
スフィルタ、(9)・・・第1比較器、(lト・・第2
比較器、au・・・ホルマント周波数検出回路、021
・・・第1割算藩、a31・・・第2割算器、tl(1
)・・・入力音声パターンメモ!Ill晃・・・参照音
声パターンメモリ、1lfil・・・認識処]11!
r’m。 出願人 三洋電m株式会社、□)、ノ。 代理人弁理士佐野 静 犬 627
Claims (1)
- 【特許請求の範囲】 1)音声の周波数スペクトル崎を検出するスペクトル検
出器と、該スペクトル検出器から得られるスペクトル値
が極大となる極大周波数の内、少なくとも低周波数側か
ら第1、第2.及び第3の極大周波数を選出する極大周
波数検出回路と、該極大周波数検出回路から得られる少
なくとも第」、第2、及び第3の相対的な比率を算出す
る比率算出回路と、該比率算出回路から得らカ、る比率
からなる音声パターンをパターン認識する認識処理部と
、からなる事を特徴とした音声認識装置。 2)上記比率算出回路に依って算出される比率として、
第1の極大周波数に対する第2の極大周波数の比率、及
び第2の極大周波数に対する第3の極大周波数の比率、
を用いた特tfF請求の範囲第1項記載の音声認識装置
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13095881A JPS5837695A (ja) | 1981-08-20 | 1981-08-20 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13095881A JPS5837695A (ja) | 1981-08-20 | 1981-08-20 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5837695A true JPS5837695A (ja) | 1983-03-04 |
Family
ID=15046603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13095881A Pending JPS5837695A (ja) | 1981-08-20 | 1981-08-20 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5837695A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6097400A (ja) * | 1983-11-01 | 1985-05-31 | 日本電気株式会社 | 音声認識装置 |
JPS63238679A (ja) * | 1987-01-07 | 1988-10-04 | Nikken Food Honsha Kk | 入力認識装置 |
-
1981
- 1981-08-20 JP JP13095881A patent/JPS5837695A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6097400A (ja) * | 1983-11-01 | 1985-05-31 | 日本電気株式会社 | 音声認識装置 |
JPH0246960B2 (ja) * | 1983-11-01 | 1990-10-17 | Nippon Electric Co | |
JPS63238679A (ja) * | 1987-01-07 | 1988-10-04 | Nikken Food Honsha Kk | 入力認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5884260A (en) | Method and system for detecting and generating transient conditions in auditory signals | |
US7711123B2 (en) | Segmenting audio signals into auditory events | |
CA2448182C (en) | Segmenting audio signals into auditory events | |
US4827519A (en) | Voice recognition system using voice power patterns | |
Scarr | Zero crossings as a means of obtaining spectral information in speech analysis | |
WO2013123747A1 (zh) | 一种基于音频实现设备解锁的方法和系统 | |
JPS6128998B2 (ja) | ||
JPS5837695A (ja) | 音声認識装置 | |
JP2992324B2 (ja) | 音声区間検出方法 | |
CA1218458A (en) | Apparatus and method for automatic speech activity detection | |
JPH04369698A (ja) | 音声認識方式 | |
JP2006154484A (ja) | 音声処理装置,音声処理方法,プログラム及び記録媒体 | |
JPS62113197A (ja) | 音声認識装置 | |
JPS58149099A (ja) | パタ−ン認識方式 | |
JP2658104B2 (ja) | 音声認識装置 | |
KR20190001623A (ko) | Rtfe 알고리즘으로 소리의 특징을 추출하는 방법 | |
JPH0285897A (ja) | 音声検出方式 | |
JPS58190999A (ja) | 音声認識装置 | |
JPS59123897A (ja) | 音声認識装置 | |
JPS63265300A (ja) | 音声の特徴抽出方法 | |
JPH0298000A (ja) | 男女声の識別方法 | |
JPS6315298A (ja) | パタ−ン作成方式 | |
JPH02127700A (ja) | 音声応答装置 | |
JPS63106800A (ja) | 音響分析器 | |
JPS61230199A (ja) | 音声認識方法 |