JPS5837695A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5837695A
JPS5837695A JP13095881A JP13095881A JPS5837695A JP S5837695 A JPS5837695 A JP S5837695A JP 13095881 A JP13095881 A JP 13095881A JP 13095881 A JP13095881 A JP 13095881A JP S5837695 A JPS5837695 A JP S5837695A
Authority
JP
Japan
Prior art keywords
voice
frequency
maximum frequency
ratio
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP13095881A
Other languages
English (en)
Inventor
伊奈 康信
塩野 一彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd, Sanyo Denki Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP13095881A priority Critical patent/JPS5837695A/ja
Publication of JPS5837695A publication Critical patent/JPS5837695A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声認識装置に関する。
近年1人間の音声を識別してその音声に対応する動作を
実行する音声認識装置の開発が進み、各棟の装置が実現
されている。
人間の音声は多数の周波数成分から成り立ち、この周波
数成分を示す周波数スペクトルをみると。
いくつかの山や谷があり、特定の周波数帯域にエネルギ
ーが集中しているのがわかる。このエネルギーが集中し
ている帯域をホルマント周波数と云い、音声の)*類に
依9てこのホルマント周波数が異なるifが知らね、て
いる。
上述の如き周波数スペクトルを音声から抽出して、この
スペクトルを音声認識に用いる音声認識装置が現在最も
一般的である。
第1図に所様な従来の音声認識装置を示す。同図に於て
、(1)は音声な電気信号に変換°rるマイクロフォン
、(2)は該マイクロフォン(1)からの信号を増rl
Jするマイクアンプ、(3)・・・は該マイクアンプで
増巾さね、た音声信号から特定周波数成分を抽出する複
数のバンドパスフィルタであって1例えば16個の各バ
ンドパスフィルタ(3)・・・の通過帯域の犬々の間隔
が1/4  オクターブ程度になる様に低音域側から順
次配列構成きね、ている。(4)・・・は該バンドパス
フィルタ(3)・・・から得られる音声(1の各周波数
成分を整流して、その短時間平均値を導出する少数の整
p、平均器、(5)は該り)4流平均器(4)・・・か
ら得られる。i!5−周波数成分値を順次選択出力する
アナログ・マルチプレクサ・、 i6]は該アナログ・
マルチプレクサ(5)から出力さね、る周波数成分1向
をディジタル置に変換するA/D変換滞であって、  
J+1+常8ビットのディジタル信号に変換される。(
7)は認識処理部であり、該A/D変換詣(6)から得
らノ1.るディジタル匿の音声力周波数成分値からなる
入力音声パターンと、予めメモリ(8)に貯えられてい
る多数の診照音声パターンとを比較演算し、峡も類似の
診照音声パターンが示す音声を人力音声と−r Z+認
識がなされる。
第6図(a)に上述の音声認識装置に依って音声信号か
ら抽出される音声パターンケ示す。図中f1〜f1sは
16個のバンドパスフィルタ(3)・・・の犬々の通過
周波数である。この様な音声パターンは音声の周波数ス
ペクトルをよく表わしており、音声を識別するに充分な
ものである。しかしながら所4・求な音声パターンを扱
う為には、こカ棟音声認識装置は、−音声当りの11−
ンブル数す′I′−16、バンドパスフィルタにす・・
・の数をn−16、−サンプル当りのビット数fw〜8
、とすると、−音声当vmnT−2048ビットもの大
情報駄の音声パターンとlる。7に−りて、t1u識処
理部(7)に於ける認識の為の演詐[11が大きくなり
、多数の認識音声を対象とする1局合には、実時間での
認識応答が困難になる恐)1、かあった。この為、更に
圧縮された音声パターンな扱う!1fのでさる音声認識
装置の開発が望まノ1でいる。
第2図に不発IJ、Jの箱声8g識装置カー実施例の構
成な示し、第3図ft1% (OJのa号図に基づいて
本分till実施例を説[yJする。第2図に於いて、
(1)〜(4)は第1図に示した従来の音声認識装置と
同様にマイクロフォン〜−Ij′−流平均器を示してお
り、そのi+D過帯域が低音域側から11111次配列
した16個のバンドパスフィルタ(3)・・・とこね、
等に連結した整流平均器(4)・・・とに依ってマイク
ロフォンfl) K人力さ11.た音声の第4図(aJ
 K示す如き1g6波数スペクトルを検出する為のスペ
クトル検出器が構成δれている。(9)・・・は15個
の第1比較器であり、隣接する2つの上記バンドパスフ
ィルタ(31(31間の出力が夫々M、、f流平均藷(
41FJを介し−C大小比較される。即ち、この第1比
較器(9)・・・からは、第4図(b)に示すIAI 
< sそノ周波数が隣1妾した2つのスペクトル値の内
、高周波数のその1直が低周波数のその値よシ大きい時
に・8174〜号が、その逆の時′″L“イt:tuが
・1(;らハ。
る。aα・・・は14個の第2比較器であり、隣接j−
る2つの上r+c!、第1比較ぺ胆9バ9)間の出力が
大小比較される。即ち、この第2比較iLt 11α・
・・からは、第4図(C) K示す如く、低周波数側の
第1比較器(9)の出力か1H″であると共に高周波数
側の第1比較と旧9)の出力がSL//である時にH“
イ目冒が得られ、これ以外の時には1L“16Mりとな
る。従って、この第2比較器11.01・・・から得ら
れた1H“(?’fυ箇所が音声力筒波数スペクトルの
極大点、即ちホルマントの位置を示す事となる。Uυは
ホルマント周波数検出回路であり、14個の上記第2比
較器0α・・・から得ら11.る1H″信”J[基づい
て、その”” ”aす1:う1所、即ちポルマントに対
応したホルマント周波数のFへ、低音域1則から第1、
第2、及び第6ホルーrント周波数F1、Ftr、 F
sな出力する。(13は第1割゛卿器であり、」−4ホ
ルマント周波数検出回路カリ)イUらノ1.る第1及び
第2ホルマント周波数の比Fn/F1がn’l葬: d
 11. 、コれか音声バラメー9R1=F’R/F1
として出力さね、る。03は第2割′IA−器てあ: 
リ、上記第1の却jτ+” l”I ll’l’?と向
しく、第2及び第3ホルマント141波数の比Fs/F
’11が’FTt TA−され、これが凸点パラメータ
R2・−1”3/F2として出力される。
(1−IJ&;t、人力1−1njパターンメモリであ
り、上記第1、及び第2割鈷ピ’1021. fUから
イ(Iらtl、る−組の汁声パラノータR1,Reの1
1り1・系列か入力音声パターンとして貯えら7−1て
いる。ilJは参照活用パターンメモリであり、1・し
め、多数色認識音声についての8化[5声パターンが(
?i納きれている。(1ωは誌昌処理  。
部であり、」二記入力音声パターンメモリ(14Jから
の人力f;−J’lパターンどfIKJ L声パターン
メモリ0ωの各参照音声パターンとを比較演算し、最も
類以の参照音声パターンが示す音声を入力音声とする認
識がなされる。
新様な構成の音声認識装置は、入力音声から、第1.第
2、及び第3ホルマント周波数F1.F’s、Fsを検
出して、この等ホルマント周波数の相対比率YR7F1
. iz/F鷹  を音声パラメータとして用いるもの
である。こ9事は、音声のll!Jは+1に依2てホル
マント周波数が異なる事に起因したものであシ、少なく
とも6つのホルマント周波数11.Fm、F3を用いn
、は音声の種類が識別できる事に基づいている。その上
、同−音声を数回発声した時に、音声の各ホルマント周
波数には多少の変動があるが、これ等の相対的位置、即
ち相対比率Fm/F1、F 37’F 麿はほとんど変
動しない事が明らかになっているので、これ等音声パラ
メータR1mF1/Fl。
R2二Fs/Fm は、第1図に示した如き従来装置に
用いられていた音声パラメータ(周波数スペクトル値)
と同程度の音声識別能力を備えたパラメータである事が
わかる。
所る音声パラメータ・R1,RQの情報上は一音声当り
のサンプル数をT −16,−サンプル当シのビット数
をm社8、とすると、2m’!!−256ビツトとなり
、従来装置の音声パラメータの情報μ(2048ビツト
)の17.に低減されている。
f+’+↑、以コニVこ説す」シた本発明の実施例に於
いては、必鼎最小限の2つの音声パラメータR1wF 
x/ F l 。
R2〜F3/Fl、  な用いているが、第1〜第4及
び第5ホルマント周波数Fl、〜、FBを求め、これ等
の相対比率Fl!/Fl、F 3 / F 1 % F
 47 F 3 % F 6乙1を、音声パラメータと
して用いr、ば、情報上を従来品の1/、にして、音声
の識別能力を更に高める事が可能となる。
不発IJJの音声認識装置は、以上の説明から明らかな
如く、音声のスペクトル値が極大となる極大周波数の内
、少なくとも低周波数側から第1.第2、及び第6の(
板大周波数を選出し、こね1等栖大周波数の相対的な化
率からなる音声パターンをパターン認識するものである
ので、即ち、従来装置で処理さtl、でいた音声パター
ンを音声の特徴な保存しながら、大巾に1王縮した音声
パターンな月4いているので、従来装置に比べ、認識処
理の為の81算駄が低減され、多数の認識音声に対しで
も、実時間でのM声認識を容易に実現する東ができる。
又、上記極大周波数の相対的な比率として、第1及び第
2の極大周波数の比率と、第2及び第6の極大周波数の
比率と、を用いているので、これ等
【図面の簡単な説明】
第1図は従来の音声認識装置の構成を示すブロック図、
第2図は不発l−1l(の音声認識装置の構成を示すブ
ロック図、第3図(&)、(bJ、((IJは従来装置
111及び本発明装置を説り1する為の信り図、である
。 (11・・・マイクロフォン、 C3)・・・バンドパ
スフィルタ、(9)・・・第1比較器、(lト・・第2
比較器、au・・・ホルマント周波数検出回路、021
・・・第1割算藩、a31・・・第2割算器、tl(1
)・・・入力音声パターンメモ!Ill晃・・・参照音
声パターンメモリ、1lfil・・・認識処]11! 
r’m。 出願人 三洋電m株式会社、□)、ノ。 代理人弁理士佐野 静 犬 627

Claims (1)

  1. 【特許請求の範囲】 1)音声の周波数スペクトル崎を検出するスペクトル検
    出器と、該スペクトル検出器から得られるスペクトル値
    が極大となる極大周波数の内、少なくとも低周波数側か
    ら第1、第2.及び第3の極大周波数を選出する極大周
    波数検出回路と、該極大周波数検出回路から得られる少
    なくとも第」、第2、及び第3の相対的な比率を算出す
    る比率算出回路と、該比率算出回路から得らカ、る比率
    からなる音声パターンをパターン認識する認識処理部と
    、からなる事を特徴とした音声認識装置。 2)上記比率算出回路に依って算出される比率として、
    第1の極大周波数に対する第2の極大周波数の比率、及
    び第2の極大周波数に対する第3の極大周波数の比率、
    を用いた特tfF請求の範囲第1項記載の音声認識装置
JP13095881A 1981-08-20 1981-08-20 音声認識装置 Pending JPS5837695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13095881A JPS5837695A (ja) 1981-08-20 1981-08-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13095881A JPS5837695A (ja) 1981-08-20 1981-08-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPS5837695A true JPS5837695A (ja) 1983-03-04

Family

ID=15046603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13095881A Pending JPS5837695A (ja) 1981-08-20 1981-08-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5837695A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6097400A (ja) * 1983-11-01 1985-05-31 日本電気株式会社 音声認識装置
JPS63238679A (ja) * 1987-01-07 1988-10-04 Nikken Food Honsha Kk 入力認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6097400A (ja) * 1983-11-01 1985-05-31 日本電気株式会社 音声認識装置
JPH0246960B2 (ja) * 1983-11-01 1990-10-17 Nippon Electric Co
JPS63238679A (ja) * 1987-01-07 1988-10-04 Nikken Food Honsha Kk 入力認識装置

Similar Documents

Publication Publication Date Title
US5884260A (en) Method and system for detecting and generating transient conditions in auditory signals
US7711123B2 (en) Segmenting audio signals into auditory events
CA2448182C (en) Segmenting audio signals into auditory events
US4827519A (en) Voice recognition system using voice power patterns
Scarr Zero crossings as a means of obtaining spectral information in speech analysis
WO2013123747A1 (zh) 一种基于音频实现设备解锁的方法和系统
JPS6128998B2 (ja)
JPS5837695A (ja) 音声認識装置
JP2992324B2 (ja) 音声区間検出方法
CA1218458A (en) Apparatus and method for automatic speech activity detection
JPH04369698A (ja) 音声認識方式
JP2006154484A (ja) 音声処理装置,音声処理方法,プログラム及び記録媒体
JPS62113197A (ja) 音声認識装置
JPS58149099A (ja) パタ−ン認識方式
JP2658104B2 (ja) 音声認識装置
KR20190001623A (ko) Rtfe 알고리즘으로 소리의 특징을 추출하는 방법
JPH0285897A (ja) 音声検出方式
JPS58190999A (ja) 音声認識装置
JPS59123897A (ja) 音声認識装置
JPS63265300A (ja) 音声の特徴抽出方法
JPH0298000A (ja) 男女声の識別方法
JPS6315298A (ja) パタ−ン作成方式
JPH02127700A (ja) 音声応答装置
JPS63106800A (ja) 音響分析器
JPS61230199A (ja) 音声認識方法