JPS59116798A - 音声認識装置の自動利得制御方法 - Google Patents

音声認識装置の自動利得制御方法

Info

Publication number
JPS59116798A
JPS59116798A JP57230417A JP23041782A JPS59116798A JP S59116798 A JPS59116798 A JP S59116798A JP 57230417 A JP57230417 A JP 57230417A JP 23041782 A JP23041782 A JP 23041782A JP S59116798 A JPS59116798 A JP S59116798A
Authority
JP
Japan
Prior art keywords
gain
sum
maximum value
energy
gain control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57230417A
Other languages
English (en)
Inventor
健一 野口
加地 正幹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyosan Electric Manufacturing Co Ltd
Original Assignee
Kyosan Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyosan Electric Manufacturing Co Ltd filed Critical Kyosan Electric Manufacturing Co Ltd
Priority to JP57230417A priority Critical patent/JPS59116798A/ja
Publication of JPS59116798A publication Critical patent/JPS59116798A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、音声認識装置における入力音声信号の回路中
へ挿入された可変利得回路の利得を自動的に制御する方
法に関するものである。
か\る音声認識装置は、本出願人の別途出願による「認
識パターン作成方式」(特願昭56−64976)、「
認識パターン照合方式」(特願昭56−68226.6
8227 )等により開示されてお)、これらにおいて
は、入力音声信号を周波数帯域毎のエネルギーへ分割し
、各エネルギーをサンプリングしてサンプリングデータ
を得たうえ、各サンプリングデータを入力音声信号の語
、句、音韻の長さおよび発声の時間変化、音量の時間変
化に関係なく、一定数のセグメントにグループ化した後
、周波数帯域別にサンプリングデータの総和を求め、こ
の総和中の最大値に対し正規化するための基準の数値を
与えると共に、他の総和に対しては、基準の数値に比例
した数値を与え、これによってサンプリングデータを正
規化してから、未知の音声に関する認識パターンおよび
既知の音声に関する照合パターンを作成し、これら両ノ
(ターンの照合によって未知の音声を判定するものとな
っている。
しかし、か\る従来の音声認識装置においては、マイク
ロホンにより入力音声信号を得る際、マイクロホンの位
置または話者の別に応じて入力音声信号のレベルが大き
く変化し、アナログ信号をディジタル信号へ変換するア
ナログ・ディジタル変換器(以下、ADC)の入力レベ
ル許容範囲外となることがあり、ADCの変換動作上歪
が発生し、あるいは、変換動作が不安定となシ、音声認
識が不正確となる欠点を生じている。
本発明は、従来のか\る欠点を根本的に排除する目的を
有し、上述の音声認識装置において、周波数帯域毎の各
エネルギーから得た各サンプリングデータをサンプリン
グの同−回数毎に集計して総和を求め、各サンプリング
回数における総和中の最大値により、入力音声信号の回
路中へ挿入てれた可変利得回路回路の利得を制御するも
のとした極めて効果的な、音声認識装置の自動利得制御
方法を提供するものである。
以下、実施例を示す図によって本発明の詳細な説明する
第1図は構成を示すブロック図であシ、マイクロホンM
によって得られた入力音声信号は、前置増幅器HAによ
り増幅されてから、人力音声信号の回路中へ挿入された
プログラマブル減衰器等の可変利得回路VGを介し、各
々が異なる通過周波数を有する帯域ろ波器BPFI〜B
PFtoへ与えられ、こ\において周波数帯域毎のエネ
ルギーへ分割されたうえ、検波器D E T l〜DE
T16により各々が検波され、周波数帯域毎のエネルギ
ーを示す直流信号となった後、マルチプレクサMPX 
により順次にサンプリングちれ、ADC−A/Dへ与え
られる。
−万、マイクロプロセッサ等のプロセッサCPUを中心
とし、固定メモリROM、El変メモIJ RAMおよ
びインターフェイスI/F等が配され、これらおよびA
DC−A/Dは母線BUSによυ接攻芒れており、固定
メモIJ ROMに格納された命令にしたがい、プロセ
ッサCPUがADC−A/Dの出力を取込み、かつ、必
要とするデータを可変メモリRAMへアクセスしなから
所足の動作を実行し、インターフェイスI/Fi介して
音声認識出力coおよび可変利得回路VGに対する制御
信号を送出するものとなっている。
なお、マルチプレクサMPXおよびADC@A/Dは、
プロセッサCPUによ多制御されており、これによって
サンプリング動作およびADC−A/Dの変換動作が規
正されている。
また、プロセッサCPUは、ADC@A/Dの出力を逐
次可変メモリRAMへ格納し、これらをサンプリングデ
ータとして一定数のセグメントにグループ化したうえ、
周波数帯域別にサンプリングデータの総和を求め、求め
た各総和を正規化した後、これによって可変メモリRA
M中へ認識パターンおよび照合パターンを格納し、両パ
ターンの照合により、与えられた現時点の入力音声信号
に対する認識判定を順次に行なっている。
だyし、プロセッサCPUは、可変利得回路VGに対す
る制御も行なっておシ、次表のデータマツプに示す演算
処理を音声認識動作と伴せて実行し〜f16は帯域洲波
器BPFi〜BPFtaの各周波数帯域、81〜Snは
サンプリング回数であシ、各サンプリングデータ32.
28.10等をサンプリングの同−回数毎に集計して総
和Fiミラめ、各サンプリング回数Sx”SHにおける
総和Fl中の最大値を判断し、この最大値によシ可変利
得回路VGの利得制御を行なうものとなっている。
すなわち、上表の場合では総和Fiが120.105.
860・・・・・・・・・7oとなっておシ、860が
最大値であるため、これに注目のうえ、最大値があらか
じめ定めた所定範囲より犬であれば利得を減少させ、最
大値が所定範囲よシ小であれば利得を増加させ、最大値
が所定範囲内であれば現状の利得を維持するものとして
利得制御を行なう。
なお、前述の制御は、1回のみの入力音声信号に基づい
て行なってもよいが、例えば、4回の入力音声信号にお
ける最大値を合計し、この合計値に基づいて行なった方
がより確実であり、実際には、第2図に示すフローチャ
ートのとおシに利得制御動作をプロセッサCPUが行な
っている。
すなわち、可変メモIJ RAM中には、現在の最大値
を一時的に格納するメモリエリヤMEおよび、4回の入
力音声信号における最大値を逐次蓄積するためのレジス
タRGI〜RG4が設けられておシ、第2図においては
、レジスタ’RG1〜RG4クリヤ“をます行なってか
ら、入力音声信号のレベルが一定レベルを越えたか否か
によ91語スタート〃の判断を行ない、これがY(YE
S)となれば、メモリエリヤ’MEクリヤ“ を行なっ
たうえ1サンプリングを行ない、Rpi演算“により総
和Fiを求めている。
ついで、′XFi)MEのデータ〃により、メモリエリ
ヤME内のデータと総和Fiとの比較を行ない、これが
Y−’C’あれば、総和1FiをMEへ格納“により、
メモリエリヤMEの内容を更新し、入力音声信号のレベ
ルが一定レベルより低くなったか否かによ91語エンド
の判断を行ない、これがN(No)の間は、″サンプリ
ング以降を反復する。
このため、メモリエリヤMEには、各サンプリング回数
における総和中の最大値がデータとして格納される。
また、1語エンド“がYとなれば、レジスタ’RGt〜
RG4の内容をシフトし、RG4へFiを蓄81“によ
シ、レジスタRGzの内容がレジスタRGIへ、レジス
タRGsの内容がレジスタRGzへ、レジスタRG4の
内容がレジスタRGIIへ順次にシフトして蓄積される
と共に、メモリエリヤMEの最大値である総和Fiがレ
ジスタRG4へ蓄積され、レジスタゝゝRGl−RG4
にデータあシ“がYとなるまで1語スタート“以降を反
復する。
したがって、レジスタRGI〜RG4には、一連の音声
信号からなるゝ語〃が与えられる度毎に総和Fl の最
大値が順次に蓄積され、−語”が4回力えられると、レ
ジスタ’ RGI〜RG4にデータあシ”がYとなる。
すると %pr演算“によシ、レジスタRGI〜RG4
のデータが合計され、合計値Frが求められたうえ、’
 Fr< 2000“によシ所定範囲の下限値2000
と比較され、これがYであれば、′利得増加“によシ可
変利得回路VGの利得を増加する方向へ制御する一方、
’ Fr<2ooo“がNであれば、1Fr〉3600
″へ移行し、こ\において所定範囲の上限値と比較され
、この結果がYであれば、′利得減少“により可変利得
回路VGの利得全減少する方向へ制御する。
しだがって、可変利得回路VGの利得は、総和F1  
の最大値が所定範囲2000〜3600と対応する状態
となる値に自ずから設定され、ADC−A/Dへ与えら
れる直流信号のレベルが最適状態となる。
たソし、レジスタRGI〜1RG4の数は、総和 Fi
の最大値を合計する回数に応じて設ければよく、所定範
囲の上限値3600および下限値2000は、状況にし
たがって選定すればよいと共に、可変利得回路VGを特
に設けず、前置増幅器HAを可変利得増幅器としても同
様である等、本発明は種々の変形が自在である。
以上の説明によシ明らかなとおシ本発明によれば、マイ
クロホンの位置または話者の別にか\わらず、ADCへ
与えられる直流信号のレベルが最適状態となり、ADC
の変換動作が確実となるため、音声認識の判定が正確と
なシ、各種用途の音声認識装置において顕著な効果が得
られる。
【図面の簡単な説明】
図は本発明の実施例を示し、第1図は構成に示すブロッ
ク図、第2図は利得制御動作のフローチャートである。 M・・Φ・マイクロホン、■G@・・・可変利得回路、
BPFl−BPFta ・・・・帯域P波器、DET1
’〜DET16 ” ”・・検波器、MPX・・・・マ
ルチプレクサ、A/D+1−・・ADC(アナログ9デ
イジタル変換り、CPU−・・−7”ロセッサ、ROM
・9・・固定メモリ、RAM・・・拳可変メモリ、I/
F・・・・インターフェイス。 特許出願人 株式会社京三製作所

Claims (1)

    【特許請求の範囲】
  1. 入力音声信号を周波数帯域毎のエネルギーへ分割し、該
    各エネルギーをサンプリングしてサンプリングデータを
    得たうえ、該サンプリングデータに基づき照合パターン
    および認識パターンを作成し、該両パターンの照合によ
    り未知の音声を判定する音声認識装置において、前記周
    波数帯域毎の各エネルギーから得た前記各サンプリング
    データ全サンプリングの同−回数毎に集計して総和を求
    め、各サンプリング回数における前記総和中の最大値に
    よυ前記入力音声信号の回路中へ挿入された可変利得回
    路の利得を制御すること全特徴とした音声認識装置の自
    動利得制御方法。
JP57230417A 1982-12-24 1982-12-24 音声認識装置の自動利得制御方法 Pending JPS59116798A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57230417A JPS59116798A (ja) 1982-12-24 1982-12-24 音声認識装置の自動利得制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57230417A JPS59116798A (ja) 1982-12-24 1982-12-24 音声認識装置の自動利得制御方法

Publications (1)

Publication Number Publication Date
JPS59116798A true JPS59116798A (ja) 1984-07-05

Family

ID=16907553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57230417A Pending JPS59116798A (ja) 1982-12-24 1982-12-24 音声認識装置の自動利得制御方法

Country Status (1)

Country Link
JP (1) JPS59116798A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5374807A (en) * 1976-12-15 1978-07-03 Fujitsu Ltd Voice recognition matching control system
JPS55121500A (en) * 1979-03-15 1980-09-18 Fujitsu Ltd Voice identification device
JPS56126896A (en) * 1980-03-10 1981-10-05 Nippon Electric Co Voice recognizing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5374807A (en) * 1976-12-15 1978-07-03 Fujitsu Ltd Voice recognition matching control system
JPS55121500A (en) * 1979-03-15 1980-09-18 Fujitsu Ltd Voice identification device
JPS56126896A (en) * 1980-03-10 1981-10-05 Nippon Electric Co Voice recognizing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions

Similar Documents

Publication Publication Date Title
JPS63301998A (ja) 音声認識応答装置
JPS59116798A (ja) 音声認識装置の自動利得制御方法
CN112634937A (zh) 一种无需数字特征提取计算的声音分类方法
JPH0462398B2 (ja)
JPH05100661A (ja) 小節境界時刻抽出装置
JPS59116797A (ja) 音声認識装置の自動利得制御方法
JPH0461359B2 (ja)
JPS59124400A (ja) 音声パタ−ン・マツチング方式
JP2966452B2 (ja) 音声認識装置の雑音除去システム
JPS63266497A (ja) 音声認識装置
JPH01136195A (ja) 音声認識用半導体装置
JPH0136640B2 (ja)
JP2003241792A (ja) 音声認識装置及び方法
JPS625298A (ja) 音声認識装置
JPS58123598A (ja) 音声認識装置
JPS6057396A (ja) 閾値算出方法
JP2951333B2 (ja) 音声信号の区間判別方法
JPS60166993A (ja) 単語音声認識装置
JPS59102296A (ja) ピツチ抽出方法
JP2844592B2 (ja) 離散単語音声認識装置
JPS5872994A (ja) 信号入力装置
JPS6045299A (ja) 音声認識における基準パタ−ン内比率の決定方法
JPS5995600A (ja) 音声認識装置
JP3002211B2 (ja) 不特定話者音声認識装置
JP3679310B2 (ja) 圧縮回路