JPS6329754B2 - - Google Patents

Info

Publication number
JPS6329754B2
JPS6329754B2 JP55039206A JP3920680A JPS6329754B2 JP S6329754 B2 JPS6329754 B2 JP S6329754B2 JP 55039206 A JP55039206 A JP 55039206A JP 3920680 A JP3920680 A JP 3920680A JP S6329754 B2 JPS6329754 B2 JP S6329754B2
Authority
JP
Japan
Prior art keywords
level
noise
detection
input
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55039206A
Other languages
English (en)
Other versions
JPS56135898A (en
Inventor
Tetsuo Shimizu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP3920680A priority Critical patent/JPS56135898A/ja
Publication of JPS56135898A publication Critical patent/JPS56135898A/ja
Publication of JPS6329754B2 publication Critical patent/JPS6329754B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、音声認識装置に関し、具体的には認
識音声の始端終端検出のレベルを、周囲の背景雑
音の大きさに応じて自動的に変える音声検出方式
を提供するものである。
音声認識技術は、最近のマイクロプロセツサ技
術と結びついて大きく進歩しており、従来よりは
るかに小型で低価格の装置が可能となつている。
第1図は、現存する音声認識装置の一例を示す
ブロツク図を示したものである。これは、特定話
者を対象とした単語単位のパターンマツチング法
による単語音声認識装置であり、使用者は登録モ
ードに於て前もつて制御命令語を登録しておく必
要がある。例えばテレビジヨンの場合であれば、
電源、音量、チヤンネルなどの制御命令語をマイ
クロフオン1を通じて入力する。入力された音声
信号は、増巾器2で増巾された後、帯域フイルタ
3に送られ周波数分析された後、整流・低域フイ
ルタ回路4により振幅包絡が検出される。この信
号の時系列は、各制御命令語に個有の特徴パター
ンとなつており、A/D変換器6によりデイジタ
ル化されて演算回路7の標準パターンメモリ9に
記憶される。
認識時には、マイクロフオン1から入力される
制御命令語の特徴パターンが入力パターンメモリ
8に導入され、あらかじめ標準パターンメモリ9
に登録されている各制御命令語の特徴パターンと
の類似度が演算回路7の認識回路10に於て計算
され、最も良く一致するものを認識語として出力
する。ここで用いられる演算回路7はマイクロコ
ンピユータシステムであり、CPU、ROM、
RAM、I/Oポートなどで構成されている。
ところで、此種の音声認識装置において、背景
雑音から音声区間を区別して正しく検出すること
は非常に重要であり、これが正しく行われないと
認識率の低下をもたらす。音声区間を検出する最
も基本的な方法は、一定の検出レベルを設定して
おき、これを越えた部分を音声信号とする方法で
ある。この時の検出レベル(V0)は、第2図a
に示すように、マイクロフオンから入力された音
声を十分に検出でき、かつ背景雑音レベルよりも
高く設定される。しかしながら、背景雑音のレベ
ルは装置の使用環境によつて大きく変化するもの
であり、検出レベル(V0)を低く設定しておけ
ば、背景雑音レベルが高い場合には、第2図bに
例示するように、雑音を音声として検出してしま
い、装置は誤動作をおこす。一方、検出レベル
(V0)を高く設定しておけば、第2図cに例示す
るように、雑音を音声として検出する危険は減る
が、その代わり、音声レベルを高く、即ちたとえ
静かな環境であつても常に大きな声を出す必要が
あり、使用者にとつて大きな負担となる。また、
音声の子音部は情報量が多く、これを正確に検出
することは認識率を高める上で重要であるが、こ
の部分はエネルギーが小さいため、検出レベル
(V0)を高くしすぎると子音部を見逃す危険が大
きくなる。
このような不都合を防ぐためには、背景雑音に
応じて手動で、あるいは自動的に検出レベルを可
変とすることが考えられる。自動的に検出レベル
を変える最も簡単な方法は、第3図に示すように
音声入力マイクロフオン1とは別に背景雑音検出
用の補助マイクロフオン11を設け、このマイク
ロフオン11の出力レベルに応じて音声認識装置
12に内蔵の音声検出回路13の検出レベルを変
更するやり方である。しかし、この場合音声入力
マイクロフオン1に入る背景雑音と補助マイクロ
フオン11に入る背景雑音のレベルが常に等しい
という保証はなく、また第2図bに示すような、
背景雑音以外に継続時間の短い衝撃性の雑音が入
つたときには、これによつて検出レベル(V0
が一時的に影響されてしまう恐れもある。尚、こ
の第3図に於て14は増巾器、15はレベル検出
回路である。
本発明は上述の欠点を解消するもので、マイク
ロフオン1から入力する衝撃性雑音を除いた純粋
の背景雑音のみを検出し、その平均的なレベルに
よつて音声の検出レベルを自動的に調整する方法
を提供するものである。
まず第4図により本発明の原理を説明する。第
4図aは、次々に音声を入力していくときの音声
の波形図を示している。本発明に於ては、音声区
間と雑音区間を識別するために2段階の検出レベ
ル(V1)(V2)を用いる。すなわち、第4図aの
要部を拡大したbに示すように、入力信号の振幅
包絡が検出レベル1、2(V1)(V2)を越え、次
いで検出レベル2、1(V2)(V1)より小さくな
り、かつ検出レベル2(V2)を越えている時間が
一定値(T1sec)以上のとき、入力信号は音声で
あるとみなし、検出レベル1(V1)を越えている
区間を音声区間とする。また検出レベル2(V2
を越えている時間が一定値(T1ses)以下のとき
は、入力信号は衝撃性の雑音であるとみなし、認
識のための計算は行わない。更に音声区間以外
で、入力信号が検出レベル2(V2)以下となる時
間がT2sec以上継続したとき、入力信号は背景雑
音であるとみなし、その区間を雑音区間としてい
る。
次に、音声検出レベルの制御について説明す
る。
先ず雑音区間をT2sec毎の区間に区切り、各区
間での雑音レベルを求める。そして、過去M個の
区間から平均の雑音レベルを求め、この平均雑音
レベルに対して検出レベル1(V1)及び2(V2
が常に一定の比率を保つように制御する。すなわ
ち、ある時点での検出レベル1(V1)及び2(V2
は、過去の雑音のMT2secの時間の平均雑音レベ
ルによつて制御されることになる。過去のM個の
区間の平均雑音レベルを次々に求めていくこと
は、背景雑音の一種の移動平均をとつていること
になり、求められた平均雑音レベルは背景雑音の
大まかな変化に追従することになる。したがつて
この方法によれば物が落下したときのような衝撃
性の雑音や、電話のベルのような短時間の突発的
な雑音に影響されずに背景雑音のレベルに応じて
音声検出レベルを制御することができる。
次に本発明装置の具体的構成を第5図を参照し
つつ説明する。この第5図に於て、1〜10は第
1図に示したものと同じで、マイクロフオン、〜
認識回路であり、これ等に依つて音声認識部16
が構成されている。17はこの音声認識部16に
関連して設けられた音声検出部、18はこの音声
検出部17に連つた平均雑音レベル検出部であ
る。上記音声検出部17は音声認識部16の入力
パターンメモリ8に連つた振巾計算回路20と、
振巾値メモリ21と、比較回路22と、時間長計
数回路23と、から構成されており、また平均雑
音レベル検出部18は、平均振巾計算回路24
と、雑音レベルメモリ25と、平均雑音レベル計
算回路26と、検出レベル計算回路27と、から
成つている。28は時間長計数回路23に連つた
アドレス制御回路で、入力パターンメモリ8、標
準パターンメモリ9、振巾値メモリ21、へのデ
ータの取り込みと転送の制御及び雑音区間が検出
されたときの雑音レベルメモリ25へのデータの
取り込みと転送の制御を行う。29はクロツク発
生回路で、アドレス制御回路28を始め、各構成
回路に必要なクロツクパルスを供給する。
而して音声入力信号はN個の帯域フイルタ3に
より周波数分析された後、振幅包絡が検出され、
A/D変換されて入力パターンメモリ8に記憶さ
れる。例えば、信号のサンプリング周期を10m
sec音声入力時間を最大1.6secとすれば、入力パ
ターンメモリ8には、J=160組の分析データが
取り込まれている。分析データの取り込みは常時
行われており、入力パターンメモリ8は循環レズ
スタとして構成されている。音声検出部17の振
幅計算回路20は、各サンプリング時点毎の帯域
フイルタ3出力値の総和を計算し、入力信号の振
幅値に相当する量を求める回路である。すなわ
ち、入力パターンメモリ8には、N個の帯域フイ
ルタ出力f1…fNがJ組取り込まれているが、この
振巾計算回路20はこれ等の記憶内容からFjNn=
fj oの計算を行い、サンプリング時点jでの振幅
値に相当する量Fjを求める。この値は、振幅値メ
モリ21に取り込まれる。振幅値メモリ21も入
力パターンメモリ8と同様、循環レジスタとして
構成されている。比較回路22は、その内部に予
め設定されている検出レベル1(V1)及び2(V2
と振幅値メモリ21の各データFjとの大小の比較
を行い、その結果を次の時間長計数回路23へ出
力する。時間長計数回路23は、入力信号が検出
レベル1(V1)及び2(V2)より大きくかつ検出
レベル2(V2)を連続して越える時間長を計数
し、その値が(T1)以上であるとき、検出レベ
ル1(V1)を越える区間が音声区間であると判定
し、判定信号を次のアドレス制御回路28へ出力
する。これにより、入力パターンメモリ8へのデ
ータの取り込みは停止され、音声区間のデータが
認識回路10へ転送される。
認識回路10は、転送されたデータと標準パタ
ーンメモリ9に記憶されているデータとの間で類
似度の計算を行い、認識結果を出力する。入力パ
ターンメモリ8へのデータの取り込み停止と認識
回路への転送及び標準パターンメモリ9のデータ
の認識回路10への転送は、時間長計数回路23
により音声区間であるとの判定信号を受けたアド
レス制御回路28からのアドレス制御信号により
行われる。
入力信号が検出レベル2(V2)を連続して越え
る時間長が(T1)以下のときは、入力信号は衝
撃性雑音であるとみなされてデータの取り込みが
継続され、認識計算は行われない。
次に、比較回路22及び時間長計数回路23で
の計算の結果、入力信号が検出レベル2(V2)を
越えない区間が(T2)以上継続したとき、その
区間は雑音区間であるとの判定信号が時間長計数
回路23により出力される。時間長(T2)の値
は、入力パターンメモリ8の容量の範囲内なら自
由に選ぶことができるが、短すぎれば雑音の瞬時
的な値の影響が強くなるので、第5図の例では
(T2)を入力パターンメモリ8の容量いつぱい、
すなわち1.6secに選んでいる。平均振幅計算回路
24は、振幅値メモリ21に記憶されているJ個
の振幅値に相当する量F1…Fjからその平均値Am
=1/JJj=1 Fjを計算している。Amの値は、入力パ ターンメモリ8へのデータの循環的取り込みに従
つて、サンプリング間隔で時々刻々と変化してい
る。しかし、時間長計数回路23により入力が雑
音区間であると判定された時点においては、入力
パターンメモリ8には雑音信号のみが記憶されて
おり、Amの値は、(T2)の雑音区間の平均振幅
となる。時間長計数回路23から雑音区間である
との判定信号が出力されると、アドレス制御回路
28は雑音レベルメモリ25へのアドレス信号を
出力しAmの値が雑音レベルメモリ25に記憶さ
れる。この雑音レベル25では、最も古いデータ
が消去され、Amによつて更新される。従つて該
雑音レベルメモリ25には、過去M個の雑音区間
の雑音レベルA1…AMが記憶される。平均雑音レ
ベル計算回路26は、雑音レベルメモリ25に記
憶されているA1…AMの値から、過去M個の雑音
区間の平均雑音レベルA0=1/MMm=1 Amを計算し、 検出レベル計算回路27に出力する。検出レベル
計算回路27は、計算された平均雑音レベルA0
に基づいて検出レベル1(V1)及び2(V2)の設
定値を算出し、比較回路22へ出力する。平均雑
音レベルA0に比して、検出レベル1、2(V1
(V2)をどの程度高く設定するか、また検出レベ
ル1と2(V1)(V2)の差をどの程度にするかは、
装置の主として音声入力部と分析部の性能に依存
しており、実験的に求められている検出レベル計
算の際の定数として検出レベル計算回路27に設
定される。また、平均雑音レベルを求める際の雑
音区間の数Mは、検出レベル制御の時定数に関係
する値であり、Mが小さければ検出レベルの追従
は速く、Mが大きければ緩やかとなる。Mの値は
背景雑音の性質や雑音区間T2の長さなどを考慮
して決定される。
以上説明したように、本発明装置は音声区間は
検出レベル1及び2によつて検出され、検出レベ
ル1及び2は過去MT2secの平均雑音レベルによ
つて制御されることになり、この求められた平均
雑音レベルは、背景雑音の一種の移動平均となつ
ており、突発的な雑音に影響されることなく背景
雑音の大まかな変化に従つて検出レベルを制御す
ることができる。従つて本発明装置によれば背景
雑音によつて装置が誤動作したり、あるいは静か
な環境であるのに使用者に大声を出させて負担を
かけたりすることを防止でき秀れた音声認識装置
を実現することができる。
【図面の簡単な説明】
第1図は帯域フイルタ分析に依る音声認識装置
の構成を示すブロツク図、第2図a,b,cは音
声信号の検出状態を示す波形図、第3図は現存す
る検出レベルの自動調整機能付音声認識装置の概
略を示すブロツク図、第4図a,bは本発明装置
に於ける検出レベルの設定状態を示す波形図、第
5図は本発明装置の構成を示すブロツク図であつ
て、7は演算回路、8は入力パターンメモリ、9
は標準パターンメモリ。10は認識回路、16は
音声認識部、17は音声検出部、18は平均雑音
レベル検出部、を夫々示している。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声を電気信号に変換する入力手段と音
    声信号の特徴を抽出する特徴抽出手段と、抽出し
    た音声の特徴パターンを記憶する手段と、該特徴
    パターンと予め登録されている特徴パターンとの
    類似度を計算して入力音声を特定する演算手段と
    から成る音声認識装置であつて、一定時間内の雑
    音レベルを検出する手段、該雑音レベルにより制
    御され、入力信号を検出するレベルを高低2つに
    設定する手段、入力信号が該高検出レベル及び低
    検出レベルを越えている時間を計数する手段、該
    計数手段の出力により前記特徴パターンの記憶手
    段及び雑音レベル検出手段への入力信号の取り込
    みを制御する手段、を備えたことを特徴とする音
    声認識装置。
JP3920680A 1980-03-26 1980-03-26 Voice recognition device Granted JPS56135898A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3920680A JPS56135898A (en) 1980-03-26 1980-03-26 Voice recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3920680A JPS56135898A (en) 1980-03-26 1980-03-26 Voice recognition device

Publications (2)

Publication Number Publication Date
JPS56135898A JPS56135898A (en) 1981-10-23
JPS6329754B2 true JPS6329754B2 (ja) 1988-06-15

Family

ID=12546653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3920680A Granted JPS56135898A (en) 1980-03-26 1980-03-26 Voice recognition device

Country Status (1)

Country Link
JP (1) JPS56135898A (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868097A (ja) * 1981-10-20 1983-04-22 日産自動車株式会社 車両用音声認識装置
JPS58120297A (ja) * 1982-01-11 1983-07-18 日本電信電話株式会社 音声応答認識装置
JPS58121717A (ja) * 1982-01-11 1983-07-20 井関農機株式会社 コンバインの扱き深さ報知装置
JPS58192095A (ja) * 1982-05-04 1983-11-09 三洋電機株式会社 音声認識装置
JPS58170698U (ja) * 1982-05-10 1983-11-14 カシオ計算機株式会社 音声認識装置におけるノイズ防止回路
JPS58211793A (ja) * 1982-06-03 1983-12-09 松下電器産業株式会社 音声区間検出装置
JPS58223198A (ja) * 1982-06-21 1983-12-24 日本電信電話株式会社 音節入力装置
JPS5984300A (ja) * 1982-11-08 1984-05-15 株式会社日立製作所 音声区間検出回路
DE3243231A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen
DE3243232A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen
EP0143161A1 (en) * 1983-07-08 1985-06-05 International Standard Electric Corporation Apparatus for automatic speech activity detection
JPS60114900A (ja) * 1983-11-25 1985-06-21 松下電器産業株式会社 有音・無音判定法
IT1160148B (it) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom Dispositivo per la verifica del parlatore
JPS6146998A (ja) * 1984-08-10 1986-03-07 ブラザー工業株式会社 音声始端検出装置
JPS61123897A (ja) * 1984-11-20 1986-06-11 ブラザー工業株式会社 音声の始端決定装置
JPS61292199A (ja) * 1985-06-19 1986-12-22 沖電気工業株式会社 音声認識装置
DE4126902C2 (de) * 1990-08-15 1996-06-27 Ricoh Kk Sprachintervall - Feststelleinheit
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4490090B2 (ja) 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4675840B2 (ja) * 2006-06-29 2011-04-27 三菱電機株式会社 リモートコントローラ並びに家電機器
JP2009122598A (ja) * 2007-11-19 2009-06-04 Pioneer Electronic Corp 電子機器、電子機器の制御方法、音声認識装置、音声認識方法及び音声認識プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
THE BELL SYSTEM TECHNICAL JOURNAL=1975 *

Also Published As

Publication number Publication date
JPS56135898A (en) 1981-10-23

Similar Documents

Publication Publication Date Title
JPS6329754B2 (ja)
FI92113C (fi) Puheprosessori ja soluradiopääte
US5617508A (en) Speech detection device for the detection of speech end points based on variance of frequency band limited energy
US4531228A (en) Speech recognition system for an automotive vehicle
US4829578A (en) Speech detection and recognition apparatus for use with background noise of varying levels
KR100307065B1 (ko) 음성검출장치
US4859964A (en) Method and circuit for automatic gain control of a signal
EP0077194B1 (en) Speech recognition system
US4597098A (en) Speech recognition system in a variable noise environment
US4610023A (en) Speech recognition system and method for variable noise environment
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
US4455676A (en) Speech processing system including an amplitude level control circuit for digital processing
JPH01167799A (ja) 語信号の開始点及び終了点決定方法並びに装置
JP3131226B2 (ja) 改良された百分位数予測器を備えた補聴器
JPS6257040B2 (ja)
US6539350B1 (en) Method and circuit arrangement for speech level measurement in a speech signal processing system
JP2000039900A (ja) 自己診断機能付き音声対話装置
JPH02103599A (ja) 音声認識装置
JP2500761Y2 (ja) 音声認識装置
JPH01316799A (ja) 音声認識装置
JPS61180296A (ja) 音声認識装置
JPS6247319B2 (ja)
JPS62287297A (ja) 音声検出装置
JPS6367199B2 (ja)
JPS6219760B2 (ja)