JPS5984300A - 音声区間検出回路 - Google Patents

音声区間検出回路

Info

Publication number
JPS5984300A
JPS5984300A JP57194771A JP19477182A JPS5984300A JP S5984300 A JPS5984300 A JP S5984300A JP 57194771 A JP57194771 A JP 57194771A JP 19477182 A JP19477182 A JP 19477182A JP S5984300 A JPS5984300 A JP S5984300A
Authority
JP
Japan
Prior art keywords
background noise
power
voice
section
average power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57194771A
Other languages
English (en)
Inventor
長沢 潔
梅村 和裕
俊宏 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57194771A priority Critical patent/JPS5984300A/ja
Publication of JPS5984300A publication Critical patent/JPS5984300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、音声認識装置等において、その入力背戸3号
について、それに含まれる背景雑音が変動じても、常に
確実な音声区間検出を行うための音声区間検出回路に関
するものである。
〔従来技術〕
例えば、音声認識装置において音声区間を正確に検出す
ることは、その認識率を向上させるために重要な問題で
ある。しかし、その背戸信号入力が電話回線等を通して
行われるときは、そのレベル変動が大きく(例えば、最
大40dB程度)、音声区間検出を検出用の一定の閾値
によって行うことはできない。
以下、第1図に示す入力音声信号パワーの各種波形図に
従い、従来の音声区間検出回路の一例の検出動作につい
て説明する。
まず、第1図(a)に示すように、一連の音声入力前の
区間T0で背景雑音平均パワーP。を測定しておき、音
声入力が行わnたときは、これに所定の検出用の閾値P
thを相加し、背景雑音との相対的な検出基準レベルに
よシ、その音声区間Tv1を検出する。この慣用された
音声区間T、は、背景雑音平均パフ−P□を定常的なも
のとすれば、はぼ真の音声区間T7に等しいものとする
ことができる。
しかしながら、第1図の)に示すように、背景雑音が測
定区間T7で高レベルの非定常平均パワーP0′(例え
ば、一時的な周囲雑音の混入等による。)であったとき
は、検出される音声区間TV2は、真の音声区間TVよ
りも相当に短かいものとなってしまう。
また、第1図(C)に示すように、測定区間Tnで定常
平均パワーP、であれば、その直後の音声入力について
検出される音声区間T113は、はぼ真の音声区間T7
に等しくなるが、その後に背景雑音が窩レベルの非定常
平均パワーPn’となると、次の音声入力について検出
される音声区間TI+4は、真の音声区間TVよりも相
当に長いものとなってし1つ。
このように、従来回路は、背景雑音の測定を一理の音声
入力の前に1回行うだけであるので、その測定が非定常
雑音レベルについてのものであるとき、または測定かだ
常雑音レベルについてのものであっても以後に非定常の
ものとなったときには、音声区間検出を正確に行うこと
ができないという問題があった。
〔発明の目的〕
本発明の目的は、上記した従来技術の欠点をなくシ、入
力音声信号について、それに含まれる背景雑音が変動し
ても、常に正確な音声区間の検出をすることができる音
声区間検出回路を提供することにある。
〔発明の概要〕
本発明に係る音声区間検出回路の構成は、入力音声信号
について音声パワーおよび背景雑音パワー・同平均パワ
ーを測圧するパワー計算部と、少および音声区間検出に
係る所定の閾値の和と上記音声パワーとの比較を行って
当該音声区間の始端・終端の決定をする判定部と、上記
谷部に対し、各音声区間の終端が決定される時点での背
景雑音平均パワーを測定せしめ、その値と上記ホールド
部における背景雑音平均パワーの記憶値との平均値を新
記憶値として更新せしめ、1唄次、音声区間の検出をせ
しめるように制御をする制御部とからなるようにしたも
のである。
なお、その原理を第2図に示す本発明に係る音声区間検
出回路に対する一例の入力音声信号波形・区間決定レベ
ル関係図に基づいて以下に詳述する。
まず、前述の従来回路と同様に音声入力前の区間T7で
背景靴音平均パワーP□の測定・設定をしておき、これ
に所定の閾値Pthを相加した基準レベル■により、は
ぼ真の音声区間TVの始端A。
終端Bを決定する。
ここで、終端Bの決定をするには、音声パワーのレベル
が所定時間T。以上継続して上記基準レベルIJ、り低
いことが必要でアシ、この音声終了決定の巣作が定まる
時点Cの前後の背景雑音平均パワーP□2と前の値P。
、との平均値を次の新しい背景雑音平均パワーの値とし
、これに上記閾値P+hを相加した新しい基準レベル■
により、次の音声区間検出を行い、以下これをj−次に
繰り返して行うようにするものである。
これにより、非定常の背景雑音平均パワーを基準として
、または定常の背景雑音平均パワーを基準としておいて
も、その後の背景雑音平均パワーの変化により、誤った
音声区間検出を行うことがなくなる。
〔発明の実施例〕
以下、本発明の実施例を図に基づいて説明する。
第3図は、本発明に係る音声区間検出回路の一実施例の
ブロック図、第4図は、そのフローチャートである。
ここで、1は背景雑音が含まれた入力音声信号INを所
定レベルまで増幅する増幅器、2は入力音声信号INに
ついてパワー計算(測定)をするパワー計算部、3は上
記パワーの値を一時的に記・隠しておくホールド部、4
は音声区間の判定(決定)を行って区間情報出力OUT
を出力する判定部、5は上記各部に対す制御を行う制御
部である。
まず、本回路が動作状態となって入力音声信号の受信か
り能になると、制御部5は、無音声時における所定時間
T。の間について、入力音声信号のパワー計算をするよ
うにパワー計算部2に指示し、その平均値P。1をホー
ルド部3に記憶せしめる。この時には、音声が無人力で
あるので、この値は背景雑音平均パワーとなる。
次に、制御部5は、判定部4に対し、その背景雑音平均
パフ−P□と、あらかじめ与えである所定の閾値PLh
とを相加して基準レベルとし、音声区間検出を行うよう
に指示する。
判定部4は、その入力信号パワーが上記基準レベルを所
定時間以上継続して超えるという条件により、その最初
に上記基準レベルを超えた時点Aを当該音声区間の始端
として決定(検出)する。
また、始端が検出された後、入力信号パワーが所定時間
T、(音声区間の終了とみなしつるのに充分な時間)以
上継続して上記基準レベル以下となるという栄件によシ
、その最初に上記基準レベル以下となる時点Bを当該音
声区間の終端として決定(検出)シ、区間情報出力OU
Tを送出する。
制御部5は、その時点の背景雑音平均パワーPn2 と
、その前の背景雑音平均パワーPnI との平均値を求
め、その値を改めて記憶するようにボールド部3に指示
し、背景雑音平均パワーの更新を行う。すなわち、次の
音声区間検出においては、この新しい値が使用されるこ
とになる。
以下、制御部5は、所足数の音声区間の検出を終了する
まで上述と同様の制御を繰り返して行う。
このようにして、音声区間検出を終了した時点および前
の背景雑音平均パワーの平均値を次の新しい基準の背景
雑音平均パワーの値とするので、順次、この値が適正化
されて正確な音声区間検出が可能となる。特に、前述の
第1図(C)のような場合には、新規準値を定常値に近
づけることになるので、その誤検出防止が顕著である。
〔発明の効果〕
以上、詳細に説明したように、本発明によれば、入力音
声信号に含まれる背景雑音の大小にかかわらず、常に正
確な音声区間の検出を行e)f−声区間検出回路を実現
することができるので、例えば、この種の機能(回路)
を必要とする音声認識装置の認識率、信頼性、サービス
性の同上に顕著な効果が得られる。
【図面の簡単な説明】
第1図は、入力信号パワーの各種波形図、第2図は、本
発明に係る音声区間検出回路に対する一例の入力音声信
号波形・区間決定レベル関係図、第3図は、本発明に係
る音声区間検出回路の一実施例のブロック図、第4図は
、そのフローチャートである。 1・・・増幅器、2・・・パワー計算部、3・・・ホー
ルド部、4・・・判定部、訃・・制御部。 代理人 弁理士 福田辛作 (ほか1名う 。、、、     第1 (b) ζこノ 第2日 $3図 茅4 目 726−

Claims (1)

    【特許請求の範囲】
  1. 1、入力背戸信号について音声パワーおよび背景雑音パ
    ワー・同平均パワーを測定するパワー計算部と、少なく
    とも所定時の背景雑音平均パワーの測定値を記憶してお
    くホールド部と、その背景雑音平均パワーおよび音声区
    間検出に係る所定の閾値の和と上記音声パワーとの比較
    を行って尚該音声区間の始端・終端の決定をする判足部
    と、上記谷部に対し、谷背戸区間の終端が決定された時
    点での背景雑音平均パワーを測定せしめ、その値と上記
    ホールド部における背景雑音平均パワーの記憶値との平
    均値を笥記憶値として更新せしめ、順次、音声区間の検
    出をせしめるように制@Jをする制m1部とから構成し
    た音声区間検出回路。
JP57194771A 1982-11-08 1982-11-08 音声区間検出回路 Pending JPS5984300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57194771A JPS5984300A (ja) 1982-11-08 1982-11-08 音声区間検出回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57194771A JPS5984300A (ja) 1982-11-08 1982-11-08 音声区間検出回路

Publications (1)

Publication Number Publication Date
JPS5984300A true JPS5984300A (ja) 1984-05-15

Family

ID=16329966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57194771A Pending JPS5984300A (ja) 1982-11-08 1982-11-08 音声区間検出回路

Country Status (1)

Country Link
JP (1) JPS5984300A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02176796A (ja) * 1988-12-28 1990-07-09 Nec Corp 音声認識装置
JPH0677894A (ja) * 1986-06-02 1994-03-18 British Telecommun Plc <Bt> 無線端末装置
JP6250852B1 (ja) * 2017-03-16 2017-12-20 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2018156627A (ja) * 2017-11-15 2018-10-04 ヤフー株式会社 判定プログラム、判定装置及び判定方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135898A (en) * 1980-03-26 1981-10-23 Sanyo Electric Co Voice recognition device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135898A (en) * 1980-03-26 1981-10-23 Sanyo Electric Co Voice recognition device

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0677894A (ja) * 1986-06-02 1994-03-18 British Telecommun Plc <Bt> 無線端末装置
JPH09325790A (ja) * 1986-06-02 1997-12-16 British Telecommun Plc <Bt> 音声処理方法および装置
JPH02176796A (ja) * 1988-12-28 1990-07-09 Nec Corp 音声認識装置
JP6250852B1 (ja) * 2017-03-16 2017-12-20 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2018155882A (ja) * 2017-03-16 2018-10-04 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2018156627A (ja) * 2017-11-15 2018-10-04 ヤフー株式会社 判定プログラム、判定装置及び判定方法

Similar Documents

Publication Publication Date Title
JPS59139099A (ja) 音声区間検出装置
KR100307065B1 (ko) 음성검출장치
US5617508A (en) Speech detection device for the detection of speech end points based on variance of frequency band limited energy
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
JPS5852695A (ja) 車両用音声検出装置
JPS6329754B2 (ja)
US4534041A (en) Digital circuit for determining the envelope frequency of PCM encoded call progress tones in a telephone system
JPS5984300A (ja) 音声区間検出回路
JPWO2003107326A1 (ja) 音声認識方法及びその装置
KR100839691B1 (ko) 톤 검출 방법 및 시스템
JPH1195785A (ja) 音声区間検出方式
JP2807457B2 (ja) 音声区間検出方式
JPS63281200A (ja) 音声区間検出方式
JP3360978B2 (ja) 音声認識装置
JP3031081B2 (ja) 音声認識装置
JPS61273596A (ja) 音声区間検出方式
JPH0673079B2 (ja) 音声区間検出回路
JPS61269197A (ja) 音声区間検出方式
JPS5834986B2 (ja) 適応形音声検出回路
JP2966460B2 (ja) 音声切り出し方法及び音声認識装置
JPS61140999A (ja) 音声区間検出方式
JPS6326879Y2 (ja)
JPH07225592A (ja) 有音区間検出装置
JPS63118197A (ja) 音声検出装置
JPH0546196A (ja) 音声認識装置