JPH0424692A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPH0424692A
JPH0424692A JP2128871A JP12887190A JPH0424692A JP H0424692 A JPH0424692 A JP H0424692A JP 2128871 A JP2128871 A JP 2128871A JP 12887190 A JP12887190 A JP 12887190A JP H0424692 A JPH0424692 A JP H0424692A
Authority
JP
Japan
Prior art keywords
level
input signal
smoothing
voice section
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2128871A
Other languages
English (en)
Inventor
Takashi Ariyoshi
有吉 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2128871A priority Critical patent/JPH0424692A/ja
Publication of JPH0424692A publication Critical patent/JPH0424692A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技権光互 本発明は、音声区間検出方式、より詳細には、音声認識
、音声合成などの音声処理の音声区間検出技術に関し、
音声認識、音声合成などの音声処理装置、特に、高騒音
下での音声を扱う音声処理装置に応用して好適なもので
ある。
良米艮嵐 音声認識装置においては、特に、孤立単語などを認識す
る単語音声認識装置においては、音声区間の検出精度が
重要であり、従来、騒音下の音声から音声区間を検出す
るために可変の閾値を設けて、この閾値を無音区間中の
騒音レベルの平均値などから計算して、周囲の騒音が小
さい場合は小さな閾値で、周囲の騒音が大きい場合は大
きな閾値で音声区間を切り出すようにしたものが一般的
である。この場合、周囲の騒音が定常的であれば比較的
良好な結果が得られるが、非定常的であると適切な音声
区間の検出は難しいという問題がある。
特に、突発性ノイズが存在する場合、騒音レベルの平均
値を求めるために比較的短い時間範囲のデータを用いる
と、突発性ノイズのない区間の後では騒音レベルの平均
値は低くなり、次の突発性ノイズを音声として切り出し
てしまい易くなる。
また、逆に、騒音レベルの平均値を求めるために比較的
長い時間範囲のデータを用いると、突発性ノイズの頻度
が低ければやはり騒音レベルの平均値は低くなり、次の
突発性ノイズを音声として切り出してしまい易くなる。
いずれにしても、時々発生するような突発性ノイズ、例
えば、オフィス内の電話のベル音やドアの開閉音が周囲
に存在する場合には、正確な音声の区間検出は困知であ
った。
m−咋 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置に入力される音声に重畳する周囲の
騒音が比較的頻度の低い突発性ノイズを含んでいてもそ
のノイズのレベルに応じた音声区間検出のための閾値を
設定することを可能にし、このような騒音環境下での音
声認識装置の認識率を低下させないことを目的としてな
されたものである。
硝−−−成− 本発明は、上記目的を達成するために、(1)音声を入
力するためのマイクロフォンで電気信号に変換された入
力信号の振幅を検出するレベル検出手段と、上記入力信
号から音声区間を検出するだめの閾値と上記入力信号の
振幅とを比較するレベル比較手段と、上記レベル比較手
段で上記入力信号の振幅が上記閾値より大きいという結
果が出た区間を基にして予め定められた手続きにより入
力信号の音声区間を決定する音声区間決定手段とを用い
て音声区間を検出する音声区間検出方式において、上記
入力信号の振幅の増減を判定するレベル増減判定手段と
、予め定められた計算方式に基づいて上記入力信号の振
幅を平滑化し、第1の平滑化された入力レベル値を求め
る第1のレベル平滑化手段と、予め定められた上記第1
のレベル平滑化手段とは異なる計算方式に基づいて上記
入力信号の振幅を平滑化し、第2の平滑化された入力レ
ベル値を求める第2のレベル平滑化手段と、上記音声区
間決定手段の決定結果と上記レベル増減判定手段の判定
結果に従って、上記第1のレベル平滑化手段で求められ
た第1の平滑化された入力レベル値、又は、第2のレベ
ル平滑化手段で求められた第2の平滑化された入力レベ
ル値から予め定められた計算方式に基づいて上記閾値を
決定する閾値決定手段を有する音声区間検出方式を特徴
としたものであり、更には、(2)上記(1)の音声区
間検出方式において、上記第1のレベル平滑化手段は、
上記音声区間決定手段が音声区間でないと決定した区間
の上記入力信号の振幅を、第1の時定数で平滑化するこ
とによって第1の平滑化された入力レベル値を求め、上
記第2のレベル平滑化手段は、上記音声区間決定手段が
音声区間でないと決定した区間の上記入力信号の振幅を
、上記第1の時定数より大なる第2の時定数で平滑化す
ることによって第2の平滑化された入力レベル値を求め
、上記閾値決定手段は、上記レベル増減判定手段が増加
を判定した場合に、上記第1の平滑化された入力レベル
値から予め定められた計算方式に基づいて上記閾値を法
定し、上記レベル増減判定手段が減少を判定した場合に
、上記第2の平滑化された入力レベル値から予め定めら
れた計算方式に基づいて上記閾値を決定すること、或い
は、(3)上記(1)の音声区間検出方式において、上
記第1のレベル平滑化手段は、上記音声区間決定手段が
音声区間でないと決定した区間の上記入力信号の振幅の
、第1の定数個の平均をとることによって第1の平滑化
された入力レベル値を求め、上記第2のレベル平滑化手
段は、上記音声区間決定手段が音声区間でないと決定し
た区間の上記入力信号の振幅の、第1の定数個より大な
る第2の定数個の平均をとることによって第2の平滑化
された入力レベル値を求め、上記閾値決定手段は、上記
レベル増減判定手段が増加を判定した場合に、上記第1
の平滑化された入力レベル値から予め定められた計算方
式に基づいて上記閾値を決定し、上記レベル増減判定手
段が減少を判定した場合に、上記第2の平滑化された入
力レベル値から予め定められた計算方式に基づいて上記
閾値を決定することを特徴としたものであり、又は、(
4)音声を入力するためのマイクロフォンで電気信号に
変換された入力信号のパワーを検出するレベル検出手段
と、上記入力信号から音声区間を検出するための閾値と
上記入力信号のパワーとを比較するレベル比較手段と、
上記レベル比較手段で上記人力信号のパワーが上記閾値
より大きいという結果が出た区間を基にして予め定めら
れた手続きにより入力信号の音声区間を決定する音声区
間決定手段とを用いて音声区間を検出する音声区間検出
方式において、上記入力信号のパワーの増減を判定する
レベル増減判定手段と、予め定められた計算方式に基づ
いて上記入力信号のパワーを平滑化し、第1の平滑化さ
れた入力レベル値を求める第1のレベル平滑化手段と、
予め定められた上記第1のレベル平滑化手段とは異なる
計算方式に基づいて上記入力信号のパワーを平滑化し、
第2の平滑化された入力レベル値を求める第2のレベル
平滑化手段と、上記音声区間決定手段の決定結果と上記
レベル増減判定手段の判定結果に従って、上記第1のレ
ベル平滑化手段で求められた第1の平滑化された入力レ
ベル値、又は、第2のレベル平滑化手段で求められた第
2の平滑化された入力レベル値から予め定められた計算
方式に基づいて上記閾値を決定する閾値決定手段を有す
る音声区間検出方式を特徴としたものであり、更には、
(5)上記(4)の音声区間検出方式において、上記第
1のレベル平滑化手段は、上記音声区間決定手段が音声
区間でないと決定した区間の」二記入力信号のパワーを
、第1の時定数で平滑化することによって第1の平滑化
された入力レベル値を求め、上記第2のレベル平滑化手
段は、上記音声区間決定手段が音声区間でないと決定し
た区間の上記入力信号のパワーを、上記第1の時定数よ
り大なる第2の時定数で平滑化することによって第2の
平滑化された入力レベル値を求め、上記閾値決定手段は
、上記レベル増減判定手段が増加を判定した場合に、上
記第1の平滑化された入力レベル値から予め定められた
計算方式に基づいて」−記聞値を決定し、上記レベル増
減判定手段が減少を判定した場合しこ、上記第2の平滑
化された入力レベル値から予め定められた計算方式に基
づいて上記閾値を決定すること、或いは、(6)上記(
4)の音声区間検出方式において、上記第1のレベル平
滑化手段は、上記音声区間決定手段が音声区間でないと
決定した区間の上記入力信号のパワーの。
第1の定数個の平均をとることによって第1の平滑化さ
れた入力レベル値を求め、上記第2のレベル平滑化手段
は、上記音声区間決定手段が音声区間でないと決定した
区間の上記入力信号のパワーの、第1の定数個より犬な
る第2の定数個の平均をとることによって第2の平滑化
された入力レベル値を求め、上記閾値決定手段は、上記
レベル増減判定手段が増加を判定した場合に、上記第1
の平滑化された入力レベル値から予め定められた計算方
式に基づいて上記閾値を決定し、上記レベル増減判定手
段が減少を判定した場合に、上記第2の平滑化された入
力レベル値から予め定められた計算方式に基づいて上記
閾値を決定することを特徴としたものである。以下、本
発明の実施例に基いて説明する。
第1図は、本発明の一実施例を説明するための構成図で
、図中、10はレベル検出手段、11はレベル比較手段
、12は音声区間決定手段、13は第1のレベル平滑化
手段、14は第2のレベル平滑化手段、15はレベル増
減判定手段、16は閾値決定手段で、レベル検出手段1
0は、マイクアンプ1、絶対値回路2、ローパスフィル
タ3、A/D変換器4より成っている。
レベル検出手段10は、マイクロフォンで電気信号に変
換された入力信号をマイクアンプ1、絶対値回路2、ロ
ーパスフィルタ3、A/D変換器4を通して、サンプリ
ング周期Tでデジタル値に変換して、入力信号の振幅を
検出する。ここで、絶対値回路2の絶対値演算、ローパ
スフィルタ3のローパスフィルタリングは、A/D変換
器を通した後でデジタルフィルタによって演算しても良
い。更に、絶対値演算の代わりに、2乗演算を用いれば
入力信号のパワーを検出できる。このレベル検出手段の
出力は、振幅/パワーのどちらを用いても良い。ここで
得られる、入力信号の振幅/パワーをx(n)とおく。
レベル比較手段11は、入力信号から音声区間を検出す
るための閾値thとレベル検出手段10で得られた入力
信号の振幅/パワーx(n)とを比較する。
音声区間決定手段12は、レベル比較手段11で、入力
信号の振幅/パワーx(n)が閾値thより大きいとい
う結果が出た区間を入力信号の音声区間と決定し、音声
区間信号として出力する。なお、この区間検出法は、レ
ベル比較手段の結果を用いた他の公知の方法を用いても
良い。
第1のレベル平滑化手段13は、入力信号の振幅/パワ
ーx(n)のうち、音声区間決定手段12が音声区間で
ないと決定した区間の入力信号の振幅/パワーを第1の
時定数τ、で平滑化1ノ、第1の平滑化された入力レベ
ル値y□(n)を求める。
即ち、 1)音声区間でない時、 y□(n)=(1−c工)x(n)+c、y、(n−1
)但し、c x =exp(−T/ ? 1)    
     (1)ii)音声区間の時、 y□(n)”yt(n−1)         (2)
である。尚、式(1)、(2)は、これらと同様の効果
をもたらす他の式でも良い。
第2のレベル平滑化手段14は、入力信号の振幅/パワ
ーx(n)のうち、音声区間決定手段12が音声区間で
ないと決定した区間の入力信号の振幅/パワーを第2の
時定数で2(τ2〉τ1)で平滑化し、第2の平滑化さ
れた入力レベル値yz(n)を求める。即ち、 j)音声区間でない時。
yz(n)=D−cz)x(n)+czyz(n−t)
但し、c 2=exp(−T/ τ2) ’     
    (3)ji )音声区間の時、 yz(n)=yz(n−1)         (4)
である。尚、式(3)、(4)は、これらと同様の効果
をもちらす他の式でも良い。
レベル増減判定手段15は、レベル検出手段10で得ら
れた入力信号の振幅/パワーX(n)を1サンプル前の
入力信号の振幅/パワーx(n−1)と比較することに
よって、入力信号の振幅/パワーの増減を判定する。
閾値決定手段16は、レベル増減判定手段15が増加を
判定した場合に、第1の平滑化された入力レベル値yユ
(n)から予め定められた計算方式に基づいて上記閾値
を決定し、上記レベル増減判定手段15が減少を判定し
た場合に、上記第2の平滑化された入力レベル値y2(
n)から定数k(k>1)に対して次式によって閾値t
hを決定して更新する。
i)増加、x(n)>x(n−1)の時、t h = 
k y、(n)          (5)ii)減少
、x(n)<x(n−1)の時、t h ” k yz
(n)           (6)尚、第1のレベル
平滑化手段13、及び、第2のレベル平滑化手段14は
、入力信号の振幅/パワー、(n)のうち、音声区間決
定手段12が音声区間でないと決定した区間の入力信号
の振幅/パワーx’ (n)の、それぞれの第1の定数
個m1、及び、第2の定数個m 2 (m 2> m 
1)の平均をとることによってそれぞれ第1の平滑化さ
れた入力レベル値yx(n)、及び、第2の平滑化され
た入力レベル値yz(n)を求めても良い。即ち、第1
のレベル平滑化手段13は、 i)音声区間でない時、 x’  (n)=x(n)             
(7)■)音声区間の時、 X’ (n)”x’ (n−1)。
x’ (n−1)=x’ (n−2)、 ・−x’ (
n−m□+1)=x’(n−m□)   (8)y、(
n)=(Σx’ (n−i))/m、   (9)i=
0 を、第2のレベル平滑化手段14は、 i)音声区間でない時、 x’ (n)=x(n)           (to
)ii)音声区間の時、 x’ (n)=x’ (n−1)。
x’ (n−1)=x’ (n−2)。
x’ (n−m2+1)=x’ (n−m2)    
(+1)y、(n)=(Σx’ (n−i))/m2 
  (12)i=O を求める。ここで、第1のレベル平滑化手段13で用い
られるx’ (n)と、第2のレベル平滑化手段14で
用いられるx’ (n)とは、同一のものであるので共
有できる。
藝−一釆 以上の説明から明らかなように、本発明によれば、音声
区間を検出するための閾値を、周囲のノイズレベルが増
加している時には、速く、逆に、周囲のノイズレベルが
減少している時には、遅く変化させ追従させているので
、音声認識装置に人力される音声に重畳する周囲のノイ
ズレベルが常に小さい場合には、閾値は小さく、また、
周囲の騒音が突発性ノイズを含んでいる場合には、その
ノイズのレベルに応じて閾値は大きくなり、更にその突
発性ノイズの頻度が低くても大きな閾値は長く維持され
るので、突発性ノイズ、特に、頻度の低い突発性ノイズ
が周囲にあっても、正確に音声区間の検出が行えるので
、このような騒音環境下での音声認識装置の認識率を低
下させないことができる。
【図面の簡単な説明】 第1図は1本発明による音声区間の検出方式の一実施例
を説明するための構成図である。 1・・・マイクアンプ、2・・・絶対値回路、3・・ロ
ーパスフィルタ、4・・A/D変換器、10・・・レベ
ル検出手段、11・ レベル比較手段、12 音声区間
決定手段、13・・第1のレベル平滑化手段、14第2
のレベル平滑化手段、15・・・レベル増減判定手段、
16・・・閾値決定手段。

Claims (1)

  1. 【特許請求の範囲】 1、音声を入力するためのマイクロフォンで電気信号に
    変換された入力信号の振幅を検出するレベル検出手段と
    、上記入力信号から音声区間を検出するための閾値と上
    記入力信号の振幅とを比較するレベル比較手段と、上記
    レベル比較手段で上記入力信号の振幅が上記閾値より大
    きいという結果が出た区間を基にして入力信号の音声区
    間を決定する音声区間決定手段とを用いて音声区間を検
    出する音声区間検出方式において、上記入力信号の振幅
    の増減を判定するレベル増減判定手段と、予め定められ
    た計算方式に基づいて上記入力信号の振幅を平滑化し、
    第1の平滑化された入力レベル値を求める第1のレベル
    平滑化手段と、予め定められた上記第1のレベル平滑化
    手段とは異なる計算方式に基づいて上記入力信号の振幅
    を平滑化し、第2の平滑化された入力レベル値を求める
    第2のレベル平滑化手段と、上記音声区間決定手段の決
    定結果と上記レベル増減判定手段の判定結果に従って、
    上記第1のレベル平滑化手段で求められた第1の平滑化
    された入力レベル値、又は、第2のレベル平滑化手段で
    求められた第2の平滑化された入力レベル値から上記閾
    値を決定する閾値決定手段を有することを特徴とする音
    声区間検出方式。 2、音声を入力するためのマイクロフォンで電気信号に
    変換された入力信号のパワーを検出するレベル検出手段
    と、上記入力信号から音声区間を検出するための閾値と
    上記入力信号のパワーとを比較するレベル比較手段と、
    上記レベル比較手段で上記入力信号のパワーが上記閾値
    より大きいという結果が出た区間を基にして入力信号の
    音声区間を決定する音声区間決定手段とを用いて音声区
    間を検出する音声区間検出方式において、上記入力信号
    のパワーの増減を判定するレベル増減判定手段と、予め
    定められた計算方式に基づいて上記入力信号のパワーを
    平滑化し、第1の平滑化された入力レベル値を求める第
    1のレベル平滑化手段と、予め定められた上記第1のレ
    ベル平滑化手段とは異なる計算方式に基づいて上記入力
    信号のパワーを平滑化し、第2の平滑化された入力レベ
    ル値を求める第2のレベル平滑化手段と、上記音声区間
    決定手段の決定結果と上記レベル増減判定手段の判定結
    果に従って、上記第1のレベル平滑化手段で求められた
    第1の平滑化された入力レベル値、又は、第2のレベル
    平滑化手段で求められた第2の平滑化された入力レベル
    値から上記閾値を決定する閾値決定手段を有することを
    特徴とする音声区間検出方式。
JP2128871A 1990-05-18 1990-05-18 音声区間検出方式 Pending JPH0424692A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2128871A JPH0424692A (ja) 1990-05-18 1990-05-18 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2128871A JPH0424692A (ja) 1990-05-18 1990-05-18 音声区間検出方式

Publications (1)

Publication Number Publication Date
JPH0424692A true JPH0424692A (ja) 1992-01-28

Family

ID=14995427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2128871A Pending JPH0424692A (ja) 1990-05-18 1990-05-18 音声区間検出方式

Country Status (1)

Country Link
JP (1) JPH0424692A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006189907A (ja) * 2001-06-11 2006-07-20 Alcatel 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ
JP2007288533A (ja) * 2006-04-17 2007-11-01 Sharp Corp レベル検波回路、集積回路および通信機器
JP2016145940A (ja) * 2015-02-09 2016-08-12 沖電気工業株式会社 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム
JP2018081277A (ja) * 2016-11-18 2018-05-24 富士通株式会社 音声区間検出方法、音声区間検出装置および音声区間検出プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006189907A (ja) * 2001-06-11 2006-07-20 Alcatel 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ
JP2007288533A (ja) * 2006-04-17 2007-11-01 Sharp Corp レベル検波回路、集積回路および通信機器
JP2016145940A (ja) * 2015-02-09 2016-08-12 沖電気工業株式会社 目的音区間検出装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム
JP2018081277A (ja) * 2016-11-18 2018-05-24 富士通株式会社 音声区間検出方法、音声区間検出装置および音声区間検出プログラム

Similar Documents

Publication Publication Date Title
JP6257063B2 (ja) 周囲雑音二乗平均平方根(rms)検出器
EP0740893B1 (en) Dynamic intensity beamforming system for noise reduction in a binaural hearing aid
JP3963850B2 (ja) 音声区間検出装置
US5867581A (en) Hearing aid
EP2643981B1 (en) A device comprising a plurality of audio sensors and a method of operating the same
CN110770827B (zh) 基于相关性的近场检测器
JP4816711B2 (ja) 通話音声処理装置および通話音声処理方法
CN112004177B (zh) 一种啸叫检测方法、麦克风音量调节方法及存储介质
TWI807012B (zh) 有計算效率的語音分類器及相關方法
CN107358964B (zh) 用于检测在变化的环境中的警戒信号的方法
RU2411595C2 (ru) Улучшение разборчивости речи в мобильном коммуникационном устройстве путем управления работой вибратора в зависимости от фонового шума
Kim et al. Signal separation for robust speech recognition based on phase difference information obtained in the frequency domain.
US8423357B2 (en) System and method for biometric acoustic noise reduction
JPH0424692A (ja) 音声区間検出方式
CN110211606B (zh) 一种语音认证系统的重放攻击检测方法
JP3134557B2 (ja) ハウリング抑制装置
EP3428918B1 (en) Pop noise control
JP2010026323A (ja) 話速検出装置
Nilsson et al. Human whistle detection and frequency estimation
US6633847B1 (en) Voice activated circuit and radio using same
JPH01146413A (ja) 音響信号処理回路
JP2859634B2 (ja) 雑音除去装置
JP3111301B2 (ja) 音声判別方法及び装置
JPH03269498A (ja) 雑音除去方式
JP2989219B2 (ja) 音声区間検出方式