JPH0213999A - 音声信号検出方法及び装置 - Google Patents

音声信号検出方法及び装置

Info

Publication number
JPH0213999A
JPH0213999A JP1112386A JP11238689A JPH0213999A JP H0213999 A JPH0213999 A JP H0213999A JP 1112386 A JP1112386 A JP 1112386A JP 11238689 A JP11238689 A JP 11238689A JP H0213999 A JPH0213999 A JP H0213999A
Authority
JP
Japan
Prior art keywords
signal
energy
maximum
digital signal
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1112386A
Other languages
English (en)
Inventor
Pierre A Laurent
ピエール アンドレ ロウラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of JPH0213999A publication Critical patent/JPH0213999A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Noise Elimination (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Selective Calling Equipment (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Complex Calculations (AREA)
  • Auxiliary Devices For Music (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の背景) 本発明は、特に車輌上で交互無線電気伝送に使用するこ
とのできる、音声信号の検出方法及び装置に関するもの
である。
(先行技術の説明) 大抵の先行技術による音声活動の検出器は、最小でも2
0dB程度の十分に高い信号対雑音比の場合を除き、正
しく動作することができない。しかもこのことは、静か
なオフィスの形式の環境における作業条件に対応するも
のである。
対照的に車輌上では、会話/雑音の弁別は非常に弱い信
号対雑音比、普通は10dB未満を考慮に入れなければ
ならない。ある条件の下では、(例えば平均的防音措置
を施した車輌内での高いエンジン速度の状態では)、雑
音レベルは信号のレベルをも上辺ることがある。
最後に、弁別すべき雑音のレベルと種類は、その車輌に
固有の条件(例えば防音の程度)によって変るが、また
とられるルートの関数としても変る。特に好ましくない
例は都市のルートのそれである。そこでは考慮すべき雑
音は一般に、高レベルであり、静止していず、普通大い
に変化する。
雑音の多い環境で動作するように設計された音声活動の
検出器の具体化は、申請者のために提出された、197
9年9月28日付の特許申請番号7974227かられ
かる。しかしこの検出器は声の音を除いては、会話/雑
音の弁別を最適化するのに使うことができず、音声信号
を専らしきい電圧値と比較することで決定が行われてい
て、この変数が、実際の雑音レベルを考慮に入れること
なく、音声信号の最大振幅値と自動的に連結されている
。その結果は、会話信号が雑音中に埋没しているような
ひどく乱された環境中で正しく動作することができるに
は十分でない、性能レベルということになる。
(発明の要約) 本発明の目的は上記の欠点を克服することである。この
趣旨で本発明の対象は、雑音に埋没している信号中の音
声信号の検出に関する方法である。上記方法は次の各段
階より成る。
・信号を幾つかのフレームに切り分けること。
・サンプルの決められた数nを含むディジタル信号を得
るため各フレームをサンプリングすること。
・前置増幅されたディジタル信号を得るために、ディジ
タル信号を前置増幅すること。
・フィルタを通したディジタル信号を得るために、高域
通過ディジタルフィルタによって、前置増幅されたディ
ジタル信号をろ波すること。
・各フレームにおいて、前置増幅された信号のサンプル
の最大エネルギー、及びフィルタを通したディジタル信
号のサンプルの最大エネルギーを測ること。
・このフィルタを通したディジタル信号のサンプルの最
大エネルギーと、前置増幅されたディジタル信号のサン
プルの最大エネルギーとの間のエネルギー比をとること
・二つの限界値の間で、フィルタを通した信号のサンプ
ルのエネルギー及びエネルギー比の、長期間の平均値を
計算すること。
・長期間の平均値を基準として、四つのしきい値を計算
することであって、その中の二つは最大値でそれぞれフ
ィルタを通した信号及びエネルギー比に対する会話状態
の二つの下限を形成し、その中の二つは最小信号でそれ
ぞれフィルタを通した信号とエネルギー比に対する雑音
状態の二つの上限を形成するものであり、フィルタを通
した信号の最大エネルギーとエネルギー比をこれらのし
きい値と比較する。
・フィルタを通したディジタル信号の最大エネルギー又
はエネルギー比が、それぞれの最大のしきい値よりも大
きいとき、雑音に犯された信号中の音声信号の存在を判
断すること。
・及び、フィルタを通したディジタル信号の最大エネル
ギー、又はエネルギー比Rが、それぞれの最小しきい値
よりも小さいとき、雑音に犯された信号中の音声信号が
不在であると判断すること。
本発明のその他の対象は、上記の方法を実施するための
装置である。
以下余白 (実施例) 第1図から第4図までに示す、本発明による方法は、約
20ミリ秒の雑音が入り込んでいる信号についてなされ
、信号サンプルSを与えるためフレーム当り160個の
サンプルという割合でサンプリングされる、実際の実施
例である。第1図のステップ1から5までに示すとおり
、処理か行われるディジタル信号Sは、先ずステップ1
で前置増幅されて信号サンプルSnを与え、次にステッ
プ2で遮断周波数FC・1200Hzを有する高域2戸
波器によって炉液して、信号サンプルsph (n)を
与える。次のステップ3と4では、次のパラメータが計
算される。
X = mas (Sn) x、h= maxSph (rl) ここでnは1と160の間の整数である。これらの計算
はサンプル5(n)とS+>h(n)の各シーケンスに
おいて、最大振幅または最大エネルギーを有するサンプ
ルを探すことからなっている。
ステップ5は、ステップ3と4で計算した二つのパラメ
ータXpbとXとの比R=xph/Xを計算することよ
り成る。
続くステップ6から11までは、次に示す諸関係に従っ
たパラメータ×1及びR1の計算より成る。
Xphが第1図で前のフレームで計算したX、よりも大
きく、X、。1dと書くことにすると、・×1=xph
  そうでなければ ・Xt=TX−Xtold  +(1−TX)XphR
が第1図で前のフレームで計算したR比よりも大きく、
Rloldと書くことにすると、・R,=Rそうでなけ
れば ・R+=Tr Rlold +(1−Tr) Rこのこ
とはパラメータX、及びR1の値において、一つのフレ
ームから次のフレームから次のフレームへ、瞬間的な成
長が許容され得るが、一方その減少はそれぞれTX及び
Trに等しい時定数で、もっとゆっくり起こるであろう
。本発明の提案する実施のB様によれば、時定数の値は
0.75に固定されている。これは約70ミリ秒に対応
する。次のステップ12から29までは、第2図と第3
図に示しであるが、パラメータXph及びRの長期平均
値を使い、四つの検出しきい値を求めることより成る。
後者は、しきい値の過度の変化を禁するように、先ずス
テップ12において、一定、最大、最小値の間に制限さ
れる。xphとR2の変化の限度はそれぞれ、Xphi
nf、Xphsup、 R,inf、R,supと呼ぶ
ことにする。
ステップ13から22までは二つのパラメータ×2及び
R2の計算にあり次の関係を確認している。
X2 = MAX (MIN (Xph、 Xph、5
up) + Lh、 1nf)R2= MAX (MI
N CR,R,5up) 、 R,1nf)パラメータ
xp及びRの長期間平均値はそれぞれXmoy及びRm
oyと記し、次の関係を適用することにおいてステップ
23から28までで計算される。
x2か第3図で直前のフレームで計算されたパラメータ
R□。アより大きく、Xmoy−0ldとかくことにす
れば ・Xmoy=Tm−xmoy−ota”(1−Tm)、
Xa rそうでなければ ・Xmoy” Td−Xmoy.old+(+a+(I
  Td)、X*R2が第3図で直前のフレームて計算
され、R4゜V、Oldと書かれたパラメータRffi
。、より大きい場合は、 ・Rmov” Tm・Rmoy.old+(ta”(I
  Tm)R2゜そうでなければ ・島。y” Td−Rn+oy.old+(+d”(1
−Td)、R2これらの関係において、上昇時定数T、
は指数的にゆっくり上昇することに備えられており、一
方下降時定数T、は指数的に早く上昇することに備えら
れており、考えている平均値は雑音に対応するレベルま
で素早く下がって戻る。これらの時定数の値は、本発明
の提案する実施の態様においては、上昇に対し、では0
.95すなわち約400m5に固定され、加工に対して
は0.2すなわち約13m5に固定されている。最終的
に、しきい値の四つの値はステップ29で計算され、次
の関係によって上に定めたX、。、とRmo yの値を
使用する。
SXt会話= a 、 Xmoy+Xph、 1nfS
X、雑音= b 、X、、、+Xph、1nfSR,会
話= a 、R+may+R,1nfSR4雑音= b
 、 R,11,y+R,inf乗算係数a及びbの値
は、本発明の提案している例では、1.8と2.5に固
定されている。なお、パラメータXphまたはRの−っ
か対応する下限値よりも小さい場合は、関連する決定は
自動的にとられることを頭においておくことが望ましい
本方法のステップ1から5までを実施し、エネルギー比
を計算する装置は第5図に示しである。
この装置は第1のフィルタ43を有し、これか伝達関数
H(z) = 1−0.86・z−”を持っていてステ
ップ1に示す信号の前置増幅を行う。このフィルタはそ
の出力によって、先ず第2の高域が波器(フィルタ)4
4で約1200Hzの遮断周波数を有するものに接続さ
れ、二番目にはエネルギー計算装置46に接続される。
第2の高域ろ波器44はまたその出力において、エネル
ギー計算装置46と同様のエネルギー計算装置45に結
合されている。フィルタ44とエネルギー計算装置45
は、拳法のステップ2と3の実行によってパラメータX
phを提供し、エネルギー計算装置46はパラメータX
を提供する。パラメータXとXphはそれぞれ除算器4
7の第1オペランド入力及び第2オペランド入力に加え
られ、ステップ5によってパラメータRを計算する。
エネルギー計算装置45及び46の実施の態様は第6図
に示されている。この回路は、側路回路50を通してレ
ジスタ49に結合した比較器回路48を有している。こ
の比較器回路48は二つの入力があり、第1の入力はデ
ィジタルフィルタ43によって与えられる信号サンプル
S (n)、またはディジタルフィルタ44によって与
えられる信号サンプルを受信する。第2の入力はレジス
タ49の出力に接続されている。側路回路50は比較器
回路48の入力によって制御され、信号サンプル5(n
)又は5ph(n)がレジスタ49の内容よりも大きい
時、レジスタ49の入力に対する信号サンプル5(n)
又は5ph(n)を側路する。
さもなければ、レジスタ49は自身にループを閉じたま
までいる。
ステップ6から11までを実施する装置の一つの実施の
態様を第7図に示す。この装置は、側路回路53を通し
て累算器回路52に結合された比較器回路51を有する
。乗算回路54は、第1オペランド入力によって比較器
回路51の第1の入力に接続され、その第2オペランド
入力においてパラメータ1−T、又は1−Trを受信す
る。これらのパラメータは拳法のステップ8と11にお
いてあられされているものである。第2の乗算回路55
は第1のオペランド入力によって、累算器52の出力に
接続され、第2オペランド入力において拳法のステップ
8と11で表されるパラメータTX又はT、を受信する
。この乗算回路54及び55の出力は、それぞれ加算回
路56の第一オペランド入力及び第二オペランド入力に
接続され、その出力が側路回路53の第一の入力に接続
されている。累算器52の出力は更に比較器回路51の
第二のオペランド入力に接続される。ステップ6から1
1までによれば、パラメータXph又はRは、比較器回
路51の第一の入力に加えられ、累算器回路52の内容
X、。ld又はR1゜1.と比較される。ステップ6は
又はステップ9に従って、パラメータXph又はRが累
算器回路52の内容X、。!、又はRo。ldより大き
ければ、側路回路53は累算器回路52の内容を、ステ
ップ7及び10に従ってパラメータXph又はRの一つ
によって更新する。そうでない時は、側路回路53は加
算回路56の出力を累算器回路52の入力に切り換えて
、ステップ8及び11に関して上記の関係によって定め
られた、パラメータx1又はR1により累算器の内容を
更新する。これらの関係において、積(1−TX) X
Xph又は稍(1−Tr) XRは乗算回路54によっ
て得られ、禎TxxX−o1dまたはTRXRlold
 Lt乗1jt回Fa55によって実行される。これら
積の和は加算回路56によって作られる。
本方法のステップ12から22までは、第2図に示され
ているか、しきい値増幅器(図示せず)によって行われ
るか、ただしその特性は第8図(A) と第8図(B)
に示されている。これらのしきい値増幅器は、パラメー
タx1及びR1の超過値を考慮に入れないですむことを
可能にする。これらの特性により、各パラメータx1又
はR□は二つの値、xlph、 tnfとX1ph、5
Ijp又はRt、infとRt、supの間に制限され
る。これらの特性はしきい値Xtp)、、infとxl
ph、5ul)又はR,、infとR,、supの間で
、パラメータ×1及びR1の直線的関係によりパラメー
タx2及びR2の作成を可能にする。このパラメータx
2及びR2はその振幅が、これらのしきい値の外側のパ
ラメータX、及びR8の値に関して制限されるものであ
る。
以下余白 拳法のステップ23から28までによって説明されてい
る、平均値島又はRue計算する装置の一つの実施の態
様を第9図に示す。この装置には減算回路57、乗算回
路58、加算回路59及び、レジスタ60かあり、この
順番に直列接続されている。減算回路57は、パラメー
タx2又はR2が加えられる第一オペランド入力と、レ
ジスタ60に接続されている第二オペランド入力とを有
する。この装置はまた二つの入力がある比較器回路61
を有し、それぞれ減算回路57の二つの入力にそれぞれ
つながっている。比較器回路61の出力は側路回路62
の制御入力に接続されている。この側路回路は二つの入
力を有し、これらに時定数TmとT、が印加される。側
路回路62の出力は乗算回路58の第一オペランド入力
に接続され、乗算回路58の第二オペランド入力は減算
回路57の出力に接続されている。乗算回路58の出力
はさらに加算回路59の第一オペランド入力に接続され
、加算回路59の第二オペランド入力は減算回路57の
第一オペランド入力につながっている。この平均値計算
装置はステップ23から28までに示す方法の演算を実
行させることができる。ステップ23又はステップ26
により、パラメータx2又はR2は比較器回路61の第
一の比較入力に加えられて、レジスタ60の内容xr、
。9.。ldと比較され、それぞれの値がレジスタ60
の内容より大きい場合は、比較器61は側路回路62に
、時定数T、、を乗算回路58の第一オペランド入力に
加えるよう命令する。乗算回路58はそれの第二オペラ
ンド入力に、レジスタ60の内容×7゜ア。1dとその
第一オペランド入力に加えられたパラメータx2又はR
2の値との間で行なった減算の結果をうける。乗算回路
58で行なった乗算T、 (X、、、.old+(ld
−Xl)又はT、 (X、、、、 。td−R2)の結
果は加算回路59の第一オペランド入力に加えられ、そ
の第二オペランド入力に加えられたパラメータx2又は
R2に加算される。この加算回路59で行なわれた加算
の結果はレジスタ60内に伝達される。しかしステップ
23又は26において、パラメータ×2又はR2の値が
レジスタ60で見出される×、。、。1d又はR1゜、
。l、の値より大きくない場合は、側路回路62は比較
器回路61によって、時定数Tdの値を乗算回路58の
第一オペランド入力に加えるよう命令される。これらの
条件の6とでは、計算は上記の記述と同様に行なわれ、
時定数T、は拳法のステップ25及び28に示される関
係に従って、時定数Tdの値と置換えられる。
会話のしきい値又は雑音のしきい値(SX、  ’“会
話°゛及びsx、  ”雑音II 、SL  II会話
″及びsn。
°゛雑音°゛)の拳法のステップ29で確立した関係に
よる計算は、第10図(A)及び第10図(B)に述べ
る回路によって実行される。SXt  “会話°°又は
SR。
“会話′″のしきい値は加算回路64に接続される乗算
回路63によって計算される。乗算回路63は、その第
一オペランド入力において第9図のレジスタ60によっ
て与えられるx、vlQy又はRmoyを受信し、また
パラメータ盗が加えられる第二オペランド入力を持って
いる。乗算の結果は加算回路64の第一オペランド入力
に加えて、その第二オペランド入力に加えられるしきい
値Sph、 infに加えられる。加算回路64の出力
はSX1  “会話パシきい値又はSR1′会話°°シ
きい値を与えることになる。
同様にして、SX1  “雑音シきい値又はSR。
′“雑音°°シきい値、あるいはその両方が乗算回路6
5と加算回路66とによって計算される。乗算回路65
の第一オペランド入力は、第9図のレジスタ60で与え
られるパラメータXmoy及びR,。、を受信する。乗
算回路65はまたパラメータ旦が加えられる、第二のオ
ペランド入力を有している。その出力は加算器66の第
一のオペランド入力に接続され、その第二のオペランド
入力がパラメータのしきい値X ph、 infの値を
受ける。加算回路66の出力はしきい値sx、  ’“
雑音”及びSRよ “雑音パを出力する。これらのしき
い値は、本方法のステップ30から40まで、及び第1
1図(A)と第11図(B)に示すグラフによって、x
lとR1の比較を可能とする。対応する比較装置は第1
2図に示しである。この回路は、67から70までの番
号をつけた四つの比較器回路の一組を持っており、これ
らはそれぞれ会話/雑音弁別器71の四つの入力に結合
されている。比較器回路67はパラメータx1を会話し
きい値SX1“会話″と比較し、比較器68はパラメー
タ×1をしきい値SX1  “雑音″と比較し、比較器
69はパラメータR1をしきい値SR,“会話“°と比
較し、比較器70はパラメータR1をしきい値SR+ 
 ’“雑音パと比較する。会話/雑音弁別器71は、音
声活動信号DAVを第13図に示す状態図によって作り
出す。この状態図は二つの安定状態DAVOとDAVI
を持っており、LlからR4までの文字で表わした不安
定状態がある。安定状態DAVOは「雑音」状態で、そ
こでは会話信号がないとき音声活動検出器が置かれる。
また安定状態DAVIは、入力に加えられた信号か会話
信号を含んでいるとき音声活動検出器が置かれる状態で
ある。検出器が「雑音」状態DAVOにあるときは、二
つのパラメータXSX、とR3X、の中の一つが、不安
定状態L1を通過する際に、対応する会話しきい値sx
、  ”会話″又はSR,”会話°′よりも大きい場合
だけ、会話状態DAVIに行くのである。
そうでない場合、すなわちパラメータx8かしきい値S
X、  ”会話″゛よりも小さく、パラメータR1がし
きい値SR,”会話″よりも小さい場合は、雑音という
判断が持続される。
対照的に、音声活動検出器が会話状態DAVIにあると
きは、二つのパラメータx1とR1の中の一つか、対応
する雑音しきい値以下である場合、すなわちxlがしき
い値SX+  “雑音”°より小さく、R1がしきい値
SR,”雑音′°より小さい場合にのみ、検出器は雑音
状態DAVIに行くことができる。これらの条件の下で
は、検出器は不安定状態L2を通過する。信号DAVの
状態変化のこのアルゴリズムは、第4図のステップ30
から39までに表わされている。信号DAVの状態の各
変化の後、及びステップ40で表わされる初期化の段階
の後、本方法は第1図のステップ6の動作にもどる。
ただし第4図のダイヤグラムのステップ41と42に示
すように、雑音状態DAVOへの変化は、N(angJ
と記したタイミングカウンタ(図示せず)で計算された
、ある期間の終りにおいてのみ有効である。このタイミ
ングカウンタは「会話」状態DAVIと判断されたとき
は何時でも、ステップ35と39において最大カウント
値でロードされ、そのカウンタの内容は、DAVOとい
う判断がステップ36において起こるときは何時でも、
−単位だけ減らされる。このことが、話し手によ乞会話
におけるギャップの間、又はある話のエネルギーが低い
ときその話の終りを遮断している間に、系統的に「雑音
」状態に行くことを避けさせることかできるのである。
本発明に基づく本方法の実施例は、今まて述べてきた装
置に限られるものではなく、また例えば読み出し専用メ
モリ(ROM )のような記録されたマイクロプログラ
ムを有する計算手段より成る構造体によっても、等しく
十分に実施することができることは、極めて明白である
【図面の簡単な説明】
第1図と第2図と第3図と第4図は、本発明によって実
施される方法の、異なったステップを説明するフローチ
ャートである。 第5図は本発明による方法のステップ1から5までを実
施する、エネルギー比の計算用装置を示す。 第6図は、フィルタを通した信号又は前置増幅した第5
図の信号の一フレーム中で、最大のエネルギーを有する
サンプルの値の計算用装置の実施の態様を示す。 第7図は第1図のステップ6から11までを実施するた
めの装置の実施の態様を示す。 第8図(A)及び第8図(B)は、第2図のステップ1
2から22までにおいて表わされる、しきい値を求める
のに使用される方法を示す二つのグラフである。 第9図は第2図のステップ12から22までにおいて、
説明されている平均値島。、及びR1゜7の計算用装置
の実施の態様を示す。 第10図(A)と第1O図(B)は、本発明によるしき
値の計算用の二つの回路を示す。 第11図(A)及び第11図(B)は、本発明によって
、適応しきい値による比較のモードを説明する、二つの
グラフを示す。 第12図は、第4図のステップ30から40までを実施
するための比較装置の実施の態様を示す。 第13図は、音声信号中に音声信号が存在するか否かを
定めることを可能とする、決定アルゴリズムを示す、状
態図である。

Claims (11)

    【特許請求の範囲】
  1. (1)雑音に埋没している信号中の音声信号を検出する
    、次の各ステップより成る方法;(a)信号を幾つかの
    フレームに切り分けるステップ。 (b)決められた数のn個のサンプルを含むディジタル
    信号を得るため各フレームをサンプリングするステップ
    。 (c)前置増幅されたディジタル信号を得るためにディ
    ジタル信号を前置増幅するステップ。 (d)フィルタを通したディジタル信号を得るために、
    高域通過ディジタルフィルタによって、前置増幅された
    ディジタル信号をフィルタに通すステップ。 (e)各フレームにおいて、前置増幅された信号のサン
    プルの最大エネルギー、及びフィルタを通したディジタ
    ル信号のサンプルの最大エネルギーを測るステップ。 (f)フィルタを通したディジタル信号の最大エネルギ
    ーと、前置増幅されたディジタル信号のサンプルの最大
    エネルギーとの間のエネルギー比をとるステップ。 (g)二つの限界値の間で、フィルタの通した信号のサ
    ンプルのエネルギーを及びエネルギー比の、長期間の平
    均値を計算するステップ。 (h)長期間の平均値を基準として、四つのしきい値を
    計算するステップであって、その中の二つは最大値でそ
    れぞれフィルタを通した信号及びエネルギー比に対する
    会話状態の二つの下限を形成し、その中の二つは最小信
    号でそれぞれフィルタを通した信号及びエネルギー比に
    対する雑音状態の二つの上限を形成するものであり、フ
    ィルタを通した信号の最大エネルギーとエネルギー比と
    これらのしきい値とを比較する。 (i)フィルタを通したディジタル信号の最大エネルギ
    ーまたはエネルギー比が、それぞれの最大のしきい値よ
    りも大きいとき、雑音に犯された信号中の音声信号の存
    在を判断するステップ。 (j)及び、フィルタを通したディジタル信号の最大エ
    ネルギー、又はエネルギー費Rが、それぞれの最小しき
    い値よりも小さいとき、雑音に犯された信号中の音声信
    号の不在を判断するステップ。
  2. (2)ディジタル信号が、z−変換高域ディジタルフィ
    ルタ(H(z)=1.86z^1)によって前置増幅さ
    れる、請求項1記載の方法。
  3. (3)高域ディジタルフィルタは約1200Hzの遮断
    周波数を持っている、請求項2記載の方法。
  4. (4)各フレームにおける最大エネルギーの測定が、最
    大振幅のサンプルについて生じる、請求項3記載の方法
  5. (5)フィルタのエネルギーの最大値の長時間平均値X
    _mを求めることが、各現在のフレームにおいて、次の
    ような形式の再帰関係を適用することによって計算され
    る、請求項4記載の方法; すなわち、パラメータX_2の値がパラメータX_m_
    o_y_._o_l_dよりも大きい場合はX_m_o
    _y=T_m・X_m_o_y_._o_l_d+(1
    −T_m).X_2又は、パラメータX_2の値がパラ
    メータX_m_o_y_._o_l_dよりも小さい場
    合は X_m_o_y=T_d・X_m_o_y_._o_l
    _d+(1−T_d).X_2ただしX_2の値は二つ
    のしきい値X_p_.s_u_pとX_p_._i_n
    _fとの間に限定された、各フレームにおける最大エネ
    ルギーのサンプルX_p_hの値に等しく、X_m_o
    _y_._o_l_dは直前のフレームで計算された長
    期間の平均値、T_m及びT_dは時定数で、T_mは
    T_dよりも大きい時定数である。
  6. (6)エネルギー比Rの最大値の平均値R_m_o_y
    が、各現在のフレームにおいて、次のような形式の再帰
    関係を適用することによって計算される、請求項5記載
    の方法; すなわち、パラメータR_2がパラメータR_m_o_
    y_._o_l_dよりも大きい場合は、 R_m_o_y=T_m・R_m_o_y_._o_l
    _d+(1−T_m)R_2又は、パラメータR_2が
    パラメータR_m_o_y_._o_l_dよりも小さ
    い場合は、R_m_o_y=T_d・R_m_o_y_
    ._o_l_d+(1−T_d)R_2ただしR_m_
    o_y_._o_l_dは直前のフレームにおいて計算
    された、長期間の平均エネルギー比を示す。
  7. (7)四つのしきい値が次の関係を適用することで計算
    される、請求項6記載の方法; SX_1会話=a.X_m_o_y+X_p_h_._
    i_n_fSX_1雑音=b.X_m_o_y+X_p
    _h_._i_n_fSR_1会話=a.R_m_o_
    y+R_._i_n_fSR_1雑音=b.R_m_o
    _y+R_._i_n_fただしa及びbは定数である
  8. (8)¥a¥=1.8で¥b¥=1.25である、請求
    項7記載の方法。
  9. (9)次に示す手段より成る、雑音に犯されている信号
    中の音声信号を検出する装置; (a)各フレームにおいて、前置増幅された信号の最大
    エネルギーと、フィルタを通したディジタル信号の最大
    エネルギーとの間の比を計算する第一の手段。 (b)フィルタを通した信号の最大エネルギー、及びエ
    ネルギー比の長期間平均値を計算する第二の手段。 (c)フィルタを通したディジタル信号とエネルギー比
    に対する、最大及び最小の適応しきい値を計算する、第
    二の手段に結合された第三の手段。 (d)ディジタル信号中に音声信号が存在するか、存在
    しないのかを判断する、第三の手段に結合された判断手
    段。
  10. (10)前記の第一、第二、第三、及び第四の各手段が
    マイクロプログラミングされた計算手段によって形成さ
    れる、請求項9記載の装置。
  11. (11)前記マイクロプログラミングされた計算手段が
    信号フロセッサによって形成される、請求項10記載の
    装置。
JP1112386A 1988-05-04 1989-05-02 音声信号検出方法及び装置 Pending JPH0213999A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR8806001 1988-05-04
FR8806001A FR2631147B1 (fr) 1988-05-04 1988-05-04 Procede et dispositif de detection de signaux vocaux

Publications (1)

Publication Number Publication Date
JPH0213999A true JPH0213999A (ja) 1990-01-18

Family

ID=9365991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1112386A Pending JPH0213999A (ja) 1988-05-04 1989-05-02 音声信号検出方法及び装置

Country Status (9)

Country Link
US (1) US4982341A (ja)
EP (1) EP0341128B1 (ja)
JP (1) JPH0213999A (ja)
AT (1) ATE83578T1 (ja)
CA (1) CA1312357C (ja)
DE (1) DE68903872T2 (ja)
ES (1) ES2036813T3 (ja)
FR (1) FR2631147B1 (ja)
GR (1) GR3007361T3 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5408581A (en) * 1991-03-14 1995-04-18 Technology Research Association Of Medical And Welfare Apparatus Apparatus and method for speech signal processing
US5781913A (en) * 1991-07-18 1998-07-14 Felsenstein; Lee Wearable hypermedium system
EP0538536A1 (en) * 1991-10-25 1993-04-28 International Business Machines Corporation Method for detecting voice presence on a communication line
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection
US5450484A (en) * 1993-03-01 1995-09-12 Dialogic Corporation Voice detection
EP0622962B1 (en) * 1993-04-29 2000-04-12 International Business Machines Corporation Tone-detection method and apparatus for detecting at least one tone in dual-tone multifrequency signal
EP0622964B1 (en) * 1993-04-29 2002-03-20 International Business Machines Corporation Voice activity detection method and apparatus using the same
BE1007355A3 (nl) * 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
US5675639A (en) * 1994-10-12 1997-10-07 Intervoice Limited Partnership Voice/noise discriminator
US5822726A (en) * 1995-01-31 1998-10-13 Motorola, Inc. Speech presence detector based on sparse time-random signal samples
US5701389A (en) * 1995-01-31 1997-12-23 Lucent Technologies, Inc. Window switching based on interblock and intrablock frequency band energy
FR2738383B1 (fr) * 1995-09-05 1997-10-03 Thomson Csf Procede de quantification vectorielle de vocodeurs bas debit
US5884255A (en) * 1996-07-16 1999-03-16 Coherent Communications Systems Corp. Speech detection system employing multiple determinants
FR2778041A1 (fr) * 1998-04-24 1999-10-29 Thomson Csf Procede de neutrodynage du tube d'un emetteur
DE19854341A1 (de) 1998-11-25 2000-06-08 Alcatel Sa Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem
FR2788390B1 (fr) 1999-01-12 2003-05-30 Thomson Csf Emetteur de radiodiffusion en ondes courtes a haut rendement optimise pour les emissions de type numerique
US6249757B1 (en) 1999-02-16 2001-06-19 3Com Corporation System for detecting voice activity
FR2790343B1 (fr) 1999-02-26 2001-06-01 Thomson Csf Systeme pour l'estimation du gain complexe d'un canal de transmission
GB9912577D0 (en) 1999-05-28 1999-07-28 Mitel Corp Method of detecting silence in a packetized voice stream
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
FR2799592B1 (fr) 1999-10-12 2003-09-26 Thomson Csf Procede de construction et de codage simple et systematique de codes ldpc
DE10244699B4 (de) * 2002-09-24 2006-06-01 Voice Inter Connect Gmbh Verfahren zur Bestimmung der Sprachaktivität
US20060241937A1 (en) * 2005-04-21 2006-10-26 Ma Changxue C Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments
US9978392B2 (en) * 2016-09-09 2018-05-22 Tata Consultancy Services Limited Noisy signal identification from non-stationary audio signals

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2466825A1 (fr) * 1979-09-28 1981-04-10 Thomson Csf Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif
DE3243231A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
US4700392A (en) * 1983-08-26 1987-10-13 Nec Corporation Speech signal detector having adaptive threshold values
EP0140249B1 (en) * 1983-10-13 1988-08-10 Texas Instruments Incorporated Speech analysis/synthesis with energy normalization
EP0167364A1 (en) * 1984-07-06 1986-01-08 AT&T Corp. Speech-silence detection with subband coding
US4920568A (en) * 1985-07-16 1990-04-24 Sharp Kabushiki Kaisha Method of distinguishing voice from noise
DE3545447A1 (de) * 1985-12-20 1988-01-28 Bayerische Motoren Werke Ag System zur integration eines personalcomputers oder eines aehnlichen rechners in ein fahrzeug zur benutzung als fahrbares buero
US4918732A (en) * 1986-01-06 1990-04-17 Motorola, Inc. Frame comparison method for word recognition in high noise environments
GB8608288D0 (en) * 1986-04-04 1986-05-08 Pa Consulting Services Noise compensation in speech recognition

Also Published As

Publication number Publication date
FR2631147A1 (fr) 1989-11-10
US4982341A (en) 1991-01-01
EP0341128A1 (fr) 1989-11-08
GR3007361T3 (ja) 1993-07-30
DE68903872T2 (de) 1993-06-24
EP0341128B1 (fr) 1992-12-16
ATE83578T1 (de) 1993-01-15
CA1312357C (fr) 1993-01-05
ES2036813T3 (es) 1993-06-01
FR2631147B1 (fr) 1991-02-08
DE68903872D1 (de) 1993-01-28

Similar Documents

Publication Publication Date Title
JPH0213999A (ja) 音声信号検出方法及び装置
US4185168A (en) Method and means for adaptively filtering near-stationary noise from an information bearing signal
EP1312162B1 (en) Voice enhancement system
US7106871B1 (en) Feedback cancellation using bandwidth detection
US7155385B2 (en) Automatic gain control for adjusting gain during non-speech portions
CA2417803C (en) A hearing aid with an adaptive filter for suppression of acoustic feedback
US5867574A (en) Voice activity detection system and method
KR101168466B1 (ko) 오디오 잡음을 감소시키는 시스템 및 방법
US20040078200A1 (en) Noise reduction in subbanded speech signals
US5483594A (en) Method and device for analysis of a return signal and adaptive echo canceller including application thereof
US9082411B2 (en) Method to reduce artifacts in algorithms with fast-varying gain
WO2004075167A2 (en) Log-likelihood ratio method for detecting voice activity and apparatus
KR930007298B1 (ko) 펄스형 간섭 검출장치
EP2685746A1 (en) Howling detection device, howling suppressing device and method of detecting howling
US20010038699A1 (en) Automatic directional processing control for multi-microphone system
EP1676261A1 (en) Voice activity detection with adaptive noise floor tracking
JPH09139696A (ja) 適応識別とそれに関する適応エコーキャンセラのための方法と装置
US5408581A (en) Apparatus and method for speech signal processing
JP3269969B2 (ja) 背景雑音消去装置
US20090122997A1 (en) Audio processing apparatus and program
CN111916099A (zh) 一种变步长助听器自适应回声消除装置及回声消除方法
US5572621A (en) Speech signal processing device with continuous monitoring of signal-to-noise ratio
US20040228495A1 (en) Circuit and method for adaptation of hearing device microphones
JP2002198918A (ja) 適応雑音レベル推定器
US5864793A (en) Persistence and dynamic threshold based intermittent signal detector