JPH02272837A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPH02272837A
JPH02272837A JP1092818A JP9281889A JPH02272837A JP H02272837 A JPH02272837 A JP H02272837A JP 1092818 A JP1092818 A JP 1092818A JP 9281889 A JP9281889 A JP 9281889A JP H02272837 A JPH02272837 A JP H02272837A
Authority
JP
Japan
Prior art keywords
power
value
threshold
blocks
power threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1092818A
Other languages
English (en)
Inventor
Yuichi Shiraki
白木 裕一
Yasuo Shoji
庄司 保夫
Takao Suzuki
孝夫 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1092818A priority Critical patent/JPH02272837A/ja
Publication of JPH02272837A publication Critical patent/JPH02272837A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は音声区間検出方式に関し、例えば、ディジタル
通信分野におけるディジタル音声挿入システム(DS 
I )や音声パケット通信システムに適用し得るもので
ある。
[従来の技術] 第2図は、従来の音声区間検出方式の一構成例を示すブ
ロック図である。
第2図において、音声入力サンプル信号は入力端子1を
介してパワ算出部2に入力され、このパワ算出部2によ
って一定のサンプル数でなるブロックに区分され、各ブ
ロックのサンプル値の平均パワ(電力であり、以下では
単にブロックのパワと呼ぶ)Piが計算される。このよ
うにして得られた各ブロックのパワPi (iはブロッ
ク番号を示す)が有音/無音判定部3及びしきい値算出
部4に与えられる。
有音/無音判定部3は、パワPiと、しきい値算出部4
から入力される判定用パワしきい値Tiとを比較し、パ
ワPiがしきい値Ti以上のときに当該ブロックiを有
音ブロックと判定し、パワPiがしきい値Tiより小さ
いときに当該ブロックiを無音ブロックと判定して出力
端子5を介して次段に出力する。
しきい値算出部4は、ブロック毎にしきい値を更新する
。ブロックiのパワPiがそのときのしきい値Tiより
ゆらぎ吸収オフセット値αを越えて小さいときには、す
なわち、P i <T i−αのときには、次のブロッ
クi+1のしきい値T i+1をTi+1=Pi+αに
よって算出する。従って、多少しきい値が小さくなる。
すなわち、しきい値Tiからゆらぎ吸収オフセット値α
を下まった値Ti−αを現時点iまでにおけるパワの最
小値と定義し、この最小値に背景雑音のパワのゆらぎ吸
収係数αを加えた値を新たなブロックi+1のしきい値
Ti+1 とする。
他方、ブロックiのパワPiが、そのときのしきい値T
iからゆらぎ吸収オフセット値αを減じた値までは小さ
くないときには、すなわち、Pi≧Ti−αのときには
、次のブロックi+1のしきい値Ti+1として今まで
のしきい値Tiを用いる。
[発明が解決しようとする課題] しかしながら、上述の方法では、背景雑音パワのゆらぎ
吸収のオフセット値αは予め決められた一定値であるの
で、実際のゆらぎが一定値αよりも小さければ、ゆらぎ
を必要以上に大きく見積もったことになり、音声信号を
検出するパワしきい値としては高すぎることになる。す
なわち、音声部分を無音と判定することが多くなる。逆
に、実際のゆらぎが一定値αよりも大きければ、雑音を
有音と判定する誤判定率を高めることになる。
そこで、最もゆらぎの大きい雑音分布に基づいてオフセ
ット値αを固定的に決めることも考えられるが、この場
合、誤判定率をある程度抑えることができるが、ゆらぎ
の小さい雑音に対しては、上述した雑音を大きく見積も
ったときと同様に、有音検出しきい値としては適切では
なくなる。
本発明は、以上の点を考慮してなされたものであり、雑
音のゆらぎを推定し、雑音に対する誤判定率を一定に確
保しつつ、雑音のゆらぎに対応した適切なパワしきい値
を設定することができる音声区間検出方式を提供しよう
とするものである。
[課題を解決するための手段] 本発明は、音声入力サンプル信号を所定長のブロック毎
に区切り、各ブロックのパワを算出するパワ算出手段と
、パワしきい値を算出して出力するパワしきい値算出手
段と、パワ算出手段で算出されたパワとパワしきい値算
出手段から出力されたパワしきい値とを比較して、パワ
がパワしきい値よりも大きいときに有音と判定し、パワ
がパワしきい値よりも小さいときに無音と判定する有音
/無音判定手段とを備えてなる。
そして、パワしきい値算出手段が、有音/無音判定出力
が無音を指示するときに、所定ブロック数毎に、その複
数のブロックの平均パワと標準列差とを計算し、計算さ
れた標準偏差に所定の係数を乗算し、この乗算値に平均
パワを加算し、この加算値の今までの最小値をパワしき
い値とすることに特徴がある。
[作用] 本発明は、基本的には、パワ算出手段が音声入力サンプ
ル信号を所定長のブロックに区切ってパワを算出し、こ
のパワを有音/無音判定手段がパワしきい値算出手段か
ら与えられるパワしきい値と比較して判定を行なうもの
である。本発明は、パワしきい値算出手段が実行するパ
ワしきい値の適応的な算出制御に特徴があるものである
パワしきい値算出手段は、有音/無音判定出力が無音を
指示するときに、所定ブロック数毎に、その複数のブロ
ックの平均パワと標準偏差とを計算して雑音パワの最近
の分布状況を検出する。そして、計算された標準偏差に
所定の係数を乗算し、この乗算値に平均パワを加算しで
ある一定の誤判定率を確保することができる値を算出し
、この加算値の今までの最小値をパワしきい値とする。
[実施例] 以下、本発明の一実施例を図面を参照しながら詳述する
ここで、第1図はこの実施例を示すブロック図である。
第1図において、この実施例においても、音声入力サン
プル信号は入力端子11を介してパワ算出部12に入力
され、このパワ算出部12によって一定のサンプル数で
なるブロックに区分され、各ブロックのサンプル値の平
均パワ(以下、単にブロックのパワと呼ぶ)P(i)が
計算される。このようにして得られた各ブロックのパワ
P(1)が有音/無音判定部13及びパワしきい値算出
部14に与えられる。
有音/無音判定部13は、パワP(i)と、パワしきい
値算出部14から入力される判定用パワしきい値PTt
l(i)とを比較し、(1)式に示すように、パワP(
i)がパワしきい値PTtl(i)以上のときに当該ブ
ロックiを有音ブロックと判定し、パワP(i)がパワ
しきい値PTII(i)より小さいときに当該ブロック
iを無音ブロックと判定して有音/無音判定出力V(i
)を出力端子15を介して次段に出力する。
1(有音)   (P(i) >PTtl(i) )V
(i) =                    
・・・(1)0(無音)   (P(i)≦PTH(i
) )パワしきい値算出部14には、この有音/無音判
定出力V(1)も与えられており、上述したパワP(i
)とこの有音/無音判定出力V(+)とに基づいてパワ
しきい値PTII(i)を適応的に算出していく。
次に、パワしきい値算出部14が実行するしきい値算出
処理について説明する。
有音・無音判定により無音と判定(V=O)されたブロ
ックが所定のブロック数Nだけ生じる毎に、下記の(2
)弐〜(5)式の計算を行ない、新た・・・(3) PD(+)=P(i)  +β・Dに)       
 ・・・(4)PTtl(i+1)  =min   
(P1旧i)  、  PD(i))  ・  (5)
ここで、(2)式におけるP(i)は、ブロックiまで
の8個のブロックの平均パワであり、(3)式における
D(i)は8個のブロックのパワについての標準偏差で
ある。(4)式中のβは誤判定率調整用の固定係数であ
る。
従って、過去の8個のブロックの平均パワを求めて、雑
音パワの最近の平均値を求め、これに、雑音のゆらぎ成
分として求められたパワの標準偏差を所定の割合βで加
えてパワしきい値の候補を形成し、過去の候補の中の最
小値を次のブロックのパワしきい値として決定するよう
にした。
固定係数βの意味を述べると、固定係数βは、雑音に対
する誤判定率を、例えば、0.1%に設定したいとする
と、平均パワPに標準偏差りの固定係数8倍した値PD
よりも大きなブロック平均パワpをもつものが0.1%
となるように設定された値である。
しかしながら、このことは、ブロック数Nが非常に大き
な値(N>>1>のときに言えることである。なぜなら
ば、ブロック数Nが非常に大きいときには、(2)式に
よって算出される平均パワPも(3)式によって算出さ
れる標準偏差りも雑音の真の平均パワ及び真の標準偏差
に近づくからである。
ところが、ブロック数Nを大きくと、その計算量及び情
報量(語長)が増えるなめ、実際上、ブロック数Nは限
られた値となる。このようにブロック数Nがあまり大き
な値に設定できないときには、標準偏差りの値が真の標
準偏差に比べて大きくなったり小さくなったりする。標
準偏差りが小さくなれば同じ固定係数βに対して雑音に
対する誤判定率が増加する。そこで、標準偏差りが真の
標準偏差よりも小さくなることを考慮して固定係数βの
値を求められている値より大きな値に設定する。すなわ
ち、小さな標準偏差りが生じても(4)に従い算出され
たパワP[)が真のパワよりも小さくならないような値
を固定係数βとして固定的に設定する。つまり、(4)
式におけるパワPDの過去の最小値が真のパワとなるよ
うに固定係数βを設定する。そして、固定係数βを大き
く決定したことを考慮して、パワしきい値を(5)式に
よって求めることとした。
従って、上述の実施例によれば、無音区間の各ブロック
のパワの所定ブロック数内の平均パワと標準偏差とを計
算し、この標準偏差に定数を乗算し、これに平均パワを
加算し、この加算値のこれまでの最小値をパワしきい値
としたので、同一の雑音パワでもパワ偏差(ゆらぎ)が
小さいければそれに応じた低いパワしきい値を設定でき
、逆に、パワ偏差が大きければ高いパワしきい値を設定
できて、雑音誤判定率を一定以内に保つことができ、有
音/無音判定に適切なパワしきい値を決定できる。
なお、本発明はディジタル通信分野の各種システムだけ
でなく、音声区間の検出を要する各種システムに適用す
ることができる。
また、(2)式及び(3)式に従って複数のブロックの
平均パワ及び標準偏差を求めるN個のブロックは、ブロ
ック1〜N、N+1〜2N、・・・のように選定しても
良く、また、ブロック1〜N、2〜N+1、・・・のよ
うに選定しても良い。
[発明の効果] 以上のように、本発明によれば、無音区間の各ブロック
のパワの所定ブロック数内の平均パワと標準偏差とを計
算し、これらにより定まる分布を考え、所望の誤判定率
を達成することができる確率調整用係数を用いて雑音パ
ワの推定値を得て、過去の最小の推定値をパワしきい値
としたので、同一の雑音パワでもゆらぎの大小に関係な
く、しかも、雑音誤判定率を一定以内に保つことができ
るような適切なパワしきい値を決定することができる。
【図面の簡単な説明】
第1図は本発明による音声区間検出方式の一実施例を示
すブロック図、第2図は従来方式を示すブロック図であ
る。 12・・・パワ算出部、13・・・有音/無音判定部、
14・・・パワしきい値算出部。

Claims (1)

  1. 【特許請求の範囲】 音声入力サンプル信号を所定長のブロック毎に区切り、
    各ブロックのパワを算出するパワ算出手段と、パワしき
    い値を算出して出力するパワしきい値算出手段と、上記
    パワ算出手段で算出されたパワと上記パワしきい値算出
    手段から出力されたパワしきい値とを比較して、パワが
    パワしきい値よりも大きいときに有音と判定し、パワが
    パワしきい値よりも小さいときに無音と判定する有音/
    無音判定手段とを備えた音声区間検出方式において、 上記パワしきい値算出手段は、 有音/無音判定出力が無音を指示するときに、所定ブロ
    ック数毎に、その複数のブロックの平均パワと標準偏差
    とを計算し、計算された標準偏差に所定の係数を乗算し
    、この乗算値に平均パワを加算し、この加算値の今まで
    の最小値をパワしきい値とすることを特徴とした音声区
    間検出方式。
JP1092818A 1989-04-14 1989-04-14 音声区間検出方式 Pending JPH02272837A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1092818A JPH02272837A (ja) 1989-04-14 1989-04-14 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1092818A JPH02272837A (ja) 1989-04-14 1989-04-14 音声区間検出方式

Publications (1)

Publication Number Publication Date
JPH02272837A true JPH02272837A (ja) 1990-11-07

Family

ID=14065008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1092818A Pending JPH02272837A (ja) 1989-04-14 1989-04-14 音声区間検出方式

Country Status (1)

Country Link
JP (1) JPH02272837A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998049673A1 (fr) * 1997-04-30 1998-11-05 Nippon Hoso Kyokai Procede et dispositif destines a detecter des parties vocales, procede de conversion du debit de parole et dispositif utilisant ce procede et ce dispositif
JP2013160938A (ja) * 2012-02-06 2013-08-19 Mitsubishi Electric Corp 音声区間検出装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998049673A1 (fr) * 1997-04-30 1998-11-05 Nippon Hoso Kyokai Procede et dispositif destines a detecter des parties vocales, procede de conversion du debit de parole et dispositif utilisant ce procede et ce dispositif
US6236970B1 (en) 1997-04-30 2001-05-22 Nippon Hoso Kyokai Adaptive speech rate conversion without extension of input data duration, using speech interval detection
JP2013160938A (ja) * 2012-02-06 2013-08-19 Mitsubishi Electric Corp 音声区間検出装置

Similar Documents

Publication Publication Date Title
US5649055A (en) Voice activity detector for speech signals in variable background noise
JP4236726B2 (ja) 音声活動検出方法及び音声活動検出装置
EP0979504B1 (en) System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
EP1861846B1 (en) Adaptive voice mode extension for a voice activity detector
JP2573352B2 (ja) 音声検出装置
JP3297346B2 (ja) 音声検出装置
EP1229520A2 (en) Silence insertion descriptor (sid) frame detection with human auditory perception compensation
US6360199B1 (en) Speech coding rate selector and speech coding apparatus
US5533133A (en) Noise suppression in digital voice communications systems
EP3438979B1 (en) Estimation of background noise in audio signals
EP1751740B1 (en) System and method for babble noise detection
RU2127912C1 (ru) Способ обнаружения и кодирования и/или декодирования стационарных фоновых звуков и устройство для кодирования и/или декодирования стационарных фоновых звуков
US8144862B2 (en) Method and apparatus for the detection and suppression of echo in packet based communication networks using frame energy estimation
US20120265526A1 (en) Apparatus and method for voice activity detection
US20030078770A1 (en) Method for detecting a voice activity decision (voice activity detector)
GB2380644A (en) Speech detection
JP3109978B2 (ja) 音声区間検出装置
JPH02272837A (ja) 音声区間検出方式
JPS63281200A (ja) 音声区間検出方式
JP2656069B2 (ja) 音声検出装置
JPH11133997A (ja) 有音無音判定装置
JP2944098B2 (ja) 音声区間検出方式
JP2624829B2 (ja) 音声区間検出方式
JPH0467200A (ja) 有音区間判定方法
JP2539027B2 (ja) 音声検出方式