JP2944098B2 - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JP2944098B2
JP2944098B2 JP1092817A JP9281789A JP2944098B2 JP 2944098 B2 JP2944098 B2 JP 2944098B2 JP 1092817 A JP1092817 A JP 1092817A JP 9281789 A JP9281789 A JP 9281789A JP 2944098 B2 JP2944098 B2 JP 2944098B2
Authority
JP
Japan
Prior art keywords
power
block
value
zero
power threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1092817A
Other languages
English (en)
Other versions
JPH02272836A (ja
Inventor
裕一 白木
孝夫 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1092817A priority Critical patent/JP2944098B2/ja
Publication of JPH02272836A publication Critical patent/JPH02272836A/ja
Application granted granted Critical
Publication of JP2944098B2 publication Critical patent/JP2944098B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は音声区間検出方式に関し、例えば、ディジタ
ル通信分野におけるディジタル音声挿入システムや音声
パケット通信システムに適用し得るものである。
[従来の技術] 第2図は、従来の音声区間検出方式の一構成例を示す
ブロック図である。
第2図において、音声入力サンプル信号は入力端子1
を介してパワ算出部2に入力され、このパワ算出部2に
よって一定のサンプル数でなるブロックに区分され、各
ブロックのサンプル値の平均パワ(電力:以下では単に
ブロックのパワと呼ぶ)Piが計算される。このようにし
て得られた各ブロックのパワPi(iはブロック番号を示
す)が有音/無音判定部3及びパワしきい値算出部4に
与えられる。
有音/無音判定部3は、パワPiと、パワしきい値算出
部4から入力される判定用パワしきい値Tiとを比較し、
パワPiがパワしきい値Ti以上のときに当該ブロックiを
有音ブロックと判定し、パワPiがパワしきい値Tiより小
さいときに当該ブロックiを無音ブロックと判定して出
力端子5を介して次段に出力する。
パワしきい値算出部4は、ブロック毎にパワしきい値
を更新する。ブロックiのパワPiがそのときのパワしき
い値Tiよりゆらぎ吸収オフセット値αを越えて小さいと
きには、すなわち、Pi<Ti−αのときには、次のブロッ
クi+1のパワしきい値Ti+1をTi+1=Pi+αによっ
て算出する。従って多少パワしきい値が小さくなる。す
なわち、パワしきい値Tiからゆらぎ吸収オフセット値α
を下まった値Ti−αを現時点iまでにおけるパワの最小
値と定義し、この最小値に背景雑音のパワのゆらぎ吸収
係数αを加えた値を新たなブロックi+1のパワしきい
値Ti+1とする。
他方、ブロックiのパワPiが、そのときのパワしきい
値Tiからゆらぎ吸収オフセット値αを減じた値までは小
さくないときには、すなわち、Pi≧Ti−αのときには、
次のブロックi+1のパワしきい値Ti+1として今まで
のパワしきい値Tiを用いる。
[発明が解決しようとする課題] しかしながら、上述した方法では、パワがある程度小
さい無音ブロックに対してはブロックパワの最小値を計
算し、これにオフセット値を加算して次のブロックの判
定のためのパワしきい値を適応的に制御するようにして
いるが、有音ブロック及びパワしきい値に近い無音ブロ
ックに対しては、次のブロックの判定のためのパワしき
い値をそれまでのしきい値と同一としているので、すな
わち、適応的な制御を行なっていないので、通話の途中
で雑音パワのレベルが大きく上昇した場合やパワしきい
値に近い雑音パワがさらに大きくなった場合には、雑音
を誤って有音と判定し続けてしまうという問題が生じて
いた。
本発明は、以上の点を考慮してなされたものであり、
雑音パワの大きな変動がある場合に雑音を誤って有音と
判定し続けるという問題を除去し、通話中に雑音パワが
大きく変動しても変動後の雑音パワを正しく推定し、雑
音パワの変動に追従し得るパワしきい値の適応的な設定
を可能とし、誤判定を減少させることができる音声区間
検出方式を提供しようとするものである。
[課題を解決するための手段] 本発明は、所定長のブロック毎に区切られている音声
入力信号から各ブロックのパワを算出するパワ算出手段
と、上記パワ、有音/無音判定結果及び零交差情報に基
づきパワしきい値を算出して出力するパワしきい値算出
手段と、上記パワと上記パワしきい値とを比較して、上
記パワが上記パワしきい値よりも大きいときに有音と判
定し、上記パワが上記パワしきい値よりも小さいときに
無音と判定する有音/無音判定手段と、上記音声入力信
号から各ブロックの零交差回数又は最大零交差間隔を算
出して零交差情報として出力し、上記パワしきい値算出
手段に与える零交差情報算出手段とを備えた音声区画検
出方式であって、 上記パワしきい値算出手段は、 (a)上記有音/無音判定手段によって無音と判定され
た上記ブロックが第1の時間以上生じていれば、そのブ
ロックの平均パワを算出し、上記平均パワから求めた第
1の最小値に雑音パワのゆらぎ吸収係数を乗算して、こ
の乗算値を上記パワしきい値として出力し、 (b)上記有音/無音判定手段によって有音と判定され
た時点からは、この時刻を第1の時刻として、上記ブロ
ックの平均パワを算出し、各ブロックの零交差回数と前
ブロックの零交差回数との差の絶対値が所定値以内であ
ることが連続して生じているか、又は、ブロックの最大
零交差間隔と前ブロックの最大零交差間隔との差の絶対
値が所定値以内であることが連続して生じているのかの
いずれかを満たすブロックの数をカウントし、このカウ
ント値が上記第1の時刻から計測して第2の時間内に、
所定値以上とならない場合に限り、第1の時刻から計測
して上記第2の時間だけ経過した時点で算出されている
平均パワから求めた第2の最小値に上記ゆらぎ吸収係数
を乗算して、この乗算値を上記パワしきい値として出力
することを特徴とするものである。
[作用] 本発明は、基本的には、パワ算出手段が音声入力サン
プル信号の所定長のブロック毎のパワを算出し、このパ
ワを有音/無音判定手段がパワしきい値算出手段から与
えられるパワしきい値と比較して判定を行なうものであ
る。また、パワしきい値算出手段が、ブロックのパワ、
零交差回数、最大零交差間隔及び有音/無音判定出力に
基づいて、パワしきい値を更新するものである。本発明
は、パワしきい値算出手段が実行するこのパワしきい値
の適応的な算出制御に特徴があるものである。
以下に、このような適応的な算出制御を採用した理由
について説明する。
上記(a)の処理で、最小値を求めるのは、第1の時
間がある程度長ければ最小値を取り続けてもその値が雑
音の真の平均パワに近くなり、最小値を用いたパワしき
い値設定による検出感度が良好になるからである。
しかし、通話の途中で雑音パワが大きく上昇した場
合、上記(a)の方法では平均パワの上昇した雑音に応
じたパワしきい値の設定ができない。
そこで、雑音と音声との次のような違いを利用する。
音声入力信号が雑音であれば、各ブロックでの零交差回
数及び最大零交差間隔は共にランダムに変化する。とこ
ろが、音声における母音部分では波形に周期性が現わ
れ、そのため、各ブロックでの零交差回数及び最大零交
差間隔が共にほぼ一定になる。
上記(b)の処理方法で、音声の平均長より長い第2
の時間の中で零交差回数及び最大零交差間隔がほぼ一定
となる割合が一定値(ブロックのカウント値)以上生じ
れば、その区間は音声を含む区間と考えてこの区間では
パワしきい値の更新を行なわない。逆に、第2の時間内
に零交差回数及び最大零交差間隔がほぼ一定となる割合
が一定値以下であれば、第2の時間中に雑音部分があ
り、その雑音部分の平均パワを、上記(a)と同様に推
定し、これを新しく雑音パワとしてパワしきい値を更新
する。
無音が続いている状態でパワしきい値が更新されたと
きには、また、カウント値が所定値以上となったときに
は、上記(b)の処理を最初からやり直すことができる
ように、初期状態とする。
[実施例] 以下、本発明の一実施例を図面を参照しながら説明す
る。
ここで、第1図はこの一実施例を示すブロック図であ
る。
実施例の全体処理構成 第1図において、所定長毎のブロックに区切られてい
る音声入力サンプル信号は入力端子11を介してパワ算出
部12に与えられ、このパワ算出部12によって、各ブロッ
クの平均パワP(i)(電力を表している:iはブロック
の番号:以下、単にブロックのパワと呼ぶ)が算出され
て有音/無音判定部13に与えられる。有音/無音判定部
13には、パワしきい値算出部14からパワしきい値Pth
(i)が与えられており、各ブロックのパワP(i)を
パワしきい値Pth(i)と比較して、有音/無音判定部1
3は、下記の(1)式に従って判定する。
このようにして得られた判定出力VD(i)が出力端子
15を介して次段に出力される。
ブロックに区切られている音声入力サンプル信号はま
た、零交差回数算出部16に与えられる。零交差回数算出
部16は、各ブロック内のサンプル信号の符号反転回数で
ある零交差回数(音声入力サンプル信号の周波数情報を
反映しており、母音と雑音では異なる回数をとるもので
ある)ZC(i)を算出してパワしきい値算出部14に与え
ると共に、各ブロック内のサンプル信号にかかる零交差
間隔を算出して最大零交差間隔検出部17に与える。最大
零交差間隔検出部17は、各ブロックiの最大零交差間隔
(音声入力サンプル信号の周波数情報を反映しており、
母音と雑音では異なる間隔をとるものである)IZCmax
(i)を算出してパワしきい値算出部14に与える。
パワしきい値算出部14は、ブロックのパワP、零交差
回数ZC、最大零交差間隔IZCmax及び有音/無音判定出力
VDに基づいて、パワしきい値Pthを適応的に算出して上
述の有音/無音判定部13に与える。
パワしきい値算出方法 以下、パワしきい値算出部14が実行するパワしきい値
算出方法について説明する。
パワしきい値Pth(i)は、次の方法(i)又は方法
(ii)により更新される。
(i) 現行のパワしきい値を用いた判定によって、該
有音・無音判定出力VDが無音と指示したブロックが連続
して所定のブロック数Nだけ生じる毎に、下記の計算式
に従ってパワしきい値Pthを更新する。
なお、これらの式はブロックiまでの連続するN個の
ブロックが無音判定ブロックである場合であって、次の
ブロックi+1のパワしきい値Pth(i+1)を算出す
る場合である。また、βは1より大きい定数値である雑
音パワのゆらぎ吸収係数である。
(ii) 第1の方法(i)に従っている状態において、
ブロックmについて有音判定がなされると、すなわち、
P(m)>Pth(m)となると、このブロックm以降
は、以下の処理を行なう。なお、この方法(ii)の処理
を行なうようになってから後述する所定の時間が経過す
るまでの間はパワしきい値Pthは更新されない。この方
法(ii)の処理を行なっている後述する所定の時間は、
この時間内の背景雑音の影響をパワしきい値Pthに反映
させるような準備の演算を行なっている時間である。
この第2の方法では、詳細には、以下の(iia)〜(i
ic)の処理を行なう。
(iia)一旦有音になると、この時刻t1以後からは、所
定のブロック数N毎にその区間のブロック間平均パワを
(2)式と同様な方法で算出し、得られたブロック間平
均パワを用いて(3)式と同様の方法でその最小値P′
min(i)を求める。
(iib)零交差回数ZC(i)と1ブロック前の零交差回
数ZC(i−1)との差の絶対値を算出し、得られた絶対
値が予め定まっている一定値SZth以下であるブロックが
所定のブロック数NSZth以上連続するか否かを判別す
る。また、最大零交差間隔IZCmax(i)と1ブロック前
の最大零交差間隔IZCmax(i−1)の差の絶対値を算出
し、この絶対値が予め定まっている一定値SIZth以下で
あるブロックが所定のブロック数NSIZth以上連続してい
るか否かを判別する。このような零交差回数の変化連続
ブロック数又は最大零交差間隔の変化連続ブロック数の
判別で所定のブロック数NSZth又はNSIZthより大きいと
判別すると、母音ブロックカウンタのカウント値CZを1
だけつインクリメントする。
そして、上述した有音になった時刻t1から計測して所
定時間TA以内にカウント値CZが所定値CZth以上にならな
い場合には、時刻t1から所定時間TAだけ経過した時刻t2
において、上記(iia)の処理でえ求まっている時刻t2
での最小値P′min(i)を(3)式の左辺のPmin
(i)とし、(4)式を実行してパワしきい値Pthを算
出する。
(iic)但し、上記(i)の方法によりパワしきい値Pth
が更新された場合、及び、カウント値CZが所定時間TA内
のある時点で所定値CZthを越えたときには、当該(ii)
の方法に関する諸量をリセットする(P′min(i)を
初期値に置き換え、カウント値CZをゼロクリアし、零交
差回数ZC(i)の前ブロックとの差分値が一定以内のブ
ロックの連続発生のカウント及び最大零交差間隔IZCmax
(i)の前ブロックとの差分値が一定以内のブロックの
連続発生のカウントをゼロクリアする)。
上述のパワしきい値算出方法を採用した理由 次に、上述のように、パワしきい値を算出するように
した理由について説明する。
上記(i)の方法において最小値を求めていくように
したのは、ブロック数Nがある程度長ければ、最小値を
取り続けてもその値が雑音の真の平均パワとごく近い値
となり、しかも、最小値によるしきい値設定は検出感度
上良好なものであるからである。
しかし、通話の途中で雑音パワが大きく上昇した場
合、上記(i)の方法では平均パワの上昇した雑音に応
じたパワしきい値を設定することができず、誤動作を増
大させてしまう。
そこで、雑音と音声(特に母音)との次のような違い
を利用して、有音判定区間内の雑音パワに応じたパワし
きい値の設定を可能とした。
音声入力信号が雑音であれば、母音のような周期的波
形をもたないので、短時間のブロックでの零交差回数
や、そのブロック内で生じる最大零交差回数の値もラン
ダムに変化する。他方、音声における母音部分では波形
に周期性が現われ、そのため短時間のブロックでの零交
差回数が、相前後するブロックでほぼ一定になり、ま
た、最大零交差間隔もほぼ一定になる。
そこで、音声の平均長T0より長い一定区間(上述の所
定時間TA)の中で零交差回数ZC(i)及び最大零交差間
隔IZCmax(i)がほぼ一定となるブロック割合が一定値
(上述のカウント値CZth)以上であれば、その区間は音
声を含む区間と考えて、この区間でパワしきい値の更新
を行なわない。逆に、一定時間TA内に零交差回数ZC
(i)及び最大零交差間隔IZCmax(i)がほぼ一定とな
る割合が一定値CZth以下であれば、この一定時間TAの中
に雑音部分があると考えて、その雑音部分の平均パワ
を、上記(i)の方法と同様にブロック数Nの平均パワ
の最小値を計算することで推定し、これを新しく雑音パ
ワとしてパワしきい値Pthを更新するようにした。
すなわち、有音判定区間内の雑音部分を音声と雑音と
の周波数上の特性の違いによって検出して、その検出さ
れた雑音部分のパワ情報によってパワしきい値を更新す
るようにした。
実施例の効果 上述の実施例によれば、現行のパワしきい値による判
定で無音が生じていれば、その無音区間のパワに基づい
てパワしきい値を更新し、他方、現行のパワしきい値に
よる判定で一旦有音となってからは、各ブロックの零交
差回数の前ブロックからの変動が一定値以内であること
が一定時間以上生じたときのブロック、又は、各ブロッ
クの最大零交差間隔の前ブロックからの変動が一定値以
内であることが一定時間以上生じたときのブロックの総
数を有音による周期性の検出に用い、この有音の割合が
一定時間内に一定値以下であるときに、この一定時間内
に雑音部分があると考え、この部分の雑音パワを所定ブ
ロック数の平均パワの最小値で推定し、これに基づいて
パワしきい値を更新するようにしたので、通話中に雑音
パワが大きく変動してもその変動した雑音パワを正しく
推定してパワしきい値の更新ができ、雑音パワ変動によ
る誤検出を軽減することができる。
他の実施例 なお、本発明はディジタル通信分野の各種システムだ
けでなく、音声区間の検出を要する各種システムに適用
することができる。
また、(2)式に従ってブロック間パワ平均値を求め
るN個のブロックは、ブロック1〜N、N+1〜2N、…
のように選定しても良く、また、ブロック1〜N、2〜
N+1、3〜N+2、…のように選定しても良い。
[発明の効果] 以上のように、本発明によれば、現行のパワしきい値
による判定で無音が生じていればその無音区間のパワに
基づいてパワしきい値を更新し、他方、現行のパワしき
い値による判定で一旦有音となってからは、有音判定区
間内の雑音部分を音声と雑音との周波数上の特性の違い
によって検出して、その検出された雑音部分のパワ情報
によってパワしきい値を更新するようにしたので、通話
中に雑音パワが大きく変動してもその変動した雑音パワ
を正しく推定してパワしきい値の更新を行なうことがで
き、雑音パワ変動による誤検出を軽減することができ
る。
【図面の簡単な説明】
第1図は本発明による音声区間検出方式の一実施例を示
すブロック図、第2図は従来方式を示すブロック図であ
る。 12……パワ算出部、13……有音/無音判定部、14……パ
ワしきい値算出部、16……零交差回数算出部、17……最
大零交差間隔算出部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】所定長のブロック毎に区切られている音声
    入力信号から各ブロックのパワを算出するパワ算出手段
    と、上記パワ、有音/無音判定結果及び零交差情報に基
    づきパワしきい値を算出して出力するパワしきい値算出
    手段と、上記パワと上記パワしきい値とを比較して、上
    記パワが上記パワしきい値よりも大きいときに有音と判
    定し、上記パワが上記パワしきい値よりも小さいときに
    無音と判定する有音/無音判定手段と、上記音声入力信
    号から各ブロックの零交差回数又は最大零交差間隔を算
    出して零交差情報として出力し、上記パワしきい値算出
    手段に与える零交差情報算出手段とを備えた音声区画検
    出方式であって、 上記パワしきい値算出手段は、 上記有音/無音判定手段によって無音と判定された上記
    ブロックが第1の時間以上生じていれば、そのブロック
    の平均パワを算出し、上記平均パワから求めた第1の最
    小値に雑音パワのゆらぎ吸収係数を乗算して、この乗算
    値を上記パワしきい値として出力し、 上記有音/無音判定手段によって有音と判定された時点
    からは、この時刻を第1の時刻として、上記ブロックの
    平均パワを算出し、各ブロックの零交差回数と前ブロッ
    クの零交差回数との差の絶対値が所定値以内であること
    が連続して生じているか、又は、ブロックの最大零交差
    間隔と前ブロックの最大零交差間隔との差の絶対値が所
    定値以内であることが連続して生じているのかのいずれ
    かを満たすブロックの数をカウントし、このカウント値
    が上記第1の時刻から計測して第2の時間内に、所定値
    以上とならない場合に限り、第1の時刻から計測して上
    記第2の時間だけ経過した時点で算出されている平均パ
    ワから求めた第2の最小値に上記ゆらぎ吸収係数を乗算
    して、この乗算値を上記パワしきい値として出力するこ
    とを特徴とする音声区間検出方式。
JP1092817A 1989-04-14 1989-04-14 音声区間検出方式 Expired - Fee Related JP2944098B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1092817A JP2944098B2 (ja) 1989-04-14 1989-04-14 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1092817A JP2944098B2 (ja) 1989-04-14 1989-04-14 音声区間検出方式

Publications (2)

Publication Number Publication Date
JPH02272836A JPH02272836A (ja) 1990-11-07
JP2944098B2 true JP2944098B2 (ja) 1999-08-30

Family

ID=14064978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1092817A Expired - Fee Related JP2944098B2 (ja) 1989-04-14 1989-04-14 音声区間検出方式

Country Status (1)

Country Link
JP (1) JP2944098B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105830152B (zh) * 2014-01-28 2019-09-06 三菱电机株式会社 集音装置、集音装置的输入信号校正方法以及移动设备信息系统

Also Published As

Publication number Publication date
JPH02272836A (ja) 1990-11-07

Similar Documents

Publication Publication Date Title
CA2288115C (en) System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
US5649055A (en) Voice activity detector for speech signals in variable background noise
US4696041A (en) Apparatus for detecting an utterance boundary
KR101437830B1 (ko) 음성 구간 검출 방법 및 장치
JP3297346B2 (ja) 音声検出装置
EP1861846A2 (en) Adaptive voice mode extension for a voice activity detector
JP2000148172A (ja) 音声の動作特性検出装置および検出方法
JP2006189907A (ja) 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ
KR930007298B1 (ko) 펄스형 간섭 검출장치
JP2573352B2 (ja) 音声検出装置
WO2003090204A1 (en) Method and apparatus for pitch period estimation
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
US20120265526A1 (en) Apparatus and method for voice activity detection
US7254532B2 (en) Method for making a voice activity decision
EP0439073B1 (en) Voice signal processing device
JP2944098B2 (ja) 音声区間検出方式
GB2380644A (en) Speech detection
EP0770254B1 (en) Transmission system and method for encoding speech with improved pitch detection
JP2000250568A (ja) 音声区間検出装置
JP2002198918A (ja) 適応雑音レベル推定器
JP2656069B2 (ja) 音声検出装置
JP2624829B2 (ja) 音声区間検出方式
JPS63281200A (ja) 音声区間検出方式
JP2007072005A (ja) 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体
JPH02272837A (ja) 音声区間検出方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees