JPH0371719B2 - - Google Patents
Info
- Publication number
- JPH0371719B2 JPH0371719B2 JP59099114A JP9911484A JPH0371719B2 JP H0371719 B2 JPH0371719 B2 JP H0371719B2 JP 59099114 A JP59099114 A JP 59099114A JP 9911484 A JP9911484 A JP 9911484A JP H0371719 B2 JPH0371719 B2 JP H0371719B2
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- value
- input
- circuit
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 claims description 42
- 230000005236 sound signal Effects 0.000 claims description 21
- 230000001186 cumulative effect Effects 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 5
- 238000009825 accumulation Methods 0.000 description 16
- 206010019133 Hangover Diseases 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- ZYHMJXZULPZUED-UHFFFAOYSA-N propargite Chemical compound C1=CC(C(C)(C)C)=CC=C1OC1C(OS(=O)OCC#C)CCCC1 ZYHMJXZULPZUED-UHFFFAOYSA-N 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Landscapes
- Time-Division Multiplex Systems (AREA)
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、音声信号の有無を判定する音声検出
方法及び回路に関する。 (従来技術とその問題点) 音声検出回路は主にDSI(Digital Speech
Interpolationの略称である。)装置に組み込ま
れ、DSI装置への入力チヤンネルに音声信号が存
在するか否かを判定するために用いられる。 尚、DSI装置に関しては、例えば1976年3月発
行の文献、コムサツト テクニカル レビユー
(COMSAT TECHNICAL REVIEW)誌vol.6,
No.1の第127〜158頁に掲載されているエス・ジエ
ー・キヤムパネラ(S.J.Campanella)による論
文、「デイジタル スピーチ インターポレーシ
ヨン(Digital Speech Interpolation)」に詳述
されているので参照されたい。 従来、ハードウエア規模が小さく検出論理が明
瞭である方法としてレベル検出法が知られている
が、この方法は入力信号の信号エネルギー(電力
及び振幅)を検出後、閾値と比較することにより
音声信号の有無を判定するものである。またレベ
ル検出法を用いた音声検出器の中で、入力信号の
振幅と予め定められた閾値とを比較する固定閾値
型音声検出器が、最もハードウエア規模が簡単で
かつ、確実な音声検出器として知られている。 次に図面を参照しながら、この固定閾値型音声
検出器の原理を説明する。 第1図は固定閾値型音声検出器の原理を示すブ
ロツク図であり、信号入力端子1、振幅閾値入力
端子2、振幅比較回路3、累積回路4、累積回路
への入力信号として+1,−1を与える増加・減
少制御線5および6、音声検出用フリツプフロツ
プ7、音声検出用フリツプフロツプセツト・リセ
ツト制御線8および9、音声検出結果出力端子1
0からなつている。なお、この場合累積回路は可
逆カウンタ(アツプダウン・カウンタ)で置換で
きる。 図において、端子1より入力される入力信号は
標本化周期ごとに振幅比較回路3において、端子
2より入力される予め定められた振幅閾値
(THa)と比較される。その結果、入力信号振幅
が振幅閾値よりも大きいと、累積回路増加制御線
5を使つて累積回路4の内容が1だけ増加され
る。また、逆に入力信号振幅が振幅閾値よりも小
さいと、累積回路減少制御線6を使つて累積回路
4の内容が1だけ減少される。但し、累積回路の
内容は負の値にならないようになつている。 音声信号が到来し、振幅閾値を超える入力が多
くなると、累積回路の内容は順次増加する。もち
ろん、その間に振幅閾値以下の入力が加わると、
累積回路の内容は1だけ減少する。このようにし
て、累積回路の内容が予め設定された判定閾値
(THD)に達すると、音声検出用フリツプフロツ
プのセツト制御線8を使つて音声検出用フリツプ
フロツプ7がセツトされ、音声が検出されたこと
になり、端子10よりその結果が出力される。 また、音声が検出されなくなると、例えば、そ
れは累積回路4の内容が0になることで示される
が、その時、音声検出用フリツプフロツプ7は音
声検出用フリツプフロツプのリセツト制御線9を
使つてリセツトされ、端子10よりその結果が出
力されるが、一般にはある一定時間の後にリセツ
トされる。これは、ハングオーバーと称され、通
話中の単語や句の間での切断に耳が敏感であるこ
とから設けられており、その時間長は100〜
250ms程度である。 さらに理解を深めるために第1図で示される固
定閾値型音声検出器に第2図のaの11で示され
る信号が入力した場合を例にとつて説明を加え
る。 第2図では、入力信号11、振幅閾値12、累
積回路の内容13、判定閾値14および音声検出
結果出力15を示している。 まず、入力信号11が端子1から入力される
と、標本化周期Tsごとに振幅比較回路3により
振幅閾値12と比較される。第2図から判るよう
に時刻ta1になつて始めて入力信号の振幅の方が
振幅閾値よりも大きくなるので累積回路の内容1
3は時刻ta1で始めて1になり、(第2図b)、以
後、時刻ta2まで1ずつ増加されていく。その結
果、時刻tb1になつて累積回路の内容13が判定
閾値14よりも大きくなるので、音声が検出され
たことになり、出力15は1になる。ところで、
時刻ta3になると、入力信号11の振幅が振幅閾
値12よりも小さくなるので、累積回路の内容1
3は1ずつ減少していき、時刻tb2になり、判定
閾値14よりも小さくなるので音声信号が無くな
つたと判定され前述の理由でハングオーバーが付
加されハングオーバー終了後、出力15は0にな
る。第2図のcにおけるTHがハングオーバー時
間を示している。 以上説明してきた様な固定閾値型音声検出器で
は確かにハードウエア規模は簡単ではあるが、一
度閾値が設定されると閾値以上でありさえすれば
雑音でも検出してしまうという欠点があつた。 (発明の目的) 本発明の目的は、入力信号中に含まれる雑音の
レベル変動に対して良好な追従性を示す閾値を有
し、雑音による誤検出が少なく音声検出能力の向
上した可変閾値型音声検出器を提供することにあ
る。 (発明の構成) 本発明によれば、標本時刻毎に外部より与えら
れる入力信号と該入力信号の無音区間雑音レベル
に応じて変動する複数の振幅閾値との大小判定を
行ない、該大小判定結果に応じて予め定められた
複数個の数値の中から1つを選択して累積し、該
累積値と判定閾値とを比較することにより音声信
号の有無を判定する音声検出方法において、 前記複数の振幅閾値のうち相隣り合う閾値の間
隔と無音区間の雑音の振幅分布とより前記複数個
の数値を決定し、無音区間における累積値の期待
値を零としたことを特徴とする音声検出方法が得
られる。 また本発明によれば、音声信号(入力信号)が
入力され、後記判定手段の出力により指定された
無音区間における雑音の電力の平均振幅値を示す
値を計算し出力する雑音電力計算手段と、前記平
均振幅値のほぼ3/4倍の値を第1の閾値として、
前記平均振幅値のほぼ2倍の値を第2の閾値とし
て出力する閾値発生手段と、前記第1の閾値及び
第2の閾値と前記入力音声信号とを比較し、前記
入力音声信号が前記第2の閾値より大なる場合に
は+3を出力し、前記入力音声信号が前記第1の
閾値より小なる場合には−1を出力し、それ以外
の場合には+1を出力するレベル検出手段と、該
レベル検出手続の出力を累積する累積手段と、該
累積手段より供給される累積値とあらかじめ定め
られた第3の閾値とを比較することにより音声信
号の有無を判定する判定手段とを少なくとも含む
ことを特徴とする音声検出回路が得られる。 (発明の原理) 本発明では上述の構成により閾値を雑音のレベ
ル変動に追従させて変動させるとともに、無音区
間における累積回路への入力値の期待値を零とす
ることにより雑音の誤検出の低減及び音声検出能
力を向上させている。 それは次の様に説明できる。 無音区間における累積回路への入力値の期待値
が正であれば、累積値は正側の最大値になり、音
声検出器としてはもはや利用できない。 また、無音区間における累積回路への入力値の
期待値が負であれば、累積値が負の最大値を取り
語頭切断を始めハングオーバー付加時の音声検出
能力が低下し、語中脱落や語尾欠落を起こしやす
い。 それ故、無音区間における集積回路への入力値
の期待値を零とすることにより雑音による誤検出
及び語中脱落、語尾欠落が低減できることにな
る。 (実施例) 本発明を図面を参照しながら詳細に説明する。
第3図は、本発明の一実施例であり入力端子2
0、偶数ビツト反転回路21、符号変換回路2
2、整流回路23、電力計算回路24、第1の閾
値発生回路25、レベル検出回路26、累積回路
27、比較回路28、第2の閾値発生回路29、
ハングオーバー付加回路30及び出力端子31か
ら構成されている。 例えば、国際電信電話諮問委員会、(CCITT;
Comite´ Consultatif International T
e´le´graphaique et Te´le´phonique)からの勧
告
案G.711に基づき非線形符号化され、8ビツトの
A−Law符号(オレンジブツクVol.−2,
pp409〜410参照のこと。)となつた入力信号が入
力端子20から入力する場合を例にとつて説明を
加える。通常、電話回線を伝送されるA−Law
符号信号はMSB(Most Significant Bitの略
称である。)側からみて、偶数ビツト目が反転さ
れているので、偶数ビツト反転回路21により入
力信号は偶数ビツトが反転され伝送される前のも
との信号に戻される。もとに戻つたA−Law符
号信号は符号変換回路22で、第4図で示すよう
に、正のA−Law符号信号に対してはMSBだけ、
負のA−Law符号信号に対しては全ビツト反転
され8ビツトのTwo′s complement符号信号に
変換され、整流回路23へ入力される。整流回路
23では、この入力信号を絶対値信号(大きさの
みを表わす信号)に変換し、一方は電力計算回路
24へ、もう一方はレベル検出回路26へ送り出
す。 電力計算回路24では、入力信号に含まれる雑
音を取り出し、雑音の実効値を計算する。 具体的には、音声が検出されない時(例えば、
後述する比較回路28の出力が0の時)はすべて
の入力信号を雑音とみなすとともに、音声が検出
された時(例えば後述する比較回路28の出力が
1の時)であつても予め定められたレベル以下の
信号は雑音であるとみなし、この雑音を低域通過
フイルタに入力することにより雑音の実効値を計
算し、その結果を第1の閾値発生回路25に送出
する。従つて、雑音の実効値を計算する際に除外
される音声信号とは、後述の比較回路の出力が1
でありかつ、予め定められたレベル以上の信号レ
ベルを有する信号である。第1の閾値発生回路2
5では、電力計算回路24からの出力を3/4倍す
ることにより、レベル検出回路26で使用される
第1の閾値(TH1)をまた電力計算算回路から
の出力を2倍することにより、第2の閾値
(TH2)とを設定し、レベル検出回路26へ送出
する。 レベル検出回路26では、整流回路23の出力
と、第1閾値発生回路25より送出される第1の
閾値及び第2の閾値とを比較し、整流回路の出力
が第2の閾値より大きい場合には入力信号が音声
信号である確率が高いので+3、第1の閾値と第
2の閾値との間に位置する場合には入力信号が音
声信号である確率と雑音である確率とがほぼ等し
いかあるいは前者が少し高い程度であるので+
1、第1の閾値より小さい場合には入力信号が雑
音である確率が高いので−1を出力する。累積回
路27ではレベル検出回路26の出力を累積して
おりその累積値を比較回路28へ送出する。比較
回路28では、後述する第2の閾値発生回路29
から出力される第3の閾値(TH3)と前記累積
値とを比較し、後者が前者よりも大きい場合には
入力信号が音声信号であると判定し、+1を、ま
た、前者が後者よりも大きい場合には入力信号は
雑音であると判定し、0を出力する。第2の閾値
発生回路29では、前記比較回路28で使用され
る音声信号判定用の第3の閾値(TH3)として、
レベルの異なる閾値を2つ用意しておき、後述す
るハングオーバー付加回路30の出力が0の場合
には高いレベルの第3の閾値(TH3H)を発生
し、また、後述するハングオーバー付加回路30
の出力が1の場合には低いレベルの第3の閾値
(TH3L)を発生し前記比較回路28へ送出する。 ハングオーバー付加回路30では、前記比較回
路28の出力を入力し、該入力信号が1の時には
音声信号が検出されたとして1を出力端子31を
介して外部に出力するとともに、前記比較回路2
8の出力が1から0に変化する時点で、予め定め
られた時間だけ出力端子31より出力する外部出
力を1に保持することによりハングオーバーを付
加している。もちろん、前記比較回路28の出力
が0である時は音声信号が検出されなかつたとし
て出力端子31を介して0が外部に出力されてい
る。 第3図における電力計算回路24としては第5
図の回路が使用でき、絶対値信号入力端子50、
雑音判定レベル入力端子51、比較回路出力信号
入力端子52、比較器53、論理和回路54、乗
算器55,56,57、被乗数入力端子59,6
0,61,62、被乗数選択器64、加算器6
5、リミツター66,67、メモリー68、出力
端子69から構成されている。絶対値入力信号は
入力端子50り入力され、一方は乗算器55へ、
もう一方は比較器53へ送られる。比較器53で
は、前記入力信号と入力端子51より入力される
雑音判定レベルと比較され、前者が後者よりも大
きい場合に0、小さい場合に+1を出力し、論理
和回路54では、比較器53の出力信号と、比較
回路28からの出力信号を反転した信号との論理
和がとられ、少なくともどちらか一方が+1のと
きに+1が出力され、乗算器56の制御信号及び
被乗数選択器64の選択制御信号となる。前記被
乗数選択器64では、前記選択制御信号が+1の
時には被乗数入力端子59より入力される被乗数
が選択され、また、0の時には被乗数入力端子6
0より入力される被乗数(現在は0を用いてい
る。)が選択され乗算器55の被乗数となる。 また、乗算器55では、絶対値入力信号と前述
のようにして選択された被乗数との積がとられ加
算器65へ送られる。一方、乗算器56では被乗
数入力端子61より入力される被乗数とメモリー
68の内容との積がとられ加算器65へ送られ
る。 但し、論理和回路54の出力が0の時はこの乗
算は行なわずメモリー68の内容がそのまま出力
される。そして、加算器65で前述の乗算器55
の出力と乗算器56の出力との加算が行なわれそ
の結果がリミツター66を介してメモリー68に
備えられる。また、それと同時にリミツター66
の出力は乗算器57により、被乗数入力端子62
より入力される被乗数との積がとられ、リミツタ
ー67を介して実効値(σ)として、出力端子6
9より出力される。 ここで、リミツタ66,67を用いているのは
メモリー68の内容及び閾値(TH1)の可変領
域を制限することにより閾値調整速度を敏速にか
つ、音声検出器の受信感度および感動レベル範囲
を制限し雑音に対する免疫性を保証するためであ
る。 尚、電力計算回路24は前述の様に絶対値信号
を一次の低域通過フイルタに通すことにより、雑
音のレベルを算出していたが、それは振幅分布が
Gauss分布であり分散がσ2である雑音をその絶対
値をとつて一次の低域通過フイルタに通して得ら
れる電力Pが次式で表す様に近似的に標準偏差
(実効値とも云いσで表わす。)に比例した値とな
るためである。 ここで【式】 ゆえに(1)式は次のようになる。 従つて、前記処理を施す事により、一次の低域
通過フイルタの出力で雑音の標準偏差σにほぼ比
例した値が得られることがわかる。 また、第3図における第1の閾値発生回路25
としては、第6図の回路が使用でき、入力端子7
0、乗算器71,72、被乗算入力端子73,7
4、第2の閾値出力端子75および第2の閾値出
力端子76から構成されている。 前述の電力計算回路24から出力される雑音の
実効値(σ)が入力端子70より入力され、一方
は乗算器71へ、もう一方は乗算器72へ送られ
る。乗算器71では被乗数入力端子73より入力
される被乗数(3/4)との積がとられ第1の閾値
として出力端子75より出力される。また、乗算
72では被乗数入力端子74より入力される被乗
数2との積がとられ第2の閾値として入力端子7
6より出力される。 第3図の如く、第2の閾値発生回路を設け、比
較回路28で使用される第3の閾値(TH3)を
2個用意し、ハングオーバー付加回路30の出力
を選択信号とし、該選択信号が1の時には低いレ
ベルの第3の閾値(TH3L)を、0の時には高い
レベルの第3の閾値(TH3H)を選択し使用し
ているがこれは比較回路28の出力にヒステリシ
スを設けることにより音声検出器の過剰なON−
OFFを避けるためである。 またこうすることにより、有音区間における音
声検出能力が向上するので語中脱落や語尾欠落が
低減する。 また、本発明では、第1の閾値(TH1)を雑
音の実効値(σ)の3/4倍に設定し、第2の閾値
(TH2)を雑音の実効値(σ)の2倍に設定して
いるので、第7図の様に横軸に振幅、縦軸に確率
密度をとつて雑音の振幅分布を示せば雑音の振幅
の振幅値がTH2以下である確率が95%となり、
TH1以下である確率が55%となる。 また、レベル検出回路26では、入力信号が
TH2より大きい場合には+3を、TH2より小さ
くTH1より大きい場合には+1を、またTH1よ
り小さい場合には−1をそれぞれ出力している。 従つて本発明による音声検出器では、無音区間
における累積回路への入力値の期待値は次式によ
つて計算される。 En=3×0.05+1×(0.95−0.55)+(−1)×
0.55=0 無音区間における累積回路への入力値の期待値
が零であるので、第1及び第2の閾値とレベル検
出回路の出力の設定に関しては、ひとつの最適解
が得られている。 さらに入力信号と閾値及び累積値との関係を中
心に説明を加える。 いま、音声検出器に第8図aの波形80で示す
音声信号が入力された場合を考える。但し、入力
信号に含まれる雑音レベルが一定であり、第8図
aで示す波形81が第1の閾値発生回路25より
出力される第2の閾値(TH2)を示し、波形8
2が第1の閾値発生回路25より出力される第1
の閾値(TH1)を示し、Tsが標本化周期を示し
ているものとする。 入力信号は端子20より入力され偶数ビツト反
転回路21符号変換回路22、整流回路23を通
り、絶対値信号となつてレベル検出回路26に入
力される。 レベル検出回路26では絶対値信号となつた入
力信号(第8図の波形80を整流した波形)と第
8図の波形82で示す第1の閾値(TH1)と第
8図aの波形81で示す第2の閾値(TH2)と
を比較し、入力信号がTH1より小さければ−1
を、TH1より大きくTH2より小さければ+1を、
また、TH2より大きければ+3をそれぞれ出力
する。 それ故、累積回路27における累積値は第8図
bで示す波形83の様になる。但し、累積値の上
限及び下限が規定されているものとする。 そこで、第2の閾値発生回路29より出力され
る第3の閾値(TH3)が第8図bで示す波形8
4であれば、時刻T1で波形83で示す累積値が
波形84で示す第3の閾値(TH3H)よりも大
きくなるので音声が検出されたことにより、比較
回路28の出力は第8図cで示す波形85の様に
1になる。 そして、音声信号が終了し、雑音だけになると
第8図bの波形83で示す累積値が除々に小さく
なりやがて第8図bの波形84で示す第3の閾値
(1度検出されているのでこの場合はTH3Lにな
つている)よりも小さくなる。それ故、比較回路
28の出力は0になり音声信号が終了したことを
知らせるが、音声検出器の外部出力(判定回路3
2の出力)は比較回路28の出力が0になつても
すぐには0にはならず、予め定められた時間だけ
1の状態が保持された後に0に戻る。すなわちハ
ングオーバーが付加される。 以上の説明では、振幅閾値として2つの閾値
(第1の閾値と第2の閾値)を用いた場合を例に
とつて説明したきたが、振幅閾値として3つ以上
の閾値を用いて無音区間における累積回路への入
力値の期待値を零としても同様の効果が得られ本
発明に含まれる。 例えば、振幅閾値として3つの閾値を用いた場
合では第9図の様に、第1の閾値(TH1)を雑
音の実効値(σ)の3/4倍に、第2の閾値
(TH2)を雑音の実効値(σ)の10/4倍に、第3
の閾値(TH3)を雑音の実効値(σ)の3倍に
設定し、レベル検出回路26の出力を、TH3よ
り大きい場合には、+8を、TH3より小さくTH2
より大きい場合には+3を、TH2より小さく
TH1より大きい場合には+1を、またTH1より
小さい場合には−1をそれぞれ割り当てれば次式
で示す様に、無音区間における累積回路への入力
値の期待値が零となる。 E=8×0.01+3×(0.99−0.975)+1 ×(0.975−0.55)−0.55=0 さらに、振幅閾値として3つ以上の閾値を用い
ても、累積回路への入力値の期待値が零となるよ
うに振幅閾値及びレベル検出回路の出力を設定す
ることができるので、本発明の効果と同じ効果が
得られるので、本発明に含まれる。 <発明の効果> 以上の様に本発明に従えばPCM符号で信号処
理を行なつていることにより、ハードウエア規模
が増大しないこと、雑音信号レベルに応じた閾値
が得られ、擬似信号に対して免疫性が強いこと、
及び該閾値の最大値、最小値を規定することによ
り受信感度や感動レベル範囲を任意に設定できる
こと、及び、累積回路への入力値の期待値を零と
することにより語頭切断、語中脱落及び語尾欠落
が減少する等の利点がある。
方法及び回路に関する。 (従来技術とその問題点) 音声検出回路は主にDSI(Digital Speech
Interpolationの略称である。)装置に組み込ま
れ、DSI装置への入力チヤンネルに音声信号が存
在するか否かを判定するために用いられる。 尚、DSI装置に関しては、例えば1976年3月発
行の文献、コムサツト テクニカル レビユー
(COMSAT TECHNICAL REVIEW)誌vol.6,
No.1の第127〜158頁に掲載されているエス・ジエ
ー・キヤムパネラ(S.J.Campanella)による論
文、「デイジタル スピーチ インターポレーシ
ヨン(Digital Speech Interpolation)」に詳述
されているので参照されたい。 従来、ハードウエア規模が小さく検出論理が明
瞭である方法としてレベル検出法が知られている
が、この方法は入力信号の信号エネルギー(電力
及び振幅)を検出後、閾値と比較することにより
音声信号の有無を判定するものである。またレベ
ル検出法を用いた音声検出器の中で、入力信号の
振幅と予め定められた閾値とを比較する固定閾値
型音声検出器が、最もハードウエア規模が簡単で
かつ、確実な音声検出器として知られている。 次に図面を参照しながら、この固定閾値型音声
検出器の原理を説明する。 第1図は固定閾値型音声検出器の原理を示すブ
ロツク図であり、信号入力端子1、振幅閾値入力
端子2、振幅比較回路3、累積回路4、累積回路
への入力信号として+1,−1を与える増加・減
少制御線5および6、音声検出用フリツプフロツ
プ7、音声検出用フリツプフロツプセツト・リセ
ツト制御線8および9、音声検出結果出力端子1
0からなつている。なお、この場合累積回路は可
逆カウンタ(アツプダウン・カウンタ)で置換で
きる。 図において、端子1より入力される入力信号は
標本化周期ごとに振幅比較回路3において、端子
2より入力される予め定められた振幅閾値
(THa)と比較される。その結果、入力信号振幅
が振幅閾値よりも大きいと、累積回路増加制御線
5を使つて累積回路4の内容が1だけ増加され
る。また、逆に入力信号振幅が振幅閾値よりも小
さいと、累積回路減少制御線6を使つて累積回路
4の内容が1だけ減少される。但し、累積回路の
内容は負の値にならないようになつている。 音声信号が到来し、振幅閾値を超える入力が多
くなると、累積回路の内容は順次増加する。もち
ろん、その間に振幅閾値以下の入力が加わると、
累積回路の内容は1だけ減少する。このようにし
て、累積回路の内容が予め設定された判定閾値
(THD)に達すると、音声検出用フリツプフロツ
プのセツト制御線8を使つて音声検出用フリツプ
フロツプ7がセツトされ、音声が検出されたこと
になり、端子10よりその結果が出力される。 また、音声が検出されなくなると、例えば、そ
れは累積回路4の内容が0になることで示される
が、その時、音声検出用フリツプフロツプ7は音
声検出用フリツプフロツプのリセツト制御線9を
使つてリセツトされ、端子10よりその結果が出
力されるが、一般にはある一定時間の後にリセツ
トされる。これは、ハングオーバーと称され、通
話中の単語や句の間での切断に耳が敏感であるこ
とから設けられており、その時間長は100〜
250ms程度である。 さらに理解を深めるために第1図で示される固
定閾値型音声検出器に第2図のaの11で示され
る信号が入力した場合を例にとつて説明を加え
る。 第2図では、入力信号11、振幅閾値12、累
積回路の内容13、判定閾値14および音声検出
結果出力15を示している。 まず、入力信号11が端子1から入力される
と、標本化周期Tsごとに振幅比較回路3により
振幅閾値12と比較される。第2図から判るよう
に時刻ta1になつて始めて入力信号の振幅の方が
振幅閾値よりも大きくなるので累積回路の内容1
3は時刻ta1で始めて1になり、(第2図b)、以
後、時刻ta2まで1ずつ増加されていく。その結
果、時刻tb1になつて累積回路の内容13が判定
閾値14よりも大きくなるので、音声が検出され
たことになり、出力15は1になる。ところで、
時刻ta3になると、入力信号11の振幅が振幅閾
値12よりも小さくなるので、累積回路の内容1
3は1ずつ減少していき、時刻tb2になり、判定
閾値14よりも小さくなるので音声信号が無くな
つたと判定され前述の理由でハングオーバーが付
加されハングオーバー終了後、出力15は0にな
る。第2図のcにおけるTHがハングオーバー時
間を示している。 以上説明してきた様な固定閾値型音声検出器で
は確かにハードウエア規模は簡単ではあるが、一
度閾値が設定されると閾値以上でありさえすれば
雑音でも検出してしまうという欠点があつた。 (発明の目的) 本発明の目的は、入力信号中に含まれる雑音の
レベル変動に対して良好な追従性を示す閾値を有
し、雑音による誤検出が少なく音声検出能力の向
上した可変閾値型音声検出器を提供することにあ
る。 (発明の構成) 本発明によれば、標本時刻毎に外部より与えら
れる入力信号と該入力信号の無音区間雑音レベル
に応じて変動する複数の振幅閾値との大小判定を
行ない、該大小判定結果に応じて予め定められた
複数個の数値の中から1つを選択して累積し、該
累積値と判定閾値とを比較することにより音声信
号の有無を判定する音声検出方法において、 前記複数の振幅閾値のうち相隣り合う閾値の間
隔と無音区間の雑音の振幅分布とより前記複数個
の数値を決定し、無音区間における累積値の期待
値を零としたことを特徴とする音声検出方法が得
られる。 また本発明によれば、音声信号(入力信号)が
入力され、後記判定手段の出力により指定された
無音区間における雑音の電力の平均振幅値を示す
値を計算し出力する雑音電力計算手段と、前記平
均振幅値のほぼ3/4倍の値を第1の閾値として、
前記平均振幅値のほぼ2倍の値を第2の閾値とし
て出力する閾値発生手段と、前記第1の閾値及び
第2の閾値と前記入力音声信号とを比較し、前記
入力音声信号が前記第2の閾値より大なる場合に
は+3を出力し、前記入力音声信号が前記第1の
閾値より小なる場合には−1を出力し、それ以外
の場合には+1を出力するレベル検出手段と、該
レベル検出手続の出力を累積する累積手段と、該
累積手段より供給される累積値とあらかじめ定め
られた第3の閾値とを比較することにより音声信
号の有無を判定する判定手段とを少なくとも含む
ことを特徴とする音声検出回路が得られる。 (発明の原理) 本発明では上述の構成により閾値を雑音のレベ
ル変動に追従させて変動させるとともに、無音区
間における累積回路への入力値の期待値を零とす
ることにより雑音の誤検出の低減及び音声検出能
力を向上させている。 それは次の様に説明できる。 無音区間における累積回路への入力値の期待値
が正であれば、累積値は正側の最大値になり、音
声検出器としてはもはや利用できない。 また、無音区間における累積回路への入力値の
期待値が負であれば、累積値が負の最大値を取り
語頭切断を始めハングオーバー付加時の音声検出
能力が低下し、語中脱落や語尾欠落を起こしやす
い。 それ故、無音区間における集積回路への入力値
の期待値を零とすることにより雑音による誤検出
及び語中脱落、語尾欠落が低減できることにな
る。 (実施例) 本発明を図面を参照しながら詳細に説明する。
第3図は、本発明の一実施例であり入力端子2
0、偶数ビツト反転回路21、符号変換回路2
2、整流回路23、電力計算回路24、第1の閾
値発生回路25、レベル検出回路26、累積回路
27、比較回路28、第2の閾値発生回路29、
ハングオーバー付加回路30及び出力端子31か
ら構成されている。 例えば、国際電信電話諮問委員会、(CCITT;
Comite´ Consultatif International T
e´le´graphaique et Te´le´phonique)からの勧
告
案G.711に基づき非線形符号化され、8ビツトの
A−Law符号(オレンジブツクVol.−2,
pp409〜410参照のこと。)となつた入力信号が入
力端子20から入力する場合を例にとつて説明を
加える。通常、電話回線を伝送されるA−Law
符号信号はMSB(Most Significant Bitの略
称である。)側からみて、偶数ビツト目が反転さ
れているので、偶数ビツト反転回路21により入
力信号は偶数ビツトが反転され伝送される前のも
との信号に戻される。もとに戻つたA−Law符
号信号は符号変換回路22で、第4図で示すよう
に、正のA−Law符号信号に対してはMSBだけ、
負のA−Law符号信号に対しては全ビツト反転
され8ビツトのTwo′s complement符号信号に
変換され、整流回路23へ入力される。整流回路
23では、この入力信号を絶対値信号(大きさの
みを表わす信号)に変換し、一方は電力計算回路
24へ、もう一方はレベル検出回路26へ送り出
す。 電力計算回路24では、入力信号に含まれる雑
音を取り出し、雑音の実効値を計算する。 具体的には、音声が検出されない時(例えば、
後述する比較回路28の出力が0の時)はすべて
の入力信号を雑音とみなすとともに、音声が検出
された時(例えば後述する比較回路28の出力が
1の時)であつても予め定められたレベル以下の
信号は雑音であるとみなし、この雑音を低域通過
フイルタに入力することにより雑音の実効値を計
算し、その結果を第1の閾値発生回路25に送出
する。従つて、雑音の実効値を計算する際に除外
される音声信号とは、後述の比較回路の出力が1
でありかつ、予め定められたレベル以上の信号レ
ベルを有する信号である。第1の閾値発生回路2
5では、電力計算回路24からの出力を3/4倍す
ることにより、レベル検出回路26で使用される
第1の閾値(TH1)をまた電力計算算回路から
の出力を2倍することにより、第2の閾値
(TH2)とを設定し、レベル検出回路26へ送出
する。 レベル検出回路26では、整流回路23の出力
と、第1閾値発生回路25より送出される第1の
閾値及び第2の閾値とを比較し、整流回路の出力
が第2の閾値より大きい場合には入力信号が音声
信号である確率が高いので+3、第1の閾値と第
2の閾値との間に位置する場合には入力信号が音
声信号である確率と雑音である確率とがほぼ等し
いかあるいは前者が少し高い程度であるので+
1、第1の閾値より小さい場合には入力信号が雑
音である確率が高いので−1を出力する。累積回
路27ではレベル検出回路26の出力を累積して
おりその累積値を比較回路28へ送出する。比較
回路28では、後述する第2の閾値発生回路29
から出力される第3の閾値(TH3)と前記累積
値とを比較し、後者が前者よりも大きい場合には
入力信号が音声信号であると判定し、+1を、ま
た、前者が後者よりも大きい場合には入力信号は
雑音であると判定し、0を出力する。第2の閾値
発生回路29では、前記比較回路28で使用され
る音声信号判定用の第3の閾値(TH3)として、
レベルの異なる閾値を2つ用意しておき、後述す
るハングオーバー付加回路30の出力が0の場合
には高いレベルの第3の閾値(TH3H)を発生
し、また、後述するハングオーバー付加回路30
の出力が1の場合には低いレベルの第3の閾値
(TH3L)を発生し前記比較回路28へ送出する。 ハングオーバー付加回路30では、前記比較回
路28の出力を入力し、該入力信号が1の時には
音声信号が検出されたとして1を出力端子31を
介して外部に出力するとともに、前記比較回路2
8の出力が1から0に変化する時点で、予め定め
られた時間だけ出力端子31より出力する外部出
力を1に保持することによりハングオーバーを付
加している。もちろん、前記比較回路28の出力
が0である時は音声信号が検出されなかつたとし
て出力端子31を介して0が外部に出力されてい
る。 第3図における電力計算回路24としては第5
図の回路が使用でき、絶対値信号入力端子50、
雑音判定レベル入力端子51、比較回路出力信号
入力端子52、比較器53、論理和回路54、乗
算器55,56,57、被乗数入力端子59,6
0,61,62、被乗数選択器64、加算器6
5、リミツター66,67、メモリー68、出力
端子69から構成されている。絶対値入力信号は
入力端子50り入力され、一方は乗算器55へ、
もう一方は比較器53へ送られる。比較器53で
は、前記入力信号と入力端子51より入力される
雑音判定レベルと比較され、前者が後者よりも大
きい場合に0、小さい場合に+1を出力し、論理
和回路54では、比較器53の出力信号と、比較
回路28からの出力信号を反転した信号との論理
和がとられ、少なくともどちらか一方が+1のと
きに+1が出力され、乗算器56の制御信号及び
被乗数選択器64の選択制御信号となる。前記被
乗数選択器64では、前記選択制御信号が+1の
時には被乗数入力端子59より入力される被乗数
が選択され、また、0の時には被乗数入力端子6
0より入力される被乗数(現在は0を用いてい
る。)が選択され乗算器55の被乗数となる。 また、乗算器55では、絶対値入力信号と前述
のようにして選択された被乗数との積がとられ加
算器65へ送られる。一方、乗算器56では被乗
数入力端子61より入力される被乗数とメモリー
68の内容との積がとられ加算器65へ送られ
る。 但し、論理和回路54の出力が0の時はこの乗
算は行なわずメモリー68の内容がそのまま出力
される。そして、加算器65で前述の乗算器55
の出力と乗算器56の出力との加算が行なわれそ
の結果がリミツター66を介してメモリー68に
備えられる。また、それと同時にリミツター66
の出力は乗算器57により、被乗数入力端子62
より入力される被乗数との積がとられ、リミツタ
ー67を介して実効値(σ)として、出力端子6
9より出力される。 ここで、リミツタ66,67を用いているのは
メモリー68の内容及び閾値(TH1)の可変領
域を制限することにより閾値調整速度を敏速にか
つ、音声検出器の受信感度および感動レベル範囲
を制限し雑音に対する免疫性を保証するためであ
る。 尚、電力計算回路24は前述の様に絶対値信号
を一次の低域通過フイルタに通すことにより、雑
音のレベルを算出していたが、それは振幅分布が
Gauss分布であり分散がσ2である雑音をその絶対
値をとつて一次の低域通過フイルタに通して得ら
れる電力Pが次式で表す様に近似的に標準偏差
(実効値とも云いσで表わす。)に比例した値とな
るためである。 ここで【式】 ゆえに(1)式は次のようになる。 従つて、前記処理を施す事により、一次の低域
通過フイルタの出力で雑音の標準偏差σにほぼ比
例した値が得られることがわかる。 また、第3図における第1の閾値発生回路25
としては、第6図の回路が使用でき、入力端子7
0、乗算器71,72、被乗算入力端子73,7
4、第2の閾値出力端子75および第2の閾値出
力端子76から構成されている。 前述の電力計算回路24から出力される雑音の
実効値(σ)が入力端子70より入力され、一方
は乗算器71へ、もう一方は乗算器72へ送られ
る。乗算器71では被乗数入力端子73より入力
される被乗数(3/4)との積がとられ第1の閾値
として出力端子75より出力される。また、乗算
72では被乗数入力端子74より入力される被乗
数2との積がとられ第2の閾値として入力端子7
6より出力される。 第3図の如く、第2の閾値発生回路を設け、比
較回路28で使用される第3の閾値(TH3)を
2個用意し、ハングオーバー付加回路30の出力
を選択信号とし、該選択信号が1の時には低いレ
ベルの第3の閾値(TH3L)を、0の時には高い
レベルの第3の閾値(TH3H)を選択し使用し
ているがこれは比較回路28の出力にヒステリシ
スを設けることにより音声検出器の過剰なON−
OFFを避けるためである。 またこうすることにより、有音区間における音
声検出能力が向上するので語中脱落や語尾欠落が
低減する。 また、本発明では、第1の閾値(TH1)を雑
音の実効値(σ)の3/4倍に設定し、第2の閾値
(TH2)を雑音の実効値(σ)の2倍に設定して
いるので、第7図の様に横軸に振幅、縦軸に確率
密度をとつて雑音の振幅分布を示せば雑音の振幅
の振幅値がTH2以下である確率が95%となり、
TH1以下である確率が55%となる。 また、レベル検出回路26では、入力信号が
TH2より大きい場合には+3を、TH2より小さ
くTH1より大きい場合には+1を、またTH1よ
り小さい場合には−1をそれぞれ出力している。 従つて本発明による音声検出器では、無音区間
における累積回路への入力値の期待値は次式によ
つて計算される。 En=3×0.05+1×(0.95−0.55)+(−1)×
0.55=0 無音区間における累積回路への入力値の期待値
が零であるので、第1及び第2の閾値とレベル検
出回路の出力の設定に関しては、ひとつの最適解
が得られている。 さらに入力信号と閾値及び累積値との関係を中
心に説明を加える。 いま、音声検出器に第8図aの波形80で示す
音声信号が入力された場合を考える。但し、入力
信号に含まれる雑音レベルが一定であり、第8図
aで示す波形81が第1の閾値発生回路25より
出力される第2の閾値(TH2)を示し、波形8
2が第1の閾値発生回路25より出力される第1
の閾値(TH1)を示し、Tsが標本化周期を示し
ているものとする。 入力信号は端子20より入力され偶数ビツト反
転回路21符号変換回路22、整流回路23を通
り、絶対値信号となつてレベル検出回路26に入
力される。 レベル検出回路26では絶対値信号となつた入
力信号(第8図の波形80を整流した波形)と第
8図の波形82で示す第1の閾値(TH1)と第
8図aの波形81で示す第2の閾値(TH2)と
を比較し、入力信号がTH1より小さければ−1
を、TH1より大きくTH2より小さければ+1を、
また、TH2より大きければ+3をそれぞれ出力
する。 それ故、累積回路27における累積値は第8図
bで示す波形83の様になる。但し、累積値の上
限及び下限が規定されているものとする。 そこで、第2の閾値発生回路29より出力され
る第3の閾値(TH3)が第8図bで示す波形8
4であれば、時刻T1で波形83で示す累積値が
波形84で示す第3の閾値(TH3H)よりも大
きくなるので音声が検出されたことにより、比較
回路28の出力は第8図cで示す波形85の様に
1になる。 そして、音声信号が終了し、雑音だけになると
第8図bの波形83で示す累積値が除々に小さく
なりやがて第8図bの波形84で示す第3の閾値
(1度検出されているのでこの場合はTH3Lにな
つている)よりも小さくなる。それ故、比較回路
28の出力は0になり音声信号が終了したことを
知らせるが、音声検出器の外部出力(判定回路3
2の出力)は比較回路28の出力が0になつても
すぐには0にはならず、予め定められた時間だけ
1の状態が保持された後に0に戻る。すなわちハ
ングオーバーが付加される。 以上の説明では、振幅閾値として2つの閾値
(第1の閾値と第2の閾値)を用いた場合を例に
とつて説明したきたが、振幅閾値として3つ以上
の閾値を用いて無音区間における累積回路への入
力値の期待値を零としても同様の効果が得られ本
発明に含まれる。 例えば、振幅閾値として3つの閾値を用いた場
合では第9図の様に、第1の閾値(TH1)を雑
音の実効値(σ)の3/4倍に、第2の閾値
(TH2)を雑音の実効値(σ)の10/4倍に、第3
の閾値(TH3)を雑音の実効値(σ)の3倍に
設定し、レベル検出回路26の出力を、TH3よ
り大きい場合には、+8を、TH3より小さくTH2
より大きい場合には+3を、TH2より小さく
TH1より大きい場合には+1を、またTH1より
小さい場合には−1をそれぞれ割り当てれば次式
で示す様に、無音区間における累積回路への入力
値の期待値が零となる。 E=8×0.01+3×(0.99−0.975)+1 ×(0.975−0.55)−0.55=0 さらに、振幅閾値として3つ以上の閾値を用い
ても、累積回路への入力値の期待値が零となるよ
うに振幅閾値及びレベル検出回路の出力を設定す
ることができるので、本発明の効果と同じ効果が
得られるので、本発明に含まれる。 <発明の効果> 以上の様に本発明に従えばPCM符号で信号処
理を行なつていることにより、ハードウエア規模
が増大しないこと、雑音信号レベルに応じた閾値
が得られ、擬似信号に対して免疫性が強いこと、
及び該閾値の最大値、最小値を規定することによ
り受信感度や感動レベル範囲を任意に設定できる
こと、及び、累積回路への入力値の期待値を零と
することにより語頭切断、語中脱落及び語尾欠落
が減少する等の利点がある。
第1図は従来の音声検出器を示すブロツク図、
第2図は第1図の各部の波形を示す図、第3図は
本発明の音声検出器を示すブロツク図、第4図は
符号変換法を示す図、第5図は第3図の1部を示
す図、第6図は第3図の1部を示す図、第7図は
本発明の音声検出器の1部の出力と雑音の振幅分
布との関係を示す図、第8図は本発明の動作説明
を行なう図、第9図は本発明の1部の関係を示す
図であり、 第3図において、20は入力端子、21は偶数
ビツト反転回路、22は符号変換回路、23は整
流回路、24は電力計算回路、25は第1の閾値
発生回路、26はレベル検出回路、27は累積回
路、28は比較回路、29は第2の閾値発生回
路、30はハングオーバー付加回路、31は出力
端子である。
第2図は第1図の各部の波形を示す図、第3図は
本発明の音声検出器を示すブロツク図、第4図は
符号変換法を示す図、第5図は第3図の1部を示
す図、第6図は第3図の1部を示す図、第7図は
本発明の音声検出器の1部の出力と雑音の振幅分
布との関係を示す図、第8図は本発明の動作説明
を行なう図、第9図は本発明の1部の関係を示す
図であり、 第3図において、20は入力端子、21は偶数
ビツト反転回路、22は符号変換回路、23は整
流回路、24は電力計算回路、25は第1の閾値
発生回路、26はレベル検出回路、27は累積回
路、28は比較回路、29は第2の閾値発生回
路、30はハングオーバー付加回路、31は出力
端子である。
Claims (1)
- 【特許請求の範囲】 1 標本時刻毎に外部より与えられる入力信号と
該入力信号の無音区間雑音レベルに応じて変動す
る複数の振幅閾値との大小判定を行ない、該大小
判定結果に応じて予め定められた複数個の数値の
中から1つを選択して累積し、該累積値と判定閾
値とを比較することにより音声信号の有無を判定
する音声検出方法において、 前記複数の振幅閾値のうち相隣り合う閾値の間
隔と無音区間の雑音の振幅分布とより前記複数個
の数値を選択し、無音区間における累積値の期待
値を零としたことを特徴とする音声検出方法。 2 音声信号(入力信号)が入力され、後記判定
手段の出力により指定された無音声間における雑
音の電力の平均振幅値を示す値を計算し出力する
雑音電力計算手段と、前記平均振幅値のほぼ3/4
倍の値を第1の閾値として、前記平均振幅値のほ
ぼ2倍の値を第2の閾値として出力する閾値発生
手段と、前記第1の閾値及び第2の閾値と前記入
力音声信号とを比較し、前記入力音声信号が前記
第2の閾値より大なる場合には+3を出力し、前
記入力音声信号が前記第1の閾値より小なる場合
には−1を出力し、それ以外の場合には+1を出
力するレベル検出手段と、該レベル検出手続の出
力を累積する累積手段と、該累積手段より供給さ
れる累積値とあらかじめ定められた第3の閾値と
を比較することにより音声信号の有無を判定する
判定手段とを少なくとも含むことを特徴とする音
声検出回路。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59099114A JPS60242499A (ja) | 1984-05-17 | 1984-05-17 | 音声検出方法及び回路 |
US06/643,929 US4700392A (en) | 1983-08-26 | 1984-08-24 | Speech signal detector having adaptive threshold values |
CA000461841A CA1220283A (en) | 1983-08-26 | 1984-08-27 | Speech signal detector having adaptive threshold values |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59099114A JPS60242499A (ja) | 1984-05-17 | 1984-05-17 | 音声検出方法及び回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60242499A JPS60242499A (ja) | 1985-12-02 |
JPH0371719B2 true JPH0371719B2 (ja) | 1991-11-14 |
Family
ID=14238779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59099114A Granted JPS60242499A (ja) | 1983-08-26 | 1984-05-17 | 音声検出方法及び回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60242499A (ja) |
-
1984
- 1984-05-17 JP JP59099114A patent/JPS60242499A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS60242499A (ja) | 1985-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4028496A (en) | Digital speech detector | |
US4700392A (en) | Speech signal detector having adaptive threshold values | |
JP2643593B2 (ja) | 音声・モデム信号識別回路 | |
US5572593A (en) | Method and apparatus for detecting and extending temporal gaps in speech signal and appliances using the same | |
US4736163A (en) | Circuit for detecting and suppressing pulse-shaped interferences | |
US4688256A (en) | Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal | |
JPH07113840B2 (ja) | 音声検出器 | |
US4001505A (en) | Speech signal presence detector | |
US5970447A (en) | Detection of tonal signals | |
US6535844B1 (en) | Method of detecting silence in a packetized voice stream | |
JPS5911293B2 (ja) | デジタルリトクチヨウセイカイロ | |
JPH0371719B2 (ja) | ||
JPH0451035B2 (ja) | ||
JPS60242500A (ja) | 音声検出方法及び回路 | |
US4912765A (en) | Voice band data rate detector | |
JPH0464074B2 (ja) | ||
JPS61151700A (ja) | 時定数変動型可変閾値音声検出器 | |
JPS59113500A (ja) | 相関関数計算装置 | |
JPS61156296A (ja) | 可変閾値型音声検出器 | |
JPS61156298A (ja) | 時定数を変動させる可変閾値型音声検出器 | |
JPS61156297A (ja) | 可変閾値型音声検出器 | |
JPH05130067A (ja) | 可変閾値型音声検出器 | |
JP2680858B2 (ja) | レベル検出回路 | |
JPS587196A (ja) | 音声信号検出装置 | |
JPS6051039A (ja) | 適応差分pcm装置 |