JP2897628B2 - Voice detector - Google Patents

Voice detector

Info

Publication number
JP2897628B2
JP2897628B2 JP5328158A JP32815893A JP2897628B2 JP 2897628 B2 JP2897628 B2 JP 2897628B2 JP 5328158 A JP5328158 A JP 5328158A JP 32815893 A JP32815893 A JP 32815893A JP 2897628 B2 JP2897628 B2 JP 2897628B2
Authority
JP
Japan
Prior art keywords
output
signal strength
comparator
unit
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5328158A
Other languages
Japanese (ja)
Other versions
JPH07181991A (en
Inventor
幸正 杉野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP5328158A priority Critical patent/JP2897628B2/en
Publication of JPH07181991A publication Critical patent/JPH07181991A/en
Application granted granted Critical
Publication of JP2897628B2 publication Critical patent/JP2897628B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は音声信号が低レベルで
も正常に閾値適応をし、良好な音声検出特性を維持する
音声検出器に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech detector which normally performs threshold adaptation even when a speech signal is at a low level and maintains good speech detection characteristics.

【0002】[0002]

【従来の技術】たとえば特開平3−141740号公報
に示す従来例の音声検出器は図11のように、低レベル
検出部1は、音声入力信号101の低レベル(音声の子
音部位等)を閾値設定部9からの適応閾値110と比較
し、有音/無音を判定し、低レベル有音/無音判定結果
102として出力する。高レベル検出部2は、音声入力
信号101の高レベル(音声の母音部位等)を予め決め
る所定閾値111と比較し、有音/無音を判定し、高レ
ベル有音/無音判定結果103として出力する。論理和
演算器3は、低レベル検出部1からの低レベル有音/無
音判定結果102と高レベル検出部2からの高レベル有
音/無音判定結果103とに対し論理和演算を施し、有
音/無音判定結果104として出力する。ハングオーバ
付加部4は、論理和演算器3からの有音/無音判定結果
104に対しハングオーバ付加処理(有音から無音へ状
態変化する後の所定時間中、有音判定を保持する処理)
を施し、音声検出出力信号105とする。雑音レベル算
出部8aは、音声入力信号101の所定ブロック区間内
サンプルに対し絶対値加算平均を施す。高レベル検出部
2からの音声入力信号101と所定閾値111との比較
結果124に従い、所定ブロック区間内で音声入力信号
101が所定閾値111を一度も越えないときは、背景
雑音レベル109を更新する。少なくとも一度越えると
きは、更新しないで直前の背景雑音レベル算出値を維持
する。閾値設定部9は、雑音レベル算出部8aからの背
景雑音レベル109に適応し閾値110を設定する。
2. Description of the Related Art For example, a conventional sound detector disclosed in Japanese Patent Application Laid-Open No. 3-141740 has a low level detecting section 1 which detects a low level (a consonant part of a sound, etc.) of a sound input signal 101 as shown in FIG. It compares with the adaptive threshold value 110 from the threshold value setting unit 9 to determine sound / non-sound, and outputs the result as a low-level sound / silence judgment result 102. The high-level detection unit 2 compares a high level (a vowel part or the like of the voice) of the voice input signal 101 with a predetermined threshold value 111 to determine the presence or absence of sound, and outputs the result as a high-level presence / absence determination result 103. I do. The OR operation unit 3 performs an OR operation on the low-level sound / non-sound determination result 102 from the low-level detection unit 1 and the high-level sound / non-sound determination result 103 from the high-level detection unit 2. The sound / silence determination result 104 is output. The hangover adding unit 4 performs a hangover addition process on the sound / non-sound determination result 104 from the logical sum operation unit 3 (a process for holding the sound determination during a predetermined time after the state is changed from the sound to the silent).
To obtain a sound detection output signal 105. The noise level calculator 8a performs an absolute value averaging on samples in the predetermined block section of the audio input signal 101. According to the comparison result 124 between the audio input signal 101 from the high level detection unit 2 and the predetermined threshold value 111, if the audio input signal 101 does not exceed the predetermined threshold value 111 within a predetermined block section, the background noise level 109 is updated. . If it exceeds at least once, the previous calculated background noise level is maintained without updating. The threshold setting unit 9 sets a threshold 110 according to the background noise level 109 from the noise level calculation unit 8a.

【0003】上記従来例の音声検出器は、背景雑音レベ
ルの急激な変化にも追従できる適応閾値型音声検出方式
を採る。
The above-mentioned conventional voice detector employs an adaptive threshold type voice detection system which can follow a rapid change in the background noise level.

【0004】低レベル検出部1は図12のように、まず
比較器11で音声入力信号101の低レベルを閾値設定
部9からの適応閾値110と比較する。つぎに音声入力
信号101と適応閾値110との比較結果125に従
い、第1の判定器12で所定時間のブロック単位に有音
/無音の判定をする。さらに第2の判定器13で所定ブ
ロック数連続の有音判定時だけ有音と判定し、低レベル
有音/無音判定結果102として出力する。
[0006] As shown in FIG. 12, the low level detector 1 first compares the low level of the audio input signal 101 with the adaptive threshold 110 from the threshold setting unit 9 by the comparator 11. Next, in accordance with the comparison result 125 between the audio input signal 101 and the adaptive threshold value 110, the first determiner 12 determines the presence / absence of sound / no sound for each block of a predetermined time. Further, the second determiner 13 determines that there is sound only when sound is determined for a predetermined number of consecutive blocks, and outputs the result as a low-level sound / silence determination result 102.

【0005】高レベル検出部2は図13のように、まず
比較器21で音声入力信号101の高レベルを予め適応
閾値110より高い値に決定する(通常予期できる最大
背景雑音レベルよりも高く設定する)所定閾値111と
比較する。つぎに音声入力信号101と所定閾値111
との比較結果124に従い、第1の判定器22で所定時
間のブロック単位に有音/無音の判定をする。さらに第
2の判定器23で所定ブロック数連続の有音判定時だけ
有音と判定し、高レベル有音/無音判定結果103とし
て出力する。また比較器21から音声入力信号101と
所定閾値111との比較結果124を出力する。
As shown in FIG. 13, the high level detector 2 first determines the high level of the audio input signal 101 to a value higher than the adaptive threshold value 110 in advance by the comparator 21 (usually set higher than the maximum background noise level which can be expected). D) Compare with a predetermined threshold value 111. Next, the voice input signal 101 and the predetermined threshold 111
In accordance with the comparison result 124, the first determiner 22 determines the presence / absence of sound / non-speech in units of blocks of a predetermined time. Further, the second determiner 23 determines that there is sound only when the sound is determined for a predetermined number of consecutive blocks, and outputs the result as a high-level sound / non-sound determination result 103. The comparator 21 outputs a comparison result 124 between the audio input signal 101 and the predetermined threshold 111.

【0006】図14(a)のように音声入力信号101
の平均レベルが極端に低いとき、まず音声入力信号10
1と所定閾値111との比較結果124は図14(c)
のようになる。従って高レベル検出部2は、有音区間に
対しても無音判定をする。また雑音レベル算出部8a
無音だけでなく有音区間に対しても背景雑音レベル10
9を引き続き算出するから、この背景雑音レベル109
は図14(b)のように望ましい背景雑音レベル算出値
よりも高くなる。また閾値設定部9は、背景雑音レベル
算出値の上昇に応じ適応閾値110を上昇する。つぎに
音声入力信号101と適応閾値110との比較結果12
5は図14(d)のようになる。従って低レベル検出部
1は、低レベルの音声区間(話頭や話尾などの低い音声
レベル区間)に対して無音判定をする。また論理和演算
器3は、図14(e)のように同じに有音/無音判定結
果104を出力する。
[0006] As shown in FIG.
When the average level of the audio input signal 10 is extremely low,
The comparison result 124 between 1 and the predetermined threshold value 111 is shown in FIG.
become that way. Therefore, the high-level detection unit 2 performs a silence determination even for a sound section. The noise level calculator 8a calculates the background noise level 10 not only for silence but also for sounded sections.
9, the background noise level 109 is calculated.
Is higher than the desired background noise level calculation value as shown in FIG. Further, the threshold setting unit 9 increases the adaptive threshold 110 according to the increase of the background noise level calculation value. Next, a comparison result 12 between the voice input signal 101 and the adaptive threshold value 110
5 is as shown in FIG. Therefore, the low-level detection unit 1 performs silence determination for a low-level voice section (a low-voice level section such as the beginning or end of a speech). Also, the logical sum operator 3 outputs the sound / non-sound determination result 104 in the same manner as shown in FIG.

【0007】[0007]

【発明が解決しようとする課題】上記のような従来の音
声検出器では、背景雑音レベルの急激な変化にも追従で
きる適応閾値型音声検出方式を採るが、音声信号レベル
が極端に低いとき、低レベルの音声区間も背景雑音レベ
ル算出区間に加えることになり適応閾値を上昇するか
ら、低レベルの音声区間に対して無音判定をする問題点
があった。
The above conventional speech detector employs an adaptive threshold type speech detection system capable of following a sudden change in the background noise level. However, when the speech signal level is extremely low, Since the low-level voice section is also added to the background noise level calculation section and the adaptive threshold is increased, there is a problem that the low-level voice section is determined to be silent.

【0008】この発明が解決しようとする課題は、音
信号が低レベルでも正常に閾値適応をし、良好な音声検
出特性を維持する音声検出器を提供することにある。
[0008] Problems to be this invention solves the audio signal is normally threshold adapted even at low levels, is to provide a speech detector to maintain good voice detection characteristic.

【0009】[0009]

【課題を解決するための手段】この発明の請求項1の音
声検出器は、低レベル検出器、高レベル検出器、論理和
演算部、ハングオーバー付加部、信号強度算出部、平滑
部、比較器、雑音レベル算出部、閾値設定部を備える音
声検出器であって、 低レベル検出器は、音声入力信号を
閾値設定部からの適応閾値と比較して低レベル有音/無
音判定結果を出力し、 高レベル検出部は、音声入力信号
を所定閾値または閾値設定部からの適応閾値と比較して
高レベル有音/無音判定結果を出力し、 論理和演算部
は、低レベル有音/無音判定結果と高レベル有音/無音
判定結果の論理和演算を施して有音/無音判定結果を出
力し、 ハングオーバー付加部は、有音/無音判定結果に
ハングオーバー付加処理を施して音声検出出力信号と
し、 信号強度算出部は、所定区間毎の音声入力信号の信
号強度を算出し信号強度出力として出力し、 平滑部は、
信号強度算出部からの信号強度出力を平滑化し、 比較器
は、信号強度出力と平滑化出力を比較し比較結果を出力
し、雑音レベル算出部は、比較器の比較結果に従い、信
号強度出力に対し相加平均を施して背景雑音レベルとし
て出力するか、直前に出力した値を背景雑音レベルとし
て出力し、 閾値設定部は背景雑音レベルに適応した適応
閾値を算出し出力するものである。
According to a first aspect of the present invention, there is provided a speech detector comprising a low level detector, a high level detector, a logical sum.
Operation unit, hangover addition unit, signal strength calculation unit, smoothing
Unit, a comparator, a noise level calculator, and a threshold setting unit
A voice detector, wherein the low level detector detects a voice input signal.
Low level sound / no compared to the adaptive threshold from the threshold setting unit
The sound detection result is output, and the high-level detection unit outputs the sound input signal.
Is compared with the predetermined threshold or the adaptive threshold from the threshold setting unit.
Outputs high-level sound / non-speech judgment result and performs logical sum operation
Indicates the low-level sound / silence judgment result and the high-level sound / silence
Performs a logical OR operation on the judgment results to produce a sound / silence judgment result
The hangover addition section adds
Hangover addition processing is performed to
Then, the signal strength calculation unit calculates the signal of the audio input signal for each predetermined section.
The signal strength is calculated and output as a signal strength output .
The signal strength output from the signal strength calculation unit smoothes comparator
Compares the signal strength output with the smoothed output and outputs the comparison result
Then, the noise level calculation unit calculates the signal based on the comparison result of the comparator.
Performs arithmetic averaging on the signal intensity output to obtain the background noise level.
Or the value output immediately before is used as the background noise level.
Output, and the threshold setting unit adapts to the background noise level.
A threshold is calculated and output.

【0010】この発明の請求項2の音声検出器は、平滑
部が、平滑部比較器、アップダウンカウンタを備え、平
滑部比較器は、信号強度出力とアップダウンカウンタの
出力とを比較して比較結果を出力し、 アップダウンカウ
ンタは、平滑部比較器の比較結果により信号強度出力が
平滑化出力より小さい時は、カウンタ現在値を減算し、
信号強度出力が平滑化出力より大きい時は、カウンタ現
在値を加算して平滑化出力とするものである。
[0010] speech detector according to claim 2 of the present invention, smooth
Section has a smoothing section comparator, up-down counter,
The slip comparator compares the signal strength output and the up / down counter.
By comparing the output to output the result of the comparison, the up-down Cow
Signal strength output based on the comparison result of the smoothing unit comparator.
If it is smaller than the smoothed output, subtract the current value of the counter,
If the signal strength output is greater than the smoothed output,
The present value is added to obtain a smoothed output.

【0011】この発明の請求項3の音声検出器は、平滑
部が、平滑部第1比較器、アップダウンカウンタ、平滑
部第2比較器、セレクタを備え、 平滑部第1比較器は、
信号強度出力とアップダウンカウンタの出力とを比較し
て比較結果を出力し、 アップダウンカウンタは、平滑部
第1比較器の比較結果により信号強度出力が平滑化出力
より小さい時は、カウンタ現在値を減算し、信号強度出
力が平滑化出力より大きい時は、カウンタ現在値を加算
して出力し、 平滑部第2比較器は、アップダウンカウン
タの出力と定数Aを比較して比較結果を出力し、 セレク
タは、平滑部第2比較器の比較結果に従いアップダウン
カウンタの出力もしくは定数Aを平滑化出力とするもの
である。
[0011] speech detector according to claim 3 of the present invention, smooth
Unit is a smoothing unit first comparator, an up-down counter, a smoothing unit
Unit second comparator, a selector, the smoothing unit first comparator,
Compare the signal strength output with the output of the up / down counter.
And outputs the comparison result Te, up-down counter, smooth portion
The signal strength output is smoothed according to the comparison result of the first comparator.
If it is smaller, subtract the current value of the counter and output the signal strength.
If the force is greater than the smoothed output, add the current counter value
The smoothing unit second comparator outputs an up-down count.
By comparing the output and the constant A of the motor and outputs a comparison result, selector
Up and down according to the comparison result of the smoothing section second comparator.
Output of counter or constant A as smoothed output
It is.

【0012】この発明の請求項4の音声検出器は、平滑
部は、第1乗算器、第2乗算器、平滑部第1比較器、平
滑部第2比較器、平滑部第3比較器、論理和演算器、ア
ップダウンカウンタを備え、 第1乗算器は、定数αとア
ップダウンカウンタの出力とを乗算して上限値を算出
し、 第2乗算器は、定数βとアップダウンカウンタの出
力とを乗算して下限値を算出し、 平滑部第1比較器は、
信号強度出力とアップダウンカウンタの出力とを比較し
て比較結果を出力し、 平滑部第2比較器は、信号強度出
力と第1乗算器の出力とを比較して比較結果を出力し、
平滑部第3比較器は、信号強度出力と第2乗算器の出力
とを比較して比較結果を出力し、 論理和演算器は、平滑
部第2比較器と平滑部第3比較器の比較結果の論理和演
算を施し、信号強度が所定範囲内か否かを判定結果とし
て出力し、 アップダウンカウンタは、論理和演算器の判
定結果が所定範囲内のときは現在値を保持し、所定範囲
外のときは、平滑部第1比較器の比較結果により、信号
強度出力がアップダウンカウンタの出力より小さい時
は、カウンタ現在値を減算し、信号強度出力がアップダ
ウンカウンタの出力より大きい時は、カウンタ現在値を
加算して平滑化出力とするものである。
[0012] speech detector according to claim 4 of the present invention, smooth
The unit includes a first multiplier, a second multiplier, a smoothing unit first comparator,
Smooth part second comparator, smoothing part third comparator, logical sum operator,
Comprising a-down counter, the first multiplier, a constant α and A
Calculate the upper limit by multiplying the output of the up / down counter
And, second multiplier output constant β and the up-down counter
Calculating a lower limit by multiplying the force, the smoothing unit first comparator,
Compare the signal strength output with the output of the up / down counter.
And outputs the comparison result. The second comparator of the smoothing unit outputs the signal strength.
Comparing the output with the output of the first multiplier and outputting a comparison result;
The smoothing unit third comparator outputs the signal strength output and the output of the second multiplier.
And the comparison result is output, and the logical sum
OR of the comparison result between the second comparator and the third comparator
And determine whether the signal strength is within a predetermined range as the determination result.
Output, and the up / down counter is determined by the OR
If the result is within the specified range, the current value is held and the
When the signal is outside, the signal obtained from the comparison result of the smoothing unit first comparator is
When the intensity output is smaller than the output of the up / down counter
Subtracts the current value of the counter and increases the signal strength output.
When the output of the counter is larger than the
The sum is used as a smoothed output.

【0013】この発明の請求項5の音声検出器は、平滑
部が、移動平均フィルタを形成する低域通過フィルタか
らなり、信号強度出力から平滑化出力を算出して出力す
るものである。
[0013] Voice detector according to claim 5 of the present invention, smooth
Is a low-pass filter forming a moving average filter
Calculates and outputs a smoothed output from the signal strength output.
Things.

【0014】この発明の請求項6の音声検出器は、比較
器は、その比較結果が変化しても一定時間直前の比較結
果を保持して出力するものである。
[0014] Voice detector according to claim 6 of the present invention, compared
Even if the result of the comparison changes, the
The result is stored and output.

【0015】[0015]

【作用】この発明の音声検出器は、音声信号が低レベル
でも正常に閾値適応し、良好な 音声検出特性を維持す
る。
According to the voice detector of the present invention, the voice signal has a low level.
Threshold adaptation normally and maintain good speech detection characteristics
You.

【0016】[0016]

【実施例】この発明を示す一実施例の音声検出器は図1
のように、低レベル検出部1と高レベル検出部2と論理
和演算器3とハングオーバ付加部4と閾値設定部9は、
上記従来例の図11と対応する。信号強度算出部5は、
音声入力信号101について信号強度算出周期tのブロ
ック区間内所定数N個のサンプルに対し2乗値相加平均
を施し、信号強度出力106とする。平滑部6は、信号
強度算出部5からの信号強度出力106を信号強度算出
周期tごとにカウンタ現在値と比較し、結果に応じカウ
ンタ現在値を加減し、平滑化出力107とする。比較器
7は、信号強度算出部5からの信号強度出力106を平
滑部6からの平滑化出力107と比較し、信号強度出力
106が平滑化出力107より大きいとき1(オン)、
小さいとき0(オフ)を比較結果108として出力す
る。雑音レベル算出部8は、比較器7からの比較結果1
08が0区間のとき、信号強度算出部5からの信号強度
出力106に対し相加平均を施して背景雑音レベル10
9として更新する。1区間のとき、更新しないで直前背
景雑音レベル算出値を維持する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A speech detector according to one embodiment of the present invention is shown in FIG.
, The low-level detection unit 1, the high-level detection unit 2, the OR operation unit 3, the hangover addition unit 4, and the threshold setting unit 9
This corresponds to FIG. 11 of the above conventional example. The signal strength calculation unit 5
The predetermined number N of samples in the block section of the signal strength calculation period t are subjected to the square-value arithmetic mean with respect to the audio input signal 101, and a signal strength output 106 is obtained. The smoothing unit 6 compares the signal strength output 106 from the signal strength calculation unit 5 with the counter current value at each signal strength calculation cycle t, and adjusts the counter current value according to the result to obtain a smoothed output 107. The comparator 7 compares the signal strength output 106 from the signal strength calculation unit 5 with the smoothed output 107 from the smoothing unit 6, and when the signal strength output 106 is larger than the smoothed output 107, 1 (ON);
When smaller, 0 (off) is output as the comparison result 108. The noise level calculator 8 calculates the comparison result 1 from the comparator 7.
When 08 is the 0 section, the signal strength output 106 from the signal strength calculation unit 5 is arithmetically averaged to obtain a background noise level 10
Updated as 9. At the time of one section, the immediately preceding background noise level calculation value is maintained without updating.

【0017】上記実施例の音声検出器は、音声信号が低
レベルでも正常に閾値適応をし、良好な音声検出特性を
維持する閾値適応型音声検出方式を採る。
The voice detector of the above-described embodiment employs a threshold adaptive voice detection system that performs threshold adaptation normally even when a voice signal is at a low level and maintains good voice detection characteristics.

【0018】信号強度算出部5は図2のように、まず2
乗器51でサンプリング周期ごとに音声入力信号101
の2乗値を算出する。つぎに信号強度算出周期tのブロ
ック区間内所定数N個のサンプルに対し、初期設定時
(電源立上げ直後)と出力ラッチ直後に出力値を0にリ
セットする累積加算器52で、2乗値と累積加算器52
の現在値とを加算する。さらに加算値のラッチ53出力
に対し乗算器54で定数1/Nを乗じ2乗値相加平均を
施し、信号強度出力106とする。
As shown in FIG. 2, the signal strength calculator 5
The voice input signal 101 is sampled by the multiplier 51 every sampling period.
Is calculated. Next, for a predetermined number N of samples in the block section of the signal strength calculation cycle t, the cumulative adder 52 resets the output value to 0 at the time of initial setting (immediately after power-on) and immediately after output latching. And the accumulator 52
And the current value of. Further, a multiplier 54 multiplies the output of the latch 53 of the added value by a constant 1 / N, and performs an arithmetic mean of square values to obtain a signal strength output 106.

【0019】平滑部6は図3のように、信号強度算出周
期tごとに、まず信号強度算出部5からの信号強度出力
106を比較器61でアップダウンカウンタ62の現在
値と比較し、信号強度出力106の方が大きいとき1
(オン)、小さいとき0(オフ)を比較結果113とし
て出力する。つぎにアップダウンカウンタ62で比較器
61からの比較結果113が1または0区間のとき、カ
ウンタ現在値を1だけ加算または減算し、比較器7への
平滑化出力107とする。
As shown in FIG. 3, the smoothing unit 6 compares the signal strength output 106 from the signal strength calculation unit 5 with the current value of the up / down counter 62 by the comparator 61 at every signal strength calculation period t. 1 when intensity output 106 is greater
(On), when it is small, 0 (Off) is output as the comparison result 113. Next, when the comparison result 113 from the comparator 61 in the up / down counter 62 is 1 or 0, the counter current value is added or subtracted by 1 to obtain a smoothed output 107 to the comparator 7.

【0020】図4(a)のように音声入力信号101の
平均レベルが極端に低いとき、まず図4(b)のように
音声入力信号101が無音から有音へ状態変化をする
と、信号強度算出部5の信号強度出力106は、増加し
平滑化出力107より大きくなる。平滑部6は、図4
(c)のように信号強度出力106とカウンタ現在値1
07との比較結果113を1とし、信号強度出力106
に等しくなるまで平滑化出力107を1ずつ増加し続け
る。有音から無音へ状態変化をすると、信号強度出力1
06は減小し、平滑化出力107より小さくなる。図4
(c)のように信号強度出力106とカウンタ現在値1
07との比較結果113を0とし、信号強度出力106
に等しくなるまで平滑化出力107を1ずつ減小し続け
る、信号強度算出周期t(平滑化出力107の更新周
期)を十分長く設定すれば、平滑化出力107を有音と
無音の状態変化に伴う音声信号強度の変化に比べ十分ゆ
るやかに変化させることができ、平滑化出力107を有
音と無音時音声信号強度の間の値にできる。また比較器
7は、信号強度出力106を平滑化出力107と比較
し、音声入力信号101が有音と無音状態のいずれかを
大まかに判定する。雑音レベル算出部8は、比較器7か
らの信号強度出力106と平滑化出力107との比較結
果が0区間(音声入力信号101が無音状態と判定され
た区間)のとき、背景雑音レベル109を算出する。雑
音レベル算出区間に有音区間を加えることが少なくな
り、図4(b)のように音声信号レベルが低いときで
も、背景雑音レベル算出値の誤差を少なくできる。つぎ
に閾値設定部9で雑音レベル算出値に適応し閾値110
を設定するから、図4(a)のように適応閾値110は
音声信号レベルの低い話頭や話尾部位を有音判定するの
に十分な低い値になる。従って低レベル有音/無音判定
結果102は、図4(e)のように有音区間を正しく有
音判定するようになる。低レベル有音/無音判定結果1
02と高レベル有音/無音判定結果103(図4(d)
参照)との論理和も図4(f)のように音声信号を正し
く検出した有音/無音判定結果104を得る。
When the average level of the audio input signal 101 is extremely low as shown in FIG. 4A, first, when the audio input signal 101 changes state from silence to speech as shown in FIG. The signal strength output 106 of the calculator 5 increases and becomes larger than the smoothed output 107. FIG.
As shown in (c), the signal strength output 106 and the counter current value 1
07 as 1 and the signal strength output 106
The smoothed output 107 continues to be increased by 1 until it becomes equal to When the state changes from sound to silence, signal strength output 1
06 decreases and becomes smaller than the smoothed output 107. FIG.
As shown in (c), the signal strength output 106 and the counter current value 1
07 and the signal strength output 106
If the signal intensity calculation cycle t (update cycle of the smoothed output 107) is set to be sufficiently long, the smoothed output 107 is changed to a state of sound or no sound. The change can be made sufficiently gently as compared with the accompanying change in the audio signal strength, and the smoothed output 107 can be set to a value between the sound signal intensity at the time of sound and at the time of no sound. Further, the comparator 7 compares the signal strength output 106 with the smoothed output 107, and roughly determines whether the audio input signal 101 is in a sound state or in a silent state. When the comparison result between the signal strength output 106 and the smoothed output 107 from the comparator 7 is in the 0 section (the section in which the voice input signal 101 is determined to be in a silent state), the noise level calculation section 8 calculates the background noise level 109. calculate. Addition of a sound section to the noise level calculation section is reduced, and the error in the background noise level calculation value can be reduced even when the audio signal level is low as shown in FIG. Next, the threshold setting unit 9 adjusts the noise level calculated value to the threshold value 110.
Therefore, as shown in FIG. 4A, the adaptive threshold value 110 is a sufficiently low value to determine whether the speech head or the tail part having a low audio signal level is sound. Therefore, in the low-level sound / non-speech determination result 102, a sound period is correctly determined as a sound as shown in FIG. Low level sound / silence judgment result 1
02 and high-level sound / silence determination result 103 (FIG. 4D)
4), a sound / silence determination result 104 in which an audio signal is correctly detected is obtained as shown in FIG.

【0021】なお上記実施例で平滑部6は図5のよう
に、第2の比較器63とセレクタ64とを設け、平滑部
6aとし、、まずアップダウンカウンタ62からの平滑
化出力107を第2の比較器63で予め決める定数Aと
比較し、平滑化出力107の方が大きいとき1(オ
ン)、小さいとき0(オフ)を比較結果115として出
力する。つぎにセレクタ64で第2の比較器63からの
比較結果115が1または0区間のとき、定数Aまたは
平滑化出力107を選択し、比較器7への選択平滑化出
力107aとしてもよい。有音継続時間の長い信号(F
AX送受信用モデム信号など)のとき、有音の間平滑化
出力107を増加し続けるから、平滑化出力107が信
号強度出力106に一致後の有音区間も背景雑音レベル
算出区間に取り込み、背景雑音レベル算出値に誤差を生
じる問題点を解消する効果がある。図6(a)のように
音声入力信号101が有音継続時間の長いとき、図6
(b)のように音声入力信号101が無音から有音へ状
態変化すると、信号強度算出部5の信号強度出力106
は、平滑化出力107より大きくなる。平滑部6aは、
図6cのように信号強度出力105とカウンタ現在値1
07との比較結果113を1とし、平滑化出力107を
1ずつ増加し始める。定数Aを越えるか否かで図6
(d)のように平滑化出力107と定数Aとの比較結果
115を0または1とし、選択平滑化出力107aとし
て図6(b)のように、平滑化出力107または定数A
を選択する。有音継続時間の長いときでも、定数Aが上
限値となり、選択平滑化出力107aは信号強度出力1
06を越えることはない。
In the above embodiment, as shown in FIG. 5, the smoothing section 6 is provided with a second comparator 63 and a selector 64 to form a smoothing section 6a . The second comparator 63 compares it with a predetermined constant A, and outputs 1 (ON) when the smoothed output 107 is larger, and outputs 0 (OFF) as the comparison result 115 when the smoothed output 107 is smaller. Next, when the comparison result 115 from the second comparator 63 is 1 or 0 in the selector 64, the constant A or the smoothed output 107 may be selected as the selected smoothed output 107a to the comparator 7. Signal with long sound duration (F
AX transmission / reception modem signal, etc.), the smoothed output 107 continues to increase during a sound, so that a sound section after the smoothed output 107 matches the signal strength output 106 is also included in the background noise level calculation section, and the background noise level is calculated. This has the effect of solving the problem of causing an error in the noise level calculation value. When the voice input signal 101 has a long sound duration as shown in FIG.
When the state of the audio input signal 101 changes from silence to sound as shown in FIG.
Is larger than the smoothed output 107. The smoothing part 6a
As shown in FIG. 6c, the signal strength output 105 and the counter current value 1
The comparison result 113 with 07 is set to 1, and the smoothed output 107 starts to be increased by one. FIG. 6 shows whether the constant A is exceeded or not.
As shown in FIG. 6D, the comparison result 115 between the smoothed output 107 and the constant A is set to 0 or 1, and as the selected smoothed output 107a, as shown in FIG.
Select Even when the sound duration is long, the constant A becomes the upper limit value, and the selected smoothed output 107a becomes the signal intensity output 1
06 will not be exceeded.

【0022】また上記実施例で平滑部6は図7のよう
に、第1、第2および第3の比較器61a、61bおよ
び61cと、アップダウン62aと、論理和演算器65
と、第1および第2の乗算器66および67とを備える
平滑部6bとしてもよい、上記図5と同じ効果がある。
信号強度算出周期tごとに、まず信号強度算出部5から
の信号強度出力106を第1と第2と第3の各比較器6
1aと61bと61cで、それぞれカウンタ現在値10
7b、カウンタ現在値107bと予め決める定数α(α
>1)との乗算結果118およびカウンタ現在値107
bと予め決める定数β(0<β<1)との乗算結果11
9と比較する。第1の比較器61aは、信号強度出力1
06がカウンタ現在値107bより大きいとき1(オ
ン)、小さいとき0(オフ)を、信号強度出力106と
カウンタ現在値107bとの比較結果120として出力
する。第2の比較器61bは、信号強度出力106が第
1の乗算結果118より大きいとき1(オン)、小さい
とき0(オフ)を、信号強度出力106と第1の乗算結
果118との比較結果121として出力する。第3の比
較器61cは、信号強度出力106が第2の乗算結果よ
り大きいとき0(オフ)、小さいとき1(オン)を、信
号強度出力106と第2の乗算結果119との比較結果
122として出力する。つぎに第2と第3の比較器61
bと61cからの比較結果121と122とに対し論理
和演算器65で、論理和演算を施し、信号強度判定結果
123として出力する。さらにアップダウンカウンタ6
2aで、論理和演算器65からの信号強度判定結果12
3が0の場合、カウンタ現在値107bを前値保持とす
る。1の場合、第1の比較器61aからの比較結果12
0が1のときはカウンタ現在値107bを1だけ加算
し、0のときはカウンタ現在値107bを1だけ減算
し、判定平滑化出力107bとする。図8(a)のよう
に音声入力信号101が有音継続時間の長いとき、図8
(b)のように音声入力信号101が無音から有音へ状
態変化をすると、信号強度算出部5の信号強度出力10
6は、判定平滑化出力107bより大きくなる。平滑部
6bは、図8(c)、(d)および(f)のように信号
強度出力106とカウンタ現在値107bとの比較結果
120、信号強度出力106と第1の乗算結果118と
の比較結果121および信号強度判定結果123をそれ
ぞれ1とし、判定平滑化出力107bを1ずつ増加し始
める。信号強度出力106が第1の乗算結果118に等
しくなると、図8(d)、(e)及び(f)のように比
較結果121、比較結果122および判定結果123を
それぞれ0とし、判定平滑化出力107bとして図8
(b)のように、前値保持を続ける。有音から無音へ状
態変化をすると、信号強度算出部5の信号強度出力10
6は、判定平滑化出力107bより小さくなる。平滑部
6bは、図8(c)、(e)及び(f)のように信号強
度出力106とカウンタ現在値107bとの比較結果1
20、信号強度出力106と第2の乗算結果119との
比較結果122および信号強度判定結果123をそれぞ
れ0、1および1とし、判定平滑化出力107bは1ず
つ減小し始める。信号強度出力106が第2の乗算結果
119に等しくなると、図8(d)、(e)および
(f)のように比較結果121、比較結果122および
判定結果123をそれぞれ0とし、判定平滑化出力10
7bとして図8(b)のように、前値保持を続ける。有
音継続時間の長いときでも、第1の乗算結果118が上
限値、第2の乗算結果119が下限値となり、判定平滑
化出力107bは有音と無音時信号強度の間の値をとる
ように制御される。
In the above embodiment, as shown in FIG. 7, the smoothing unit 6 includes first, second and third comparators 61a, 61b and 61c, an up-down unit 62a, and a logical sum operation unit 65.
And a smoothing unit 6b including first and second multipliers 66 and 67, which has the same effect as in FIG.
At each signal strength calculation period t, first, the signal strength output 106 from the signal strength calculation unit 5 is output to the first, second, and third comparators 6.
At 1a, 61b and 61c, the counter current value is 10 respectively.
7b, a counter current value 107b and a predetermined constant α (α
> 1) and the current counter value 107
multiplication result 11 of b and a predetermined constant β (0 <β <1)
Compare with 9. The first comparator 61a outputs the signal strength output 1
When 06 is larger than the current counter value 107b, 1 (ON) is output, and when 0 is smaller, 0 (OFF) is output as a comparison result 120 between the signal strength output 106 and the current counter value 107b. The second comparator 61b determines 1 (on) when the signal strength output 106 is larger than the first multiplication result 118 , and 0 (off) when the signal strength output 106 is smaller than the first multiplication result 118. The comparison result between the signal strength output 106 and the first multiplication result 118 Output as 121. The third comparator 61c determines 0 (off) when the signal strength output 106 is larger than the second multiplication result, and 1 (on) when the signal strength output 106 is smaller than the second multiplication result. The comparison result 122 between the signal strength output 106 and the second multiplication result 119 Output as Next, the second and third comparators 61
The logical sum operation unit 65 performs a logical sum operation on the comparison results 121 and 122 from b and 61c, and outputs the result as a signal strength determination result 123. Up / down counter 6
2a, the signal strength determination result 12 from the logical sum operator 65
When 3 is 0, the current counter value 107b is held as the previous value. In the case of 1, the comparison result 12 from the first comparator 61a
When 0 is 1, the counter current value 107b is incremented by 1; when it is 0, the counter current value 107b is decremented by 1 to obtain a decision smoothed output 107b. When the voice input signal 101 has a long sound duration as shown in FIG.
When the state of the audio input signal 101 changes from silence to sound as shown in (b), the signal intensity output 10
6 is larger than the judgment smoothed output 107b. The smoothing unit 6b compares the signal strength output 106 with the current counter value 107b 120 and compares the signal strength output 106 with the first multiplication result 118 as shown in FIGS. 8C, 8D and 8F. The result 121 and the signal strength determination result 123 are each set to 1, and the determination smoothed output 107b starts to increase by one. When the signal strength output 106 becomes equal to the first multiplication result 118, the comparison result 121, the comparison result 122, and the judgment result 123 are set to 0 as shown in FIGS. 8D, 8E, and 8F, and the judgment smoothing is performed. 8 as the output 107b.
As shown in (b), the previous value is maintained. When the state changes from sound to silence, the signal strength output 10
6 is smaller than the decision smoothing output 107b. As shown in FIGS. 8C, 8E, and 8F, the smoothing unit 6b compares the signal strength output 106 with the counter current value 107b.
20, the comparison result 122 between the signal strength output 106 and the second multiplication result 119 and the signal strength determination result 123 are set to 0, 1, and 1, respectively, and the determination smoothed output 107b starts to decrease by one. When the signal strength output 106 is equal to the second multiplication result 119, the comparison result 121, the comparison result 122, and the judgment result 123 are set to 0 as shown in FIGS. 8D, 8E, and 8F, and the judgment smoothing is performed. Output 10
As shown in FIG. 8B, the previous value is maintained as 7b. Even when the sound duration is long, the first multiplication result 118 becomes the upper limit value and the second multiplication result 119 becomes the lower limit value, and the judgment smoothed output 107b takes a value between the sound intensity and the signal intensity at the time of no sound. Is controlled.

【0023】また上記実施例で平滑部6として、図9の
ように第1〜3の加算器600と601と602、第1
〜4の遅延素子611と612と621と622および
第1〜5の乗算器630と631と632と641と6
42を備える低域通過フィルタを設けてもよい。上記図
5と同じ効果がある。図9でサンプリング間隔を信号強
度算出周期t、時刻(k×t、k=0、±1、±2、
…)時の入力と出力信号をXk とYk とすると、たとえ
ばb n =0の場合、次のとおり移動平均フィルタを形成
する。 Yk =Σnnk-n (n=0〜N N:タップ数) =1/N+1 Σnk-n (an =1/N+1の場合) 入力信号Xk としての信号強度出力106に対し信号強
度算出周期tのブロック区間内でフィルタリング演算を
施すから、出力信号Yk としての低域通過平滑化出力1
07cは、移動平均時間幅(N+1)×tのブロック区
間内入力サンプルの2乗値相加平均となる。移動平均時
間幅(N+1)×tを信号強度算出ブロック時間幅tに
比べ十分広くなるようにNを設定すれば、移動平均時間
幅内に有音/無音とも含み、低域通過平滑出力107
cは有音時音声レベル無音時背景雑音レベル間の値を
とるようになる。
In the above embodiment, the first to third adders 600, 601 and 602, as shown in FIG.
To 4 delay elements 611, 612, 621, and 622 and first to fifth multipliers 630, 631, 632, 641, and 6
A low-pass filter comprising 42 may be provided. There is the same effect as in FIG. In FIG. 9, the sampling interval is set to the signal strength calculation cycle t, time (k × t, k = 0, ± 1, ± 2,
If the input and output signal when ...) and X k and Y k, if
For example, if b n = 0, a moving average filter is formed as follows. To: (number of taps n = 0~N N) = 1 / N + 1 Σ n X kn (a n = 1 / N + 1 if) the signal intensity output 106 as an input signal X k Y k = Σ n a n X kn since performing a filtering operation in the block section of the signal strength calculation cycle t, the low-pass smoothing output as an output signal Y k 1
07c is the squared arithmetic mean of the input samples in the block section of the moving average time width (N + 1) × t. If the moving average time width (N + 1) × t a signal strength calculation block time setting the N to be sufficiently wider than the width t, also include a voiced / silent to the moving average time in bandwidth, low-pass smoothing output 107
c takes a value between the sound level at the time of speech and the background noise level at the time of silence.

【0024】また上記実施例で比較器7に出力保持手段
を設け比較器7dとし、信号強度出力106と平滑化出
力107との比較結果108が1から0へ状態変化をす
ると、所定時間t1を経過する時までは出力を1に保持
し、0から1へ状態変化をする時までは出力を0に保持
するように制御してもよい。雑音レベル算出部8で低レ
ベルの音声区間(語尾部位など)を背景雑音レベルの算
出区間に加えることを防ぐ効果がある。図10(a)の
ように音声入力信号101の平均レベルが極端に低いと
き、まず図10(b)のように音声入力信号101が無
音から有音へ状態変化をすると、信号強度算出部5の信
号強度出力106は、増加し平滑化出力107より大き
くなる。平滑部6は、信号強度出力106に等しくなる
まで平滑化出力107を1ずつ増加し続ける。比較器7
は、図10(c)のように信号強度出力106と平滑化
出力107との比較結果108を1とする。有音から無
音へ状態変化をすると、信号強度出力106減小し、
平滑化出力107より小さくなる。信号強度出力106
に等しくなるまで平滑化出力107を1ずつ減小し続け
る。信号強度出力106と平滑化出力107との比較結
果108を0とする。図10(c)のように比較結果1
08が1から0へ状態変化をすると、所定時間t1 を経
過する時までは、図10(d)のように保持機能付加後
の信号強度出力106と平滑化出力107との比較結果
108aを1とし、比較結果108が0から1へ状態変
化をする時までは、比較結果108aを0とする。従っ
て図10(c)のように比較結果108の0区間をその
まま背景雑音レベル算出区間とすると、低レベルの音声
区間をも背景雑音レベル算出区間に加えることになる
が、図10(d)のように比較結果108aの0区間を
背景雑音レベル算出区間とすれば防げる。
In the above-described embodiment, the output holding means is provided in the comparator 7 to form a comparator 7d. When the comparison result 108 of the signal strength output 106 and the smoothed output 107 changes from 1 to 0, the predetermined time t1 is reduced. Control may be performed such that the output is held at 1 until the time elapses and the output is held at 0 until the state changes from 0 to 1. This has the effect of preventing the noise level calculation unit 8 from adding a low-level voice section (such as an end part) to the background noise level calculation section. When the average level of the audio input signal 101 is extremely low as shown in FIG. 10A, first, when the state of the audio input signal 101 changes from silence to speech as shown in FIG. Signal strength output 106 increases and becomes larger than the smoothed output 107. The smoothing unit 6 keeps increasing the smoothed output 107 by one until it becomes equal to the signal strength output 106. Comparator 7
Sets the comparison result 108 between the signal strength output 106 and the smoothed output 107 to 1 as shown in FIG. When the state changes from the voiced to the silence, the signal strength output 106 is reduced small,
It becomes smaller than the smoothed output 107. Signal strength output 106
The smoothed output 107 is continuously reduced by 1 until the value becomes equal to. The comparison result 108 between the signal strength output 106 and the smoothed output 107 is set to 0. As shown in FIG.
If 08 is a state change from 1 to 0, until when a predetermined time elapses t 1, the comparison result 108a of the signal strength output 106 and the smooth output 107 after holding additional function as shown in FIG. 10 (d) The comparison result 108a is set to 1 until the state of the comparison result 108 changes from 0 to 1. Therefore, assuming that the 0 section of the comparison result 108 is the background noise level calculation section as it is as shown in FIG. 10C, a low-level speech section is also added to the background noise level calculation section. As described above, this can be prevented by setting the 0 section of the comparison result 108a as the background noise level calculation section.

【0025】また上記実施例で高レベル検出部2は、所
定閾値111の代わりに閾値設定部9で背景雑音レベル
に適応する閾値を用いてもよい。また信号強度算出部5
は、2乗値加算平均値の代わりに絶対値加算平均値また
はピーク値を信号強度出力106としてもよい。また平
滑部6は、平滑化出力107を1ずつではなく一定量ず
つ増加/減小してもよい。増加/減小時で一定量ではな
く異なる値をとってもよい。
In the above embodiment, the high level detector 2 may use a threshold adapted to the background noise level in the threshold setting unit 9 instead of the predetermined threshold 111. In addition, the signal strength calculator 5
The signal strength output 106 may use an absolute value average value or a peak value instead of the square value average value. Further, the smoothing unit 6 may increase / decrease the smoothed output 107 by a fixed amount instead of by one. When increasing / decreasing, a different value may be used instead of a fixed amount.

【0026】以上のようにこの一実施例では、まず音声
入力信号の低レベルおよび高レベルをそれぞれ適応閾値
および所定閾値と比較し、有音/無音判定結果に対し論
理和演算とハングオーバ付加処理を施し音声検出出力信
号とする。つぎに音声入力信 号の信号強度算出周期ブロ
ック区間内所定数サンプルに対し、たとえば2乗値相加
平均を施す信号強度出力とカウンタ現在値との比較結果
でカウンタ現在値を加減し平滑化出力とする。または平
滑化出力と予め決める定数との比較結果で平滑化出力と
定数とのいずれかを選択し出力とする。または前記信号
強度出力とカウンタ現在値、第1の乗算結果(カウンタ
現在値と予め決める第1の定数との乗算結果)および第
2の乗算結果(カウンタ現在値と予め決める第2の定数
との乗算結果)との第1、第2および第3の比較結果に
従い、第2と第3の比較結果に論理和演算を施す信号強
度判定結果と第1の比較結果との組合せでカウンタ現在
値を加減または前値保持し出力する。または信号強度算
出周期ごとに入力する前記信号強度出力に対しフィルタ
リング演算を施し移動平均時間幅のブロック区間内で信
号強度を平滑化し出力する。さらに前記信号強度出力と
平滑化出力との比較結果でまたはその状態変化で出力保
持機能を制御し、信号強度出力に対し相加平均を施して
更新するか、しないで直前値を維持する背景雑音レベル
に適応し閾値を設定する。
As described above, in this embodiment, first,
Adaptive threshold for low and high levels of input signal
And a predetermined threshold value, and discuss the sound / non-speech judgment result.
Performs a logical sum operation and hangover addition processing to output a voice detection output signal.
No. Then the signal strength calculation cycle Bro audio input signal
For a given number of samples in the
Comparison result between the signal strength output to be averaged and the current counter value
To add or subtract the current value of the counter to obtain a smoothed output. Or flat
The smoothed output is calculated based on the result of comparing the smoothed output with a predetermined constant.
Select one of constants and output. Or the signal
Intensity output, counter current value, first multiplication result (counter
Multiplication result of current value and first predetermined constant) and
Multiplication result of 2 (counter current value and second constant determined in advance
And the first, second and third comparison results with
Accordingly, the signal strength for performing a logical sum operation on the second and third comparison results
The counter is determined by the combination of the degree judgment result and the first comparison result.
Adds, subtracts, or retains the previous value and outputs it. Or signal strength calculation
A filter for the signal strength output input every output cycle
The ring operation is performed and the signal is transmitted within the block section of the moving average time width.
The signal intensity is smoothed and output. Further, the signal strength output and
Output is held as a result of comparison with the smoothed output or
Control and maintain the signal strength output by arithmetic averaging.
Background noise level to keep the previous value without updating
And set a threshold.

【0027】[0027]

【発明の効果】以上のようなこの発明の音声検出器で
は、 雑音レベル算出部は、音声入力信号の所定区間毎
に信号強度を算出し、この信号強度と、先に入力され、
平滑化された音声入力信号の信号強度と比較して背景雑
音レベルを定め、この背景雑音レベルに適応した適応閾
値を閾値設定部が算出し出力するので、音声信号が低レ
ベルでも雑音レベルの算出値が誤って上昇するのを防ぐ
ことができ、正常に閾値適応し、良好な音声検出特性を
維持することができる。
As described above, in the speech detector according to the present invention, the noise level calculation unit performs the processing for each predetermined section of the speech input signal.
, Calculate the signal strength, and this signal strength is input first,
Compared with the signal strength of the smoothed audio input signal,
Determines the sound level and an adaptive threshold adapted to this background noise level
Since the threshold setting unit calculates and outputs the value, the audio signal is low level.
Prevents the noise level calculation value from rising accidentally even at the bell
Threshold adaptation can be performed normally, and good voice detection characteristics can be maintained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明を示す一実施例の音声検出器の機能
ブロック図。
FIG. 1 is a functional block diagram of a voice detector according to an embodiment of the present invention.

【図2】 図1に示す信号強度算出部の機能ブロック
図。
FIG. 2 is a functional block diagram of a signal strength calculator shown in FIG. 1;

【図3】 図1に示す平滑部の機能ブロック図。FIG. 3 is a functional block diagram of a smoothing unit shown in FIG. 1;

【図4】 図1に示す音声検出器の動作を説明する図。FIG. 4 is a view for explaining the operation of the voice detector shown in FIG. 1;

【図5】 図1に示す平滑部の他の一実施例の機能ブロ
ック図。
FIG. 5 is a functional block diagram of another embodiment of the smoothing unit shown in FIG. 1;

【図6】 図5に示す平滑部の動作を説明する図。FIG. 6 is a view for explaining the operation of the smoothing unit shown in FIG. 5;

【図7】 図1に示す平滑部の他の一実施例の機能ブロ
ック図。
FIG. 7 is a functional block diagram of another embodiment of the smoothing unit shown in FIG. 1;

【図8】 図7に示す平滑部の動作を説明する図。FIG. 8 is a view for explaining the operation of the smoothing unit shown in FIG. 7;

【図9】 図1に示す平滑部として用いる低域通過フィ
ルタを説明する図。
FIG. 9 is a diagram illustrating a low-pass filter used as a smoothing unit shown in FIG. 1;

【図10】 図1に示す比較器に付加する出力保持機能
を説明する図。
FIG. 10 is a view for explaining an output holding function added to the comparator shown in FIG. 1;

【図11】 従来例の音声検出器の機能ブロック図。FIG. 11 is a functional block diagram of a conventional voice detector.

【図12】 図11に示す低レベル検出部の機能ブロッ
ク図。
FIG. 12 is a functional block diagram of a low-level detection unit shown in FIG. 11;

【図13】 図11に示す高レベル検出部の機能ブロッ
ク図。
FIG. 13 is a functional block diagram of a high-level detection unit shown in FIG. 11;

【図14】 図11に示す音声検出器の動作を説明する
図。
FIG. 14 is a view for explaining the operation of the voice detector shown in FIG. 11;

【符号の説明】[Explanation of symbols]

1 低レベル検出部、2 高レベル検出部、3 論理和
演算器、4 ハングオーバ付加部、5 信号強度算出
部、6 平滑部、7 比較器、8 雑音レベル算出部、
9 閾値設定部、101 音声入力信号、102 低レ
ベル有音/無音判定結果、103 高レベル有音/無音
判定結果、104 有音/無音判定結果、105 音声
検出出力信号、106 信号強度出力、107 平滑化
出力、108 信号強度出力と平滑化出力との比較結
果、109 背景雑音レベル、110適応閾値、111
所定閾値、112 定数1/N。
1 low level detection section, 2 high level detection section, 3 OR operation section, 4 hangover addition section, 5 signal strength calculation section, 6 smoothing section, 7 comparator, 8 noise level calculation section,
9 Threshold setting unit, 101 voice input signal, 102 low-level voice / non-voice determination result, 103 high-level voice / non-voice determination result, 104 voice / non-voice determination result, 105 voice detection output signal, 106 signal strength output, 107 Smoothed output, 108 comparison result between signal strength output and smoothed output, 109 background noise level, 110 adaptive threshold, 111
Predetermined threshold, 112 constant 1 / N.

フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 G10L 9/00 Continuation of the front page (58) Field surveyed (Int. Cl. 6 , DB name) G10L 3/00 G10L 9/00

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 低レベル検出器、高レベル検出器、論理
和演算部、ハングオーバー付加部、信号強度算出部、平
滑部、比較器、雑音レベル算出部、閾値設定部を備える
音声検出器であって、 低レベル検出器は、音声入力信号を閾値設定部からの適
応閾値と比較して低レベル有音/無音判定結果を出力
し、 高レベル検出部は、音声入力信号を所定閾値または閾値
設定部からの適応閾値と比較して高レベル有音/無音判
定結果を出力し、 論理和演算部は、低レベル有音/無音判定結果と高レベ
ル有音/無音判定結果の論理和演算を施して有音/無音
判定結果を出力し、 ハングオーバー付加部は、有音/無音判定結果にハング
オーバー付加処理を施して音声検出出力信号とし、 信号強度算出部は、所定区間毎の音声入力信号の信号強
度を算出し信号強度出力として出力し、 平滑部は、信号強度算出部からの信号強度出力を平滑化
し、 比較器は、信号強度出力と平滑化出力を比較し比較結果
を出力し、 雑音レベル算出部は、比較器の比較結果により信号強度
出力が平滑化出力より小さい時は、信号強度出力に対し
相加平均を施して背景雑音レベルとして出力し、信号強
度出力が平滑化出力より大きい時は、直前に出力した値
を背景雑音レベルとして出力し、 閾値設定部は背景雑音レベルに適応した適応閾値を算出
し出力する 音声検出器。
1. Low level detector, high level detector, logic
Sum calculation unit, hangover addition unit, signal strength calculation unit, flat
Smooth section, comparator, noise level calculation section, threshold setting section
The low-level detector detects an audio input signal from a threshold setting unit.
Outputs low-level sound / no-sound judgment result in comparison with response threshold
The high-level detection unit detects the audio input signal as a predetermined threshold or a threshold.
High level sound / silence judgment compared to the adaptive threshold from the setting unit
The logical sum operation unit outputs a low level sound / non-speech judgment result and a high level
Performs a logical OR operation on the voiced / silent judgment result to generate voiced / silent
The judgment result is output, and the hangover adding unit hangs on the sound / silence judgment result.
An over-addition process is performed to generate a voice detection output signal, and the signal strength calculation unit determines the signal strength of the voice input signal for each predetermined section.
Calculates the degree and outputs it as a signal strength output, and the smoothing unit smoothes the signal strength output from the signal strength calculation unit
The comparator compares the signal strength output with the smoothed output and
And the noise level calculator calculates the signal strength based on the comparison result of the comparator.
When the output is smaller than the smoothed output,
Apply arithmetic averaging and output as background noise level, signal strength
If the degree output is larger than the smoothed output, the value output immediately before
Is output as a background noise level, and the threshold setting unit calculates an adaptive threshold value adapted to the background noise level.
Output sound detector.
【請求項2】 平滑部は、平滑部比較器、アップダウン
カウンタを備え、 平滑部比較器は、信号強度出力とアップダウンカウンタ
の出力とを比較して比較結果を出力し、 アップダウンカウンタは、平滑部比較器の比較結果によ
り信号強度出力が平滑化出力より小さい時は、カウンタ
現在値を減算し、信号強度出力が平滑化出力より大きい
時は、カウンタ現在値を加算して平滑化出力とする 請求
項1記載の音声検出器。
2. The smoothing section includes a smoothing section comparator, and an up-down converter.
It has a counter, a smoothing unit comparator, a signal strength output and an up-down counter.
The up / down counter outputs the result of comparison by the smoothing unit comparator.
If the signal strength output is smaller than the smoothed output,
Subtract current value and signal strength output is greater than smoothed output
2. The voice detector according to claim 1 , wherein at the time, the current value of the counter is added to obtain a smoothed output .
【請求項3】 平滑部は、平滑部第1比較器、アップダ
ウンカウンタ、平滑部第2比較器、セレクタを備え、 平滑部第1比較器は、信号強度出力とアップダウンカウ
ンタの出力とを比較して比較結果を出力し、 アップダウンカウンタは、平滑部第1比較器の比較結果
により信号強度出力が平滑化出力より小さい時は、カウ
ンタ現在値を減算し、信号強度出力が平滑化出力より大
きい時は、カウンタ現在値を加算して出力し、 平滑部第2比較器は、アップダウンカウンタの出力と定
数Aを比較して比較結果を出力し、 セレクタは、平滑部第2比較器の比較結果に従いアップ
ダウンカウンタの出力もしくは定数Aを平滑化出力とす
請求項1記載の音声検出器。
3. The smoothing unit includes a smoothing unit first comparator and an up-converter.
A smoothing unit second comparator and a selector. The smoothing unit first comparator has a signal strength output and an up / down counter.
The up / down counter outputs the comparison result of the smoothing unit first comparator.
When the signal strength output is smaller than the smoothed output,
Subtracts the current signal value and the signal strength output is greater than the smoothed output.
When the threshold is high, the counter current value is added and output, and the second comparator of the smoothing unit determines the output of the up / down counter as constant.
The number A is compared and the comparison result is output, and the selector is increased according to the comparison result of the smoothing unit second comparator.
The output of the down counter or the constant A is used as the smoothed output.
Speech detector according to claim 1, wherein that.
【請求項4】 平滑部は、第1乗算器、第2乗算器、平
滑部第1比較器、平滑部第2比較器、平滑部第3比較
器、論理和演算器、アップダウンカウンタを備え、 第1乗算器は、定数αとアップダウンカウンタの出力と
を乗算して上限値を算出し、 第2乗算器は、定数βとアップダウンカウンタの出力と
を乗算して下限値を算出し、 平滑部第1比較器は、信号強度出力とアップダウンカウ
ンタの出力とを比較して比較結果を出力し、 平滑部第2比較器は、信号強度出力と第1乗算器の出力
とを比較して比較結果を出力し、 平滑部第3比較器は、信号強度出力と第2乗算器の出力
とを比較して比較結果を出力し、 論理和演算器は、平滑部第2比較器と平滑部第3比較器
の比較結果の論理和演算を施し、信号強度が所定範囲内
か否かを判定結果として出力し、 アップダウンカウンタは、論理和演算器の判定結果が所
定範囲内のときは現在値を保持し、所定範囲外のとき
は、平滑部第1比較器の比較結果により、信号強度出力
がアップダウンカウンタの出力より小さい時は、カウン
タ現在値を減算し 、信号強度出力がアップダウンカウン
タの出力より大きい時は、カウンタ現在値を加算して平
滑化出力とする 請求項1記載の音声検出器。
4. The smoothing unit includes a first multiplier, a second multiplier, and a flat multiplier.
Smooth part first comparator, smoothing part second comparator, smoothing part third comparison
, An OR operation unit, and an up / down counter, and the first multiplier has a constant α and an output of the up / down counter.
And the second multiplier calculates the upper limit by multiplying the constant β by the output of the up / down counter.
To calculate the lower limit, and the smoothing unit first comparator compares the signal strength output with the up / down count.
The smoothing unit second comparator compares the signal strength output with the output of the first multiplier.
And outputs a comparison result, and the smoothing unit third comparator outputs the signal strength output and the output of the second multiplier.
And a comparison result is output, and the OR operation unit includes a smoothing unit second comparator and a smoothing unit third comparator
OR operation of the comparison result of
Is output as a determination result, and the up / down counter indicates that the determination result of the OR
When the current value is within the specified range, the current value is held.
Is a signal strength output based on the comparison result of the smoothing unit first comparator.
Is smaller than the output of the up / down counter,
The current value is subtracted, and the signal strength output is
If the output of the counter is larger than the
2. The sound detector according to claim 1, wherein the sound output is a smoothed output .
【請求項5】 平滑部は、移動平均フィルタを形成する
低域通過フィルタを備え、信号強度出力から平滑化出力
を算出し出力する請求項1記載の音声検出器。
5. The smoothing unit forms a moving average filter.
Equipped with low-pass filter, smoothed output from signal strength output
The voice detector according to claim 1, wherein the voice detector calculates and outputs the following .
【請求項6】 比較器は、その比較結果が変化しても一
定時間直前の比較結果を保持して出力する請求項1乃至
5の何れかに記載の音声検出器。
6. The comparator according to claim 1 , wherein said comparison result changes.
4. The method according to claim 1, wherein the comparison result immediately before the fixed time is held and output.
6. The voice detector according to any one of 5 .
JP5328158A 1993-12-24 1993-12-24 Voice detector Expired - Lifetime JP2897628B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5328158A JP2897628B2 (en) 1993-12-24 1993-12-24 Voice detector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5328158A JP2897628B2 (en) 1993-12-24 1993-12-24 Voice detector

Publications (2)

Publication Number Publication Date
JPH07181991A JPH07181991A (en) 1995-07-21
JP2897628B2 true JP2897628B2 (en) 1999-05-31

Family

ID=18207139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5328158A Expired - Lifetime JP2897628B2 (en) 1993-12-24 1993-12-24 Voice detector

Country Status (1)

Country Link
JP (1) JP2897628B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6983242B1 (en) * 2000-08-21 2006-01-03 Mindspeed Technologies, Inc. Method for robust classification in speech coding
FR2825826B1 (en) * 2001-06-11 2003-09-12 Cit Alcatel METHOD FOR DETECTING VOICE ACTIVITY IN A SIGNAL, AND ENCODER OF VOICE SIGNAL INCLUDING A DEVICE FOR IMPLEMENTING THIS PROCESS
GB0703275D0 (en) * 2007-02-20 2007-03-28 Skype Ltd Method of estimating noise levels in a communication system
JP5333307B2 (en) * 2010-03-19 2013-11-06 沖電気工業株式会社 Noise estimation method and noise estimator

Also Published As

Publication number Publication date
JPH07181991A (en) 1995-07-21

Similar Documents

Publication Publication Date Title
KR100335162B1 (en) Noise reduction method of noise signal and noise section detection method
JP4279357B2 (en) Apparatus and method for reducing noise, particularly in hearing aids
US6038532A (en) Signal processing device for cancelling noise in a signal
JP4236726B2 (en) Voice activity detection method and voice activity detection apparatus
CA2638265C (en) Noise reduction with integrated tonal noise reduction
US7171357B2 (en) Voice-activity detection using energy ratios and periodicity
US6023674A (en) Non-parametric voice activity detection
US6360199B1 (en) Speech coding rate selector and speech coding apparatus
WO1999067774A1 (en) A noise suppressor having weighted gain smoothing
US6298139B1 (en) Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
JP2006189907A (en) Method of detecting voice activity of signal and voice signal coder including device for implementing method
KR930007298B1 (en) Circuit for detecting and suppressing pulse shaped interferences
EP0571079B1 (en) Discriminating and suppressing incoming signal noise
US5507037A (en) Apparatus and method for discriminating signal noise from saturated signals and from high amplitude signals
EP1279163A1 (en) Speech presence measurement detection techniques
AU721270B2 (en) Noise reduction apparatus and noise reduction method
JP2897628B2 (en) Voice detector
US8243955B2 (en) System for attenuating noise in an input signal
JP2001159899A (en) Noise suppressor
JP2009147701A (en) Amplitude control apparatus, mobile telephone device, and amplitude limiting method
CN114466285B (en) Method, device, equipment and storage medium for adjusting loudness of audio signal
JP2009147702A (en) Device for estimating noise level, receiving speech volume controller, portable telephone device and method for estimating noise level
JP2002140100A (en) Noise suppressing device
JP4204828B2 (en) Automatic gain control device, automatic gain control method, and automatic gain control program
JP3588555B2 (en) Method and apparatus for automatically adjusting sound level

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080312

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090312

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100312

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100312

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110312

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110312

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120312

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140312

Year of fee payment: 15

EXPY Cancellation because of completion of term