JPS62294296A - Voice detector - Google Patents

Voice detector

Info

Publication number
JPS62294296A
JPS62294296A JP61138596A JP13859686A JPS62294296A JP S62294296 A JPS62294296 A JP S62294296A JP 61138596 A JP61138596 A JP 61138596A JP 13859686 A JP13859686 A JP 13859686A JP S62294296 A JPS62294296 A JP S62294296A
Authority
JP
Japan
Prior art keywords
value
amplitude
noise
minimum
calculates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61138596A
Other languages
Japanese (ja)
Inventor
茨木 悟
博基 古川
博之 直野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61138596A priority Critical patent/JPS62294296A/en
Publication of JPS62294296A publication Critical patent/JPS62294296A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 3、発明の詳細な説明 産業上の利用分野 本発明は音声伝送装置、音声認識装置に使用する、雑音
の混入した信号から音声信号区間全正確に検出する音声
伝送装置番で関するものである。
[Detailed Description of the Invention] 3. Detailed Description of the Invention Industrial Application Field The present invention is a voice transmission device for accurately detecting all voice signal sections from a signal mixed with noise, which is used in voice transmission devices and voice recognition devices. This is related to the number.

従来の技術 近年、スピーカホン、テレコンファレンスシステムの普
及が目ざましく、これらの装置で;はハウリングの防止
および室内属音の除去のためにボイススイッチが使用さ
れている。また音声伝送のディジタル化も進んでおり、
無音声区間と音声区間全判別し、音声区間のみの信号を
伝送し伝送効率を向上する研究開発も行なわれている。
2. Description of the Related Art In recent years, speakerphones and teleconference systems have become widespread, and voice switches are used in these devices to prevent howling and eliminate indoor sounds. Furthermore, digitalization of audio transmission is progressing.
Research and development is also being conducted to improve transmission efficiency by distinguishing between non-voice sections and all voice sections, and transmitting signals only for the voice sections.

さら(で、人間の音声で種々の機器をコントロールする
音声認識技術も急速に進歩している。
Furthermore, voice recognition technology, which uses human voice to control various devices, is rapidly progressing.

これらの装置の性能向上のために、雑音による誤動作の
無い音声検出装置が強く要望されている。
In order to improve the performance of these devices, there is a strong demand for a voice detection device that does not malfunction due to noise.

この音声認識装置の従来の技術としては、例えば、電子
通信学会論文誌、Vol、J63−人。
As a conventional technique of this speech recognition device, for example, the Journal of the Institute of Electronics and Communication Engineers, Vol. J63-Jin.

陥7. P、P、 159−176 (1980) 、
電子通信学会技術研究報告、CAS84−238゜P、
P、 71−78 (1984) 、岩通技報、 Vo
l。
Fall 7. P, P, 159-176 (1980),
Institute of Electronics and Communication Engineers Technical Research Report, CAS84-238゜P,
P, 71-78 (1984), Iwatsu Giho, Vo
l.

201嵐i、p、p、18−21  (1981)に示
されているような、雑音による誤動作を経減した音声検
出装置がある。
201 Arashi i, p, p, 18-21 (1981), there is a voice detection device that reduces malfunctions caused by noise.

以下、図面を参照しながら、上述した従来の音声検出装
置について説明を行う。
Hereinafter, the above-mentioned conventional voice detection device will be explained with reference to the drawings.

第7図は従来の音声検出装置のブロック図を示すもので
ある。第7図において、71は信号の入力端子、72は
この信号を整流する整流回路、73は立ち上がりの時定
数が短く、立ち下がりの時定数の長い極大値ホールド回
路、74は立ち下がりの時定数が短く、立ち上が9の時
定数の長い極小値ホールド回路、76はこの極小値ホー
ルド回路74の出力信号からしきい値信号全算出するし
きい値設定回路、76はこのしきい値信号と極大値ホー
ルド回路73で求めた極大値信号とを比較して、極大値
信号がしきい値信号より大きい場合には音声信号が存在
すると判定する判定回路、77はこの判定信号の出力端
子である。
FIG. 7 shows a block diagram of a conventional voice detection device. In FIG. 7, 71 is a signal input terminal, 72 is a rectifier circuit that rectifies this signal, 73 is a maximum value hold circuit with a short rising time constant and a long falling time constant, and 74 is a falling time constant. 76 is a threshold value setting circuit that calculates the entire threshold signal from the output signal of this minimum value hold circuit 74; A determination circuit that compares the local maximum value signal obtained by the local maximum value hold circuit 73 and determines that an audio signal exists if the local maximum value signal is larger than the threshold signal; 77 is an output terminal for this determination signal. .

以上のように構成された音声検出装置について、以下そ
の動作について説明する。
The operation of the voice detection device configured as described above will be described below.

第8図は第7図の各部における信号波形を示したもので
、この図を使用して、第7図の動作説明2行う。
FIG. 8 shows the signal waveforms at each part in FIG. 7, and the operation of FIG. 7 will be explained using this diagram.

第8図において、81は第7図のA点の入力信号の波形
、82は第7図のB点の整流信号の波形、83ば0点の
極大値信号の波形、84はD点の極小値信号の波形、8
5ばE点のしきい値信号の波形、86ばF点の判定信号
の波形を示すまず第7図の入力端子71に第7図の入力
信号81が入力される。この入力信号81において時刻
To−T、までは雑音区間であり、音声信号は含まれて
いない0時刻T1〜T2までが音声信号区間テアル。時
刻T2〜T5は雑音の区間である。
In FIG. 8, 81 is the waveform of the input signal at point A in FIG. 7, 82 is the waveform of the rectified signal at point B in FIG. 7, 83 is the waveform of the maximum value signal at point 0, and 84 is the minimum value at point D. Waveform of value signal, 8
5 shows the waveform of the threshold signal at point E, and 86 shows the waveform of the determination signal at point F. First, the input signal 81 shown in FIG. 7 is input to the input terminal 71 shown in FIG. In this input signal 81, the period up to time To-T is a noise section, and the period from time 0 T1 to T2, in which no audio signal is included, is an audio signal section TEAL. Time T2 to T5 is a noise section.

このように音声信号に含まれる雑音としては、機器の電
気的な雑音と、音声収音時の吸音による雑音がある。通
常は、騒音による雑音の方が電気的な雑音よりも大きい
。騒音としては空調設備、換気扇、自動車、工場設備等
から発生するものが考えられ、これ等の騒音による雑音
が電気的な雑音と大きく異なる点は、その振幅が時間的
(て大きく変動する点である。入力信号81に示す波形
)まこの顕音による雑音が主に混入しており、雑音の振
幅は時間的に大きく変動している。
As described above, the noise included in the audio signal includes electrical noise from equipment and noise due to sound absorption during audio recording. Noise noise is usually louder than electrical noise. Noise can be generated from air conditioning equipment, ventilation fans, automobiles, factory equipment, etc. The difference between noise caused by these types of noise and electrical noise is that its amplitude varies greatly over time. (The waveform shown in the input signal 81) Mainly contains noise due to obvious sounds, and the amplitude of the noise fluctuates greatly over time.

この入力信号81ば、第7図の繁流回路72で整流され
第8図の整流信号82となる。この整流信号82は極太
値ホールド回路73で処理され極大値信号83となる。
This input signal 81 is rectified by the frequent flow circuit 72 shown in FIG. 7 and becomes a rectified signal 82 shown in FIG. This rectified signal 82 is processed by a maximum value hold circuit 73 and becomes a maximum value signal 83.

一方、整流信号82)ま(返小値ホールド回路74にも
入力され、極小値信号84となる。次に、この甑小値信
号84はしきい値設定回路下5により増幅され、しきい
値信号85となる。このしきい値設定回路75の増幅率
は時刻To−T、および時刻T2〜T5 の雑音区間で
、しきい値信号85が必ず極太値83以上となるように
あらかじめ設定されている。すなわち、あらかじめ雑音
振幅の極大値と極小値の比全想定し、この比に見合った
増幅率としている。次にこのしきい値信号85と極大値
信号83は判定回路76で比較される。ここでは極大値
信号83がしきい値信号85を超えた時に音声信号が存
在していると判定し、判定信号86を出力端子77から
外部機器に出力する。この判定信号86は時刻T1〜T
2でONすなわち音声信号が存在していると判定してお
り、雑音下でも音声検出が正確に行われていることがわ
かる。
On the other hand, the rectified signal 82) is also input to the return minimum value hold circuit 74, and becomes the minimum value signal 84.Next, this minimum value signal 84 is amplified by the threshold setting circuit 5, and the threshold value is The amplification factor of this threshold setting circuit 75 is set in advance so that the threshold signal 85 always has an extremely thick value of 83 or more in the noise interval from time To-T and from time T2 to T5. That is, the ratio between the maximum value and the minimum value of the noise amplitude is assumed in advance, and the amplification factor is set in accordance with this ratio.Next, the threshold signal 85 and the maximum value signal 83 are compared in the determination circuit 76. Here, when the maximum value signal 83 exceeds the threshold signal 85, it is determined that an audio signal is present, and a determination signal 86 is outputted from the output terminal 77 to an external device.This determination signal 86 is transmitted from time T1 to T
2, it is determined that it is ON, that is, a voice signal is present, and it can be seen that voice detection is performed accurately even under noise.

発明が解決しようとする問題点 しかしながら、上記のような構成では、音声信号に振幅
変動の大きい雑音が混入した場合に、この雑音を音声信
号と誤って検出するという問題点を有していた0例えば
空調のファンの不調で、周期的に高いレベルの騒音を発
生したり、プリンタあるいはタイプライタから断続的に
騒音が発生している場合である。この騒音を音声信号と
誤検出しないためには、しきい値設定回路75の増幅率
を上昇させ、しきい値を雑音振幅の最大値よりも高く設
定しなければならない。しかし、従来の構成ではこの増
幅率を一定としてお夛、上記振幅変動の大きい雑音に追
従させて、しきい値に制御することは不可能であった。
Problems to be Solved by the Invention However, the above configuration has the problem that when noise with large amplitude fluctuations is mixed into an audio signal, this noise is mistakenly detected as an audio signal. For example, if an air conditioner fan malfunctions and periodically generates high level noise, or if a printer or typewriter generates intermittent noise. In order to avoid erroneously detecting this noise as a voice signal, it is necessary to increase the amplification factor of the threshold setting circuit 75 and set the threshold value higher than the maximum value of the noise amplitude. However, with the conventional configuration, it was impossible to keep this amplification factor constant and control it to a threshold value by making it follow the noise with large amplitude fluctuations.

本発明は上記問題点に鑑み、雑音振幅の変動幅に追従し
てしきい値を制御できるようにし、変動幅の大きい雑音
が混入してもこれを音声信号と誤検出することのない音
声検出装置を提供するものである。
In view of the above-mentioned problems, the present invention makes it possible to control a threshold value by following the fluctuation width of the noise amplitude, and to perform voice detection that does not erroneously detect noise as an audio signal even if noise with a large fluctuation width is mixed in. It provides equipment.

問題点?解決するための手段 この目的を達成するために、本発明の音声検出装置は、
雑音が混入した音声信号全整流平滑して振幅値を計算す
る振幅計算部と、この振幅値の最小値である最小振幅値
を計算する最小振幅計算部と、振幅値から雑音区間にお
ける雑音振幅の変動幅を計算する雑音振幅変動幅計算部
と、この雑音振幅変動幅と最小振幅値とから、しきい値
を計算するしきい値計算部と、このしきい値と振幅値と
を比較して、振幅値が前記しきい値を超えた場合に音声
信号が存在していると判定する判定部と金有する構成と
なっている。
problem? Means for Solving In order to achieve this objective, the voice detection device of the present invention comprises:
An amplitude calculation unit calculates the amplitude value by fully rectifying and smoothing the audio signal mixed with noise; a minimum amplitude calculation unit calculates the minimum amplitude value, which is the minimum value of this amplitude value; and a minimum amplitude calculation unit that calculates the noise amplitude in the noise interval from the amplitude value. A noise amplitude fluctuation width calculation section that calculates the fluctuation width, a threshold calculation section that calculates a threshold value from this noise amplitude fluctuation width and the minimum amplitude value, and a threshold calculation section that compares this threshold value and the amplitude value. The present invention includes a determination unit that determines that an audio signal is present when the amplitude value exceeds the threshold value.

作用 本発明はこの構成により、振幅が一定の定常雑音の振幅
を最小振幅値として、断続的に発生する非定常雑音の振
幅を雑音振幅変動幅として分離検出することができる。
With this configuration, the present invention can separate and detect the amplitude of unsteady noise that occurs intermittently as the noise amplitude fluctuation range, with the amplitude of stationary noise having a constant amplitude as the minimum amplitude value.

この2つの値から、しきい値を算出することにより、雑
音の性質に適応して、最適しきい値を設定することがで
きる。
By calculating the threshold value from these two values, it is possible to set the optimal threshold value in accordance with the nature of the noise.

振幅が一定の定常雑音が主である場合には、しきい値を
この定常雑音の振幅に近づけても、誤検出の恐れは少な
く、感度も高くできる。逆に、非定常雑音が主である場
合には、しきい値を非定常雑音の最大振幅より高く設定
しないと、雑音が高くなった時にこれを音声信号と誤検
出することになる。本発明の音声検出装置は、このしき
い値の制御を自動的に行えるもので、常に高感度で、誤
検出の無い音声検出が可能となる。
If stationary noise with a constant amplitude is the main noise, even if the threshold value is set close to the amplitude of the stationary noise, there is less risk of false detection and sensitivity can be increased. Conversely, if non-stationary noise is the main component, unless the threshold is set higher than the maximum amplitude of the non-stationary noise, when the noise becomes high it will be mistakenly detected as a voice signal. The voice detection device of the present invention can automatically control this threshold value, and can always perform voice detection with high sensitivity and without false detection.

実施例 以下本発明の一実施例について、図面を参照しながら説
明する。
EXAMPLE An example of the present invention will be described below with reference to the drawings.

第1図は本発明の第1の実施例における音声検出装置の
ブロック図を示すものである。
FIG. 1 shows a block diagram of a voice detection device according to a first embodiment of the present invention.

第1図において、11は信号の入力端子、12はこの信
号を整流平滑して振幅値を計算する振幅計算部、13は
この振幅値の最小値である最小振幅値を計算する最小振
幅計算部、14は雑音区間における雑音振幅の変動幅全
計算する雑音振幅変動幅計算部、15はこの雑音振幅変
動幅と最小振幅値とから、しきい値を計算するしきい値
計算部、16はこのしきい値と振幅値とを比較して、振
幅値が前記しきい値を超えた場合に音声信号が存在して
いると判定する判定部、17ばこの判定信号の出力端子
である。
In FIG. 1, 11 is a signal input terminal, 12 is an amplitude calculation unit that rectifies and smoothes this signal to calculate an amplitude value, and 13 is a minimum amplitude calculation unit that calculates the minimum amplitude value that is the minimum value of this amplitude value. , 14 is a noise amplitude fluctuation range calculation unit that calculates the entire noise amplitude fluctuation range in the noise interval, 15 is a threshold calculation unit that calculates a threshold value from this noise amplitude fluctuation range and the minimum amplitude value, and 16 is this noise amplitude fluctuation width calculation unit. This is an output terminal for a determination signal of a 17-bar determination unit that compares a threshold value with an amplitude value and determines that an audio signal is present when the amplitude value exceeds the threshold value.

第2図は第1の実施例の各部における信号波形?示した
もので、この図を使用して、第1の実施例の動作の説明
を行う。
Fig. 2 shows the signal waveforms at each part of the first embodiment? The operation of the first embodiment will be explained using this figure.

第2図において、21は第1図のA点の入力信号の波形
、22は第1図のB点の振幅値の波形、23は0点の最
小振幅値の波形、24 ij: D点の雑音振幅変動幅
の波形、26はE点のしきい値の波形、26はF点の判
定信号の波形を示す。
In FIG. 2, 21 is the waveform of the input signal at point A in FIG. 1, 22 is the waveform of the amplitude value at point B in FIG. 1, 23 is the waveform of the minimum amplitude value at point 0, and 24 ij: is the waveform at point D. 26 shows the waveform of the noise amplitude fluctuation width, 26 shows the waveform of the threshold value at point E, and 26 shows the waveform of the determination signal at point F.

まず第1図の入力端子11に第2図の入力信号21が入
力される。この入力信号21において時刻To%T1ま
では雑音区間であり、音声信号は含まれていない。時刻
T1〜で2までが音声信号区間である。時刻T2〜T3
は雑音の区間である。
First, the input signal 21 shown in FIG. 2 is input to the input terminal 11 shown in FIG. In this input signal 21, the period up to time To%T1 is a noise section and does not include a voice signal. The period from time T1 to time T2 is the audio signal section. Time T2-T3
is the noise section.

入力信号21に示す波形は従来例で説明したように、雑
音の振幅が時間的に変動している例であるO この入力信号21は第1図の振篇計算部12で整流平滑
され、第2図の振幅値22となる。入力信号21ば、振
幅がほぼ一定の定常雑音と、振幅が変動する非定常雑音
と、音声信号との加算結果である。この振幅値22の最
小値は定常雑音の振幅値を示している。し念がって、振
幅値22を最小振幅計算部13で処理し、定常雑音振幅
である最小振幅値23を求める。一方、振幅値22i;
j、雑音振幅変動幅計算部14にも入力され、時刻To
%T1および時刻T2〜T5のピーク、ディップの差か
ら、非定常雑音の最大振幅値として雑音振幅変動幅24
を求める。次に、この雑音振幅変動幅24と最小振幅値
23ばしきい値計算部15に入力されると、しきい値2
5を算出する。このしきい値計算部15では、次式によ
シしきい値を計算している。
As explained in the conventional example, the waveform shown in the input signal 21 is an example in which the amplitude of the noise fluctuates over time. The amplitude value becomes 22 in Fig. 2. The input signal 21 is the result of addition of stationary noise with a substantially constant amplitude, non-stationary noise with a varying amplitude, and a voice signal. The minimum value of the amplitude values 22 indicates the amplitude value of stationary noise. To be careful, the amplitude value 22 is processed by the minimum amplitude calculation unit 13 to obtain the minimum amplitude value 23 which is the stationary noise amplitude. On the other hand, amplitude value 22i;
j, is also input to the noise amplitude fluctuation width calculation unit 14, and is input to the time To
%T1 and the peak and dip difference between times T2 and T5, the noise amplitude fluctuation width 24 is determined as the maximum amplitude value of the unsteady noise.
seek. Next, when the noise amplitude fluctuation width 24 and the minimum amplitude value 23 are inputted to the threshold calculation section 15, the threshold value 2
Calculate 5. This threshold calculation section 15 calculates the threshold according to the following equation.

(しきい値)=(最小振幅値)+2X(雑音振幅変動幅
)・・・・・・ (1) 従って、雑音の変動が大きければ、余裕度の大きいしき
い値に、雑音変動が小さければ最小振幅値に近い、余裕
度の小さいしきい値に自動設定される。時刻’ro、’
r1および時刻T2〜T5で、しきい値26は振幅値2
2より常に高い値に設定されている。
(Threshold) = (Minimum amplitude value) + 2X (Noise amplitude fluctuation width) (1) Therefore, if the noise fluctuation is large, the threshold with a large margin is set, and if the noise fluctuation is small, the threshold The threshold value is automatically set to a value close to the minimum amplitude value with a small margin. Time 'ro,'
r1 and times T2 to T5, the threshold value 26 is the amplitude value 2
It is always set to a value higher than 2.

判定部16では、このしきい値25と振幅値22と全比
較して、振幅値22がし、きい値2甲企超えた場合に音
声信号が存在していると判定し、判定信号26を出力端
子17から外部機器に出力する。
The determination unit 16 compares the threshold value 25 and the amplitude value 22, and if the amplitude value 22 exceeds the threshold value 2A, it is determined that an audio signal exists, and the determination signal 26 is determined. Output from the output terminal 17 to external equipment.

この判定信号26は時刻T1〜T2でオン(ON)すな
わち音声信号が存在していると判定しておυ、雑音下で
も音声検出が正確に行われていることがわかる。
This determination signal 26 is turned ON between times T1 and T2, that is, it is determined that a voice signal is present, and it can be seen that voice detection is performed accurately even under noise.

なお、しきい値の計算に(1)式を用いたが、この計算
方法には種々のものが考えられる。(1)式tより一般
化した次の例では、KとCの2つの定数によりさらに細
かくしきい値を制御できる。
Note that although equation (1) was used to calculate the threshold value, various methods can be considered for this calculation method. In the next example, which is generalized from equation (1) t, the threshold value can be controlled more finely using two constants K and C.

(しきい値)=(最小振幅値)+Kx(雑音振幅変動幅
)+CK>1 、G>。
(Threshold value) = (minimum amplitude value) + Kx (noise amplitude fluctuation width) + CK>1, G>.

以上のように本実施例によれば、最小振幅計算部13と
、雑音振幅変動幅計算部14とにより、定常雑音の振幅
を最小振幅値として、断続的に発生する非定常雑音の振
幅?雑音振幅変動幅とし分離検出することができる。し
きい値計算部15で、この2つの値から(1)式の方法
でしきい値全算出することにより、雑音の性質に適応し
て、最適しきい値を設定することができる。
As described above, according to the present embodiment, the minimum amplitude calculation section 13 and the noise amplitude fluctuation width calculation section 14 calculate the amplitude of the non-stationary noise that occurs intermittently by setting the amplitude of the stationary noise as the minimum amplitude value. It is possible to separate and detect the noise amplitude fluctuation range. By calculating all the threshold values from these two values using the method of equation (1) in the threshold calculation unit 15, it is possible to set an optimal threshold value in accordance with the nature of the noise.

即ち、振幅がほぼ一定の定常雑音が主である場合には、
しきい値をこの定常雑音の振幅に近づけても、誤検出の
恐れは少なく、感度も高くできる。
In other words, if the main noise is stationary noise with approximately constant amplitude,
Even if the threshold value is set close to the amplitude of this stationary noise, there is less risk of false detection and sensitivity can be increased.

逆に、非定常雑音が主である場合には、しきい値を非定
常雑音の最大振幅より高く設定しないと、雑音のレベル
が高くなった時にこれを音声信号と誤検出することにな
る。本実施例は、このしきい値の制御を自動的に行える
もので、常に高感度で、誤検出の無い音声検出装置が実
現できる。
Conversely, if non-stationary noise is the main component, unless the threshold is set higher than the maximum amplitude of the non-stationary noise, when the noise level becomes high, it will be mistakenly detected as a voice signal. In this embodiment, this threshold value can be controlled automatically, and a voice detection device that is always highly sensitive and does not cause false detections can be realized.

第3図は、本発明の第2の実施例における音声検出装置
のブロック図を示すものである。
FIG. 3 shows a block diagram of a voice detection device according to a second embodiment of the present invention.

第3図は第1の実施例の雑音振幅変動幅計算部14をさ
らに具体的に示したもので、他の構成は第1の実施例と
まったく同じである。
FIG. 3 shows more specifically the noise amplitude fluctuation range calculation unit 14 of the first embodiment, and the other configurations are exactly the same as the first embodiment.

第3図において、30は雑音振幅変動幅計算部、31は
振幅値のピークの包絡線を計算するところの、立ち下が
りの時定数を数秒〜数10秒に設定した短時間ピークホ
ールド部、32はこのピークの包絡線から最小振幅値を
減じた減算値を出力する減算部、33ばこの減算値の最
小値すなわち雑音振幅変動幅を求める最小減算値計算部
である。
In FIG. 3, 30 is a noise amplitude fluctuation range calculation unit, 31 is a short-time peak hold unit that calculates the envelope of the peak of the amplitude value, and has a fall time constant set to several seconds to several tens of seconds; 32 is a subtraction unit that outputs a subtracted value obtained by subtracting the minimum amplitude value from the envelope of this peak, and a minimum subtracted value calculation unit that calculates the minimum value of the subtracted value of 33, that is, the noise amplitude fluctuation width.

これ以外の部分は第1の実施例とまったく同じ構成であ
る。
The other parts have exactly the same configuration as the first embodiment.

以上のように構成された音声検出装置について、以下そ
の動作を説明する。
The operation of the voice detection device configured as described above will be described below.

第4図は第2の実施例の各部における信号波形2示した
もので、この図を使用して、第2の実施例の動作の説明
を行う。
FIG. 4 shows signal waveforms 2 at each part of the second embodiment, and the operation of the second embodiment will be explained using this diagram.

第4図において、41は第3図のA点の入力信号の波形
、42は第3図のB点の振幅値の波形、43は0点の最
小振幅値の波形、44はD点のピークの包絡線の波形、
45ばE点の減算値の波形、46ばF点の最小減算値す
なわち雑音振幅変動幅の波形、47は0点のしきい値の
波形、48iはH点の判定信号の波形を示す。
In Fig. 4, 41 is the waveform of the input signal at point A in Fig. 3, 42 is the waveform of the amplitude value at point B in Fig. 3, 43 is the waveform of the minimum amplitude value at point 0, and 44 is the peak at point D. The envelope waveform of
45 shows the waveform of the subtracted value at point E, 46 shows the waveform of the minimum subtracted value, that is, the noise amplitude fluctuation width, at point F, 47 shows the waveform of the threshold value at point 0, and 48i shows the waveform of the determination signal at point H.

まず第3図の入力端子11に第4図の入力信号41が入
力される。この入力信号41は第3図の振幅計算部12
で整流平滑され、第4図の振幅値42となる。次に、振
幅値42を最小振幅計算部13で処理し、定常雑音振幅
である最小振幅値43を求める〇一方、振幅値42は、
雑音振幅変動幅計算部30にも入力され、非定常雑音の
最大振幅値として雑音振幅変動幅46を求める0次に、
この雑音振幅変動幅46と最小振幅値43ばしきい値計
算部15に入力されると、しきい値47を算出する。判
定部16では、このしきい値47と振幅値42とを比較
して、振幅値42がしきい値47を超えた場合に音声信
号が存在していると判定し判定信号48を出力端子17
から外部機器に出力する。このように基本動作は第1の
実施例とまったく同じである。
First, the input signal 41 shown in FIG. 4 is input to the input terminal 11 shown in FIG. This input signal 41 is input to the amplitude calculation section 12 in FIG.
The signal is rectified and smoothed to obtain an amplitude value of 42 in FIG. Next, the amplitude value 42 is processed by the minimum amplitude calculation unit 13 to obtain the minimum amplitude value 43 which is the stationary noise amplitude.〇On the other hand, the amplitude value 42 is
The zero-order is also input to the noise amplitude fluctuation width calculation unit 30 and calculates the noise amplitude fluctuation width 46 as the maximum amplitude value of the unsteady noise.
When the noise amplitude fluctuation range 46 and the minimum amplitude value 43 are input to the threshold value calculation section 15, a threshold value 47 is calculated. The determination unit 16 compares the threshold value 47 with the amplitude value 42, and if the amplitude value 42 exceeds the threshold value 47, it determines that an audio signal is present and sends the determination signal 48 to the output terminal 17.
Output from to an external device. In this way, the basic operation is exactly the same as the first embodiment.

次にこの実施例で具体化された雑音振幅変動幅計算部3
0の動作の詳細を説明する。
Next, the noise amplitude fluctuation range calculation unit 3 embodied in this embodiment
The details of the operation of 0 will be explained below.

まず、振幅値42は短時間ピークホールド部31に入力
される。短時間ピークホールド部31はその立ち下がり
の時定数を数秒〜数10秒に設定されており、振幅値4
2のピークの包絡線44を得ることができる。ピークの
包絡線44を詳細に観ると、時刻To%T、の雑音区間
で、雑音振幅の最大値を示していることがわかる。時刻
T、〜T2の音声信号区間で、その値は急激に増大する
が、時刻T2〜T3の雑音区間で徐々に減衰し、時刻T
5付近でまた雑音振幅の最大値を示すようになる。
First, the amplitude value 42 is input to the short-time peak hold section 31. The short-time peak hold section 31 has a falling time constant set to several seconds to several tens of seconds, and has an amplitude value of 4.
An envelope 44 of two peaks can be obtained. If we look at the peak envelope 44 in detail, we can see that it shows the maximum value of the noise amplitude in the noise section at time To%T. Its value increases rapidly in the audio signal section from time T to T2, but gradually attenuates in the noise section from time T2 to T3, and then reaches time T.
Around 5, the noise amplitude again reaches its maximum value.

したがって、減算部32で、この値から最小振幅値43
を減じた減算値45において、時刻To〜T1の値が雑
音振幅の変動幅を示すことをなる。
Therefore, the subtraction unit 32 calculates the minimum amplitude value 43 from this value.
In the subtraction value 45 obtained by subtracting , the value from time To to T1 indicates the fluctuation range of the noise amplitude.

またこの区間の値が最も小さい。最小減算値計算部33
では、この減算値45の最小値を求め、最小減算値すな
わち雑音振幅変動幅46としてしきい値計算部15に出
力している。
Also, the value in this interval is the smallest. Minimum subtraction value calculation unit 33
Then, the minimum value of this subtraction value 45 is determined and outputted to the threshold calculation section 15 as the minimum subtraction value, that is, the noise amplitude fluctuation width 46.

以上のように本実施例によれば、短時間ピークホールド
部31と、減算部32と、最小減算値計算部33とから
構成された雑音振幅変動幅計算部3Qにより、雑音振幅
の変動幅を正確に求めることができる。
As described above, according to the present embodiment, the noise amplitude fluctuation width calculating section 3Q, which includes the short-time peak hold section 31, the subtracting section 32, and the minimum subtraction value calculating section 33, calculates the fluctuation width of the noise amplitude. can be determined accurately.

第5図は本発明の第3の実施例における音声検出装置の
ブロック図を示すものである。
FIG. 5 shows a block diagram of a voice detection device according to a third embodiment of the present invention.

第5図は第2の実施例の雑音振幅変動幅計算部30の他
の構成例を示したもので、他の構成は第1、第2の実施
例とまったく同じである0第5図において、5oは雑音
振幅変動幅計算部、31は振幅値のピークの包絡線全計
算するところの、立ち下がりの時定数全数秒〜数1Q秒
に設定した短時間ピークホールド部、51はピークの包
絡線の最小値を計算する最小ピーク計算部、52はこの
ピークの包絡線の最小値から最小振幅値を減じ、減算値
すなわち雑音振幅変動幅を求める減算部である。これ以
外の部分は第1.第2の実施例とまったく同じである。
FIG. 5 shows another example of the configuration of the noise amplitude fluctuation width calculating section 30 of the second embodiment, and the other configurations are exactly the same as those of the first and second embodiments. , 5o is a noise amplitude fluctuation range calculation unit, 31 is a short-time peak hold unit whose falling time constant is set to several seconds to several Q seconds, and 51 is a peak envelope, which calculates the entire envelope of the peak of the amplitude value. A minimum peak calculation section 52 calculates the minimum value of the line, and a subtraction section 52 subtracts the minimum amplitude value from the minimum value of the envelope of this peak to obtain a subtracted value, that is, a noise amplitude fluctuation width. The other parts are 1st. This is exactly the same as the second embodiment.

以上のように構成された音声検出装置について、以下そ
の動作を説明する。
The operation of the voice detection device configured as described above will be described below.

第6図は第3の実施例の各部における信号波形を示した
もので、この図を使用して、第3の実施例の動作説明を
行う。
FIG. 6 shows signal waveforms in each part of the third embodiment, and the operation of the third embodiment will be explained using this diagram.

第6図において、61は第5図のA点の入力信号の波形
、62は第5図のB点の振幅値の波形、63ば0点の最
小振幅値の波形、64ばD点のピークの包絡線の波形、
65ばE点のピークの包絡線の最小値の波形、66ばF
点の減算値すなわち雑音振幅変動幅の波形、67ばG点
のしきい値の波形、68はH点の判定信号の波形を示す
0この実施例の基本動作は第1.第2の実施例とまった
く同じである。したがって、この実施例での特徴である
雑音振幅変動幅計算部50の動作に焦点を絞って説明す
る。
In Fig. 6, 61 is the waveform of the input signal at point A in Fig. 5, 62 is the waveform of the amplitude value at point B in Fig. 5, 63 is the waveform of the minimum amplitude value at point 0, and 64 is the peak at point D. The envelope waveform of
65 is the waveform of the minimum value of the envelope of the peak at point E, 66 is F
67 indicates the waveform of the threshold value at point G, and 68 indicates the waveform of the judgment signal at point H. The basic operation of this embodiment is as follows. This is exactly the same as the second embodiment. Therefore, the explanation will be focused on the operation of the noise amplitude fluctuation range calculating section 50, which is a feature of this embodiment.

まず、振幅値62は短時間ピークホールド部31に入力
される。この短時間ピークホールド部31は第2の実施
例のものと同一である。短時間ピークホールド部31は
その立ち下がりの時定数を数秒〜数10秒に設定されて
おり、振幅値62のピークの包絡線64を得ることがで
きる。ピークの包絡線64を詳細に観ると、時刻TO〜
T1の雑音区間で、雑音振幅の最大値を示していること
がわかる。時刻T1〜T2の音声信号区間で、その値は
急激に増大するが、時刻T2〜T5の雑音区間で徐々に
減衰し、時刻T3付近でまた雑音振幅の最大値を示すよ
うになる。したがって、最小ピーク計算部51で求めた
ピークの包絡、線の最小値65は雑音振幅の最大値?示
す。減算部32では、この値から最小振幅値63を減じ
、雑音振幅変動幅閏として、しきい値計算部15に出力
している0以上のように本実施例によれば、短時間ピー
クホールド部31と、最小ピーク計算部51と、減算部
52とから構成された雑音振幅変動幅計算部50により
、雑音振幅の変動幅を正確に求めることができる。
First, the amplitude value 62 is input to the short-time peak hold section 31. This short-time peak hold section 31 is the same as that of the second embodiment. The short time peak hold section 31 has a falling time constant set to several seconds to several tens of seconds, and can obtain the envelope 64 of the peak of the amplitude value 62. Looking at the peak envelope 64 in detail, the time TO~
It can be seen that the maximum value of the noise amplitude is shown in the noise section of T1. The value increases rapidly in the audio signal section from time T1 to T2, but gradually attenuates in the noise section from time T2 to T5, and reaches the maximum value of the noise amplitude again near time T3. Therefore, is the minimum value 65 of the peak envelope and line calculated by the minimum peak calculation unit 51 the maximum value of the noise amplitude? show. The subtraction unit 32 subtracts the minimum amplitude value 63 from this value, and outputs it to the threshold calculation unit 15 as a noise amplitude fluctuation width jump.According to this embodiment, the short-time peak hold unit 31, a minimum peak calculation section 51, and a subtraction section 52, the noise amplitude fluctuation width calculation section 50 can accurately determine the fluctuation width of the noise amplitude.

発明の効果 本発明は、最小振幅計算部と、雑音振幅変動幅計算部と
により、定常雑音の振@を最小振幅値として、断続的に
発生する非定常雑音の振幅を雑音振幅変動幅として分離
検出することができる。しきい値計算部で、この2つの
値からしきい埴を算出することにより、雑音の性質に適
応して、最適しきい値を設定することができる0 即ち、振幅がほぼ一定の定常雑音が主である場合には、
しきい値をこの定常雑音の振幅に近づけても、誤検出の
恐れは少なく、感度も高くできる。
Effects of the Invention The present invention uses a minimum amplitude calculation section and a noise amplitude fluctuation range calculation section to separate the amplitude of unsteady noise that occurs intermittently into a noise amplitude fluctuation range, with the amplitude of stationary noise as the minimum amplitude value. can be detected. By calculating the threshold value from these two values in the threshold calculation section, it is possible to set the optimal threshold value in accordance with the nature of the noise. If the main
Even if the threshold value is set close to the amplitude of this stationary noise, there is less risk of false detection and sensitivity can be increased.

逆に、非定常雑音が主である場合には、しきい値を非定
常雑音の最大振幅より高く設定しないと、雑音のレベル
が高くなった時にこれを音声信号と誤検出することにな
る。本発明は、このしきい値の制御全自動的に行えるも
ので、常に高感度で、誤検出の無い音声検出装置が実現
できる。
Conversely, if non-stationary noise is the main component, unless the threshold is set higher than the maximum amplitude of the non-stationary noise, when the noise level becomes high, it will be mistakenly detected as a voice signal. According to the present invention, this threshold value can be controlled completely automatically, and a voice detection device that is always highly sensitive and does not cause false detection can be realized.

【図面の簡単な説明】 第1図は本発明の一実施例における音声検出装置のブロ
ック図、第2図は第1図の各部における信号の波形図、
第3図は本発明の第2の実施例における音声検出装置の
ブロック図、第4図は第3図の各部における信号の波形
図、第5図は本発明の第3の実施例における音声検出装
置のブロック図、第6図は第6図の各部における信号の
波形図、第7図は従来の音声検出装置のブロック図、第
8図は第7図の各部における信号の波形図である。 12・・・・・・振幅計算部、13・・・・・・最小振
幅計算部、141 30.50・・・・・・雑音振幅変
動幅計算部、15・・・・・・しきい値計算部、16・
・・・・・判定部、31・・・・・・短時間ピークホー
ルド部、32・・・・・・減算部、33・・・・・・最
小減算値計算部、61・・・・・・最小ピーク計算部、
62・・・・・・減算部。 第 1 区 第2図 Fff閣 第4図 ToT+  Tz   Ts 時間 第 6121 吟間 第 7 図 フ3 第 8 図 Th          T+    Tz     
    TJ杵蘭
[BRIEF DESCRIPTION OF THE DRAWINGS] FIG. 1 is a block diagram of a voice detection device in an embodiment of the present invention, FIG. 2 is a waveform diagram of signals in each part of FIG. 1,
FIG. 3 is a block diagram of a voice detection device in a second embodiment of the present invention, FIG. 4 is a waveform diagram of signals in each part of FIG. 3, and FIG. 5 is a voice detection device in a third embodiment of the present invention. FIG. 6 is a block diagram of the device, FIG. 6 is a waveform diagram of signals in each part of FIG. 6, FIG. 7 is a block diagram of a conventional voice detection device, and FIG. 8 is a waveform diagram of signals in each part of FIG. 7. 12...Amplitude calculation unit, 13...Minimum amplitude calculation unit, 141 30.50...Noise amplitude fluctuation width calculation unit, 15...Threshold value Calculation Department, 16.
...Judgment section, 31... Short time peak hold section, 32... Subtraction section, 33... Minimum subtraction value calculation section, 61...・Minimum peak calculation part,
62... Subtraction section. 1st Ward Figure 2 Fff Cabinet Figure 4 ToT+ Tz Ts Time 6121 Ginma Figure 7 Fff 3 Figure 8 Th T+ Tz
TJ Kiran

Claims (3)

【特許請求の範囲】[Claims] (1)雑音が混入した音声信号を整流平滑して振幅値を
計算する振幅計算部と、この振幅値の最小値である最小
振幅値を計算する最小振幅計算部と、前記振幅値から雑
音区間における雑音振幅の変動幅を計算する雑音振幅変
動幅計算部と、この雑音振幅変動幅と前記最小振幅値と
からしきい値を計算するしきい値計算部と、このしきい
値と前記振幅値とを比較して、前記振幅値が前記しきい
値を超えた場合に音声信号が存在していると判定する判
定部とを具備したことを特徴とする音声検出装置。
(1) An amplitude calculation unit that calculates an amplitude value by rectifying and smoothing an audio signal mixed with noise, a minimum amplitude calculation unit that calculates a minimum amplitude value that is the minimum value of this amplitude value, and a noise interval from the amplitude value. a noise amplitude fluctuation width calculation section that calculates a fluctuation range of the noise amplitude at , a threshold calculation section that calculates a threshold value from this noise amplitude fluctuation width and the minimum amplitude value, and a threshold calculation section that calculates a threshold value from the noise amplitude fluctuation width and the minimum amplitude value; and a determination unit that compares the amplitude values and determines that an audio signal is present when the amplitude value exceeds the threshold value.
(2)雑音振幅変動幅計算部は、振幅値のピークの包絡
線を計算するところの、立ち下がりの時定数を数秒〜数
10秒に設定した短時間ピークホールド部と、このピー
クの包絡線から最小振幅値を減じ減算値を出力する減算
部と、この減算値の最小値を求める最小減算値計算部と
を含むように構成したことを特徴とする特許請求の範囲
第1項記載の音声検出装置。
(2) The noise amplitude fluctuation range calculation unit includes a short-time peak hold unit that calculates the envelope of the peak of the amplitude value, with a falling time constant set to several seconds to several tens of seconds, and a short-time peak hold unit that calculates the envelope of the peak of the amplitude value. The audio according to claim 1, characterized in that it is configured to include a subtraction section that subtracts the minimum amplitude value from and outputs the subtraction value, and a minimum subtraction value calculation section that calculates the minimum value of the subtraction value. Detection device.
(3)雑音振幅変動幅計算部は、振幅値のピークの包絡
線を計算するところの、立ち下がりの時定数を数秒〜数
10秒に設定した短時間ピークホールド部と、このピー
クの包絡線の最小値を求める最小ピーク計算部と、この
最小ピーク値から最小振幅値を減じ、減算値を出力する
減算部とを含むように構成したことを特徴とする特許請
求の範囲第1項記載の音声検出装置。
(3) The noise amplitude fluctuation width calculation unit includes a short-time peak hold unit whose fall time constant is set to several seconds to several tens of seconds, which calculates the envelope of the peak of the amplitude value, and a short-time peak hold unit that calculates the envelope of the peak of the amplitude value. Claim 1, characterized in that it is configured to include a minimum peak calculation section that calculates the minimum value of , and a subtraction section that subtracts the minimum amplitude value from this minimum peak value and outputs the subtracted value. Voice detection device.
JP61138596A 1986-06-13 1986-06-13 Voice detector Pending JPS62294296A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61138596A JPS62294296A (en) 1986-06-13 1986-06-13 Voice detector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61138596A JPS62294296A (en) 1986-06-13 1986-06-13 Voice detector

Publications (1)

Publication Number Publication Date
JPS62294296A true JPS62294296A (en) 1987-12-21

Family

ID=15225788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61138596A Pending JPS62294296A (en) 1986-06-13 1986-06-13 Voice detector

Country Status (1)

Country Link
JP (1) JPS62294296A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04204898A (en) * 1990-11-30 1992-07-27 Matsushita Electric Ind Co Ltd Sound section deciding method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS607497A (en) * 1983-06-27 1985-01-16 シャープ株式会社 Voice recognition equipment

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS607497A (en) * 1983-06-27 1985-01-16 シャープ株式会社 Voice recognition equipment

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04204898A (en) * 1990-11-30 1992-07-27 Matsushita Electric Ind Co Ltd Sound section deciding method

Similar Documents

Publication Publication Date Title
US8457961B2 (en) System for detecting speech with background voice estimates and noise estimates
KR930007298B1 (en) Circuit for detecting and suppressing pulse shaped interferences
US4143325A (en) Constant amplitude interference squelch system
US10157603B2 (en) Noise detector and sound signal output device
US4975657A (en) Speech detector for automatic level control systems
DK215690A (en) VOICE ACTIVITY DETECTOR
JPS59139099A (en) Voice section detector
JPS5852695A (en) Voice detector for vehicle
JPH071958B2 (en) Sound pickup device
JPS62294296A (en) Voice detector
JPH08279784A (en) Infrared receiver
JPS62287297A (en) Voice detector
JPS63118197A (en) Voice detector
US6990206B1 (en) Integrating apparatus
JPH07109559B2 (en) Voice section detection method
CA1227573A (en) Adaptive speech detector system
KR0138148B1 (en) Audio signal detecting circuit
JP2897796B2 (en) Auto gain controller
JPH0424693A (en) Voice section detection system
JP2000352987A (en) Voice recognition device
JPS5838010A (en) Masking mitigating method for automatic sound volume adjusting device
KR900004793Y1 (en) Over output preventing & howling preventing circuit of amp
JPH01600A (en) voice detection device
KR930004940Y1 (en) Circuit for distinguishing a kind of cartridge in turntable
JPH07135434A (en) Automatic gain controller