JP4850191B2 - Automatic volume control device and voice communication device using the same - Google Patents
Automatic volume control device and voice communication device using the same Download PDFInfo
- Publication number
- JP4850191B2 JP4850191B2 JP2008006823A JP2008006823A JP4850191B2 JP 4850191 B2 JP4850191 B2 JP 4850191B2 JP 2008006823 A JP2008006823 A JP 2008006823A JP 2008006823 A JP2008006823 A JP 2008006823A JP 4850191 B2 JP4850191 B2 JP 4850191B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- ratio
- amplification factor
- volume control
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Control Of Amplification And Gain Control (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、入力音声信号の音量制御を行う自動音量制御装置及びそれを用いた音声通信装置に関する。 The present invention relates to an automatic volume control device that performs volume control of an input audio signal and a voice communication device using the same.
近年、FTTH(Fiber To The Home)、公衆無線網、高速移動体通信網といったネットワークの整備により、様々な場所で音声通信機器を用いた音声通信が増加し、テレビ音声会議システム等の多地点(3地点以上)の通話が可能な音声通信システムがコスト削減等を目的に普及しつつある。 In recent years, with the development of networks such as FTTH (Fiber To The Home), public wireless networks, and high-speed mobile communication networks, voice communication using voice communication devices has increased in various places, and multipoints (such as TV voice conference systems) Voice communication systems capable of calling at three or more locations are becoming popular for the purpose of cost reduction and the like.
多地点通話では、利用するマイクロホンの感度や指向性の違い、マイクロホンと話者の距離等により、話者によって音量レベルが様々に異なっている。このため、受話側での音量調節が困難となっている。 In a multipoint call, the volume level varies depending on the speaker depending on the sensitivity and directivity of the microphone to be used and the distance between the microphone and the speaker. This makes it difficult to adjust the volume on the receiving side.
受話側のユーザが調節できる音量は、各話者の音声がミックスされた後の音声だけであることが多く、ある話者の音量に合わせて音量を調節すると、別の話者の音量が不適切になるという問題が生じやすい。 The volume that can be adjusted by the user on the receiver side is often only the audio after each speaker's audio is mixed, and if the volume is adjusted to match the volume of one speaker, the volume of the other speaker may not be adjusted. The problem of becoming appropriate is likely to occur.
これを解決するため、音声通信システムでは、受信した音声が予め定めておいた目標音量レベルになるよう、音量を調節する自動音量制御装置(Automatic Gain Control:AGC)が搭載されていることが多い。自動音量制御装置は、図1に示すように、AGC部1において、入力音声信号の音量を予め定めておいた目標音量レベルに調節して出力する技術である。
In order to solve this, an audio communication system is often equipped with an automatic volume control device (AGC) that adjusts the volume so that the received voice has a predetermined target volume level. . As shown in FIG. 1, the automatic volume control device is a technique for adjusting and outputting the volume of an input audio signal to a predetermined target volume level in the
図2は、多地点音声通信システムに用いられる音声通信装置の受話側部分の一例のブロック図を示す。同図中、ある話者からの音声信号はAGC部2で目標音量レベルに調節されてミキシング部4に供給され、他の話者からの音声信号はAGC部3で目標音量レベルに調節されてミキシング部4に供給されて、ミキシング部4から合成音声信号が出力される。
FIG. 2 is a block diagram showing an example of a receiving side portion of a voice communication apparatus used in a multipoint voice communication system. In the figure, an audio signal from a certain speaker is adjusted to a target volume level by the
なお、特許文献1には、信号を音声区間と雑音区間に分類し、SN比に応じて雑音区間の増幅率を音声区間の増幅率以下にすることで、雑音の増幅による耳障り感を抑えることが記載されている。
In
また、特許文献2には、複数の入力信号のうち1つの信号を用いて基準となる利得を決定し、その他の信号の利得を、前述の基準となる利得をベースとして自動的に微調節を行って決定することにより、全ての音声信号を容易に同じ音量に調節することが記載されている。
3地点以上の多地点通話時にSN比が悪い音声の話者が存在する場合について考える。図3に示すように、第1話者の入力音声信号はSN比が高く、第2話者の入力音声信号はSN比が中くらい、第3話者の入力音声信号はSN比が低いとする。 Consider a case in which there is a voice speaker with a poor signal-to-noise ratio during a multipoint call at three or more points. As shown in FIG. 3, if the input voice signal of the first speaker has a high S / N ratio, the input voice signal of the second speaker has a medium S / N ratio, and the input voice signal of the third speaker has a low S / N ratio. To do.
各話者の入力音声信号はそれぞれAGC部において目標音量レベルまで増幅されるため、第3話者の音声信号の雑音レベルは第1,第2話者の音声信号の雑音レベルに比して大きくなる。このため、増幅後の第1〜第3話者の音声信号をミキシングした音声信号における雑音レベルが大きくなり、第1,第2話者の音声信号のSN比までも悪化して、音声が聞き取りにくくなるという問題がある。 Since each speaker's input speech signal is amplified to the target volume level in the AGC unit, the noise level of the speech signal of the third speaker is larger than the noise level of the speech signals of the first and second speakers. Become. For this reason, the noise level in the audio signal obtained by mixing the amplified audio signals of the first to third speakers is increased, the SN ratio of the audio signals of the first and second speakers is deteriorated, and the voice is heard. There is a problem that it becomes difficult.
本発明は、上記の点に鑑みなされたものであり、雑音レベルが大きくなりすぎることを抑制し、SN比の悪い話者が存在しても他の話者の音声が聞き取り難くなることを低減する自動音量制御装置及びそれを用いた音声通信装置を提供することを目的とする。 The present invention has been made in view of the above points, suppresses an excessive increase in noise level, and reduces the difficulty of hearing other speakers' voices even if there are speakers with poor signal-to-noise ratios. It is an object of the present invention to provide an automatic sound volume control device and a voice communication device using the same.
本発明の一実施態様による自動音量制御装置は、入力音声信号の音声部分と非音声部分を判定する音声判定手段と、
前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
前記音声レベルと前記雑音レベルと前記SN比と予め設定されている目標音量レベルから前記入力音声信号の増幅率を算出する増幅率算出手段と、
前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
を有し、
前記増幅率算出手段は、前記SN比が閾値以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比が閾値未満のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出する。
An automatic volume control device according to an embodiment of the present invention includes a sound determination unit that determines a sound portion and a non-voice portion of an input sound signal;
A sound level calculating means for calculating a sound level in a sound portion of the input sound signal;
Noise level calculation means for calculating a noise level in a non-voice portion of the input voice signal;
SN ratio calculating means for calculating an SN ratio of the input voice signal from the voice level and the noise level;
An amplification factor calculating means for calculating an amplification factor of the input audio signal from the audio level, the noise level, the SN ratio, and a preset target volume level;
Amplifying means for amplifying and outputting the input audio signal at the amplification factor;
I have a,
The amplification factor calculating means calculates an amplification factor so that the sound level becomes the target sound volume level when the SN ratio is equal to or greater than a threshold value, and the noise level is calculated from the target sound volume level when the SN ratio is less than the threshold value. The amplification factor is calculated so as to be lower by the threshold value .
本発明の他の一実施態様による自動音量制御装置は、入力音声信号の音声部分と非音声部分を判定する音声判定手段と、
前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
前記音声レベルと前記雑音レベルと前記SN比算出手段で算出したSN比と予め設定されている目標音量レベルと一又は複数の他の自動音量制御装置から供給されるSN比から前記入力音声信号の増幅率を算出する増幅率算出手段と、
前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
を有し、
前記増幅率算出手段は、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比未満のとき前記雑音レベルが前記目標音量レベルから最も高いSN比だけ低い値となるように増幅率を算出する。
An automatic volume control device according to another embodiment of the present invention includes a sound determination unit that determines a sound part and a non-sound part of an input sound signal;
A sound level calculating means for calculating a sound level in a sound portion of the input sound signal;
Noise level calculation means for calculating a noise level in a non-voice portion of the input voice signal;
SN ratio calculating means for calculating an SN ratio of the input voice signal from the voice level and the noise level;
The input audio signal is calculated from the audio level, the noise level, the SN ratio calculated by the SN ratio calculating means, the preset target volume level, and the SN ratio supplied from one or more other automatic volume control devices. An amplification factor calculating means for calculating the amplification factor;
Amplifying means for amplifying and outputting the input audio signal at the amplification factor;
I have a,
The amplification factor calculating means is configured such that when the SN ratio calculated by the SN ratio calculating means is equal to or higher than the SN ratio supplied from the one or more other automatic sound volume control devices, the sound level becomes the target sound volume level. When the S / N ratio calculated by the S / N ratio calculating means is less than the S / N ratio supplied from the one or more other automatic volume control devices, the noise level is the highest S / N ratio from the target volume level. The amplification factor is calculated so as to be a low value .
また、前記自動音量制御装置において、
前記増幅率算出手段は、前記SN比算出手段で算出したSN比が閾値以上のとき又は前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比のいずれかが前記閾値以上のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比が全て前記閾値未満のとき前記雑音レベルが前記目標音量レベルから前記一又は複数の他の自動音量制御装置から供給されるSN比のうち最も高いSN比だけ低い値となるように増幅率を算出する。
In the automatic volume control device,
The amplification factor calculating means is configured such that when the SN ratio calculated by the SN ratio calculating means is greater than or equal to a threshold value or greater than or equal to an SN ratio supplied from the one or more other automatic volume control devices, the audio level is the target volume. An amplification factor is calculated so as to be a level, and the SN ratio calculated by the SN ratio calculation means is not more than a threshold value, and any of the SN ratios supplied from the one or more other automatic volume control devices is not less than the threshold value. When the amplification factor is calculated so that the noise level is lower than the target volume level by the threshold value, the SN ratio calculated by the SN ratio calculation unit is less than the threshold value and the one or more other automatic volume control devices The noise level is the highest SN ratio among the SN ratios supplied from the target volume level from the one or more other automatic volume control devices when all the S / N ratios supplied from Calculating the amplification factor so that the lower value.
また、前記自動音量制御装置において、
前記音声レベル算出手段は、今回の入力音声信号フレームで算出した音声レベルを前回までの入力音声信号フレームで得た音声レベルにより平滑化して出力する。
In the automatic volume control device,
The voice level calculation means smoothes and outputs the voice level calculated in the current input voice signal frame with the voice level obtained in the previous input voice signal frame.
また、前記自動音量制御装置において、
前記雑音レベル算出手段は、今回の入力音声信号フレームで算出した雑音レベルを前回までの入力音声信号フレームで得た雑音レベルにより平滑化して出力する。
In the automatic volume control device,
The noise level calculation means smoothes and outputs the noise level calculated in the current input voice signal frame with the noise level obtained in the previous input voice signal frame.
また、前記自動音量制御装置において、
前記増幅率算出手段は、今回の入力音声信号フレームで算出した増幅率を前回までの入力音声信号フレームで得た増幅率により平滑化して出力する。
In the automatic volume control device,
The amplification factor calculating means smoothes and outputs the amplification factor calculated for the current input audio signal frame with the amplification factor obtained for the previous input audio signal frame.
また、本発明の一実施態様による音声通信装置は、前記自動音量制御装置を複数備え、
前記複数の自動音量制御装置から出力される音声信号を混合するミキシング手段を、
有する。
In addition, a voice communication device according to an embodiment of the present invention includes a plurality of the automatic volume control devices,
Mixing means for mixing audio signals output from the plurality of automatic volume control devices;
Have.
本発明によれば、雑音レベルが大きくなりすぎることを抑制できる。 According to the present invention, it is possible to suppress an excessive increase in noise level.
ひいては、SN比の悪い話者が存在しても他の話者の音声が聞き取り難くなることを低減することができる。 As a result, even if there is a speaker with a poor S / N ratio, it is possible to reduce the difficulty of listening to the voices of other speakers.
以下、図面に基づいて本発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
<第1実施形態>
図4は、自動音量制御装置の第1実施形態の構成例を示す。同図中、端子11からの入力音声信号をVAD(Voice Activity Detection:音声活動判定)部12に供給する。なお、音声信号は、例えばサンプリング周波数8KHzでサンプリングされ、160サンプル(20msecに相当)を1フレームとするデジタル音声信号である。
<First Embodiment>
FIG. 4 shows a configuration example of the first embodiment of the automatic volume control device. In the figure, an input audio signal from a
VAD部12は、例えば特許第3849116号に記載されたものであり、入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期等を用いて音声の特徴量を算出し、パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出し、上記2つの特徴量を基に音声か非音声(すなわち雑音)であるかを判定して、判定結果を音声信号と共に音声レベル更新部13及び雑音レベル更新部14に供給する。
The
音声レベル更新部13は、今回フレームnで音声部分と判定された場合、まず、今回フレームにおける音声レベルVを(1)式にて求める。
When the sound
V_ave(n)=V_ave(n−1)×COF1+V×(1.0−COF1)
…(2)
雑音レベル更新部14は、今回フレームnで非音声部分と判定された場合、まず、今回フレームにおける雑音レベルNを(3)式にて求める。
V_ave (n) = V_ave (n−1) × COF1 + V × (1.0−COF1)
... (2)
When it is determined that the current frame n is a non-speech part, the noise
N_ave(n)=N_ave(n−1)×COF1+N×(1.0−COF1)
…(4)
増幅率決定部15は、平均音声レベルV_ave(n)と、平均雑音レベルN_ave(n)と、予め決定されており上位装置から端子16を介して供給される目標音量レベルから、今回フレームのゲインs_gainを決定してゲイン乗算部17に供給する。
N_ave (n) = N_ave (n−1) × COF1 + N × (1.0−COF1)
... (4)
The amplification
ゲイン乗算部17は、端子11から供給される入力音声信号に増幅率決定部15からの増幅率を乗算して端子18から出力音声信号ouput(k)を出力する。
The
output(k)=input(k)×s_gain
(ただし、k=1,2…M) …(5)
なお、増幅率決定部15は、フレーム境界で増幅率が急激に変化することを防ぐため、例えば以下のように増幅率をサンプル単位で滑らかに変動させる構成としても良い。ここで、nフレームのkサンプル目におけるゲインをgain(n,k)とし、nフレームのみで求めた瞬時ゲインをs_gainとし、平滑化係数をCOF2とする。なお、平滑化係数COF2は例えば0.90〜0.99程度の値である。
output (k) = input (k) × s_gain
(However, k = 1, 2 ... M) (5)
The amplification
gain(n,k)=gain(n,k−1)×COF2
+s_gain×(1.0−COF2) …(6)
この場合、出力音声信号output(k)は以下のようになる。
gain (n, k) = gain (n, k−1) ×
+ S_gain × (1.0−COF2) (6)
In this case, the output audio signal output (k) is as follows.
output(k)=input(k)×gain(n,k)
(ただし、k=1,2…M) …(7)
<増幅率決定部の構成>
図5は、増幅率決定部15の一実施形態の構成例を示す。同図中、増幅率決定部15は、SN比算出部21と増幅率算出部22から構成されている。
output (k) = input (k) × gain (n, k)
(However, k = 1, 2 ... M) (7)
<Configuration of amplification factor determination unit>
FIG. 5 shows a configuration example of an embodiment of the amplification
SN比算出部21は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)からSN比を算出して増幅率算出部22に供給する。
The SN
増幅率算出部22は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)と、SN比算出部21からのSN比と、上位装置からの目標音量レベルから今回フレームのゲインs_gainを算出する。
The amplification
<増幅率算出部22の動作>
図6は、増幅率算出部22が実行する処理の一例のフローチャートを示す。同図中、ステップS1で、増幅率算出部22は、SN比算出部21から供給されるSN比が閾値以上か否かを判別する。ここで、閾値は例えば12dB程度の値として予め設定されている。
<Operation of
FIG. 6 shows a flowchart of an example of processing executed by the amplification
SN比が閾値以上であれば、ステップS2で今回フレームの平均音声レベルV_ave(n)が、目標音量レベルとなるような今回フレームのゲインs_gainを算出する。 If the S / N ratio is equal to or greater than the threshold, the gain s_gain of the current frame is calculated in step S2 such that the average audio level V_ave (n) of the current frame becomes the target volume level.
一方、SN比が閾値未満であれば、ステップS3で今回フレームの平均雑音レベルN_ave(n)が、目標音量レベルから閾値を減算した値(目標音量レベル−閾値)となるよう今回フレームのゲインs_gainを算出する。 On the other hand, if the SN ratio is less than the threshold value, the gain s_gain of the current frame is set so that the average noise level N_ave (n) of the current frame becomes a value obtained by subtracting the threshold value from the target sound volume level (target sound volume level−threshold) in step S3. Is calculated.
<多地点音声通信システムの音声通信装置の構成>
図7は、多地点音声通信システムにおける音声通信装置の受話側部分の第1実施形態のブロック図を示す。同図中、音声通信装置20の端子21−1〜21−nには複数の話者から受信した符号化音声信号が供給され、各符号化音声信号は音声復号部22−1〜22−nそれぞれで復号される。復号された各音声信号はAGC部23−1〜23−nそれぞれに供給される。
<Configuration of voice communication device of multipoint voice communication system>
FIG. 7 shows a block diagram of the first embodiment of the receiving side portion of the voice communication apparatus in the multipoint voice communication system. In the figure, encoded speech signals received from a plurality of speakers are supplied to terminals 21-1 to 21-n of the
AGC部23−1〜23−nそれぞれは、図4及び図5に示す構成で図6に示す動作を行う自動音量制御装置であり、各音声信号の音量制御を行って出力音声信号をミキシング部24に供給する。ミキシング部24は、AGC部23−1〜23−nそれぞれから供給される音声信号を混合して端子25から出力する。
Each of the AGC units 23-1 to 23-n is an automatic volume control device that performs the operation shown in FIG. 6 with the configuration shown in FIGS. 4 and 5, and controls the volume of each audio signal to mix the output audio signal. 24. The mixing
<具体的な音量制御動作>
ここで、図7において、n=3とした場合の具体的な音量制御動作について説明する。AGC部23−1〜23−3それぞれに与える目標音量レベルを−24dBov(ov:overload,最大値と比較してどれだけ小さいかのdB表示)、SN比の閾値=12dBとする。
<Specific volume control operation>
Here, a specific sound volume control operation when n = 3 in FIG. 7 will be described. The target sound volume level given to each of the AGC units 23-1 to 23-3 is set to -24 dBov (ov: overload, dB display of how much smaller than the maximum value), and the SN ratio threshold = 12 dB.
図8に示すように、AGC部23−1に入力される第1話者の音声レベルが−30dBovで、雑音レベルが−54dBovで、SN比が24dBであり、AGC部23−2に入力される第2話者の音声レベルが−42dBovで、雑音レベルが−48dBovで、SN比が6dBであり、AGC部23−3に入力される第3話者の音声レベルが−18dBovで、雑音レベルが−36dBovで、SN比が18dBである場合を考える。 As shown in FIG. 8, the voice level of the first speaker input to the AGC unit 23-1 is −30 dBov, the noise level is −54 dBov, the SN ratio is 24 dB, and the input is input to the AGC unit 23-2. The second speaker's voice level is -42 dBov, the noise level is -48 dBov, the S / N ratio is 6 dB, and the third speaker's voice level input to the AGC unit 23-3 is -18 dBov, and the noise level is Is −36 dBov and the S / N ratio is 18 dB.
AGC部23−1では、SN比=24dBが閾値=12dB以上であるため、音声レベル=−30dBovを目標音量レベル=−24dBovとするように、増幅率=6dB(増幅)が算出される。この結果、AGC部23−1の出力する第1話者の音声レベルは−24dBov、雑音レベルが−48dBov、SN比が24dBとなる。 In the AGC unit 23-1, since the SN ratio = 24 dB is equal to or greater than the threshold = 12 dB, the amplification factor = 6 dB (amplification) is calculated so that the audio level = −30 dBov is set to the target volume level = −24 dBov. As a result, the voice level of the first speaker output from the AGC unit 23-1 is -24 dBov, the noise level is -48 dBov, and the SN ratio is 24 dB.
AGC部23−2では、SN比=6dBが閾値=12dB未満であるため、雑音レベル=−48dBovを目標音量レベル−12dB=−36dBovとするように、増幅率=12dB(増幅)が算出される。この結果、AGC部23−2の出力する第2話者の音声レベルは−30dBov、雑音レベルが−36dBov、SN比が6dBとなる。 In the AGC unit 23-2, since the SN ratio = 6 dB is less than the threshold value = 12 dB, the amplification factor = 12 dB (amplification) is calculated so that the noise level = −48 dBov is set to the target volume level−12 dB = −36 dBov. . As a result, the voice level of the second speaker output from the AGC unit 23-2 is -30 dBov, the noise level is -36 dBov, and the SN ratio is 6 dB.
AGC部23−3では、SN比=18dBが閾値=12dB以上であるため、音声レベル=−18dBovを目標音量レベル=−24dBovとするように、増幅率=−6dB(減衰)が算出される。この結果、AGC部23−3の出力する第3話者の音声レベルは−24dBov、雑音レベルが−42dBov、SN比が18dBとなる。 In the AGC unit 23-3, since the SN ratio = 18 dB is equal to or greater than the threshold = 12 dB, the amplification factor = −6 dB (attenuation) is calculated so that the audio level = −18 dBov is set to the target sound volume level = −24 dBov. As a result, the voice level of the third speaker output from the AGC unit 23-3 is -24 dBov, the noise level is -42 dBov, and the SN ratio is 18 dB.
このように、SN比が良い話者に対しては音声レベルが目標音量レベルとなるようにゲインを決定し、SN比が悪い話者に対しては雑音レベルが目標音量レベルから閾値を減算した値より大きくならないようにゲインを決定することで、第1話者と第3話者について一定以上のSN比を確保でき、SN比が悪い第2話者の影響によって他の話者の音声が聞き取りにくくなる問題を生じず、良好な通話が可能となる。 Thus, the gain is determined so that the voice level becomes the target volume level for the speaker having a good S / N ratio, and the threshold value is subtracted from the target volume level for the speaker having a poor S / N ratio. By determining the gain so that it does not become larger than the value, it is possible to secure a certain S / N ratio for the first speaker and the third speaker, and the voices of other speakers are affected by the influence of the second speaker having a poor S / N ratio. A good call can be made without causing the problem of difficulty in hearing.
これに対し、従来のように入力音声を目標音量レベルに調節するだけの技術では、図9に示すように、目標音量レベルを−24dBovとして、第1〜第3話者から図8と同様の入力音声があった場合、第1,第3話者の増幅率は図8の例と変わらないものの、第2話者の増幅率は18dBとなって雑音レベルが−30dBovとなり、この結果、第1,第3話者の音声が聞き取りにくくなる。 On the other hand, in the conventional technique that only adjusts the input voice to the target volume level, as shown in FIG. 9, the target volume level is set to −24 dBov, and the same as in FIG. 8 from the first to third speakers. When there is an input voice, the amplification factor of the first and third speakers is not different from the example of FIG. 8, but the amplification factor of the second speaker is 18 dB and the noise level is −30 dBov. 1. It becomes difficult to hear the voice of the third speaker.
<第2実施形態>
図10は、自動音量制御装置の第2実施形態の構成例を示す。同図中、図4と同一部分には同一符号を付す。
Second Embodiment
FIG. 10 shows a configuration example of the second embodiment of the automatic volume control device. In the figure, the same parts as those in FIG.
図10において、端子11からの入力音声信号をVAD(Voice Activity Detection:音声活動判定)部12に供給する。なお、音声信号は、例えばサンプリング周波数8KHzでサンプリングされ、160サンプル(20msecに相当)を1フレームとするデジタル音声信号である。
In FIG. 10, an input voice signal from the terminal 11 is supplied to a VAD (Voice Activity Detection)
VAD部12は、例えば特許第3849116号に記載されたものであり、入力信号として環境騒音が重畳した音声信号が時系列順に与えられるフレーム毎に、電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期等を用いて音声の特徴量を算出し、パワースペクトルのピーク周波数の高次成分のみの相違を基に音声の特徴量を算出し、上記2つの特徴量を基に音声か非音声(すなわち雑音)であるかを判定して、判定結果を音声信号と共に音声レベル更新部13及び雑音レベル更新部14に供給する。
The
音声レベル更新部13は、今回フレームnで音声部分と判定された場合、まず、今回フレームにおける音声レベルVを(1)式にて求める。
次に、音声レベルVと、前回フレームの平均音声レベルV_ave(n−1)とを、平滑化係数COF1を用いて平滑化を行い、今回フレームの平均音声レベルV_ave(n)を求める。なお、今回フレームが非音声部分と判定された場合は、平均音声レベルV_ave(n)は更新しない。この今回フレームの平均音声レベルV_ave(n)を増幅率決定部35に供給する。なお、平滑化係数COF1は例えば0.90〜0.99程度の値である。
When the sound
Next, the audio level V and the average audio level V_ave (n−1) of the previous frame are smoothed using the smoothing coefficient COF1, and the average audio level V_ave (n) of the current frame is obtained. Note that if it is determined that the current frame is a non-voice portion, the average voice level V_ave (n) is not updated. The average voice level V_ave (n) of the current frame is supplied to the amplification
V_ave(n)=V_ave(n−1)×COF1+V×(1.0−COF1)
…(2)
雑音レベル更新部14は、今回フレームnで非音声部分と判定された場合、まず、今回フレームにおける雑音レベルNを(3)式にて求める。
次に、雑音レベルNと、前回フレームの平均雑音レベルN_ave(n−1)とを、平滑化係数COF1を用いて平滑化を行い、今回フレームの平均雑音レベルN_ave(n)を求める。なお、今回フレームが音声部分と判定された場合は、平均雑音レベルN_ave(n)は更新しない。この今回フレームの平均雑音レベルN_ave(n)を増幅率決定部35に供給する。
V_ave (n) = V_ave (n−1) × COF1 + V × (1.0−COF1)
... (2)
When it is determined that the current frame n is a non-speech part, the noise
Next, the noise level N and the average noise level N_ave (n−1) of the previous frame are smoothed using the smoothing coefficient COF1, and the average noise level N_ave (n) of the current frame is obtained. Note that if it is determined that the current frame is an audio part, the average noise level N_ave (n) is not updated. The average noise level N_ave (n) of the current frame is supplied to the amplification
N_ave(n)=N_ave(n−1)×COF1+N×(1.0−COF1)
…(4)
増幅率決定部35は、平均音声レベルV_ave(n)と、平均雑音レベルN_ave(n)と、予め決定されており上位装置から端子16を介して供給される目標音量レベルと、端子36を介して供給される他の自動音量制御装置から供給される他の話者のSN比から、今回フレームのゲインs_gainを決定してゲイン乗算部17に供給する。
N_ave (n) = N_ave (n−1) × COF1 + N × (1.0−COF1)
... (4)
The amplification
ゲイン乗算部17は、端子11から供給される入力音声信号に増幅率決定部35からの増幅率を乗算して端子18から出力音声信号ouput(k)出力する。
The
output(k)=input(k)×s_gain
(ただし、k=1,2…M) …(5)
なお、増幅率決定部35は、フレーム境界で増幅率が急激に変化することを防ぐため、例えば以下のように増幅率をサンプル単位で滑らかに変動させる構成としても良い。ここで、nフレームのkサンプル目におけるゲインをgain(n,k)とし、nフレームのみで求めた瞬時ゲインをs_gainとし、平滑化係数をCOF2とする。なお、平滑化係数COF2は例えば0.90〜0.99程度の値である。
output (k) = input (k) × s_gain
(However, k = 1, 2 ... M) (5)
Note that the amplification
gain(n,k)=gain(n,k−1)×COF2
+s_gain×(1.0−COF2) …(6)
この場合、出力音声信号output(k)は以下のようになる。
gain (n, k) = gain (n, k−1) ×
+ S_gain × (1.0−COF2) (6)
In this case, the output audio signal output (k) is as follows.
output(k)=input(k)×gain(n,k)
(ただし、k=1,2…M) …(7)
<増幅率決定部の構成>
図11は、増幅率決定部35の一実施形態の構成例を示す。同図中、図5と同一部分には同一符号を付す。図11において、増幅率決定部35は、SN比算出部21とSN比比較部37と増幅率算出部38から構成されている。
output (k) = input (k) × gain (n, k)
(However, k = 1, 2 ... M) (7)
<Configuration of amplification factor determination unit>
FIG. 11 shows a configuration example of an embodiment of the amplification
SN比算出部21は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)からSN比を算出してSN比比較部37に供給する。
The SN
SN比比較部37は、SN比算出部21で算出した自装置の話者のSN比を閾値及び他の話者のSN比と比較して、比較結果を自装置の話者のSN比と閾値と他の話者のSN比と共に増幅率算出部38に供給する。
The S / N
増幅率算出部38は、音声レベル更新部13からの今回フレームの平均音声レベルV_ave(n)と、雑音レベル更新部14からの今回フレームの平均雑音レベルN_ave(n)と、SN比算出部21からのSN比と、上位装置からの目標音量レベルと、SN比比較部37からの比較結果と、自装置の話者のSN比と、閾値と、一又は複数の他の話者のSN比から今回フレームのゲインs_gainを算出する。
The amplification factor calculation unit 38 includes the average audio level V_ave (n) of the current frame from the audio
<増幅率算出部38の動作>
図12は、増幅率算出部38が実行する処理の一例のフローチャートを示す。同図中、ステップS11で、増幅率算出部38は、SN比算出部21から供給される比較結果から自装置の話者のSN比が一又は複数の他の話者のSN比の中で最も高いか否かを判別し、自装置の話者のSN比が最も高い場合には、ステップS12で今回フレームの平均音声レベルV_ave(n)が目標音量レベルとなるような今回フレームのゲインs_gainを算出する。
<Operation of Gain Calculation Unit 38>
FIG. 12 shows a flowchart of an example of processing executed by the amplification factor calculation unit 38. In the figure, in step S11, the amplification factor calculation unit 38 determines that the SN ratio of the speaker of the own device is one of the SN ratios of one or more other speakers based on the comparison result supplied from the SN
一方、自装置の話者のSN比より他の話者のSN比が高い場合には、ステップS13で今回フレームの平均雑音レベルN_ave(n)が目標音量レベルからSN比が最も高い他の話者のSN比を減算した値(目標音量レベル−SN比が最大の話者のSN比)となるような今回フレームのゲインs_gainを算出する。 On the other hand, if the S / N ratio of the other speaker is higher than the S / N ratio of the speaker of the own device, in step S13, the average noise level N_ave (n) of the current frame is the other story having the highest S / N ratio from the target volume level. The gain s_gain of the current frame is calculated so as to be a value obtained by subtracting the SN ratio of the speaker (the target sound volume level-the SN ratio of the speaker having the maximum SN ratio).
<多地点音声通信システムの音声通信装置の構成>
図13は、多地点音声通信システムにおける音声通信装置の受話側部分の第2実施形態のブロック図を示す。同図中、図7と同一部分には同一符号を付す。
<Configuration of voice communication device of multipoint voice communication system>
FIG. 13 is a block diagram of a second embodiment of the receiving side portion of the voice communication apparatus in the multipoint voice communication system. In the figure, the same parts as those in FIG.
図13において、音声通信装置20の端子21−1〜21−nには複数の話者から受信した符号化音声信号が供給され、各符号化音声信号は音声復号部22−1〜22−nそれぞれで復号される。復号された各音声信号はAGC部43−1〜43−nそれぞれに供給される。
In FIG. 13, encoded speech signals received from a plurality of speakers are supplied to terminals 21-1 to 21-n of the
AGC部43−1〜43−nそれぞれは、図10及び図11に示す構成で図12(又は図15)に示す動作を行う自動音量制御装置であり、各音声信号の音量制御を行って出力音声信号をミキシング部24に供給すると共に、自装置の話者のSN比を求めて他の全ての自動音量制御装置に供給する。ミキシング部24は、AGC部43−1〜43−nそれぞれから供給される音声信号を混合して端子25から出力する。
Each of the AGC units 43-1 to 43-n is an automatic volume control device that performs the operation shown in FIG. 12 (or FIG. 15) with the configuration shown in FIGS. 10 and 11, and controls the volume of each audio signal and outputs it. The audio signal is supplied to the mixing
<具体的な音量制御動作>
ここで、図13において、n=3とした場合の具体的な音量制御動作について説明する。AGC部43−1〜23−3それぞれに与える目標音量レベルを−24dBov(ov:overload,最大値と比較してどれだけ小さいかのdB表示)、SN比の閾値=12dBとする。
<Specific volume control operation>
Here, a specific sound volume control operation when n = 3 in FIG. 13 will be described. It is assumed that the target volume level given to each of the AGC units 43-1 to 23-3 is -24 dBov (ov: overload, dB display of how much smaller than the maximum value), and the SN ratio threshold = 12 dB.
図14に示すように、AGC部43−1に入力される第1話者の音声レベルが−30dBovで、雑音レベルが−40dBovで、SN比が10dBであり、AGC部43−2に入力される第2話者の音声レベルが−42dBovで、雑音レベルが−48dBovで、SN比が6dBであり、AGC部43−3に入力される第3話者の音声レベルが−18dBovで、雑音レベルが−26dBovで、SN比が8dBである場合を考える。 As shown in FIG. 14, the voice level of the first speaker input to the AGC unit 43-1 is −30 dBov, the noise level is −40 dBov, the SN ratio is 10 dB, and the input is input to the AGC unit 43-2. The second speaker's voice level is -42 dBov, the noise level is -48 dBov, the SN ratio is 6 dB, and the third speaker's voice level input to the AGC unit 43-3 is -18 dBov, and the noise level Is −26 dBov and the S / N ratio is 8 dB.
この場合、AGC部43−1の出力する第1話者のSN比が最も高い。AGC部43−1では、SN比が最も高いため、音声レベル=−30dBovを目標音量レベル=−24dBovとするように、増幅率=6dB(増幅)が算出される。この結果、AGC部43−1の出力する第1話者の音声レベルは−24dBov、雑音レベルが−34dBov、SN比が10dBとなる。 In this case, the SN ratio of the first speaker output from the AGC unit 43-1 is the highest. In the AGC unit 43-1, since the SN ratio is the highest, the amplification factor = 6 dB (amplification) is calculated so that the audio level = −30 dBov is set to the target sound volume level = −24 dBov. As a result, the voice level of the first speaker output from the AGC unit 43-1 is -24 dBov, the noise level is -34 dBov, and the SN ratio is 10 dB.
AGC部43−2では、自装置の第2話者のSN比(6dB)より第1話者のSN比(10dB)が高いため、雑音レベル=−48dBovを目標音量レベル(−24dBov)−第1話者のSN比(10dB)=−34dBovとするように、増幅率=14dB(増幅)が算出される。この結果、AGC部43−2の出力する第2話者の音声レベルは−28dBov、雑音レベルが−34dBov、SN比が6dBとなる。 In the AGC unit 43-2, since the SN ratio (10 dB) of the first speaker is higher than the SN ratio (6 dB) of the second speaker of the own apparatus, the noise level = −48 dBov is set to the target volume level (−24 dBov) − Amplification factor = 14 dB (amplification) is calculated so that the SN ratio of one speaker (10 dB) = − 34 dBov. As a result, the voice level of the second speaker output from the AGC unit 43-2 is -28 dBov, the noise level is -34 dBov, and the SN ratio is 6 dB.
AGC部43−3では、自装置の第3話者のSN比(8dB)より第1話者のSN比(10dB)が高いため、雑音レベル=−26dBovを目標音量レベル(−24dBov)−第1話者のSN比(10dB)=−34dBovとするように、増幅率=−8dB(減衰)が算出される。この結果、AGC部43−3の出力する第3話者の音声レベルは−26dBov、雑音レベルが−34dBov、SN比が8dBとなる。 In the AGC unit 43-3, since the SN ratio (10 dB) of the first speaker is higher than the SN ratio (8 dB) of the third speaker of the own apparatus, the noise level = −26 dBov is set to the target volume level (−24 dBov) − Amplification factor = −8 dB (attenuation) is calculated so that the SN ratio of one speaker (10 dB) = − 34 dBov. As a result, the voice level of the third speaker output from the AGC unit 43-3 is -26 dBov, the noise level is -34 dBov, and the SN ratio is 8 dB.
このように、SN比が良い話者に対しては音声レベルが目標音量レベルとなるようにゲインを決定し、SN比が悪い話者に対しては雑音レベルが目標音量レベルからSN比が最も高い話者のSN比を減算した値より大きくならないようにゲインを決定することで、SN比が最も高い話者のSN比を維持することができ、SN比が悪い話者の影響によって他の話者の音声が聞き取りにくくなる問題を生じず、良好な通話が可能となる。 As described above, the gain is determined so that the voice level becomes the target volume level for the speaker having a good S / N ratio, and the noise level is the highest from the target volume level to the speaker for the speaker having a poor S / N ratio. By determining the gain so that it does not become larger than the value obtained by subtracting the SN ratio of the high speaker, the SN ratio of the speaker having the highest SN ratio can be maintained. A good call can be made without causing a problem that it is difficult to hear the voice of the speaker.
<増幅率算出部38の他の動作>
図15は、増幅率算出部38が実行する処理の他の例のフローチャートを示す。同図中、ステップS21で、増幅率算出部38は、SN比算出部21から供給される比較結果からSN比が閾値以上か否かを判別する。ここで、閾値は例えば12dB程度の値として予め設定されている。
<Other operations of amplification factor calculation unit 38>
FIG. 15 shows a flowchart of another example of processing executed by the amplification factor calculation unit 38. In the figure, in step S <b> 21, the amplification factor calculation unit 38 determines whether or not the SN ratio is equal to or greater than a threshold value from the comparison result supplied from the SN
SN比が閾値以上であれば、ステップS22で今回フレームの平均音声レベルV_ave(n)が目標音量レベルとなるような今回フレームのゲインs_gainを算出する。 If the S / N ratio is equal to or greater than the threshold, the gain s_gain of the current frame is calculated in step S22 such that the average sound level V_ave (n) of the current frame becomes the target volume level.
一方、SN比が閾値未満であれば、ステップS23で自装置の話者のSN比が一又は複数の他の話者のSN比の中で最も高いか否かを判別し、自装置の話者のSN比が最も高い場合にはステップS22で今回フレームの平均音声レベルV_ave(n)が目標音量レベルとなるような今回フレームのゲインs_gainを算出する。 On the other hand, if the SN ratio is less than the threshold value, it is determined in step S23 whether or not the SN ratio of the speaker of the own device is the highest among the SN ratios of one or more other speakers. If the S / N ratio of the user is the highest, the gain s_gain of the current frame is calculated in step S22 so that the average sound level V_ave (n) of the current frame becomes the target volume level.
ステップS23で自装置の話者のSN比より他の話者のSN比が高い場合にはステップS24でSN比が閾値以上の他の話者が存在するか否かを判別し、閾値以上の他の話者が存在する場合には、ステップS25で今回フレームの平均雑音レベルN_ave(n)が目標音量レベルから閾値を減算した値(目標音量レベル−閾値)となるような今回フレームのゲインs_gainを算出する。 If the SN ratio of the other speaker is higher than the SN ratio of the speaker of the own device in step S23, it is determined in step S24 whether or not there is another speaker whose SN ratio is greater than or equal to the threshold. If there is another speaker, the gain s_gain of the current frame such that the average noise level N_ave (n) of the current frame becomes a value obtained by subtracting the threshold value from the target sound volume level (target sound volume level−threshold) in step S25. Is calculated.
ステップS24で閾値以上の他の話者が存在しない場合には、ステップS26で今回フレームの平均雑音レベルN_ave(n)が目標音量レベルからSN比が最も高い他の話者のSN比を減算した値(目標音量レベル−SN比が最大の話者のSN比)となるような今回フレームのゲインs_gainを算出する。 If there is no other speaker exceeding the threshold value in step S24, in step S26, the average noise level N_ave (n) of the current frame is obtained by subtracting the SN ratio of the other speaker having the highest SN ratio from the target volume level. The gain s_gain of the current frame is calculated so as to be a value (target volume level-SN ratio of the speaker having the maximum SN ratio).
つまり、全ての話者のSN比が閾値未満のときはSN比が最も高い話者のSN比を閾値とみなして、全ての自動音量制御装置のSN比を最も高い話者のSN比に合わせるようにしている。 That is, when the S / N ratio of all the speakers is less than the threshold, the S / N ratio of the speaker having the highest S / N ratio is regarded as the threshold, and the S / N ratios of all automatic volume control devices are matched to the S / N ratio of the highest speaker. I am doing so.
このように、SN比が良い話者に対しては音声レベルが目標音量レベルとなるようにゲインを決定し、SN比が悪い話者に対しては雑音レベルが目標音量レベルからSN比が最も高い話者のSN比を減算した値より大きくならないようにゲインを決定することで、SN比が良好な話者について一定以上のSN比を確保でき、SN比が悪い話者の影響によって他の話者の音声が聞き取りにくくなる問題を生じず、良好な通話が可能となる。 As described above, the gain is determined so that the voice level becomes the target volume level for the speaker having a good S / N ratio, and the noise level is the highest from the target volume level to the speaker for the speaker having a poor S / N ratio. By determining the gain so as not to be larger than the value obtained by subtracting the SN ratio of a high speaker, an SN ratio of a certain level or more can be ensured for a speaker having a good SN ratio, and other factors are affected by the influence of the speaker having a poor SN ratio. A good call can be made without causing a problem that it is difficult to hear the voice of the speaker.
12 VAD部
13 音声レベル更新部
14 雑音レベル更新部
15,35 増幅率決定部
17 ゲイン乗算部
21 SN比算出部
22,38 増幅率算出部
23−1〜23−n,43−1〜43−n AGC部
24 ミキシング部
37 SN比比較部
12 サービスエリア
12
Claims (7)
前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
前記音声レベルと前記雑音レベルと前記SN比と予め設定されている目標音量レベルから前記入力音声信号の増幅率を算出する増幅率算出手段と、
前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
を有し、
前記増幅率算出手段は、前記SN比が閾値以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比が閾値未満のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出する、
ことを特徴とする自動音量制御装置。 Voice determination means for determining a voice portion and a non-voice portion of an input voice signal;
A sound level calculating means for calculating a sound level in a sound portion of the input sound signal;
Noise level calculation means for calculating a noise level in a non-voice portion of the input voice signal;
SN ratio calculating means for calculating an SN ratio of the input voice signal from the voice level and the noise level;
Amplification factor calculating means for calculating an amplification factor of the input audio signal from the audio level, the noise level, the SN ratio, and a preset target volume level;
Amplifying means for amplifying and outputting the input audio signal at the amplification factor;
I have a,
The amplification factor calculating means calculates an amplification factor so that the sound level becomes the target sound volume level when the SN ratio is equal to or greater than a threshold value, and the noise level is calculated from the target sound volume level when the SN ratio is less than the threshold value. The amplification factor is calculated so as to be a value lower by the threshold value.
An automatic volume control device characterized by that.
前記入力音声信号の音声部分における音声レベルを算出する音声レベル算出手段と、
前記入力音声信号の非音声部分における雑音レベルを算出する雑音レベル算出手段と、
前記音声レベルと前記雑音レベルから前記入力音声信号のSN比を算出するSN比算出手段と、
前記音声レベルと前記雑音レベルと前記SN比算出手段で算出したSN比と予め設定されている目標音量レベルと一又は複数の他の自動音量制御装置から供給されるSN比から前記入力音声信号の増幅率を算出する増幅率算出手段と、
前記入力音声信号を前記増幅率で増幅して出力する増幅手段と、
を有し、
前記増幅率算出手段は、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が前記一又は複数の他の自動音量制御装置から供給されるSN比未満のとき前記雑音レベルが前記目標音量レベルから最も高いSN比だけ低い値となるように増幅率を算出する、
ことを特徴とする自動音量制御装置。 Voice determination means for determining a voice portion and a non-voice portion of an input voice signal;
A sound level calculating means for calculating a sound level in a sound portion of the input sound signal;
Noise level calculation means for calculating a noise level in a non-voice portion of the input voice signal;
SN ratio calculating means for calculating an SN ratio of the input voice signal from the voice level and the noise level;
The input audio signal is calculated from the audio level, the noise level, the SN ratio calculated by the SN ratio calculating means, the preset target volume level, and the SN ratio supplied from one or more other automatic volume control devices. An amplification factor calculating means for calculating the amplification factor;
Amplifying means for amplifying and outputting the input audio signal at the amplification factor;
I have a,
The amplification factor calculating means is configured such that when the SN ratio calculated by the SN ratio calculating means is equal to or higher than the SN ratio supplied from the one or more other automatic sound volume control devices, the sound level becomes the target sound volume level. When the S / N ratio calculated by the S / N ratio calculating means is less than the S / N ratio supplied from the one or more other automatic volume control devices, the noise level is the highest S / N ratio from the target volume level. Calculate the amplification factor so that the value is as low as possible,
An automatic volume control device characterized by that.
前記増幅率算出手段は、前記SN比算出手段で算出したSN比が閾値以上のとき又は前記一又は複数の他の自動音量制御装置から供給されるSN比以上のとき前記音声レベルが前記目標音量レベルとなるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比のいずれかが前記閾値以上のとき前記雑音レベルが前記目標音量レベルから前記閾値だけ低い値となるように増幅率を算出し、前記SN比算出手段で算出したSN比が閾値以下かつ前記一又は複数の他の自動音量制御装置から供給されるSN比が全て前記閾値未満のとき前記雑音レベルが前記目標音量レベルから前記一又は複数の他の自動音量制御装置から供給されるSN比のうち最も高いSN比だけ低い値となるように増幅率を算出する、
ことを特徴とする自動音量制御装置。 The automatic volume control device according to claim 2 ,
The amplification factor calculating means is configured such that when the SN ratio calculated by the SN ratio calculating means is greater than or equal to a threshold value or greater than or equal to an SN ratio supplied from the one or more other automatic volume control devices, the audio level is the target volume. An amplification factor is calculated so as to be a level, and the SN ratio calculated by the SN ratio calculation means is not more than a threshold value, and any of the SN ratios supplied from the one or more other automatic volume control devices is not less than the threshold value. When the amplification factor is calculated so that the noise level is lower than the target volume level by the threshold value, the SN ratio calculated by the SN ratio calculation unit is less than the threshold value and the one or more other automatic volume control devices The noise level is the highest SN ratio among the SN ratios supplied from the target volume level from the one or more other automatic volume control devices when all the S / N ratios supplied from The amplification factor is calculated as a lower value,
An automatic volume control device characterized by that.
前記音声レベル算出手段は、今回の入力音声信号フレームで算出した音声レベルを前回までの入力音声信号フレームで得た音声レベルにより平滑化して出力する、
ことを特徴とする自動音量制御装置。 The automatic volume control device according to any one of claims 1 to 3 ,
The sound level calculating means smoothes and outputs the sound level calculated in the current input sound signal frame with the sound level obtained in the previous input sound signal frame,
An automatic volume control device characterized by that.
前記雑音レベル算出手段は、今回の入力音声信号フレームで算出した雑音レベルを前回までの入力音声信号フレームで得た雑音レベルにより平滑化して出力する、
ことを特徴とする自動音量制御装置。 The automatic volume control device according to any one of claims 1 to 4 ,
The noise level calculation means smoothes and outputs the noise level calculated in the current input voice signal frame with the noise level obtained in the previous input voice signal frame,
An automatic volume control device characterized by that.
前記増幅率算出手段は、今回の入力音声信号フレームで算出した増幅率を前回までの入力音声信号フレームで得た増幅率により平滑化して出力する、
ことを特徴とする自動音量制御装置。 The automatic volume control device according to any one of claims 1 to 5 ,
The amplification factor calculating means smoothes and outputs the amplification factor calculated in the current input audio signal frame by the amplification factor obtained in the previous input audio signal frame,
An automatic volume control device characterized by that.
前記複数の自動音量制御装置から出力される音声信号を混合するミキシング手段を、
有することを特徴とする音声通信装置。 A plurality of automatic volume control devices according to any one of claims 1 to 6 ,
Mixing means for mixing audio signals output from the plurality of automatic volume control devices;
A voice communication device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008006823A JP4850191B2 (en) | 2008-01-16 | 2008-01-16 | Automatic volume control device and voice communication device using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008006823A JP4850191B2 (en) | 2008-01-16 | 2008-01-16 | Automatic volume control device and voice communication device using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009171208A JP2009171208A (en) | 2009-07-30 |
JP4850191B2 true JP4850191B2 (en) | 2012-01-11 |
Family
ID=40971904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008006823A Expired - Fee Related JP4850191B2 (en) | 2008-01-16 | 2008-01-16 | Automatic volume control device and voice communication device using the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4850191B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5477854B2 (en) * | 2010-01-22 | 2014-04-23 | 株式会社タムラ製作所 | Automatic gain setting device and automatic gain setting method |
JP5834088B2 (en) * | 2010-11-29 | 2015-12-16 | ニュアンス コミュニケーションズ インコーポレイテッドNuance Communications,Inc. | Dynamic microphone signal mixer |
EP2673777B1 (en) * | 2011-02-10 | 2018-12-26 | Dolby Laboratories Licensing Corporation | Combined suppression of noise and out-of-location signals |
JP6135106B2 (en) * | 2012-11-29 | 2017-05-31 | 富士通株式会社 | Speech enhancement device, speech enhancement method, and computer program for speech enhancement |
EP3053356B8 (en) | 2013-10-30 | 2020-06-17 | Cerence Operating Company | Methods and apparatus for selective microphone signal combining |
US9484043B1 (en) * | 2014-03-05 | 2016-11-01 | QoSound, Inc. | Noise suppressor |
JP6451079B2 (en) * | 2014-05-14 | 2019-01-16 | 沖電気工業株式会社 | Speech enhancement device and program, and speech decoding device and program |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03145811A (en) * | 1989-10-31 | 1991-06-21 | Toshiba Corp | Audio output level controller |
JP2547649B2 (en) * | 1990-04-03 | 1996-10-23 | 岩崎通信機株式会社 | Conference call equipment |
JP3441112B2 (en) * | 1993-06-22 | 2003-08-25 | 三菱電機株式会社 | Multipoint communication controller |
AUPM900594A0 (en) * | 1994-10-24 | 1994-11-17 | Cochlear Pty. Limited | Automatic sensitivity control |
JP2003060459A (en) * | 2001-08-21 | 2003-02-28 | Oki Electric Ind Co Ltd | Automatic gain control(agc) amplifier |
JP2003218652A (en) * | 2002-01-23 | 2003-07-31 | Oki Electric Ind Co Ltd | Automatic gain control amplifier |
-
2008
- 2008-01-16 JP JP2008006823A patent/JP4850191B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009171208A (en) | 2009-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7630887B2 (en) | Enhancing the intelligibility of received speech in a noisy environment | |
KR101184402B1 (en) | Improving sound quality by intelligently selecting between signals from a plurality of microphones | |
KR101311028B1 (en) | Intelligibility control using ambient noise detection | |
CN101669284B (en) | Automatic volume and dynamic range adjustment method and device for mobile audio devices | |
JP4850191B2 (en) | Automatic volume control device and voice communication device using the same | |
JP4580409B2 (en) | Volume control apparatus and method | |
US6785381B2 (en) | Telephone having improved hands free operation audio quality and method of operation thereof | |
US8718562B2 (en) | Processing audio signals | |
EP1969721B1 (en) | Telecommunications terminal and method of operation of the terminal | |
EP2663979B1 (en) | Processing audio signals | |
JP2008148179A (en) | Noise suppression processing method in audio signal processor and automatic gain controller | |
JP5853540B2 (en) | Voice communication apparatus and program | |
JPH05235789A (en) | Voice communication terminal equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110920 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111018 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |