JP3365113B2 - Audio level control device - Google Patents

Audio level control device

Info

Publication number
JP3365113B2
JP3365113B2 JP33621094A JP33621094A JP3365113B2 JP 3365113 B2 JP3365113 B2 JP 3365113B2 JP 33621094 A JP33621094 A JP 33621094A JP 33621094 A JP33621094 A JP 33621094A JP 3365113 B2 JP3365113 B2 JP 3365113B2
Authority
JP
Japan
Prior art keywords
data
value
envelope detection
level
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33621094A
Other languages
Japanese (ja)
Other versions
JPH08180582A (en
Inventor
一郎 濱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP33621094A priority Critical patent/JP3365113B2/en
Publication of JPH08180582A publication Critical patent/JPH08180582A/en
Application granted granted Critical
Publication of JP3365113B2 publication Critical patent/JP3365113B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Control Of Amplification And Gain Control (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、音声記録装置に用いて
好適な音声レベル制御装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice level control device suitable for use in a voice recording device.

【0002】[0002]

【従来の技術】一般に、音声記録装置は、この装置の記
録可能なダイナミックレンジを越えるような大入力の音
声をそのまま記録すると再生音声の品質が著しく低下す
るため、このダイナミックレンジを越えたレベルの音声
が入力されたときには、この入力レベルに応じて速やか
に音声増幅回路のゲインを下げ、その後入力レベルが小
さくなったときにはゲインを元の値に復帰させるように
動作する音声レベル制御装置を内蔵している。
2. Description of the Related Art Generally, a voice recording apparatus has a problem that if a large input voice that exceeds the recordable dynamic range of this apparatus is recorded as it is, the quality of reproduced voice is significantly deteriorated. When a voice is input, the gain of the voice amplification circuit is promptly reduced according to this input level, and when the input level becomes lower thereafter, the built-in voice level control device operates to restore the gain to the original value. ing.

【0003】そして、このような音声レベル制御装置で
は、収録対象が電話或るいは会議等における人の会話で
ある場合には、上記のゲインを元の値に復帰させるとき
の復帰速度も大きく設定しておくことにより、収録対象
の音声を常に一定の大きさで記録できるように構成され
ている。然るに、収録対象が、例えば、拍手のような破
裂音と川のせせらぎのような低レベルの定常音とが混在
する音源である場合には、上記のように復帰速度を大き
く設定しておくと破裂音に応じて川のせせらぎの音がふ
わふわレベルが変わってしまう不自然な収音になるとい
う問題が生ずる。
In such a voice level control device, when the recording target is a telephone conversation or a conversation of a person in a conference or the like, the return speed for returning the gain to the original value is also set to a large value. By doing so, the voice to be recorded can always be recorded in a fixed size. However, if the recording target is a sound source in which, for example, a plosive sound such as applause and a low-level steady sound such as river murmuring are mixed, it is necessary to set the return speed to a large value as described above. There is a problem in that the sound of river murmuring becomes an unnatural sound pickup in which the fluffy level changes depending on the plosive sound.

【0004】これに対し、上記の復帰速度を小さく設定
しておけば、このような問題は起きないが、例えば、収
録対象が川のせせらぎで、かつ、この収録の最中に花火
のような破裂音が1回だけ発生したときには、ゲイン
が、この破裂音に応じたレベルに直ちに下げられて川の
せせらぎの音を十分な大きさで収録できず、しかも、復
帰速度が遅いため破裂音が発生する以前のレベルまでゲ
インが戻るのに時間がかかるという問題がある。
On the other hand, if the return speed is set to a small value, such a problem will not occur, but, for example, the recording target is a river murmuring and a fireworks-like image is recorded during the recording. When the plosive sound occurs only once, the gain is immediately lowered to a level according to the plosive sound, and the sound of the river murmuring cannot be recorded in a sufficient volume. Moreover, since the recovery speed is slow, the plosive sound is generated. There is a problem that it takes time for the gain to return to the level before the occurrence.

【0005】そこで、従来、アナログの音声レベル制御
装置では、以上のような復帰速度の問題を解決するため
に2重時定数による制御を採用している。これは、瞬間
的な大音量に対してはレベル制御の追従性を速くし、定
常的またはある一定時間以上継続されるエネルギーの大
きな音に対しては追従を遅くするものであり、ゲイン制
御信号を生成する際の音声の検波回路に、2つの時定数
の異なるアナログの積分回路を組み合わせて用いてい
る。
Therefore, in the past, the analog voice level control device has adopted the control by the double time constant in order to solve the above problem of the return speed. This speeds up the level control tracking capability for a momentary loud volume, and slows tracking for a large energy sound that is steady or continues for a certain period of time. Two analog integrating circuits with different time constants are used in combination with the voice detection circuit for generating the.

【0006】[0006]

【発明が解決しようとする課題】ところで、このような
2重時定数回路を用いた音声レベル制御装置では、積分
時定数が2つしか選べないため、入力音声の状況に応じ
た細かい追従が不可能である。また、積分の時定数を数
10秒となるように設定するため、これをディジタル回
路で構成しようとすると演算精度を上げる必要があり、
処理が複雑になるという欠点がある。
By the way, in the voice level control device using such a double time constant circuit, since only two integration time constants can be selected, it is not possible to finely follow the situation of the input voice. It is possible. Further, since the integration time constant is set to be several tens of seconds, it is necessary to improve the calculation accuracy when it is configured by a digital circuit.
It has the drawback of complicated processing.

【0007】[0007]

【課題を解決するための手段】本発明による音声レベル
制御装置は、ディジタル音声信号に関する絶対値データ
を導出する手段と、該絶対値データについての所定サン
プル数分の平均値データを導出する手段と、該平均値デ
ータについての包絡線検波データを導出する手段と、前
記所定サンプル数の値を設定する手段と、前記絶対値デ
ータについての包絡線検波データを導出する手段と、前
記絶対値データについての包絡線検波データ及び前記平
均値データについての包絡線検波データのうち、値が大
きい方の包絡線検波データに基づいて音声信号増幅手段
のゲインを設定する手段とを備えていることを特徴とす
る。
A voice level control apparatus according to the present invention comprises means for deriving absolute value data regarding a digital voice signal, and means for deriving average value data of a predetermined number of samples for the absolute value data. A means for deriving envelope detection data for the average value data, a means for setting a value of the predetermined number of samples, a means for deriving the envelope detection data for the absolute value data, and the absolute value data. Of the envelope detection data of the envelope detection data and the average value data, a means for setting the gain of the audio signal amplifying means based on the envelope detection data having the larger value. To do.

【0008】この場合、所定サンプル数の値を設定する
手段は、前記平均値データについての包絡線検波データ
に基づき該包絡線検波データのレベルが大きいほど所定
サンプル数の値を高く設定するように構成するのが好適
であり、また、複数のチャンネルの音声のレベルを制御
する場合には、絶対値データとして、複数チャンネルの
それぞれのディジタル音声信号の絶対値のうち最も値の
大きい絶対値を使用するのが望ましい。
In this case, the means for setting the value of the predetermined number of samples sets the value of the predetermined number of samples to be higher as the level of the envelope detection data is higher based on the envelope detection data for the average value data. It is preferable to configure it, and when controlling the audio levels of multiple channels, use the largest absolute value of the absolute values of the digital audio signals of each of the multiple channels as absolute value data. It is desirable to do.

【0009】[0009]

【作用】音源のレベルに応じてゲイン制御が行われ、か
つ、大入力の音声によって下げられたゲインが元のゲイ
ンへ戻るまでの復帰時間が、音源のレベルに応じて適応
的に制御される。
The gain control is performed according to the level of the sound source, and the recovery time until the gain lowered by the voice of the large input returns to the original gain is adaptively controlled according to the level of the sound source. .

【0010】[0010]

【実施例】以下、本発明による音声レベル制御装置の1
実施例について図面を参照して説明する。図1は、かか
る音声レベル制御装置の設けられた音声信号処理段を示
す図であり、この音声信号処理段は、チャンネル1及び
チャンネル2の各アナログ入力音声信号を48KHzで
サンプリングして20.8μsの周期のディジタル音声
信号を出力するAD変換回路31及び32と、これらの
回路から出力されるディジタル音声信号A1及びA2に
対する可変増幅装置として機能する係数器33及び34
と、該係数器33及び34の各出力に基づいて、これら
の各係数器へ供給すべき係数kを生成するための点線で
囲まれたディテクターブロックとから構成される。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A voice level control device according to the present invention will be described below.
Examples will be described with reference to the drawings. FIG. 1 is a diagram showing an audio signal processing stage provided with such an audio level control device, and this audio signal processing stage samples each analog input audio signal of channel 1 and channel 2 at 48 KHz for 20.8 μs. AD conversion circuits 31 and 32 for outputting digital audio signals of a cycle, and coefficient units 33 and 34 functioning as variable amplifiers for the digital audio signals A1 and A2 output from these circuits.
And a detector block surrounded by a dotted line for generating a coefficient k to be supplied to each of the coefficient units 33 and 34 on the basis of each output of the coefficient units 33 and 34.

【0011】ディテクターブロックにおける係数kの生
成動作について説明すると、係数器33及び34の出力
A3及びA4は、まず、絶対値化処理部35及び36へ
入力されて、それぞれの絶対値A7及びA6が取り出さ
れる。これらの絶対値は比較ゲート部38へ入力され、
ここで、絶対値A7及びA6のうち大きい方の絶対値
(A8)のみが出力される。比較ゲート部38から出力
された絶対値信号A8は、平均化処理部39及び包絡線
検波部40へ入力される。
Explaining the operation of generating the coefficient k in the detector block, the outputs A3 and A4 of the coefficient units 33 and 34 are first input to the absolute value conversion processing units 35 and 36, and their absolute values A7 and A6 are obtained. Taken out. These absolute values are input to the comparison gate unit 38,
Here, only the larger absolute value (A8) of the absolute values A7 and A6 is output. The absolute value signal A8 output from the comparison gate unit 38 is input to the averaging processing unit 39 and the envelope detection unit 40.

【0012】この包絡線検波部40における処理につい
て図2を参照して説明すると、図2における(1)は、
包絡線検波部40への入力A8を表し、(2)は、包絡
線検波部の出力A12を表す。ここで、入力A8に対す
る出力A12の追従特性は、音声信号のダイナミックレ
ンジに相当する40dBの入力変化に対して、立ち上が
り特性については20ms、立ち下がり特性については
20ms〜100ms程度に設定されており、A8は、
この図に示されるように、入力A8に対して小さい時定
数でほぼ忠実に追従した信号として得られる。
The processing in the envelope detecting section 40 will be described with reference to FIG. 2. (1) in FIG.
The input A8 to the envelope detection unit 40 is represented, and (2) represents the output A12 of the envelope detection unit. Here, the tracking characteristic of the output A12 with respect to the input A8 is set to about 20 ms for the rising characteristic and about 20 ms to 100 ms for the falling characteristic with respect to the input change of 40 dB corresponding to the dynamic range of the audio signal. A8 is
As shown in this figure, it is obtained as a signal that faithfully follows the input A8 with a small time constant.

【0013】また、入力A8は、平均化処理部39へ入
力され、ここで、平均化サンプル数設定部37において
設定されたサンプル数Nに応じて平均化処理を施され
る。なお、このサンプル数Nは、平均化処理部39の出
力A9を包絡線検波部41において包絡線検波した出力
A11に基づいて設定される。次に、これらの処理部3
9、41、37における処理について、図3を参照して
説明する。
Further, the input A8 is input to the averaging processing section 39, where it is subjected to averaging processing according to the sample number N set in the averaging sample number setting section 37. The number of samples N is set based on the output A11 obtained by envelope detection of the output A9 of the averaging processing unit 39 by the envelope detection unit 41. Next, these processing units 3
The processing in 9, 41 and 37 will be described with reference to FIG.

【0014】この図の(1)に示される入力A8に対し
て、平均化サンプル数設定部から与えられるサンプル数
Nに基づき平均化処理部39において次のような演算式
に従って平均化出力A9を導出する。 A9=(a1+a2+a3+・・・+aN)/N 但し、ここでa1,a2,a3,・・・,aNは、入力
A8の連続して入力されるN個の音声データを表す。ま
た、Nの値は、通常のレベルの音声が入力されている場
合には320程度の値となるように設計されており、こ
れにより、平均化出力A9として、この図の(2)に示
されるように6.6ms(=320×20.8μs)程
度の周期のデータが得られる。
With respect to the input A8 shown in (1) of this figure, the averaging processing unit 39 produces an averaging output A9 according to the following arithmetic expression based on the sample number N given from the averaging sample number setting unit. Derive. A9 = (a1 + a2 + a3 + ... + aN) / N where a1, a2, a3, ..., aN represent N audio data of the input A8 that are continuously input. Further, the value of N is designed to be a value of about 320 when a normal level voice is input, and as a result, the averaged output A9 is shown in (2) of this figure. As described above, data having a period of about 6.6 ms (= 320 × 20.8 μs) is obtained.

【0015】次に、この平均化出力A9を包絡線検波部
41へ入力してもとの20.8μsの周期のデータへ変
換すると共に、更に、所定の立ち上がり特性及び立ち下
がり特性を付与する。ここで付与される立ち上がり特性
は、包絡線検波部40における立ち上がり特性と同様
に、40dBの入力変化に対しては20ms程度までの
追従ができるように設定し、立ち下がり特性については
数秒〜数10秒程度の時定数のきわめて大きいものに設
定する。以上のような処理を行うことにより、包絡線検
波部41の出力としてこの図の(3)に示されるような
出力A11を得る(なお、これらの(1)〜(3)に示
される信号図は簡略化したものであり、サンプル数及び
各サンプルデータのレベル等は正確に表されたものでは
ない)。
Next, the averaged output A9 is input to the envelope detection section 41 to be converted into data of a period of 20.8 μs, and at the same time, predetermined rising and falling characteristics are given. The rising characteristic given here is set so as to be able to follow an input change of 40 dB for up to about 20 ms, like the rising characteristic in the envelope detection unit 40, and the falling characteristic is several seconds to several tens. Set it to an extremely large time constant such as seconds. By performing the above processing, the output A11 as shown in (3) of this figure is obtained as the output of the envelope detection unit 41 (note that the signal diagrams shown in these (1) to (3) are shown). Is a simplification, and the number of samples, the level of each sample data, etc. are not represented accurately).

【0016】このようにして得られた出力A11のレベ
ルに基づいて、平均化処理部39へ与えるべきサンプル
数が平均化サンプル数設定部37において設定される
が、この場合、A11のレベルが大きい程サンプル数の
値を大きく設定する。そして、A11のレベルに対して
具体的にどのような特性に従ってNを設定するかは、求
められる音声レベル制御の制御特性に応じて決定すれば
よく、例えば、この図の(4)に示されるように、、
、等の様々な特性を採用することができる。
Based on the level of the output A11 thus obtained, the number of samples to be given to the averaging processing unit 39 is set in the averaging sample number setting unit 37. In this case, the level of A11 is large. The larger the number of samples is set. Then, what characteristic the N is specifically set for the level of A11 may be determined according to the control characteristic of the required audio level control. For example, it is shown in (4) of this figure. like,,
Various characteristics such as, can be adopted.

【0017】以上のようにして生成された包絡線検波出
力A11は、比較ゲート部43へ入力される。この比較
ゲート部において前述の包絡線検波出力A12と比較さ
れ、両入力A11及びA12のうちレベルの大きい方の
信号が出力A13として取り出される。この出力A13
は係数発生部42へ入力され、A13のレベルが大きい
ほど値の小さな係数kが発生される。そして、この係数
kを係数器33及び34へ供給することによりフィード
バック制御が実行され、所望のレベルに増幅されたディ
ジタル音声信号A3及びA4が得られる。
The envelope detection output A11 generated as described above is input to the comparison gate unit 43. In the comparison gate section, the signal is compared with the envelope detection output A12 described above, and the signal with the higher level of both inputs A11 and A12 is taken out as the output A13. This output A13
Is input to the coefficient generator 42, and a coefficient k having a smaller value is generated as the level of A13 is higher. Then, the feedback control is executed by supplying the coefficient k to the coefficient units 33 and 34, and the digital audio signals A3 and A4 amplified to a desired level are obtained.

【0018】なお、この場合、各係数器の入出力間の増
幅特性が概ね図4に示されるような特性となるように設
計するのが望ましい。なお、この特性図では、レベルが
P以上の入力についてはその出力のレベルがLに抑えら
れており、この出力レベルLは、ダイナミックレンジ最
大に近い値に設定しておくことがS/Nの面で望まし
い。また、標準出力レベルが設定されている音声記録装
置の場合は標準出力レベルを少し越えた値に設定するの
が望ましい。
In this case, it is desirable that the amplification characteristic between the input and output of each coefficient unit is designed so as to have a characteristic as shown in FIG. It should be noted that, in this characteristic diagram, the output level of the input whose level is P or higher is suppressed to L, and it is necessary to set the output level L to a value close to the maximum dynamic range of the S / N. Desirable in terms of aspect. Further, in the case of an audio recording device in which the standard output level is set, it is desirable to set it to a value slightly exceeding the standard output level.

【0019】なお、以上に説明した実施例は、2チャン
ネルの音声を記録するものであるが、本発明は、これ以
外の任意のチャンネル数の音声を記録する装置にも適用
することができ、例えば、1チャンネルの音声のみを記
録する装置の場合には図1における比較ゲート部38は
不要であり、複数チャンネルの音声を記録する装置にあ
っては、そのチャンネル数分だけの絶対値化処理部を設
け、それらの絶対値化出力を全て比較ゲート部38へ入
力するように構成する。
Although the embodiment described above records two channels of audio, the present invention can be applied to an apparatus for recording audio of any other number of channels. For example, the comparison gate unit 38 in FIG. 1 is not necessary in the case of a device that records only one channel of sound, and in a device that records a plurality of channels of sound, absolute value conversion processing for only that number of channels is performed. Units are provided and all the absolute value outputs thereof are input to the comparison gate unit 38.

【0020】次に、図1に示した音声レベル制御装置に
おける制御特性について、具体的な場合を例に挙げて説
明する。図5に示される(1)〜(4)は、低レベルの
定常音を収録している最中に高レベルの破裂音が1回だ
け発生した場合の信号A8,A12,A11,及びA1
3のそれぞれの包絡線波形を表したものである。この図
に示されるように、A8を図1の処理部40において包
絡線検波して取り出した出力A12は、A8とほぼ同じ
包絡線波形を有するのに対して、A8を図1における処
理部39及び41において平均化及び包絡線検波して取
り出した出力A11は、破裂音の発生期間において多少
立ち上がった後、緩やかに立ち下がる波形を有するもの
となる。
Next, the control characteristics of the audio level control device shown in FIG. 1 will be described by taking a specific case as an example. (1) to (4) shown in FIG. 5 are signals A8, A12, A11, and A1 when a high-level plosive sound is generated only once while a low-level stationary sound is recorded.
3 shows each envelope waveform of No. 3 of FIG. As shown in this figure, the output A12 obtained by envelope detection of A8 in the processing unit 40 of FIG. 1 has substantially the same envelope waveform as that of A8, whereas A8 is a processing unit 39 in FIG. The output A11 obtained by the averaging and envelope detection in 41 and 41 has a waveform that rises slightly after the burst sound is generated and then gently falls.

【0021】これにより、A11及びA12を比較ゲー
ト43へ入力して得られる出力A13は、この図の
(4)に示されるような包絡線波形を有するものとな
る。従って、このA13に基づいて発生される係数kの
値は、破裂音発生期間中は急激に小さくなって破裂音が
抑圧されると共に、該期間経過後はほぼ元の値まで戻る
ので低レベルの定常音を再び十分収録できるようにな
る。
As a result, the output A13 obtained by inputting A11 and A12 to the comparison gate 43 has an envelope waveform as shown in (4) of this figure. Therefore, the value of the coefficient k generated based on this A13 is rapidly reduced during the plosive sound generation period, the plosive sound is suppressed, and after the period elapses, it returns to almost the original value, so that it is at a low level. It will be possible to record enough steady sound again.

【0022】また、図6に示される波形は、低レベルの
定常音を収録している最中に高レベルの破裂音が所定期
間繰り返し発生した場合の信号A8,A12,A11,
及びA13のそれぞれの包絡線波形を表したものであ
る。この図の場合には、出力A11は、立ち下がり特性
が緩やかであるため破裂音の発生毎にレベルが上昇して
ゆき、破裂音の繰り返し発生期間の経過後は、緩やかに
立ち下がる波形を有するものとなる。
The waveforms shown in FIG. 6 are the signals A8, A12, A11, when a high-level plosive sound is repeatedly generated for a predetermined period while a low-level stationary sound is recorded.
And A13 represent envelope waveforms. In the case of this figure, the output A11 has a gradual fall characteristic, so that the level rises each time a plosive sound is generated, and has a waveform that gently falls after the elapse of the repeated plosive sound generation period. Will be things.

【0023】これにより、A11及びA12を比較ゲー
ト43へ入力して得られる出力A13は、この図の
(4)に示されるような包絡線波形を有するものとな
る。即ち、このように破裂音が繰り返し発生する場合に
は、1つの破裂音が終わってから次の破裂音が発生する
までの期間におけるA13のレベルが逐次上昇してゆく
ので、この期間に発生している低レベルの定常音の録音
レベルは次第に低いレベルに保持されてゆき、従来のよ
うに定常音の録音レベルがふわふわ変動することがな
い。
As a result, the output A13 obtained by inputting A11 and A12 to the comparison gate 43 has an envelope waveform as shown in (4) of this figure. That is, in the case where the plosive sound is repeatedly generated in this manner, the level of A13 in the period from the end of one plosive sound to the occurrence of the next plosive sound is gradually increased. The low level steady sound recording level is gradually maintained at a low level, and the steady sound recording level does not fluctuate as in the past.

【0024】更に、A11のレベルが高くなる程A8に
基づいてA11を生成する際の平均化のサンプル数が大
きくなるように設定されているので、A11の波形の立
ち下がり特性は、A11のレベルが高くなる程ゆるやか
なものとなる。つまり、破裂音の繰り返し回数が少ない
ほど、破裂音の繰り返し発生期間経過後のA13の波形
の立ち下がりが速やかに行われて、それだけ低レベルの
定常音の収録が早く実行されることになる。
Further, the higher the level of A11 is, the larger the number of samples for averaging when A11 is generated based on A8 is set. Therefore, the falling characteristic of the waveform of A11 is the level of A11. The higher the, the more gradual. That is, the smaller the number of times the plosive sound is repeated, the more quickly the waveform of A13 falls after the repeated occurrence period of the plosive sound is completed, and the lower level stationary sound is recorded accordingly.

【0025】以上に説明した音声レベル制御装置におけ
るディテクターブロックは、その内部の各処理部を全て
ハードウェアによって構成することができるが、マイコ
ン制御を利用した構成とすることも可能である。そこ
で、次に、マイコンによって上記のディテクターブロッ
クの機能を実現するようにした構成例について図7〜図
12を参照して説明する。
In the detector block in the above-described audio level control device, all the internal processing units can be configured by hardware, but it is also possible to use a configuration using microcomputer control. Therefore, next, a configuration example in which the function of the detector block is realized by the microcomputer will be described with reference to FIGS. 7 to 12.

【0026】図7は、マイコンを用いた場合のディテク
ターブロックの構成であり、信号A3及びA4はインタ
ーフェース53を介してマイコン55へ入力され、これ
らの入力に基づいてマイコン内で導出された係数kが該
インターフェース53を介して出力される。そして、マ
イコン内のRAM56の内部には前述の出力A8を格納
するためのレジスタRa、出力A12を格納するための
レジスタRh、出力A9を格納するためのレジスタR
m、出力A11を格納するためのレジスタRo、平均化
サンプル数Nを格納するためのレジスタRn、及びマイ
コン55への音声データの入力回数が格納されるレジス
タRcが設けられ、また、ROM57の内部には通常の
マイコンプログラムの他に、出力A11のレベルに応じ
た平均化サンプル数Nを取り出すための「A11→N」
変換用テーブルTn、及び出力A13のレベルに基づい
て係数kを設定するための「A13→k」変換用テーブ
ルTkが設けられている。
FIG. 7 shows the structure of the detector block when a microcomputer is used. The signals A3 and A4 are input to the microcomputer 55 via the interface 53, and the coefficient k derived in the microcomputer based on these inputs. Is output via the interface 53. In the RAM 56 in the microcomputer, a register Ra for storing the output A8, a register Rh for storing the output A12, and a register R for storing the output A9 are provided.
m, a register Ro for storing the output A11, a register Rn for storing the averaged sample number N, and a register Rc for storing the number of times of inputting audio data to the microcomputer 55, and the inside of the ROM 57. In addition to the normal microcomputer program, "A11 → N" for extracting the averaged sample number N according to the level of the output A11
A conversion table Tn and an “A13 → k” conversion table Tk for setting the coefficient k based on the level of the output A13 are provided.

【0027】次に、このマイコン55における係数kの
生成フローを図8により説明する。この図において、先
ずステップS1及びステップS2の実行によりレジスタ
Rn、Ro、及びRhにそれぞれデフォルト値を格納す
ると共に、レジスタRc及びRmの内容をクリアする。
次にステップS3で音声データA3及びA4が入力され
るまで待機し、音声データが入力されたら入力音声デー
タA3及びA4のそれぞれの絶対値データのうち値が大
きい方の絶対値データA8をレジスタRaに格納する
(ステップS4)。
Next, a flow of generating the coefficient k in the microcomputer 55 will be described with reference to FIG. In the figure, first, by executing steps S1 and S2, default values are stored in the registers Rn, Ro, and Rh, respectively, and the contents of the registers Rc and Rm are cleared.
Next, in step S3, the process waits until the voice data A3 and A4 are input. When the voice data is input, the absolute value data A8 having the larger value among the absolute value data of the input voice data A3 and A4 is registered in the register Ra. (Step S4).

【0028】次のステップS5ではレジスタRa内のデ
ータA8をレジスタRnに格納されている平均化サンプ
ル数で割った値をレジスタRmに格納されているデータ
と加算し、この加算出力をレジスタRmに格納すると共
に、レジスタRcの内容を「1」だけ増加させる。次に
ステップS6TでレジスタRa内のデータA8に関する
包絡線検波データA12を導出してこれをレジスタRh
に格納した後、ステップS7でレジスタRc内の入力回
数データの値がレジスタRn内の平均化サンプル数と等
しいかどうかを判断する。
In the next step S5, a value obtained by dividing the data A8 in the register Ra by the averaged sample number stored in the register Rn is added to the data stored in the register Rm, and the addition output is stored in the register Rm. While storing, the content of the register Rc is incremented by "1". Next, in step S6T, the envelope detection data A12 relating to the data A8 in the register Ra is derived and stored in the register Rh.
Then, in step S7, it is determined whether the value of the input count data in the register Rc is equal to the averaged sample count in the register Rn.

【0029】この判断結果がNOであれば、レジスタR
h内のデータA12とレジスタRo内のデータ(A1
1)とを比較し、大きい方のデータの値に対応する係数
kをテーブルTkから読み出して係数器33及び34へ
出力(ステップS8〜ステップS10)した後、ステッ
プS3へ戻る。ステップS3〜ステップS10からなる
ループの繰り返し実行によりステップS7での判断結果
がYESとなったときには、レジスタRm内には求める
平均化サンプル数分についての平均化データA9が格納
されたことになるので、このデータA9に関する包絡線
検波データA11を導出し、レジスタRo内のデータを
この新たに導出されたデータA11に更新する(ステッ
プS7及びステップS11)。
If the result of this determination is NO, the register R
Data A12 in h and data (A1 in register Ro
1) is compared, the coefficient k corresponding to the value of the larger data is read from the table Tk and output to the coefficient units 33 and 34 (steps S8 to S10), and then the process returns to step S3. When the determination result in step S7 is YES due to the repeated execution of the loop including steps S3 to S10, it means that the averaged data A9 for the number of averaged samples to be obtained is stored in the register Rm. Then, the envelope detection data A11 relating to this data A9 is derived, and the data in the register Ro is updated to this newly derived data A11 (steps S7 and S11).

【0030】次に、このデータA11に対応させて設定
すべき平均化サンプル数をテーブルTnから読み出して
レジスタRnに格納することにより次の平均化演算処理
の準備をした(ステップS12)後、レジスタRh内の
データA12とレジスタRo内のデータ(A11)とを
比較し、大きい方のデータの値に対応する係数kをテー
ブルTkから読み出して係数器33及び34へ出力(ス
テップS13〜ステップS15)した後、ステップS2
へ戻る。
Next, the number of averaging samples to be set corresponding to this data A11 is read from the table Tn and stored in the register Rn to prepare for the next averaging calculation process (step S12), and then the register The data A12 in Rh is compared with the data (A11) in the register Ro, and the coefficient k corresponding to the value of the larger data is read from the table Tk and output to the coefficient units 33 and 34 (steps S13 to S15). And then step S2
Return to.

【0031】なお、この図におけるステップS4の具体
的フローは、図9のように構成される。また、ステップ
S6の具体的フローは図10のように構成される。この
図10のフローについて説明すると、入力音声データか
ら取り出された絶対値データA8(レジスタRaの内
容)が1サンプル前の包絡線検波データ(レジスタRh
の内容)と等しい値を持つときは、レジスタRh内の包
絡線検波データ(A12)の値は更新されないが、値が
等しくないときにはレジスタRh内のデータA12の値
を更新する。
The specific flow of step S4 in this figure is configured as shown in FIG. The specific flow of step S6 is configured as shown in FIG. Explaining the flow of FIG. 10, the absolute value data A8 (contents of the register Ra) extracted from the input voice data is the envelope detection data (register Rh) one sample before.
When the values are not equal, the value of the envelope detection data (A12) in the register Rh is not updated, but when the values are not equal, the value of the data A12 in the register Rh is updated.

【0032】即ち、レジスタRa内のデータA8の値が
レジスタRh内のデータの値より大きいときはデータA
8をα倍した値をレジスタRhに格納し(ステップS2
2)、逆の大小関係のときはレジスタRh内のデータか
ら値βだけ減算した数値をレジスタRhに格納する(ス
テップS23)。ここで、αの値が包絡線検波データの
立ち上がり特性を決定すると共に、βの値が立ち下がり
特性を決定し、これらの値は、図2で説明した立ち上が
り特性及び立ち下がり特性が得られるように設定され
る。
That is, when the value of the data A8 in the register Ra is greater than the value of the data in the register Rh, the data A
The value obtained by multiplying 8 by α is stored in the register Rh (step S2
2) In the case of the opposite magnitude relationship, the numerical value obtained by subtracting the value β from the data in the register Rh is stored in the register Rh (step S23). Here, the value of α determines the rising characteristic of the envelope detection data, and the value of β determines the falling characteristic, and these values are such that the rising characteristic and the falling characteristic described in FIG. 2 are obtained. Is set to.

【0033】ステップS11の包絡線検波の具体的フロ
ーは、ステップS6の場合と同様に図11に示されるよ
うに実行される。そして、この図のステップS27にお
けるγの値及びステップS28におけるδの値は、図1
0の場合と同様、それぞれ包絡線検波の立ち上がり特性
及び立ち下がり特性を決定し、これらの値は図3で説明
した立ち上がり特性及び立ち下がり特性が得られるよう
に設定される。
The concrete flow of envelope detection in step S11 is executed as shown in FIG. 11 as in the case of step S6. The value of γ in step S27 and the value of δ in step S28 in FIG.
As in the case of 0, the rising characteristic and the falling characteristic of the envelope detection are respectively determined, and these values are set so that the rising characteristic and the falling characteristic described in FIG. 3 can be obtained.

【0034】なお、図10及び図11の包絡線検波のフ
ローにおいて使用する立ち上がり時及び立ち下がり時の
包絡線検波データ値を決定する演算式としては、ステッ
プS22及びステップS23、ステップS27及びステ
ップS28に示されるものの他に、例えばステップS2
2及びステップS23に関して示すと、図12の(i)
〜(iii)のように種々のものを考えることができる
が、本実施例においては、実験において最も聴感上のク
オリティーが優れていた図10及び図11に示される演
算式を採用している。
The arithmetic expressions for determining the envelope detection data values at the rising and falling edges used in the envelope detection flow of FIGS. 10 and 11 are step S22 and step S23, step S27 and step S28. In addition to what is shown in FIG.
2 and step S23, FIG.
Although various types can be considered as in (iii), in this embodiment, the arithmetic expressions shown in FIGS. 10 and 11 which have the best auditory quality in the experiment are adopted.

【0035】以上に説明したように、本発明においては
音源のレベルに応じて適応的に追従性を制御することに
よって、ダイナミックレンジの広い音源を収録する際聴
感上自然なゲイン制御が行われ、かつ、これをマイコン
制御により行う場合、簡単なアルゴリズムで実現でき
る。なお、本発明を適用できる音声記録装置としては、
アナログ録音或るいはディジタル録音を問わず様々な装
置が挙げられるが、この他にVTR或るいはビデオディ
スク等のように画像と共に音声を記録する装置にも適用
できることは勿論である。
As described above, in the present invention, by adaptively controlling the followability according to the level of the sound source, a gain control which is natural to the listener when performing recording of a sound source having a wide dynamic range is performed. Moreover, when this is controlled by a microcomputer, it can be realized by a simple algorithm. In addition, as an audio recording device to which the present invention can be applied,
Various devices can be used regardless of whether analog recording or digital recording is used, but it is needless to say that the present invention can also be applied to a device for recording audio with an image such as a VTR or a video disc.

【0036】[0036]

【発明の効果】ダイナミックレンジの広い音源を収録す
る際、聴感上自然なゲイン制御が行われる。マイコン制
御を用いて構成する場合、簡単なアルゴリズムで実現で
きる。
When recording a sound source having a wide dynamic range, a gain control that is natural to the sense of hearing is performed. When configured using microcomputer control, it can be realized with a simple algorithm.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の1実施例の構成を示す図である。FIG. 1 is a diagram showing a configuration of an exemplary embodiment of the present invention.

【図2】同実施例における包絡線検波部40の処理を説
明する図である。
FIG. 2 is a diagram illustrating a process of an envelope detection unit 40 according to the same embodiment.

【図3】同実施例における平均化処理部39、包絡線検
波部41、及び平均化サンプル数設定部37の処理を説
明する図である。
FIG. 3 is a diagram illustrating the processing of an averaging processing unit 39, an envelope detection unit 41, and an averaging sample number setting unit 37 in the same embodiment.

【図4】同実施例における増幅特性を説明する図であ
る。
FIG. 4 is a diagram illustrating amplification characteristics in the example.

【図5】同実施例において、破裂音が1回のみ発生した
ときの制御特性を説明する図である。
FIG. 5 is a diagram illustrating control characteristics when a plosive sound is generated only once in the embodiment.

【図6】同実施例において、破裂音が継続的に複数回発
生したときの制御特性を説明する図である。
FIG. 6 is a diagram illustrating control characteristics when a plosive sound is continuously generated a plurality of times in the embodiment.

【図7】同実施例の制御部をマイコンにより構成した場
合の説明図である。
FIG. 7 is an explanatory diagram of a case where the control unit of the embodiment is configured by a microcomputer.

【図8】同マイコンの動作フローを示す図である。FIG. 8 is a diagram showing an operation flow of the same microcomputer.

【図9】同マイコンにより図1の絶対値化処理部35及
び36、比較ゲート部38の処理を実現するためのフロ
ーである。
9 is a flow for realizing the processing of the absolute value conversion processing units 35 and 36 and the comparison gate unit 38 of FIG. 1 by the same microcomputer.

【図10】同マイコンにより包絡線検波部40の処理を
実現するためのフローである。
FIG. 10 is a flow for realizing the processing of the envelope detection unit 40 by the same microcomputer.

【図11】同マイコンにより包絡線検波部41の処理を
実現するためのフローである。
FIG. 11 is a flow for realizing the processing of the envelope detection unit 41 by the same microcomputer.

【図12】マイコンにより包絡線検波処理を実行する場
合に採用しうる他の演算式の例である。
FIG. 12 is an example of another arithmetic expression that can be adopted when executing envelope detection processing by a microcomputer.

【符号の説明】[Explanation of symbols]

33,34…係数器、 35,36…絶対値化処理
部、38,43…比較ゲート部、 37…平均化サ
ンプル数設定部、39…平均化処理部、 40,4
1…包絡線検波部、42…係数発生部、
33, 34 ... Coefficient unit, 35, 36 ... Absolute value processing unit, 38, 43 ... Comparison gate unit, 37 ... Averaging sample number setting unit, 39 ... Averaging processing unit, 40, 4
1 ... Envelope detection unit, 42 ... Coefficient generation unit,

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 (1)ディジタル音声信号に関する絶対
値データを導出する手段と、(2)該絶対値データにつ
いての所定サンプル数分の平均値データを導出する手段
と、(3)該平均値データについての包絡線検波データ
を導出する手段と、(4)前記所定サンプル数の値を設
定する手段と、(5)前記絶対値データについての包絡
線検波データを導出する手段と、(6)前記絶対値デー
タについての包絡線検波データ及び前記平均値データに
ついての包絡線検波データのうち、値が大きい方の包絡
線検波データに基づいて音声信号増幅手段のゲインを設
定する手段と、を備えたことを特徴とする音声レベル制
御装置。
1. A method of deriving (1) absolute value data relating to a digital audio signal, (2) a means of deriving average value data of a predetermined number of samples for the absolute value data, and (3) the average value. Means for deriving envelope detection data for data, (4) means for setting a value of the predetermined number of samples, (5) means for deriving envelope detection data for the absolute value data, (6) Of the envelope detection data for the absolute value data and the envelope detection data for the average value data, a means for setting the gain of the audio signal amplifying means based on the envelope detection data having the larger value. A voice level control device characterized by the above.
【請求項2】 所定サンプル数の値を設定する手段は、
前記平均値データについての包絡線検波データに基づき
該包絡線検波データのレベルが大きいほど所定サンプル
数の値を高く設定するものであることを特徴とする請求
項1記載の音声レベル制御装置。
2. The means for setting the value of the predetermined number of samples comprises:
The audio level control device according to claim 1, wherein the value of the predetermined number of samples is set higher as the level of the envelope detection data is higher based on the envelope detection data for the average value data.
【請求項3】 ディジタル音声信号に関する絶対値デー
タは、複数チャンネルのそれぞれのディジタル音声信号
の絶対値のうち最も値の大きい絶対値であることを特徴
とする請求項1または2記載の音声レベル制御装置。
3. The audio level control according to claim 1, wherein the absolute value data regarding the digital audio signal is the absolute value having the largest value among the absolute values of the digital audio signals of a plurality of channels. apparatus.
JP33621094A 1994-12-22 1994-12-22 Audio level control device Expired - Fee Related JP3365113B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33621094A JP3365113B2 (en) 1994-12-22 1994-12-22 Audio level control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33621094A JP3365113B2 (en) 1994-12-22 1994-12-22 Audio level control device

Publications (2)

Publication Number Publication Date
JPH08180582A JPH08180582A (en) 1996-07-12
JP3365113B2 true JP3365113B2 (en) 2003-01-08

Family

ID=18296778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33621094A Expired - Fee Related JP3365113B2 (en) 1994-12-22 1994-12-22 Audio level control device

Country Status (1)

Country Link
JP (1) JP3365113B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005055420A1 (en) * 2003-12-02 2005-06-16 Koninklijke Philips Electronics N.V. Constant sound level
JP5129115B2 (en) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド System, method and apparatus for suppression of high bandwidth burst
TWI324336B (en) 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing

Also Published As

Publication number Publication date
JPH08180582A (en) 1996-07-12

Similar Documents

Publication Publication Date Title
KR100197776B1 (en) Amplitude compressing / expanding circuit
US5172358A (en) Loudness control circuit for an audio device
JP3295440B2 (en) Signal processing circuit in audio equipment
JP3295443B2 (en) Signal processing circuit in audio equipment
US5392381A (en) Acoustic analysis device and a frequency conversion device used therefor
JP3365113B2 (en) Audio level control device
JP3097376B2 (en) Howling suppression device
JPH04365210A (en) On-vehicle sound reproducing device
JPH09116362A (en) Automatic volume control equipment
EP3471267A1 (en) Method and apparatus for repairing distortion of an audio signal
JPH0855428A (en) Sound recording signal processor
JP3243737B2 (en) Volume control circuit device
JPH0982019A (en) Audio level controlling device and method
CN113611271B (en) Digital volume augmentation method and device suitable for mobile terminal and storage medium
JP3102553B2 (en) Audio signal processing device
KR100348628B1 (en) Volume control method for digital audio player
JP3119677B2 (en) Signal processing circuit
JPH05204388A (en) Message output device
JPH075579Y2 (en) Playback device with built-in solid-state memory
JPH0575366A (en) Signal processing circuit in audio equipment
JPH08298698A (en) Environmental sound analyzer
KR950006847B1 (en) Volume automatic control system of reproducing signal
JP3022619B2 (en) Automatic adjustment device for information playback speed
JP3162868B2 (en) Noise reduction circuit of recording / reproducing device
JPH0965492A (en) Loudness compensation device and hearing aid device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021001

LAPS Cancellation because of no payment of annual fees