JP5841405B2 - Dynamic range expansion device - Google Patents
Dynamic range expansion device Download PDFInfo
- Publication number
- JP5841405B2 JP5841405B2 JP2011241092A JP2011241092A JP5841405B2 JP 5841405 B2 JP5841405 B2 JP 5841405B2 JP 2011241092 A JP2011241092 A JP 2011241092A JP 2011241092 A JP2011241092 A JP 2011241092A JP 5841405 B2 JP5841405 B2 JP 5841405B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- envelope
- signal
- detection
- dynamic range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
本発明は、ダイナミックレンジ拡張装置に関し、より詳細には、ダイナミックレンジを圧縮して平坦化したオーディオ信号をスピーカなどから出力する場合に、出力音のメリハリ感と臨場感とを発現させることができ、音質を向上させることが可能なダイナミックレンジ拡張装置に関する。 The present invention relates to a dynamic range expansion device, and more specifically, when an audio signal that has been flattened by compressing a dynamic range is output from a speaker or the like, the sharpness and presence of the output sound can be expressed. The present invention relates to a dynamic range expansion device capable of improving sound quality.
一般に、コンサートホールや録音用スタジオにおいて演奏される楽器やボーカル等の音量レベルの範囲は非常に大きい。このため、音量レベルの範囲が非常に大きい楽器やボーカルの音を収録機器で録音する場合には、収録機器のダイナミックレンジを超えるような過大な音が収録機器に対して入力されるおそれがあった。 In general, the range of volume levels of musical instruments and vocals played in concert halls and recording studios is very large. For this reason, when recording a musical instrument or vocal sound with a very large volume level on the recording device, it is possible that an excessive sound exceeding the dynamic range of the recording device may be input to the recording device. It was.
ここで、ダイナミックレンジとは、識別可能な信号の最小値と最大値の比率を意味している。例えば、CDのように分解能が16bitに規定される場合は、ダイナミックレンジが96dBとなり、DVDのように分解能が24bitに規定される場合には、ダイナミックレンジが144dBとなる。 Here, the dynamic range means the ratio between the minimum value and the maximum value of the identifiable signal. For example, when the resolution is defined as 16 bits as in a CD, the dynamic range is 96 dB, and when the resolution is defined as 24 bits as in a DVD, the dynamic range is 144 dB.
ダイナミックレンジを超えた音を収録機器に収録すると、収録音に大きな歪が発生し、音質劣化の原因となってしまう。このような問題を解決する手段として、一般にコンプレッサやリミッタが適用されている(例えば、非特許文献1,非特許文献2参照)。
If sound exceeding the dynamic range is recorded on the recording device, large distortion occurs in the recorded sound, resulting in deterioration of sound quality. As a means for solving such a problem, a compressor and a limiter are generally applied (for example, see Non-Patent
図16(a)は、コンプレッサに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示し、図16(b)は、リミッタに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示している。 FIG. 16A shows an input / output operation example showing the relationship between the signal level of the input signal to the compressor and the output level of the output signal, and FIG. 16B shows the signal level and output signal of the input signal to the limiter. An input / output operation example showing the relationship with the output level is shown.
コンプレッサは、可変式ゲインアンプとして機能するものである。コンプレッサは、図16(a)に示すように、入力信号の信号レベルに対する出力信号の信号レベルの増加割合を、予め設定されるスレッシホールドのレベルを超える前に比べて、スレッシホールドのレベルを超えた後の方が低くなるようにして、出力信号の信号レベルを抑制する役割を有している。すなわち、コンプレッサは、オーディオ信号を常時モニタし、設定されたスレッシホールドのレベルよりも音が大きくならないように自動的にゲインをコントロールするものである。 The compressor functions as a variable gain amplifier. As shown in FIG. 16A, the compressor sets the threshold level of the output signal relative to the signal level of the input signal as compared with the level before the threshold level exceeds a preset threshold level. It has a role of suppressing the signal level of the output signal by lowering the value after exceeding. That is, the compressor constantly monitors the audio signal and automatically controls the gain so that the sound does not become louder than the set threshold level.
一方で、リミッタは、高い圧縮レシオを持ったコンプレッサとして機能するものである。リミッタは、入力信号の信号レベルがスレッシホールドのレベルを大きく超えても出力レベルを一定に保つ役割を有している。 On the other hand, the limiter functions as a compressor having a high compression ratio. The limiter has a role of keeping the output level constant even when the signal level of the input signal greatly exceeds the threshold level.
コンプレッサとリミッタは、いずれも自動的にゲイン(信号レベル)が高い部分を抑圧し、所定のダイナミックレンジ内に収める役割を有している。しかしながら、コンプレッサは、スレッシホールドのレベルを超えた入力信号レベルの増加量をゆるやかに抑える(減少させる)ものであり、リミッタは設定したスレッシホールドのレベルを超えた信号をカットするものである点で、大きく相違する。 Both the compressor and the limiter have a role of automatically suppressing a portion with a high gain (signal level) and keeping it within a predetermined dynamic range. However, the compressor gently suppresses (decreases) the increase of the input signal level exceeding the threshold level, and the limiter cuts the signal exceeding the set threshold level. This is a big difference.
図17は、CDに記録されたオーディオ信号の信号波形の一例を示した図である。上述したように、CDではダイナミックレンジが96dBとなり、ダイナミックレンジが96dBに収まらないオーディオ信号の信号レベルは抑制されることになる。図17の破線Cで囲んだ部分は、信号レベルが高くなっている箇所に該当し、オーディオ信号のレンジ内における振幅の最大値が、コンプレッサおよびリミッタにより±1に正規化された(クリップされた)箇所に該当する。図17の最小分解能は、1/(2(16−1))、つまり、3.05×10−5となっている。 FIG. 17 is a diagram illustrating an example of a signal waveform of an audio signal recorded on a CD. As described above, the CD has a dynamic range of 96 dB, and the signal level of the audio signal whose dynamic range does not fit within 96 dB is suppressed. A portion surrounded by a broken line C in FIG. 17 corresponds to a portion where the signal level is high, and the maximum value of the amplitude within the range of the audio signal is normalized to ± 1 by the compressor and the limiter (clipped). ) The minimum resolution in FIG. 17 is 1 / (2 (16-1) ), that is, 3.05 × 10 −5 .
特に、図17の破線Aおよび破線Bで示される部分は、CDに記録されるオーディオ信号の振幅が±1に抑制されて振幅形状が矩形形状となっている。このため、フルスケールの信号は、矩形形状部分において振幅が±1に制限され、音源のダイナミックレンジが圧縮される。 In particular, the portions indicated by the broken lines A and B in FIG. 17 have a rectangular shape in which the amplitude of the audio signal recorded on the CD is suppressed to ± 1. For this reason, the amplitude of the full-scale signal is limited to ± 1 in the rectangular portion, and the dynamic range of the sound source is compressed.
ところで、このようなダイナミックレンジが圧縮されたCD音源を、ボリューム設定で音量を増大した後にスピーカから再生(出力)し、または、CD音源を増幅するパワーアンプ等を介してスピーカから再生(出力)する場合が多く存在する。このようにボリューム設定やパワーアンプ等による出力音の音量増大が行われると、CDに記録された状態において、既に信号出力が抑制されて平坦化されているため(ダイナミックレンジが圧縮されて、クリップされているため)、音のメリハリ感が大きく低減され、また、臨場感も低下してしまうという問題があった。 By the way, a CD sound source having such a compressed dynamic range is reproduced (output) from the speaker after the volume is increased by volume setting, or is reproduced (output) from the speaker via a power amplifier that amplifies the CD sound source. There are many cases to do. When the volume of the output sound is increased by the volume setting or the power amplifier in this way, the signal output is already suppressed and flattened in the state recorded on the CD (the dynamic range is compressed, the clip Therefore, there is a problem that the sharpness of the sound is greatly reduced and the sense of reality is also lowered.
また、図17の破線Aおよび破線Bで囲んだ部分のように、オーディオ信号の振幅が±1でクリップされた場合には、信号波形が矩形状になるため、不要な高調波が発生し易くなり、音質の劣化が発生するという問題があった。このため、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号の出力音に対して、ダイナミックレンジを拡張することに対する要望が高まっている。 Further, when the audio signal is clipped with an amplitude of ± 1 as shown by a broken line A and a broken line B in FIG. 17, the signal waveform becomes rectangular, and unnecessary harmonics are easily generated. Therefore, there is a problem that sound quality is deteriorated. For this reason, there is an increasing demand for extending the dynamic range of the output sound of the audio signal that has been flattened by compressing the dynamic range.
一方で、ダイナミックレンジの圧縮が行われていない場合において、ダイナミックレンジの拡張が行われてしまうと、音質の劣化を招いてしまうおそれがあるという問題がある。 On the other hand, when the dynamic range is not compressed, there is a problem that the sound quality may be deteriorated if the dynamic range is expanded.
さらに、インターネットラジオのような音声配信サービスでは、信号がフルスケールに満たない場合(スピーカなどの出力レンジに余裕がある場合)であっても、ダイナミックレンジの圧縮が行われてしまっている場合もあり得る。同楽曲でありながら、フルスケールに満たない場合の信号とフルスケールである場合の信号に対し、ダイナミックレンジの拡張処理を行った結果、振幅スケールの違いから、補完された信号の変動形状が異なることがないよう配慮すべきである。 Furthermore, in audio distribution services such as Internet radio, the dynamic range may be compressed even if the signal is less than full scale (when the output range of speakers, etc. is sufficient). possible. As a result of dynamic range expansion processing for signals that are the same song but less than full scale and signals that are full scale, the variation shape of the complemented signal differs due to the difference in amplitude scale Care should be taken so that nothing happens.
本発明は、上記課題に鑑みてなされたものであり、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号の出力音に対して、当該オーディオ信号がフルスケールに満たない信号であっても、フルスケールを満たす信号であっても、メリハリ感と臨場感とを発現させ、音質を向上させることが可能なダイナミックレンジ拡張装置を提供することを課題とする。 The present invention has been made in view of the above problems, and even if the audio signal is less than full scale with respect to the output sound of the audio signal whose dynamic range has been compressed and flattened, the signal is not full. It is an object of the present invention to provide a dynamic range expansion device capable of improving the sound quality by expressing sharpness and presence even if the signal satisfies the scale.
上記課題を解決するために、本発明に係るダイナミックレンジ拡張装置は、音源から出力されるオーディオ信号の最大値変化状態に基づいて第1包絡線の検出を行う第1包絡線検出手段と、該第1包絡線検出手段により検出された前記第1包絡線における所定時間の平均的な振幅の値を振幅平均値Ymeanとして算出する平均値算出手段と、前記第1包絡線検出手段により検出された前記第1包絡線の前記所定時間における振幅の最大値を振幅最大値Ymaxとして算出する最大値算出手段と、前記平均値算出手段により算出された振幅平均値Ymeanと前記最大値算出手段により算出された振幅最大値Ymaxと基づいて、検出ゲインを決定する検出ゲイン決定手段と、該検出ゲイン決定手段により決定された前記検出ゲインを下限値として、前記音源から出力されるオーディオ信号の最大値変化状態を求めて第2包絡線の検出を行う第2包絡線検出手段と、該第2包絡線検出手段により検出された前記第2包絡線をデシベル変換するデシベル変換手段と、該デシベル変換手段によりデシベル変換された前記第2包絡線を微分処理することにより、前記第2包絡線の変化量を示す変化量信号を生成する微分手段と、前記微分手段により生成された変化量信号に−1を乗算することにより信号の反転を行う反転手段と、該反転手段により反転された前記変化量信号をリニアな信号に変換することにより検出信号を生成するリニア変換手段と、前記オーディオ信号に前記検出信号を乗算した信号を、前記オーディオ信号から減算することにより補完信号を生成する補完信号生成手段と、該補完信号生成手段により生成された補完信号を、前記オーディオ信号に加算する加算手段とを備え、前記検出ゲイン決定手段は、前記振幅最大値Ymaxに対する前記振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、前記検出ゲインを0[dB]に決定し、前記比の値が前記第1閾値である場合に、前記検出ゲインを10logYmax 2[dB]に決定し、前記比の値が前記第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logYmax 2[dB]より低減させた値を前記検出ゲインに決定し、前記比の値が前記第2閾値より大きい場合に、低減された前記検出ゲインにおける前記第2閾値の値を前記検出ゲインに決定することを特徴とする。 In order to solve the above problem, a dynamic range expansion device according to the present invention includes first envelope detection means for detecting a first envelope based on a maximum value change state of an audio signal output from a sound source, Average value calculating means for calculating an average amplitude value for a predetermined time in the first envelope detected by the first envelope detecting means as an amplitude average value Y mean , and detected by the first envelope detecting means Further, a maximum value calculating means for calculating the maximum value of the amplitude of the first envelope at the predetermined time as an amplitude maximum value Y max , an amplitude average value Y mean calculated by the average value calculating means, and the maximum value calculating means based the calculated maximum amplitude value Y max, the detection gain determining means for determining a detection gain, as the lower limit of the detection gain which has been determined by the detection gain determination unit, the sound source A second envelope detecting means for detecting a second envelope by obtaining a maximum value change state of the audio signal output from the signal, and decibel transforming the second envelope detected by the second envelope detecting means. A decibel transforming means, a differentiating means for generating a change amount signal indicating a change amount of the second envelope by differentiating the second envelope transformed by the decibel transforming means, and the differentiating means Inversion means for inverting the signal by multiplying the generated change amount signal by −1, and linear conversion for generating a detection signal by converting the change amount signal inverted by the inversion means into a linear signal Means, a complementary signal generating means for generating a complementary signal by subtracting a signal obtained by multiplying the audio signal by the detection signal from the audio signal, and the complementary signal Complementary signal generated by formation means, and an adding means for adding to the audio signal, the detection gain determination means, the value of the ratio of the average amplitude value Y mean for the amplitude maximum value Y max is 0. The detection gain is determined to be 0 [dB] when smaller than a first threshold value set to a value smaller than 5, and when the ratio value is the first threshold value, the detection gain is set to 10 log Y max 2 [DB], and when the ratio value is equal to or greater than the first threshold value and equal to or less than a second threshold value set to a value greater than 0.5, the ratio value is equal to the first threshold value. When the detection gain is determined to be a value reduced from 10 logY max 2 [dB] in an inverse proportion to the increase from the threshold value to the second threshold value, and the ratio value is greater than the second threshold value Reduced detection gain The value of the second threshold value in is determined as the detection gain.
本発明に係るダイナミックレンジ拡張装置は、第2包絡線検出手段においてオーディオ信号の最大値変化状態に基づいて第2包絡線の検出を行い、微分手段により第2包絡線の変化量を示す変化量信号の生成を行う。 The dynamic range extending apparatus according to the present invention detects the second envelope based on the maximum value change state of the audio signal in the second envelope detecting means, and the change amount indicating the change amount of the second envelope by the differentiating means. Generate a signal.
このため、第2包絡線における最大値変化が大きい場合には、変化量信号の変化量が大きくなり、第2包絡線における最大値変化が小さい場合には、変化量信号の変化量が小さくなる。反転手段で第2包絡線の変化量が示された変化量信号の反転を行った後にオーディオ信号に乗算し、乗算処理された信号を、オーディオ信号から減算することにより、圧縮されて平坦化されたオーディオ信号のダイナミックレンジを拡張するための補完信号を生成することができる。 For this reason, when the maximum value change in the second envelope is large, the change amount of the change amount signal is large, and when the maximum value change in the second envelope is small, the change amount of the change amount signal is small. . The inversion means inverts the change amount signal indicating the change amount of the second envelope and then multiplies the audio signal, and subtracts the multiplied signal from the audio signal to compress and flatten it. It is possible to generate a complementary signal for extending the dynamic range of the audio signal.
従って、加算手段において補完信号生成手段により生成された補完信号を、オーディオ信号に加算することにより、ダイナミックレンジが圧縮されて平坦化された箇所のダイナミックレンジを拡張することができ、出力されるオーディオ信号のメリハリ感と臨場感とを発現させることが可能となる。 Therefore, by adding the complementary signal generated by the complementary signal generating means in the adding means to the audio signal, the dynamic range of the portion where the dynamic range is compressed and flattened can be expanded, and the output audio is output. It is possible to express the sharpness and presence of the signal.
さらに、本発明に係るダイナミックレンジ拡張装置では、検出ゲイン決定手段により決定された検出ゲインを下限値として、オーディオ信号の最大値変化状態に基づいて第2包絡線が求められている。つまり、ダイナミックレンジの拡張処理に用いられる第2包絡線検出の下限値が、検出ゲインに基づいて決定される。 Furthermore, in the dynamic range expansion apparatus according to the present invention, the second envelope is obtained based on the maximum value change state of the audio signal, with the detection gain determined by the detection gain determination means as the lower limit value. That is, the lower limit value of the second envelope detection used for the dynamic range expansion process is determined based on the detection gain.
ここで、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、検出ゲインは0に決定される。つまり、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合には、第2包絡線検出の下限値が0[dB]に決定されることになる。 Here, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is smaller than the first threshold value set to a value smaller than 0.5, the detection gain is determined to be zero. That is, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is relatively small (less than 0.5), the lower limit value of the second envelope detection is determined to be 0 [dB]. become.
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれが低い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合に、検出ゲイン決定手段が、第2包絡線検出の下限値(検出ゲイン)を0[dB]に決定することにより、第2包絡線が過大に検出されて不必要な補完信号がオーディオ信号に加算され、オーディオ信号の音質が低減されてしまうことを抑制することが可能となる。 In general, when the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is small in the audio signal, the possibility that the dynamic range is compressed is low. For this reason, when the value of the ratio of the amplitude average value Y mean to the maximum amplitude value Y max is relatively small (less than 0.5), the detection gain determination means is the lower limit value (detection gain) of the second envelope detection. Is determined to be 0 [dB], so that it is possible to prevent the second envelope from being excessively detected and an unnecessary complementary signal being added to the audio signal, thereby reducing the sound quality of the audio signal. Become.
一方で、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値よりも小さい場合に、比の値が第1閾値から第2閾値まで増加するのに反比例させるようにして、10logYmax 2[dB]より低減された値が検出ゲインとして決定される。 On the other hand, when the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is equal to or larger than the first threshold value and smaller than the second threshold value set to a value larger than 0.5, the ratio As a detection gain, a value reduced from 10 logY max 2 [dB] is determined so that the value of is increased in inverse proportion to the increase from the first threshold value to the second threshold value.
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれが高い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値から第2閾値まで増加するに従って、第1閾値に対応する10logYmax 2[dB]より低減させた値を第2包絡線検出の下限値に決定することにより、ダイナミックレンジの圧縮が行われたオーディオ信号に適切な補完信号を加算することができ、オーディオ信号の音質向上を図ることが可能となる。 In general, when the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is large in the audio signal, there is a high possibility that the dynamic range is being compressed. For this reason, as the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max increases from the first threshold value to the second threshold value, a value reduced from 10 log Y max 2 [dB] corresponding to the first threshold value is increased. By determining the lower limit value of the two envelope detection, an appropriate complementary signal can be added to the audio signal whose dynamic range has been compressed, and the sound quality of the audio signal can be improved.
さらに、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第2閾値より大きい場合には、比の値に反比例して低減された第2閾値における検出ゲインを、第2包絡線検出の下限値(検出ゲイン)に決定することにより、第2包絡線における最大値変化が過大に検出されてしまって、オーディオ信号に不適切な補完信号が加算されてしまうことを防止することができる。 Further, when the ratio value of the average amplitude value Y mean with respect to the maximum amplitude value Y max is larger than the second threshold value, the detection gain at the second threshold value reduced in inverse proportion to the ratio value is detected as the second envelope. By determining the lower limit value (detection gain), it is possible to prevent the maximum change in the second envelope from being excessively detected and adding an inappropriate complementary signal to the audio signal. .
また、本発明に係るダイナミックレンジ拡張装置では、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値に基づいてダイナミックレンジの圧縮の程度を判断するため、ダイナミックレンジの圧縮が行われたオーディオ信号がフルスケールである場合であっても、フルスケールに満たない場合であっても、その出力レベルに左右されることなくダイナミックレンジの拡張処理を行うことができる。このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われている信号に対し、ダイナミックレンジの拡張処理が行われない可能性を排除することができる。 Further, in the dynamic range expansion device according to the present invention, the dynamic range compression audio is performed in order to determine the degree of compression of the dynamic range based on the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max . Whether the signal is full scale or less than full scale, the dynamic range can be expanded regardless of the output level. For this reason, it is possible to eliminate the possibility that the dynamic range expansion processing is not performed on a signal that is less than full scale and that has undergone dynamic range compression.
また、上述したダイナミックレンジ拡張装置において、前記検出ゲイン決定手段は、前記比の値が前記第1閾値以上であって、かつ、前記第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記検出ゲインを、前記10logYmax 2[dB]から−30+10logYmax 2[dB]まで低減させ、前記比の値が前記第2閾値より大きい場合に、前記検出ゲインを−30+10logYmax 2[dB]に決定するものであってもよい。 Further, in the above-described dynamic range expansion apparatus, the detection gain determination unit may determine that the ratio value is the first threshold value when the ratio value is equal to or greater than the first threshold value and equal to or less than the second threshold value. The detection gain is reduced from 10 logY max 2 [dB] to −30 + 10 log Y max 2 [dB] in an inverse proportion to the increase from 1 threshold to the second threshold, and the value of the ratio is the second When it is larger than the threshold value, the detection gain may be determined to be −30 + 10 logY max 2 [dB].
CDやDVD等においてダイナミックレンジが圧縮された状態で記録されるオーディオ信号では、第2包絡線検出の検出範囲を−30[dB]〜0[dB]に設定した上でダイナミックレンジを拡張することにより、効果的な音質向上を図ることが好ましい。 For an audio signal recorded with a dynamic range compressed on a CD, DVD, or the like, the dynamic range is expanded after setting the detection range of the second envelope detection to -30 [dB] to 0 [dB]. Therefore, it is preferable to improve the sound quality effectively.
このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値以上であって、かつ、第2閾値以下である場合には、比の値が前記第1閾値から第2閾値まで増加するのに反比例させるようにして、検出ゲインを、10logYmax 2[dB]から−30+10logYmax 2[dB]まで低減させ、比の値が第2閾値より大きい場合には、検出ゲインを−30+10logYmax 2[dB]に決定することにより、CDやDVD等に記録されるオーディオ信号に適したダイナミックレンジの拡張処理を行うことが可能となる。 For this reason, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is equal to or larger than the first threshold value and equal to or smaller than the second threshold value, the ratio value is changed from the first threshold value to the second threshold value. When the detection gain is reduced from 10 log Y max 2 [dB] to −30 + 10 log Y max 2 [dB] in an inverse proportion to the increase to the threshold, and the ratio value is greater than the second threshold, the detection gain is By determining -30 + 10 log Y max 2 [dB], it is possible to perform a dynamic range expansion process suitable for an audio signal recorded on a CD, a DVD, or the like.
また、上述したダイナミックレンジ拡張装置は、前記補完信号生成手段により生成された補完信号のゲインを増幅又は減衰することによりゲイン調節を行うゲイン調節手段を有し、前記加算手段は、前記ゲイン調節手段によりゲイン調節された前記補完信号を、前記オーディオ信号に加算するものであってもよい。 In addition, the above-described dynamic range extending apparatus has gain adjusting means for performing gain adjustment by amplifying or attenuating the gain of the complementary signal generated by the complementary signal generating means, and the adding means is the gain adjusting means. The complementary signal that has been gain-adjusted according to the above may be added to the audio signal.
補完信号は、包絡線における最大値変化に基づいて生成されるため、ダイナミックレンジが圧縮されて平坦化された箇所におけるゲイン(振幅)を拡張することが可能である。しかしながら、拡張すべきダイナミックレンジのゲインは、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号ごとに異なり、そのまま補完信号をオーディオ信号に加算しても、十分なダイナミックレンジの補完(拡張)を行えなかったり、ダイナミックレンジの補完(拡張)量が多すぎたりして、かえって音質の低下を招いてしまうおそれもある。 Since the complementary signal is generated based on the maximum value change in the envelope, it is possible to expand the gain (amplitude) at the location where the dynamic range is compressed and flattened. However, the gain of the dynamic range that should be expanded differs for each audio signal that has been flattened by compressing the dynamic range, and even if the complementary signal is added to the audio signal as it is, sufficient dynamic range can be supplemented (expanded). There is also a possibility that the sound quality is deteriorated because there is not enough or the amount of complementation (expansion) of the dynamic range is too large.
このため、オーディオ信号の圧縮状態などに応じて、ゲイン調節手段で予め補完信号のゲインを増幅又は減衰しておくことにより、加算手段で補完信号が加算されたオーディオ信号のダイナミックレンジを、適切に拡張することが可能となる。 Therefore, according to the compression state of the audio signal, the gain adjustment means amplifies or attenuates the gain of the complementary signal in advance, thereby appropriately adjusting the dynamic range of the audio signal to which the complementary signal is added by the adding means. It becomes possible to expand.
また、上述したダイナミックレンジ拡張装置において、前記微分手段は、ハイパスフィルタを用いて前記オーディオ信号のフィルタリング処理を行うことによって微分処理を行い、該フィルタリング処理により求められる前記変化量の変化時間は、前記ハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することにより調整されるものであってもよい。 Further, in the above-described dynamic range expansion device, the differentiating unit performs a differentiation process by performing a filtering process of the audio signal using a high-pass filter, and the change time of the amount of change obtained by the filtering process is It may be adjusted by changing the set value of the normalized cutoff frequency in the high-pass filter.
上述したように、微分手段における微分処理は、オーディオ信号に対して、ハイパスフィルタを用いたフィルタリング処理を行うことによって実現される。また、このハイパスフィルタの正規化カットオフ周波数の設定値を変更することにより、フィルタリング処理により求められる変化量の変化時間を調整することが可能となる。 As described above, the differentiation process in the differentiation unit is realized by performing a filtering process using a high-pass filter on the audio signal. Further, by changing the set value of the normalized cutoff frequency of the high-pass filter, it is possible to adjust the change time of the change amount obtained by the filtering process.
例えば、ダイナミックレンジが圧縮されて振幅が平坦化される状態は、コンプレッサやリミッタにおける設定により異なり、また、CDとDVDとではダイナミックレンジの圧縮状態が異なったものとなる。従って、オーディオ信号におけるダイナミックレンジの圧縮状態に応じて正規化カットオフ周波数を調整することにより、ダイナミックレンジの圧縮状態に適したダイナミックレンジの拡張時間の調整を行うことが可能となる。 For example, the state where the dynamic range is compressed and the amplitude is flattened differs depending on the setting in the compressor and limiter, and the compression state of the dynamic range differs between CD and DVD. Therefore, by adjusting the normalized cutoff frequency according to the compression state of the dynamic range in the audio signal, it is possible to adjust the expansion time of the dynamic range suitable for the compression state of the dynamic range.
本発明に係るダイナミックレンジ拡張装置は、検出ゲイン決定手段により決定された検出ゲインを下限値として、オーディオ信号の最大値変化状態に基づいて第2包絡線が求められている。つまり、ダイナミックレンジの拡張処理に用いられる第2包絡線検出の下限値が、検出ゲインに基づいて決定される。 In the dynamic range expansion apparatus according to the present invention, the second envelope is obtained based on the maximum value change state of the audio signal with the detection gain determined by the detection gain determination means as the lower limit value. That is, the lower limit value of the second envelope detection used for the dynamic range expansion process is determined based on the detection gain.
ここで、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、検出ゲインは0に決定される。つまり、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合には、第2包絡線検出の下限値が0[dB]に決定されることになる。 Here, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is smaller than the first threshold value set to a value smaller than 0.5, the detection gain is determined to be zero. That is, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is relatively small (less than 0.5), the lower limit value of the second envelope detection is determined to be 0 [dB]. become.
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれが低い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合に、検出ゲイン決定手段が、第2包絡線検出の下限値(検出ゲイン)を0[dB]に決定することにより、第2包絡線が過大に検出されて不必要な補完信号がオーディオ信号に加算され、オーディオ信号の音質が低減されてしまうことを抑制することが可能となる。 In general, when the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is small in the audio signal, the possibility that the dynamic range is compressed is low. For this reason, when the value of the ratio of the amplitude average value Y mean to the maximum amplitude value Y max is relatively small (less than 0.5), the detection gain determination means is the lower limit value (detection gain) of the second envelope detection. Is determined to be 0 [dB], so that it is possible to prevent the second envelope from being excessively detected and an unnecessary complementary signal being added to the audio signal, thereby reducing the sound quality of the audio signal. Become.
一方で、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値よりも小さい場合に、比の値が第1閾値から第2閾値まで増加するのに反比例させるようにして、10logYmax 2[dB]より低減された値が検出ゲインとして決定される。 On the other hand, when the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is equal to or larger than the first threshold value and smaller than the second threshold value set to a value larger than 0.5, the ratio As a detection gain, a value reduced from 10 logY max 2 [dB] is determined so that the value of is increased in inverse proportion to the increase from the first threshold value to the second threshold value.
一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれが高い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値から第2閾値まで増加するに従って、第1閾値に対応する10logYmax 2[dB]より低減させた値を第2包絡線検出の下限値に決定することにより、ダイナミックレンジの圧縮が行われたオーディオ信号に適切な補完信号を加算することができ、オーディオ信号の音質向上を図ることが可能となる。 In general, when the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is large in the audio signal, there is a high possibility that the dynamic range is being compressed. For this reason, as the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max increases from the first threshold value to the second threshold value, a value reduced from 10 log Y max 2 [dB] corresponding to the first threshold value is increased. By determining the lower limit value of the two envelope detection, an appropriate complementary signal can be added to the audio signal whose dynamic range has been compressed, and the sound quality of the audio signal can be improved.
さらに、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第2閾値より大きい場合には、比の値に反比例して低減された第2閾値における検出ゲインを、第2包絡線検出の下限値(検出ゲイン)に決定することにより、第2包絡線における最大値変化が過大に検出されてしまって、オーディオ信号に不適切な補完信号が加算されてしまうことを防止することができる。 Further, when the ratio value of the average amplitude value Y mean with respect to the maximum amplitude value Y max is larger than the second threshold value, the detection gain at the second threshold value reduced in inverse proportion to the ratio value is detected as the second envelope. By determining the lower limit value (detection gain), it is possible to prevent the maximum change in the second envelope from being excessively detected and adding an inappropriate complementary signal to the audio signal. .
また、本発明に係るダイナミックレンジ拡張装置では、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値に基づいてダイナミックレンジの圧縮の程度を判断するため、ダイナミックレンジの圧縮が行われたオーディオ信号がフルスケールである場合であってもフルスケールに満たない場合であっても、その出力レベルに左右されることなくダイナミックレンジの拡張処理を行うことができる。このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われていない信号などに対して、不要なダイナミックレンジの拡張処理が行われてしまうことを抑制することが可能となる。 Further, in the dynamic range expansion device according to the present invention, the dynamic range compression audio is performed in order to determine the degree of compression of the dynamic range based on the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max . Whether the signal is full scale or less than full scale, the dynamic range can be expanded regardless of the output level. For this reason, it is possible to suppress an unnecessary dynamic range expansion process from being performed on an audio signal that is less than full scale and has not been subjected to dynamic range compression. .
以下、本発明に係るダイナミックレンジ拡張装置の一例について、図面を示して詳細について説明する。 Hereinafter, an example of a dynamic range expansion apparatus according to the present invention will be described in detail with reference to the drawings.
[ダイナミックレンジ拡張装置]
図1は、本実施の形態に係るダイナミックレンジ拡張装置1の概略構成を示したブロック図である。ダイナミックレンジ拡張装置1は、ダイナミックレンジの圧縮により平坦化された状態となったオーディオ信号のゲイン(信号レベル)を拡張する(補完する)役割を有している。
[Dynamic range expansion device]
FIG. 1 is a block diagram showing a schematic configuration of a dynamic
ダイナミックレンジ拡張装置1は、LPF部(ローパスフィルタ部)10と、HPF部(ハイパスフィルタ部)11と、第1変動検出部12と、第2変動検出部13と、第1重み付け部14と、第2重み付け部15と、合成部(加算手段)16と、楽曲分析部17とを有している。
The dynamic
ダイナミックレンジ拡張装置1には、ダイナミックレンジの圧縮されたオーディオ信号(例えば、CDなどへの記録に伴ってダイナミックレンジが圧縮されたオーディオ信号)が入力される。入力されたオーディオ信号は、図1に示すように、ダイナミックレンジ拡張装置1のLPF部10と、HPF部11と、合成部16と、楽曲分析部17に対してそれぞれ出力される。
The dynamic
[楽曲分析部]
楽曲分析部17は、入力されるオーディオ信号(ダイナミックレンジの圧縮が行われたオーディオ信号)より包絡線(第1包絡線)の検出を行い、検出された包絡線に基づいて、第1変動検出部12および第2変動検出部13に対する包絡線(第2包絡線)の検出の下限値(検出ゲイン)を動的に決定(設定)する役割を有している。
[Music analysis section]
The
楽曲分析部17は、図2に示すように、第1最大値検出部(第1包絡線検出手段)21と、第1最大値ホールド部(第1包絡線検出手段)22と、第1スムージング部(第1包絡線検出手段)23と、モノラル変換部24と、平均値ホールド部(平均値算出手段)25と、第2最大値ホールド部(最大値算出手段)26と、検出ゲイン算出部(検出ゲイン決定手段)27とを有している。
As shown in FIG. 2, the
第1最大値検出部21は、入力されたLチャネルおよびRチャネルのそれぞれのオーディオ信号の振幅を絶対値化した後に、所定の時間(mサンプル)内の最大値を検出して、それぞれのチャネル毎に出力する役割を有している。従って、第1最大値検出部21において所定の時間(mサンプル)ごとに最大値が更新されて、第1最大値ホールド部22に出力される。ただし、第2最大値検出部31(図8参照)に対する入力信号として、所定の周波数でサンプリングされたデータが用いられている。
The first maximum
第1最大値ホールド部22は、第1最大値検出部21において所定の時間(mサンプル)ごとに更新されるそれぞれのチャネルの最大値を受信した場合において、受信した最新の最大値だけでなく、その最大値を含む過去n回分の最大値(n個の最大値)の中で、最も大きな値を示す最大値の値を、それぞれのチャネル毎に求める。そして、第1最大値ホールド部22は、求められた各チャネルの最大値を、所定の時間(mサンプル)ごとに、第1スムージング部23へ出力する。
The first maximum
つまり、第1最大値ホールド部22は、第1最大値検出部21から所定の時間(mサンプル)ごとに所定の時間(mサンプル)の内で最も大きな値の最大値を取得し、さらに、取得した最大値を含む過去n回分の最大値の中で最も値の大きな最大値(つまり、n×mサンプルの間における最も値の高い最大値)を検出して、所定の時間(mサンプル)ごとに、第1スムージング部23へ出力する。なお、第1最大値ホールド部22から第1スムージング部23へと出力されるn×mサンプルの中で最も高い値の最大値は、所定の時間(mサンプル)だけ値がホールド(保持)された状態で出力される。
That is, the first maximum
第1スムージング部23は、第1最大値ホールド部22より取得した各チャネルの最大値の信号を積分処理することにより、最大値の変動を滑らかにする(スムージング処理する)役割を有している。このようにして第1最大値ホールド部22より取得した信号を滑らかにすることにより、オーディオ信号に対する包絡線(第1包絡線)の信号検出をチャネル毎(LチャネルおよびRチャネル)に行う。この包絡線(第1包絡線)の検出信号は、リニアな信号特性(振幅でゲインが示される特性)を有している。このようにして検出された包絡線(第1包絡線)の検出信号を第1の包絡線信号という。
The
モノラル変換部24は、第1スムージング部23において求められたLチャネルおよびRチャネルの第1の包絡線信号の平均を算出する役割を有している。算出された平均の包絡線信号は、平均値ホールド部25と第2最大値ホールド部26とのそれぞれに出力される。
The
平均値ホールド部25は、モノラル変換部24より取得した第1の包絡線信号の平均値(振幅平均値)を、オーディオ信号の入力が行われている間(オーディオ信号が特定の楽曲である場合には、その楽曲が終了するまでの間:所定時間)算出してホールド(保持・維持)する役割を有している。つまり、オーディオ信号が入力されて間もない時間においては、入力から間もない時間が経過するまでの振幅の平均値が算出されてホールドされ、その後、入力からしばらく時間が経過した場合には、入力からしばらく時間が経過するまでの振幅の平均値が算出されてホールドされることになる。
The average
また、第2最大値ホールド部26は、モノラル変換部24より取得した第1の包絡線信号の最大値(振幅最大値)を、入力されたオーディオ信号の入力が行われている間(オーディオ信号が特定の楽曲である場合には、その楽曲が終了するまでの間:所定時間)算出してホールドする役割を有している。従って、オーディオ信号が入力されて間もない時間においては、入力から間もない時間が経過するまでの振幅の最大値が算出されてホールドされ、その後、入力からしばらく時間が経過した場合には、入力からしばらく時間が経過するまでの振幅の最大値が算出されてホールドされることになる。
The second maximum
平均値ホールド部25において算出された包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26において算出された包絡線(第1包絡線)の振幅最大値は、それぞれ検出ゲイン算出部27へ出力される。
The average amplitude value of the envelope (first envelope) calculated in the average
検出ゲイン算出部27は、平均値ホールド部25で算出された包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26で算出された包絡線(第1包絡線)の振幅最大値とを用いて、第1変動検出部12および第2変動検出部13における包絡線検出(第2包絡線の検出)の下限値[dB]を動的に算出する(決定する)役割を有している。
The detection
平均値ホールド部25で算出された包絡線(第1包絡線)の振幅平均値をYmeanとし、第2最大値ホールド部26で算出された包絡線(第1包絡線)の振幅最大値をYmaxとすると、包絡線検出(第2包絡線の検出)の下限値[dB]を示すf(Ymean,Ymax)は、
で求められる。
The average amplitude value of the envelope (first envelope) calculated by the average
Is required.
Ymean/Ymaxが0.45(第1閾値)より小さい値である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に決定され、Ymean/Ymaxが0.60(第2閾値)より大きい値である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が、−30+10logYmax 2[dB]に決定され、Ymean/Ymaxが0.45以上で0.60以下である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が、−200・Ymean/Ymax+90+10logYmax 2[dB]に決定される。なお、10logYmax 2には、包絡線(第1包絡線)の振幅の最大値をデシベル値に変換するための変換式(変換関係)を示している。 When Y mean / Y max is a value smaller than 0.45 (first threshold value), the lower limit f (Y mean , Y max ) of envelope detection (detection of the second envelope) is 0 [dB]. When Y mean / Y max is a value greater than 0.60 (second threshold), the lower limit f (Y mean , Y max ) of envelope detection (second envelope detection) is -30 + 10 log Y max 2 [dB], and when Y mean / Y max is 0.45 or more and 0.60 or less, the lower limit f (Y of the envelope detection (detection of the second envelope)) mean , Y max ) is determined to be −200 · Y mean / Y max + 90 + 10 log Y max 2 [dB]. Note that 10 logY max 2 indicates a conversion formula (conversion relation) for converting the maximum value of the amplitude of the envelope (first envelope) into a decibel value.
図3は、上述した式1に基づいて、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)と、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)との関係を示したグラフである。図3に示すように比の値(Ymean/Ymax)が0.45より小さい場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に維持(決定・設定)されるが、比の値(Ymean/Ymax)が0.45になると、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が10logYmax 2の値(−200・Ymean/Ymax+90+10logYmax 2においてYmean/Ymaxに0.45を代入した値)[dB]となる。その後、比の値(Ymean/Ymax)が0.45から0.60まで増加するのに反比例して、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が減少し、比の値(Ymean/Ymax)が0.60以上になった場合には、包絡線検出の下限値f(Ymean,Ymax)が−30+10logYmax 2の値(−200・Ymean/Ymax+90+10logYmax 2においてYmean/Ymaxに0.60を代入した値)[dB]に維持(決定・設定)される。
FIG. 3 shows the lower limit value f (Y mean , Y max ) of envelope detection (detection of the second envelope) and the amplitude relative to the maximum amplitude value of the envelope (first envelope) based on the above-described
このように、比の値(Ymean/Ymax)の0.45と0.60とが閾値(第1閾値:0.45、第2閾値:0.60)となり、比の値(Ymean/Ymax)が0.00〜0.45の間では、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に維持(決定・設定)され、比の値(Ymean/Ymax)が0.45〜0.60の間では、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が比の値(Ymean/Ymax)に反比例して低減され、比の値(Ymean/Ymax)が0.60以上になる場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が−30+10logYmax 2[dB]に維持される。 Thus, the ratio values (Y mean / Y max ) of 0.45 and 0.60 become threshold values (first threshold value: 0.45, second threshold value: 0.60), and the ratio value (Y mean / Y max ) is between 0.00 and 0.45, the lower limit f (Y mean , Y max ) of envelope detection (detection of the second envelope) is maintained at 0 [dB] (decision / setting) When the ratio value (Y mean / Y max ) is between 0.45 and 0.60, the lower limit f (Y mean , Y max ) of envelope detection (detection of the second envelope) is the ratio value. When it is reduced in inverse proportion to (Y mean / Y max ) and the ratio value (Y mean / Y max ) is 0.60 or more, the lower limit f of envelope detection (detection of the second envelope) (Y mean, Y max) is maintained at -30 + 10logY max 2 [dB] .
図4(a)は、リミッタ処理によりダイナミックレンジの圧縮が行われる前のオーディオ信号の振幅変化を示した図であり、(b)は、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号の振幅変化を示した図である。 FIG. 4A is a diagram showing an amplitude change of an audio signal before the dynamic range is compressed by the limiter process, and FIG. 4B is an audio after the dynamic range is compressed by the limiter process. It is the figure which showed the amplitude change of the signal.
図4(a)に示すように、ダイナミックレンジの圧縮が行われる前のオーディオ信号では、振幅の振れ幅が大きいため、振幅最大値と振幅平均値との差が大きくなる。しかしながら、図4(b)に示すように、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号では、振幅最大値がリミッタ処理により制限されてクリップが発生するため、振幅最大値が低く抑えられる。 As shown in FIG. 4 (a), in the audio signal before the dynamic range compression is performed, the amplitude fluctuation is large, so that the difference between the maximum amplitude value and the average amplitude value is large. However, as shown in FIG. 4B, in the audio signal after the dynamic range compression is performed by the limiter process, the maximum amplitude value is limited by the limiter process and a clip is generated. Therefore, the maximum amplitude value is low. It can be suppressed.
また、振幅最大値が抑えられることから、振幅平均値が相対的に高い値を示すことなり、振幅最大値と振幅平均値との差が小さくなる。このため、ダイナミックレンジの圧縮が行われる前のオーディオ信号とダイナミックレンジの圧縮が行われた後のオーディオ信号とで、振幅最大値に対する振幅平均値の比の値(第1包絡線の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に対応する)とを比べると、ダイナミックレンジの圧縮が行われる前の方が比の値が小さく、ダイナミックレンジの圧縮が行われた後の方が比の値が大きくなる傾向が生ずる。 Further, since the maximum amplitude value is suppressed, the average amplitude value shows a relatively high value, and the difference between the maximum amplitude value and the average amplitude value becomes small. Therefore, the ratio of the average amplitude value to the maximum amplitude value (the maximum amplitude value of the first envelope) between the audio signal before the dynamic range compression and the audio signal after the dynamic range compression are performed. Compared to the ratio of the amplitude average value to Y (corresponding to the value of Y mean / Y max ), the ratio value is smaller before the dynamic range compression is performed, and after the dynamic range compression is performed. There is a tendency that the ratio value becomes larger.
従って、振幅最大値に対する振幅平均値の比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれの高いオーディオ信号であると判断することができる。比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれの低いオーディオ信号であると判断することができる。 Accordingly, when the ratio of the average amplitude value to the maximum amplitude value is large, it can be determined that the audio signal is highly likely to be compressed in the dynamic range. When the value of the ratio is small, it can be determined that the audio signal is less likely to be compressed in the dynamic range.
図5は、ダイナミックレンジが大きく圧縮されて多数のクリップが発生するオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。図6は、ダイナミックレンジが図5に比べて小さく圧縮されているがクリップが散見されるオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。図7は、ダイナミックレンジの圧縮が行われていないオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。
FIG. 5 is a graph when an audio signal in which a large dynamic range is compressed and a large number of clips are generated is input to the
具体的に、図5〜図7において(a)は、オーディオ信号の3秒間の振幅変化を示したグラフである。(b)は、第1スムージング部23によって算出された包絡線と、平均値ホールド部25において算出される包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26において算出される包絡線(第1包絡線)の振幅最大値の変化を示したグラフである。(c)は、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値を示したグラフである。
Specifically, in FIGS. 5 to 7, (a) is a graph showing an amplitude change of an audio signal for 3 seconds. (B) is calculated by the
図5(a)に示されるオーディオ信号はダイナミックレンジの圧縮が大きいため、ほぼ連続的に振幅が±1に制限(維持)された状態となっており、連続的にクリップが発生している。このため、図5(b)に示すように、包絡線(第1包絡線)の振幅値と振幅最大値とがほぼ1の値(振幅)を維持し、また、振幅平均値も振幅最大値に近い値を示している。従って、図5(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、0.9程度の高い値を示している。 Since the audio signal shown in FIG. 5A has a large dynamic range compression, the amplitude is almost continuously limited (maintained) to ± 1, and clips are continuously generated. For this reason, as shown in FIG. 5B, the amplitude value and the maximum amplitude value of the envelope (first envelope) maintain a value of about 1 (amplitude), and the average amplitude value is also the maximum amplitude value. It shows a value close to. Accordingly, as shown in FIG. 5C, the ratio (Y mean / Y max ) of the amplitude average value to the amplitude maximum value of the envelope (first envelope) is high (about 0.9). The value is shown.
一方で、図6(a)に示されるオーディオ信号はダイナミックレンジの圧縮が小さいため、一部分の振幅だけが±1に制限(維持)された状態となっており、クリップが散見される状態である。このため、図6(b)に示すように、包絡線(第1包絡線)の振幅値が、クリップの発生していない箇所において変動した状態となっている。従って、図6(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、図5(c)に比べて低減されて、0.7程度の値を示している。 On the other hand, since the audio signal shown in FIG. 6A has a small dynamic range compression, only a part of the amplitude is limited (maintained) to ± 1, and a clip is scattered. . For this reason, as shown in FIG.6 (b), the amplitude value of an envelope (1st envelope) is in the state fluctuate | varied in the location where the clip does not generate | occur | produce. Accordingly, as shown in FIG. 6C, the ratio (Y mean / Y max ) of the average amplitude value to the maximum amplitude value of the envelope (first envelope) (Y mean / Y max ) is shown in FIG. Compared to this, the value is about 0.7.
また、図7(a)に示されるオーディオ信号はダイナミックレンジの圧縮が行われていないため、振幅の最大値が±1の範囲に制限されており、クリップが全く発生していない。このため、図7(b)に示すように、包絡線(第1包絡線)の振幅値が図5(b)、図6(b)に比べて大きく変動した状態を保っており、振幅平均値も、図5(b)、図6(b)に比べて低い値となっている。従って、図7(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、図5(c)、図6(c)に比べて低減されて、0.3程度の値を示している。 Further, since the audio signal shown in FIG. 7A is not compressed in the dynamic range, the maximum value of the amplitude is limited to a range of ± 1, and no clip is generated. For this reason, as shown in FIG. 7 (b), the amplitude value of the envelope (first envelope) is largely changed compared to FIGS. 5 (b) and 6 (b), and the amplitude average is maintained. The value is also lower than those in FIGS. 5B and 6B. Therefore, as shown in FIG. 7C, the ratio (Y mean / Y max ) of the average amplitude value to the maximum amplitude value of the envelope (first envelope) (Y mean / Y max ) is as shown in FIG. Compared to FIG. 6C, the value is reduced to about 0.3.
図5〜図7に示したように、ダイナミックレンジの圧縮が大きい程、振幅最大値に対する振幅平均値の比の値が大きな値を示し、ダイナミックレンジの圧縮が小さくなるに従って、振幅最大値に対する振幅平均値の比の値が低減し、ダイナミックレンジの圧縮が行われていない場合には、振幅最大値に対する振幅平均値の比の値が低くなる。 As shown in FIGS. 5 to 7, the larger the compression of the dynamic range, the larger the ratio of the average amplitude value to the maximum amplitude value, and the smaller the dynamic range compression, the smaller the amplitude relative to the maximum amplitude value. When the ratio of the average values is reduced and the dynamic range is not compressed, the ratio of the average amplitude value to the maximum amplitude value is low.
このため、楽曲分析部17では、比(Ymean/Ymax)の値に応じて、包絡線検出(第2包絡線の検出)の下限値を一定の範囲内で(上述した式1においては、0〜−30+10logYmax 2[dB]の範囲内で)で低減変動させる。例えば、比(Ymean/Ymax)の値が高くて、ダイナミックレンジの圧縮が行われているおそれが高い場合には、ダイナミックレンジの拡張を行う包絡線(第2包絡線)の下限値を低い値に設定(決定)し、クリップが生じ得るオーディオ信号のダイナミックレンジが効果的に拡張されるようにする。
For this reason, the
一方で、比(Ymean/Ymax)の値が低くて、ダイナミックレンジの圧縮が行われていないおそれが高い場合には、ダイナミックレンジの拡張を行う包絡線(第2包絡線)の下限値を高い値に設定(決定)することによって、クリップが生じていないオーディオ信号のダイナミックレンジが過剰に拡張されてしまうことを防止する。 On the other hand, when the value of the ratio (Y mean / Y max ) is low and there is a high possibility that the dynamic range is not compressed, the lower limit value of the envelope (second envelope) for expanding the dynamic range By setting (determining) to a high value, it is possible to prevent the dynamic range of an audio signal in which clipping has not occurred from being excessively expanded.
その後、楽曲分析部17の検出ゲイン算出部27において算出された包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)の値は、第1変動検出部12および第2変動検出部13のそれぞれの第2最大値検出部31(図8参照)へと、リアルタイム(連続的)に出力される。
Thereafter, the value of the lower limit f (Y mean , Y max ) of the envelope detection (detection of the second envelope) calculated by the detection
[LPF部およびHPF部]
LPF部10は、入力されたオーディオ信号(ダイナミックレンジの圧縮が行われたオーディオ信号)に対して、ローパスフィルタリング処理を行うことにより、入力されたオーディオ信号の低域成分を抽出する役割を有している。一方で、HPF部11は、入力されたオーディオ信号に対して、ハイパスフィルタリング処理を行うことにより、入力されたオーディオ信号の高域成分を抽出する役割を有している。
[LPF part and HPF part]
The
[第1変動検出部および第2変動検出部]
第1変動検出部12は、LPF部10より入力された低域のオーディオ信号の包絡線を求め、求められた包絡線(第2包絡線)が小さい信号から大きい信号に変化する量を検出信号として検出して、第1重み付け部14へと出力する役割を有している。また、第2変動検出部13も同様に、HPF部11より入力された高域のオーディオ信号の包絡線(第2包絡線)を求め、求められた包絡線(第2包絡線)が小さい信号から大きい信号に変化する量を検出信号として検出して、第2重み付け部15へと出力する役割を有している。
[First variation detection unit and second variation detection unit]
The first
図8は、第1変動検出部12の概略構成を示したブロック図である。第1変動検出部12は、図8に示すように、第2最大値検出部(第2包絡線検出手段)31と、第3最大値ホールド部(第2包絡線検出手段)32と、第2スムージング部(第2包絡線検出手段)33と、デシベル変換部(デシベル変換手段)34と、微分部(微分手段)35と、反転部(反転手段)36と、レベル制限部37と、リニア変換部(リニア変換手段)38とを有している。
FIG. 8 is a block diagram showing a schematic configuration of the first
第2最大値検出部31は、LPF部10によって低域成分が抽出されたオーディオ信号の振幅を絶対値化した後に、所定の時間(mサンプル)内の最大値を検出して出力する役割を有している。第2最大値検出部31は、第1最大値検出部21と同様の処理を行う。従って、第2最大値検出部31においても、第1最大値検出部21と同様に、所定の時間(mサンプル)ごとに最大値が更新されて、第3最大値ホールド部32に出力される。ただし、第2最大値検出部31に対する入力信号として、所定の周波数でサンプリングされたデータが用いられている。
The second maximum
なお、第2最大値検出部31または第3最大値ホールド部32においては、最大値検出における検出範囲が予め設定されており、設定された検出範囲以下(所定値以下)の信号レベルの検出は行なわれない。ここで、第2最大値検出部31には、楽曲分析部17の検出ゲイン算出部27より包絡線検出(第2包絡線の検出)の下限値(検出ゲイン)がリアルタイムに入力される。第2最大値検出部31は、検出ゲイン算出部27より取得した包絡線検出(第2包絡線の検出)の下限値に基づいて、設定された検出範囲の下限値をリアルタイムに(動的に)変動させて最大値の検出を行う。
In the second maximum
第3最大値ホールド部32は、第2最大値検出部31において所定の時間(mサンプル)ごとに更新される最大値を受信した場合において、受信した最新の最大値だけでなく、その最大値を含む過去n回分の最大値(n個の最大値)の中で、最も大きな値を示す最大値の値を求める。そして、第3最大値ホールド部32は、求められた最大値を所定の時間(mサンプル)ごとに、第2スムージング部33へ出力する。
When the second maximum
ここで、第3最大値ホールド部32も第1最大値ホールド部22と同様の処理を行う。このため、第3最大値ホールド部32も、第1最大値ホールド部22と同様に、第2最大値検出部31から所定の時間(mサンプル)ごとに所定の時間(mサンプル)の内で最も大きな値の最大値を取得し、さらに、取得した最大値を含む過去n回分の最大値の中で最も値の大きな最大値(つまり、n×mサンプルの間における最も値の高い最大値)を検出して、所定の時間(mサンプル)ごとに、第2スムージング部33へ出力する。なお、第3最大値ホールド部32から第2スムージング部33へと出力されるn×mサンプルの中で最も高い値の最大値は、所定の時間(mサンプル)だけ値がホールド(保持)された状態で出力される。
Here, the third maximum
第2スムージング部33は、第3最大値ホールド部32より取得した最大値の信号を積分処理することにより、最大値の変動を滑らかにする(スムージング処理する)役割を有している。第2スムージング部33も、第1スムージング部23と同様の処理を行う。第2スムージング部33が、第3最大値ホールド部32より取得した信号を滑らかにすることにより、低域のオーディオ信号に対する包絡線(第2包絡線)の信号検出を行うことが可能となる。
The
デシベル変換部34は、第2スムージング部33においてスムージング処理することにより求められた包絡線信号(第2包絡線:この第2包絡線信号は、リニアな信号特性(振幅でゲインが示される特性)を有している)を、デシベルの包絡線信号(ゲインがデシベル単位で示される信号特性の包絡線信号)へと変換する役割を有している。デシベル変換部34によりデシベルの包絡線信号へと変換された信号は、微分部35へ出力される。
The
微分部35は、デシベル変換部34より取得したデシベルの包絡線信号(第2包絡線信号)を微分することにより、変化量検出を行う役割を有している。微分部35によって、包絡線信号(第2包絡線信号)に対して微分処理がなされた信号は、ゲイン(デシベル値)の変化量が大きい場合に高い値を示すことになり、変化量が小さい場合には低い値を示すことになる。微分部35によって微分処理された信号は反転部36へと出力される。
The differentiating
なお、微分部35における微分処理は、LPF部10で低域成分の抽出が行われたオーディオ信号に対して、ハイパスフィルタを用いたフィルタリング処理を行うことによって実現される。また、このハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することによりフィルタリング処理により求められる変化量の変化時間を調整することが可能となっている。
The differentiation process in the
例えば、ダイナミックレンジが圧縮されて振幅が平坦化される状態は、コンプレッサやリミッタにおける設定により異なり、また、CDとDVDとでは、既に説明したように、ダイナミックレンジの圧縮状態が異なったものとなる。従って、オーディオ信号におけるダイナミックレンジの圧縮状態に応じて正規化カットオフ周波数を調整することにより、ダイナミックレンジの圧縮状態に適したダイナミックレンジの拡張時間の調整を行うことが可能となる。 For example, the state in which the dynamic range is compressed and the amplitude is flattened differs depending on the settings in the compressor and limiter, and as described above, the compression state of the dynamic range differs between CD and DVD. . Therefore, by adjusting the normalized cutoff frequency according to the compression state of the dynamic range in the audio signal, it is possible to adjust the expansion time of the dynamic range suitable for the compression state of the dynamic range.
反転部36は、微分部35より取得された信号(変化量信号)に−1を乗算することにより信号の反転を行う役割を有している。さらに、レベル制限部37は、反転部36において反転された信号のマイナス側の変化量を制限し、プラス側の変化量のみを検出して、リニア変換部38へ出力する。リニア変換部38は、レベル制限部37においてプラス側の変化量のみ検出された信号を、リニアな信号に変換して検出信号として第1重み付け部14へと出力する。
The inverting
このように、第1変動検出部12では、LPF部10によって抽出された低域のオーディオ信号の包絡線(第2包絡線)に基づいて、小さい信号から大きい信号に変化する量を検出信号(低域用検出信号)として検出することができ、検出された検出信号は、大きく変化するほど検出量が大きくなる。
As described above, the first
また、第2変動検出部13も、図8に示す第1変動検出部12と同様の機能部を備えている。第2変動検出部13においては、HPF部11によって抽出された高域のオーディオ信号の包絡線(第2包絡線)に基づいて、小さい信号から大きい信号に変化する量を検出信号(高域用検出信号)として検出することができ、検出された検出信号は、大きく変化するほど検出量が大きくなる。第2変動検出部13における機能部の構成およびその役割は、図2に示す第1変動検出部12と同じものであるため、説明を省略する。
Moreover, the 2nd fluctuation | variation detection part 13 is also provided with the function part similar to the 1st fluctuation |
なお、第2変動検出部13の第2最大値検出部31に対しても、楽曲分析部17の検出ゲイン算出部27より包絡線検出の下限値(検出ゲイン)がリアルタイムに入力される。このため、第2変動検出部13の第2最大値検出部31も、検出ゲイン算出部27より取得した包絡線検出の下限値(検出ゲイン)に基づいて、設定された検出範囲の下限値をリアルタイムに(動的に)変動させて最大値の検出を行う。
Note that the lower limit value (detection gain) of envelope detection is also input in real time from the detection
[第1重み付け部および第2重み付け部]
図9は、第1重み付け部14の概略構成を示したブロック図である。第1重み付け部14は、図9に示すように、乗算部(補完信号生成手段)41、減算部(補完信号生成手段)42およびゲイン部(ゲイン調節手段)43を有している。
[First weighting unit and second weighting unit]
FIG. 9 is a block diagram illustrating a schematic configuration of the
乗算部41は、LPF部10より入力される低域のオーディオ信号と、第1変動検出部12より入力される低域用検出信号との乗算処理を行う役割を有している。乗算部41の乗算処理により、低域のオーディオ信号において、小さい信号から大きい信号に変化する箇所の信号レベルが検出信号の検出量に対応して増幅されることになる。
The
減算部42は、LPF部10より入力される低域のオーディオ信号から、乗算部41によって検出量に対応する増幅処理が行われた低域のオーディオ信号を減算する役割を有している。このように、減算部42で減算処理を行うことにより、低域のオーディオ信号において、小さい信号から大きい信号に変化する箇所における増幅前のオーディオ信号と増幅後のオーディオ信号との信号レベル差を重み付け量として求めることが可能となる。このようにして求められた重み付け量に関する信号(低域用重み付け信号:ゲイン調節手段によりゲイン調節される前の低域補完信号)は、減算部42からゲイン部43へ出力される。
The subtracting unit 42 has a role of subtracting a low-frequency audio signal that has been subjected to amplification processing corresponding to the detection amount by the multiplying
ゲイン部43は、低域用重み付け信号に対してゲインの増幅および減衰を行うことにより重み付け量の調節を行い、低域用の補完信号(低域補完信号)を生成する役割を有している。生成された低域用の補完信号は、合成部16へ出力される。
The
低域用重み付け信号は、包絡線信号における最大値変化に基づいて生成されるため、ダイナミックレンジが圧縮されて平坦化された箇所におけるゲイン(振幅)を拡張することが可能である。しかしながら、拡張すべきダイナミックレンジのゲインは、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号ごとに異なり、そのまま低域用重み付け信号をオーディオ信号に加算しても、十分なダイナミックレンジの補完(拡張)を行えなかったり、ダイナミックレンジの補完(拡張)量が多すぎたりして、かえって音質の低下を招いてしまうおそれもある。 Since the low-frequency weighting signal is generated based on the maximum value change in the envelope signal, it is possible to expand the gain (amplitude) at a location where the dynamic range is compressed and flattened. However, the gain of the dynamic range to be expanded differs for each audio signal that has been flattened by compressing the dynamic range, and even if the weighting signal for low frequency is added to the audio signal as it is, sufficient complementation of the dynamic range (expansion) ) Cannot be performed, or the amount of complementation (expansion) of the dynamic range is too large, leading to a decrease in sound quality.
このため、オーディオ信号の圧縮状態などに応じて、ゲイン部43で予め低域用重み付け信号にゲインの増幅および減衰を行って、重み付け量の調節をした補完信号を生成することにより、次述する合成部16においてオーディオ信号に補完信号が加算された信号のダイナミックレンジを適切に拡張し、調整することが可能となる。
Therefore, in accordance with the compression state of the audio signal, the
このように、第1重み付け部14では、減算部42で、LPF部10より入力された低域のオーディオ信号から、検出量に対応する増幅処理が行われた低域のオーディオ信号を減算することにより、低域のオーディオ信号における重み付け量を求めるとともに、ゲイン部43で、求められた重み付け量の調整を行うことにより低域補完信号を生成する。
As described above, in the
また、第2重み付け部15も、図9に示す第1重み付け部14と同様の機能部を備えている。第2重み付け部15では、減算部で、HPF部11より入力された高域のオーディオ信号から、検出量に対応する増幅処理が行われた高域のオーディオ信号を減算することにより、高域のオーディオ信号における重み付け量を求めるとともに、求められた重み付け量の調整を行うことにより高域補完信号を生成する。第2重み付け部15における機能部の構成およびその役割は、図9に示す第1重み付け部14と同じものであるため、説明を省略する。
The
[合成部]
合成部16は、ダイナミックレンジ拡張装置1に入力されたオーディオ信号(ダイナミックレンジの圧縮により平坦化された状態となったオーディオ信号)に対して、第1重み付け部14において求められた低域補完信号と、第2重み付け部15において求められた高域補完信号とを加算する処理を行う役割を有している。このように加算処理を行うことによって、ダイナミックレンジの圧縮により平坦化された音源のオーディオ信号に対して、信号の包絡線(第2包絡線)の変化量に応じてゲイン補完がなされた低域成分・高域成分のオーディオ信号が加えられるため、ダイナミックレンジを拡張することができ、聴感上でメリハリ感や臨場感、音質を向上させることができる。
[Combining section]
The synthesizing
なお、本実施の形態に係るダイナミックレンジ拡張装置1では、中域成分に対するダイナミックレンジの拡張処理は行っていない。中域成分は、一般的に、聴覚の感度が高く、ボーカル等の音声成分も多く含まれるため、中域成分におけるダイナミックレンジの拡張を行うと、聴感上の変動感を聴取者に与えてしまうおそれがあるからである。ただし、本実施の形態に係るダイナミックレンジ拡張装置1は、低域成分と高域成分とに対してのみダイナミックレンジの拡張処理を行う場合を一例として示しただけであり、中域成分についてもダイナミックレンジの拡張処理を行う構成とすることも可能である。さらに、低域成分のみ、中域成分のみ、高域成分のみ、低域成分と中域成分のみ、高域成分と中域成分のみなど、様々な組み合わせによってダイナミックレンジの拡張処理を行うことも可能である。
Note that the dynamic
[動作例説明]
次に、上述したダイナミックレンジ拡張装置1の動作例について説明する。図10は、ダイナミックレンジ拡張装置1における動作例を説明するために設定した各機能部の動作パラメータを示した表である。ダイナミックレンジ拡張装置1には、CDに記録されるオーディオ信号が入力されるものとする。
[Explanation of operation example]
Next, an operation example of the dynamic
図10に示すように、LPF部10およびHPF部11には、2次のバタワースフィルタが用いられており、LPF部10のカットオフ周波数は200Hz、HPF部11のカットオフ周波数は4kHzに設定されている。また、第1変動検出部12、第2変動検出部13および楽曲分析部17に入力されるオーディオ信号は、CDに記録されるオーディオ信号であることから、サンプリング周波数が44.1kHzの音源によるものとなる。このようなオーディオ信号に対して、第1変動検出部12、第2変動検出部13および楽曲分析部17の最大値検出の間隔は、64サンプルに設定される。
As shown in FIG. 10, the
さらに、第1変動検出部12および第2変動検出部13の第2最大値検出部31による最大値検出の検出範囲は、−30+10logYmax 2[dB]〜0[dB]の間で動的に変動される設定になっている。この検出範囲の下限値は、検出ゲイン算出部27によって設定された包絡線検出(第2包絡線検出)の下限値(検出ゲイン)により決定される。ただし、最大値検出における検出範囲は−30+10logYmax 2[dB]〜0[dB]の間であるため、−30+10logYmax 2[dB]以下となるオーディオ信号に関しては、−30+10logYmax 2[dB]として出力される。従って、−30+10logYmax 2[dB]以下のオーディオ信号については、低域補完信号および高域補完信号の生成は行われない。また、楽曲分析部17の第1最大値検出部21における最大値検出のサンプリング周波数、最大値検出の間隔は、第2最大値検出部31と同様である。
Further, the detection range of the maximum value detection by the second maximum
また、サンプリング周波数が44.1kHzのオーディオ信号において、最大値検出の間隔が64サンプルに設定されると、第1〜第3最大値ホールド部22、26、32によりホールド処理されるオーディオ信号のサンプリング周波数は、689Hz(44,110Hz÷64サンプル)となる。
Also, in an audio signal with a sampling frequency of 44.1 kHz, if the maximum value detection interval is set to 64 samples, sampling of the audio signal that is held by the first to third maximum
さらに、楽曲分析部17の第1スムージング部23、および第1変動検出部12および第2変動検出部13の第2スムージング部33には、1次のバタワース・ローパスフィルタが用いられ、微分部35には、1次のバタワース・ハイパスフィルタが用いられている。なお、楽曲分析部17の第1スムージング部23、および、第1変動検出部12および第2変動検出部13における第2スムージング部33の正規化カットオフ周波数は、689Hzを1.0とした場合に0.1に該当する周波数(68.9Hz)が設定されている。
Further, a first Butterworth low-pass filter is used for the
また、第1変動検出部12における微分部35の正規化カットオフ周波数は、689Hzを1.0とした場合に0.0171に該当する周波数が設定され、第2変動検出部13における微分部の正規化カットオフ周波数は、689Hzを1.0とした場合に0.0051に該当する周波数が設定されている。
Further, the normalized cutoff frequency of the differentiating
微分部35におけるハイパスフィルタのカットオフ周波数を調整することにより、低域用検出信号および高域用検出信号における応答時間を制御することが可能となっている。例えば、カットオフ周波数を高くするほど検出信号の応答時間(検出信号における検出量の変動時間(反映時間))が長くなり、ダイナミックレンジの拡張における低域補完信号および高域補完信号の生成時間(補完信号により増大されるオーディオ信号の増大反映時間)を長くすることができる。
By adjusting the cut-off frequency of the high-pass filter in the differentiating
また、第1重み付け部14のゲイン部43では、重み付け量の調整を行うために、入力される低域用重み付け信号に対して6dBのゲイン増幅量が設定されている。また、第2重み付け部15のゲイン部においては、入力される高域用重み付け信号に対して0dBのゲイン増幅量が設定されており、実質的に増減を行わない設定となっている。
Further, in the
図11〜図15は、図10に示すように各機能部のパラメータを設定した場合における動作例を示した図である。 FIG. 11 to FIG. 15 are diagrams showing an operation example when the parameters of each functional unit are set as shown in FIG.
図11(a)は、ダイナミックレンジ拡張装置1に、ダイナミックレンジが圧縮されて振幅が平坦化されたオーディオ信号が入力される場合の振幅変化状態を示した図である。一方で、図11(b)は、第1変動検出部12および第2変動検出部13の第2最大値検出部31において、検出の下限値を−30[dB]に固定した場合におけるダイナミックレンジ拡張装置1の出力信号の振幅変化状態を示している。図11(c)は、第2最大値検出部31における検出の下限値を−30+10logYmax 2[dB]として変動させた場合におけるダイナミックレンジ拡張装置1の出力信号の振幅変化状態を示している。
FIG. 11A is a diagram illustrating an amplitude change state when an audio signal whose dynamic range is compressed and whose amplitude is flattened is input to the dynamic
図11(a)では、オーディオ信号が平坦化されているのに対して、(b)(c)は、ダイナミックレンジの拡張が行われて平坦化された振幅部分(クリップ)がなくなり、違和感のないオーディオ出力を得ることが可能となっている。このように、本実施の形態に係るダイナミックレンジ拡張装置1では、低域補完信号および高域補完信号が、低域のオーディオ信号の包絡線(第2包絡線)および高域のオーディオ信号の包絡線(第2包絡線)をそれぞれ微分することにより生成されるため、ダイナミックレンジが圧縮されたオーディオ信号の信号波形が矩形状に近づき変化量が大きくなるほど、生成される低域補完信号および高域補完信号のレベルが大きくなる。このため、ダイナミックレンジの圧縮が大きい部分ほど(平坦化された部分ほど)、信号補完が積極的に行われて平坦部分が低減されて、圧縮の度合い応じた補完信号がオーディオ信号に合成されることになる。従って、いかなるダイナミックレンジの圧縮状態においても、ダイナミックレンジの圧縮処理が行われる前の状態の源音に、ダイナミックレンジを近づけることが可能となる。
In FIG. 11 (a), the audio signal is flattened, whereas in (b) and (c), the dynamic range is expanded and the flattened amplitude portion (clip) disappears, and the sense of incongruity is lost. It is possible to get no audio output. As described above, in the dynamic
また、ダイナミックレンジ拡張装置1におけるダイナミックレンジの拡張処理は、包絡線に基づいて求められる低域補完信号および高域補完信号により行われるため、ダイナミックレンジが圧縮されたオーディオ信号のボリューム設定の大小に係わらず効果的に行うことが可能となる。従って、パワーアンプやスピーカに十分な再生能力がある場合には、CDやDVDのような記録媒体におけるダイナミックレンジの制限によって、ダイナミックレンジが圧縮されたオーディオ信号を、ボリューム設定の音量を増大した後にスピーカから再生(出力)し、または、パワーアンプ等を介してスピーカから再生(出力)しても、出力信号のダイナミックレンジが拡張されているため、出力音のメリハリ感と臨場感を体感することが可能となり、不要な高調波の発生を抑制することが可能となる。
In addition, the dynamic range expansion processing in the dynamic
なお、図11(b)(c)のどちらのオーディオ信号も、同様にダイナミックレンジの拡張が行われており、出力される音に高調波などが発生していない。 Note that in both audio signals of FIGS. 11B and 11C, the dynamic range is similarly expanded, and no harmonics are generated in the output sound.
一方で、図12(a)は、ダイナミックレンジ拡張装置1に、ダイナミックレンジが圧縮されていないオーディオ信号が入力される場合の振幅変化状態を示した図である。図12(b)は、第2最大値検出部31における包絡線(第2包絡線)の検出の下限値を−30[dB]に固定した場合における出力信号の振幅変化状態を示し、(c)は、検出の下限値を−30+10logYmax 2[dB]として変動させた場合における出力信号の振幅変化状態を示している。
On the other hand, FIG. 12A is a diagram illustrating an amplitude change state when an audio signal whose dynamic range is not compressed is input to the dynamic
図12(a)では、オーディオ信号のダイナミックレンジの圧縮が行われていないため、信号は平坦化されていない。このようなオーディオ信号に対して、検出の下限値を−30[dB]に固定した状態でダイナミックレンジの拡張処理を行ってしまうと、図12(b)に示すように、本来拡張を行う必要のないダイナミックレンジが拡張されてしまい、音質の低減を招いてしまうおそれがある。 In FIG. 12A, since the dynamic range of the audio signal is not compressed, the signal is not flattened. If such an audio signal is subjected to dynamic range expansion processing in a state where the lower limit of detection is fixed to −30 [dB], as shown in FIG. There is a possibility that the dynamic range without noise will be expanded and the sound quality will be reduced.
一方で、検出の下限値を−30+10logYmax 2[dB]として変動させた状態でダイナミックレンジの拡張処理を行うと、図12(c)に示すように、ダイナミックレンジが不要に拡張されてしまうことを抑制し、音質の低下を抑制することが可能となる。これは、楽曲分析部17において、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に応じて、包絡線検出の下限値が変動されるためである。
On the other hand, if the dynamic range expansion process is performed in a state where the lower limit of detection is changed as −30 + 10 logY max 2 [dB], the dynamic range is unnecessarily expanded as shown in FIG. Can be suppressed, and deterioration of sound quality can be suppressed. This is because, in the
具体的に、比(Ymean/Ymax)の値が高くて、ダイナミックレンジの圧縮が行われているおそれが高い場合には、ダイナミックレンジの拡張を行うための包絡線(第2包絡線)の下限値を積極的に低い値に設定(決定)して、クリップが生じ得るオーディオ信号のダイナミックレンジが効果的に拡張されるように制御し、比(Ymean/Ymax)の値が低くて、ダイナミックレンジの圧縮が行われていないおそれが高い場合には、楽曲分析部17において、ダイナミックレンジの拡張を行うための包絡線(第2包絡線)の下限値を積極的に高い値に設定(決定)することによって、クリップが生じていないオーディオ信号のダイナミックレンジが過剰に拡張されてしまうことを防止する。
Specifically, when the value of the ratio (Y mean / Y max ) is high and there is a high possibility that the dynamic range is being compressed, an envelope for expanding the dynamic range (second envelope) By actively setting (determining) the lower limit value of the audio signal to a low value so as to effectively extend the dynamic range of the audio signal that can be clipped, the ratio (Y mean / Y max ) is reduced. If there is a high possibility that the dynamic range is not compressed, the
従って、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に応じて、包絡線検出(第2包絡線検出)の下限値を変動させることにより、ダイナミックレンジの圧縮が行われていないオーディオ信号のダイナミックレンジが、不要に拡張されてしまうことを効果的に抑制することが可能となる。 Therefore, the dynamic range is compressed by changing the lower limit value of envelope detection (second envelope detection) according to the ratio of the average amplitude value to the maximum amplitude value (Y mean / Y max ). It is possible to effectively suppress the dynamic range of the audio signal not being unnecessarily expanded.
図13は、楽曲分析部17において設定される包絡線検出の下限値の変動状態を説明するための図である。図13(a)は、図11(a)に示す圧縮されたオーディオ信号がダイナミックレンジ拡張装置1に入力されて図11(c)の信号が出力される場合において、第1スムージング部23より算出された入力信号の包絡線(第1包絡線)と、平均値ホールド部25で求められた振幅平均値と、第2最大値ホールド部26で求められた振幅最大値との変化状態((a)の上段グラフ参照)と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化((a)の中段グラフ参照)と、包絡線検出(第2包絡線の検出)の下限値の変動状態((a)の下段グラフ参照)とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示している。また、図13(b)は、図12(a)に示す圧縮されていないオーディオ信号がダイナミックレンジ拡張装置1に入力されて図12(c)の信号が出力される場合における同様の変動状態((b)の上・中・下段グラフ参照)を、30秒間検出した結果を示している。
FIG. 13 is a diagram for explaining a variation state of the lower limit value of envelope detection set in the
図13(a)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45(20秒経過後)を上回るに従って、図13(a)の下段グラフにおいて、包絡線検出の下限値が低減される状態が示されている。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものである。一方で、図13(b)の中段グラフにおいては、振幅平均値の比(Ymean/Ymax)の値が0.45を下回っているため、図13(b)の下段グラフには、包絡線検出の下限値は示されていない。 In the middle graph of FIG. 13A, as the ratio of the average amplitude value to the maximum amplitude value (Y mean / Y max ) exceeds 0.45 (after 20 seconds), the lower graph of FIG. FIG. 3 shows a state where the lower limit value of envelope detection is reduced. The fluctuation of the lower limit value of the envelope detection with respect to the value of this ratio (Y mean / Y max ) corresponds to the graph shown in FIG. On the other hand, in the middle graph of FIG. 13B, the value of the ratio of average amplitude values (Y mean / Y max ) is less than 0.45, so the lower graph of FIG. The lower limit of line detection is not shown.
図14(a)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールのオーディオ信号の振幅変動状態を示し、(b)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールに満たない(フルスケール未満)のオーディオ信号の振幅変動状態を示している。また、図14(c)は、(a)に示されるフルスケールのオーディオ信号のダイナミックレンジをダイナミックレンジ拡張装置1において拡張したオーディオ信号の振幅変動状態を示し、図14(d)は、(b)に示されるフルスケール未満のオーディオ信号のダイナミックレンジをダイナミックレンジ拡張装置1において拡張したオーディオ信号の振幅変動状態を示している。
FIG. 14A shows the amplitude fluctuation state of a full-scale audio signal whose dynamic range is compressed and the amplitude is flattened, and FIG. 14B is a full scale whose dynamic range is compressed and the amplitude is flattened. The amplitude fluctuation state of the audio signal that is less than (less than full scale) is shown. FIG. 14C shows the amplitude variation state of the audio signal obtained by extending the dynamic range of the full-scale audio signal shown in FIG. The dynamic
具体的に、図14(a)は、CDに収録されたフルスケールのオーディオ信号の振幅変動状態を示している。図14(b)は、フルスケールに満たない信号であって、(a)のオーディオ信号の振幅に1/100(百分の一)を乗算した信号を示している。このため、図14(a)のオーディオ信号では、平坦化された振幅の制限値が±1となっているのに対して、図14(b)のオーディオ信号では、平坦化された振幅の制限値が±0.01となって、図14(a)に示す振幅の百分の一のスケールとなっている。なお、図14(a)のオーディオ信号も、図14(b)のオーディオ信号も、振幅のスケールは異なるが、振幅の変化状態は共通しており、制限される振幅(振幅±1又は振幅±0.01)に基づいて一部の箇所が平坦化された状態となっている。 Specifically, FIG. 14A shows the amplitude fluctuation state of a full-scale audio signal recorded on a CD. FIG. 14B shows a signal that is less than full scale and that is obtained by multiplying the amplitude of the audio signal in FIG. Therefore, in the audio signal in FIG. 14A, the flattened amplitude limit value is ± 1, whereas in the audio signal in FIG. 14B, the flattened amplitude limit is set. The value is ± 0.01, which is one hundredth of the amplitude shown in FIG. It should be noted that the audio signal in FIG. 14A and the audio signal in FIG. 14B have different amplitude scales, but have a common amplitude change state and are limited in amplitude (amplitude ± 1 or amplitude ± 0.01) is partially flattened.
また、図15(a)は、図13(a)と同様に、図14(a)に示す圧縮されたフルスケールのオーディオ信号がダイナミックレンジ拡張装置1に入力されて図14(c)の信号が出力される場合において、第1スムージング部23より算出された入力信号の包絡線と、平均値ホールド部25で求められた振幅平均値と、第2最大値ホールド部26で求められた振幅最大値との変化状態((a)の上段グラフ参照)と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化((a)の中段グラフ参照)と、包絡線検出の下限値の変動状態((a)の下段グラフ参照)とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示している。また、図15(b)は、図14(b)に示す圧縮されたフルスケール未満のオーディオ信号がダイナミックレンジ拡張装置1に入力されて、図14(d)の信号が出力される場合における同様の変動状態((b)の上・中・下段グラフ参照)を、30秒間検出した結果を示している。
15 (a) is similar to FIG. 13 (a), the compressed full-scale audio signal shown in FIG. 14 (a) is input to the dynamic
本実施の形態に係るダイナミックレンジ拡張装置1に、図14(a)に示す圧縮されたフルスケールのオーディオ信号が入力されると、図14(c)に示すように、ダイナミックレンジの拡張が行われて、±1に平坦化されていた振幅が±1以上に補正され、ダイナミックレンジの拡張が行われる。このとき、図15(a)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45を上回る(20秒以降になる)と、図15(a)の下段グラフに示すように、包絡線検出の下限値が低減された状態となる。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものであるが、図15(a)において入力されるオーディオ信号の振幅最大値は、図14(a)・図15(a)上段に示すように1であるため、比の値(Ymean/Ymax)が0.45を上回る場合には、包絡線検出の下限値f(Ymean,Ymax)が−10[dB]程度の値(−200・Ymean/Ymax+90+10logYmax 2において、Ymean/Ymaxに0.45を代入し、Ymaxに1を代入した値)に低減(変動)されることになる。
When the compressed full-scale audio signal shown in FIG. 14A is input to the dynamic
一方で、本実施の形態に係るダイナミックレンジ拡張装置1に、図14(b)に示す圧縮されたフルスケール未満のオーディオ信号が入力されると、図14(d)に示すように、ダイナミックレンジの拡張が行われて、±0.01に平坦化されていた振幅が±0.01以上に補正され、ダイナミックレンジの拡張が行われる。このとき、図15(b)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45を上回る場合には、図15(b)の下段グラフに示すように、包絡線検出の下限値が一気に−40[dB]まで低減された後に緩やかに低減される傾向を示す。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものであるが、図15(b)において入力されるオーディオ信号の振幅最大値は、図14(b)、図15(b)の上段の振幅最大値に示すように0.01であるため、比の値(Ymean/Ymax)が0.45の場合には、包絡線検出の下限値f(Ymean,Ymax)が−40[dB]程度の値(−200・Ymean/Ymax+90+10logYmax 2において、Ymean/Ymaxに0.45を代入し、Ymaxに0.01を代入した値)に低減(変動)されることになる。
On the other hand, when an audio signal less than the compressed full scale shown in FIG. 14B is input to the dynamic
このように、本実施の形態に係るダイナミックレンジ拡張装置1では、包絡線検出(第2包絡線検出)の下限値が振幅最大値に応じて(logYmax 2の値に応じて)変動されるため、入力されるオーディオ信号がフルスケールに満たない場合であって制限される振幅の値が低い場合であっても、入力されるオーディオ信号がフルスケールであって制限される振幅の値が高い場合であっても、その制限される振幅値(振幅最大値)に応じて適切にダイナミックレンジの拡張処理が行われることになる。
Thus, in the dynamic
このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われている信号に対し、ダイナミックレンジの拡張処理が行われない可能性を排除することができる。 For this reason, it is possible to eliminate the possibility that the dynamic range expansion processing is not performed on a signal that is less than full scale and that has undergone dynamic range compression.
以上、本発明に係るダイナミックレンジ拡張装置について、実施の形態において一例を示して説明を行ったが、本発明に係るダイナミックレンジ拡張装置は、上述した実施の形態に示す例には限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 The dynamic range extending apparatus according to the present invention has been described with reference to an example in the embodiment. However, the dynamic range extending apparatus according to the present invention is not limited to the example shown in the above-described embodiment. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.
例えば、本実施の形態に係るダイナミックレンジ拡張装置1では、入力されたオーディオ信号を、LPF部10とHPF部11とでそれぞれ低域成分および高域成分を抽出してダイナミックレンジの拡張を行う場合について説明を行ったが、ダイナミックレンジの拡張は必ずしも低域成分と高域成分とに分割する場合には限定されない。高域成分と低域成分との2つに分割するだけでなく3つ以上の帯域に分割してそれぞれダイナミックレンジの拡張を行う構成とするものであってもよく、また、全く帯域分割することなくダイナミックレンジの拡張を行う構成とするものであってもよい。
For example, in the dynamic
1 …ダイナミックレンジ拡張装置
10 …LPF部
11 …HPF部
12 …第1変動検出部
13 …第2変動検出部
14 …第1重み付け部
15 …第2重み付け部
16 …合成部(加算手段)
17 …楽曲分析部
21 …第1最大値検出部(第1包絡線検出手段)
22 …第1最大値ホールド部(第1包絡線検出手段)
23 …第1スムージング部(第1包絡線検出手段)
24 …モノラル変換部
25 …平均値ホールド部(平均値算出手段)
26 …第2最大値ホールド部(最大値算出手段)
27 …検出ゲイン算出部(検出ゲイン決定手段)
31 …第2最大値検出部(第2包絡線検出手段)
32 …第3最大値ホールド部(第2包絡線検出手段)
33 …第2スムージング部(第2包絡線検出手段)
34 …デシベル変換部(デシベル変換手段)
35 …微分部(微分手段)
36 …反転部(反転手段)
37 …レベル制限部
38 …リニア変換部(リニア変換手段)
41 …乗算部(補完信号生成手段)
42 …減算部(補完信号生成手段)
43 …ゲイン部(ゲイン調節手段)
DESCRIPTION OF
17 ...
22 ... 1st maximum value hold part (1st envelope detection means)
23 ... 1st smoothing part (1st envelope detection means)
24 ...
26 ... 2nd maximum value hold part (maximum value calculation means)
27: Detection gain calculation unit (detection gain determination means)
31 ... 2nd maximum value detection part (2nd envelope detection means)
32 ... 3rd maximum value hold part (2nd envelope detection means)
33 ... 2nd smoothing part (2nd envelope detection means)
34. Decibel conversion unit (decibel conversion means)
35 ... Differential part (differentiating means)
36 ... reversing part (reversing means)
37 ...
41 ... Multiplication unit (complementary signal generating means)
42 Subtracting unit (complementary signal generating means)
43 ... Gain section (gain adjusting means)
Claims (4)
該第1包絡線検出手段により検出された前記第1包絡線における所定時間の平均的な振幅の値を振幅平均値Ymeanとして算出する平均値算出手段と、
前記第1包絡線検出手段により検出された前記第1包絡線の前記所定時間における振幅の最大値を振幅最大値Ymaxとして算出する最大値算出手段と、
前記平均値算出手段により算出された振幅平均値Ymeanと前記最大値算出手段により算出された振幅最大値Ymaxとに基づいて、検出ゲインを決定する検出ゲイン決定手段と、
前記音源から出力されるオーディオ信号のうち、前記検出ゲイン決定手段により決定された前記検出ゲインよりも高い値を満たすオーディオ信号の最大値変化状態を求めて第2包絡線の検出を行う第2包絡線検出手段と、
該第2包絡線検出手段により検出された前記第2包絡線をデシベル変換するデシベル変換手段と、
該デシベル変換手段によりデシベル変換された前記第2包絡線を微分処理することにより、前記第2包絡線の変化量を示す変化量信号を生成する微分手段と、
前記微分手段により生成された変化量信号に−1を乗算することにより信号の反転を行う反転手段と、
該反転手段により反転された前記変化量信号をリニアな信号に変換することにより検出信号を生成するリニア変換手段と、
前記オーディオ信号に前記検出信号を乗算した信号を、前記オーディオ信号から減算することにより補完信号を生成する補完信号生成手段と、
該補完信号生成手段により生成された補完信号を、前記オーディオ信号に加算する加算手段と
を備え、
前記検出ゲイン決定手段は、
前記振幅最大値Ymaxに対する前記振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、前記検出ゲインを0[dB]に決定し、
前記比の値が前記第1閾値である場合に、前記検出ゲインを10logYmax 2[dB]に決定し、
前記比の値が前記第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logYmax 2[dB]より低減させた値を前記検出ゲインに決定し、
前記比の値が前記第2閾値より大きい場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logY max 2 [dB]より低減させた値のうち最も低い値を前記検出ゲインに決定する
ことを特徴とするダイナミックレンジ拡張装置。 First envelope detecting means for detecting the first envelope based on the maximum value change state of the audio signal output from the sound source;
Average value calculating means for calculating an average amplitude value for a predetermined time in the first envelope detected by the first envelope detecting means as an amplitude average value Y mean ;
Maximum value calculating means for calculating the maximum value of the amplitude of the first envelope detected by the first envelope detecting means at the predetermined time as an amplitude maximum value Y max ;
Wherein on the basis of the amplitude maximum value Y max is calculated by the amplitude average value Y mean and the maximum value calculation means calculated by the average value calculating means, and the detection gain determining means for determining a detection gain,
A second envelope for detecting a second envelope by obtaining a maximum value change state of an audio signal satisfying a value higher than the detection gain determined by the detection gain determination means among the audio signals output from the sound source. Line detection means;
A decibel transforming means for decibel transforming the second envelope detected by the second envelope detecting means;
Differentiating means for generating a change amount signal indicating a change amount of the second envelope by differentiating the second envelope converted by the decibel conversion means;
Inversion means for inverting the signal by multiplying the change amount signal generated by the differentiating means by -1.
Linear conversion means for generating a detection signal by converting the change amount signal inverted by the inversion means into a linear signal;
Complementary signal generation means for generating a complementary signal by subtracting a signal obtained by multiplying the audio signal by the detection signal from the audio signal;
Adding means for adding the complementary signal generated by the complementary signal generating means to the audio signal;
The detection gain determining means includes
When the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is smaller than a first threshold set to a value smaller than 0.5, the detection gain is determined to be 0 [dB];
When the value of the ratio is the first threshold, the detection gain is determined to be 10 logY max 2 [dB],
When the ratio value is equal to or greater than the first threshold value and equal to or less than a second threshold value set to a value greater than 0.5, the ratio value ranges from the first threshold value to the second threshold value. A value reduced from the 10 log Y max 2 [dB] is determined as the detection gain so as to be inversely proportional to the increase,
When the value of the ratio is larger than the second threshold value, the ratio value is decreased in proportion to the increase from the first threshold value to the second threshold value, so that the value is less than 10 logY max 2 [dB]. A dynamic range expansion device, wherein the lowest value among the values is determined as the detection gain.
前記比の値が前記第1閾値以上であって、かつ、前記第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記検出ゲインを、前記10logYmax 2[dB]から−30+10logYmax 2[dB]まで低減させ、
前記比の値が前記第2閾値より大きい場合に、前記検出ゲインを−30+10logYmax 2[dB]に決定する
ことを特徴とする請求項1に記載のダイナミックレンジ拡張装置。 The detection gain determining means includes
When the value of the ratio is greater than or equal to the first threshold and less than or equal to the second threshold, the ratio is increased in inverse proportion to increasing from the first threshold to the second threshold. Reducing the detection gain from 10 log Y max 2 [dB] to −30 + 10 log Y max 2 [dB],
2. The dynamic range expansion device according to claim 1, wherein when the value of the ratio is larger than the second threshold, the detection gain is determined to be −30 + 10 logY max 2 [dB].
前記加算手段は、前記ゲイン調節手段によりゲイン調節された前記補完信号を、前記オーディオ信号に加算すること
を特徴とする請求項1または請求項2に記載のダイナミックレンジ拡張装置。 Gain adjusting means for performing gain adjustment by amplifying or attenuating the gain of the complementary signal generated by the complementary signal generating means;
The dynamic range extending apparatus according to claim 1, wherein the adding unit adds the complementary signal whose gain is adjusted by the gain adjusting unit to the audio signal.
該フィルタリング処理により求められる前記変化量の変化時間は、前記ハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することにより調整されること
を特徴とする請求項1乃至請求項3のいずれか1項に記載のダイナミックレンジ拡張装置。
The differentiating means performs a differentiation process by performing a filtering process of the second envelope transformed by the decibel transform means by using the high-pass filter,
4. The change time of the change amount obtained by the filtering process is adjusted by changing a set value of a normalized cutoff frequency in the high-pass filter. 5. The dynamic range expansion device as described in the paragraph.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011241092A JP5841405B2 (en) | 2011-11-02 | 2011-11-02 | Dynamic range expansion device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011241092A JP5841405B2 (en) | 2011-11-02 | 2011-11-02 | Dynamic range expansion device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013098832A JP2013098832A (en) | 2013-05-20 |
JP5841405B2 true JP5841405B2 (en) | 2016-01-13 |
Family
ID=48620324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011241092A Active JP5841405B2 (en) | 2011-11-02 | 2011-11-02 | Dynamic range expansion device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5841405B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106887233B (en) * | 2015-12-15 | 2020-01-24 | 广州酷狗计算机科技有限公司 | Audio data processing method and system |
KR102483222B1 (en) * | 2017-11-17 | 2023-01-02 | 삼성전자주식회사 | Audio system and method of controlling the same |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5814613A (en) * | 1981-07-17 | 1983-01-27 | Sanyo Electric Co Ltd | Expanding circuit of signal level |
JP5715910B2 (en) * | 2011-09-01 | 2015-05-13 | クラリオン株式会社 | Dynamic range expansion device |
-
2011
- 2011-11-02 JP JP2011241092A patent/JP5841405B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013098832A (en) | 2013-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110326308B (en) | Distortion sensing, anti-distortion, and distortion aware bass enhancement | |
JP5898534B2 (en) | Acoustic signal processing apparatus and acoustic signal processing method | |
JP5295238B2 (en) | Sound processor | |
JP6711881B2 (en) | Device and method for tuning a frequency dependent damping stage | |
EP1680781B1 (en) | System and method for audio signal processing | |
JP6186470B2 (en) | Acoustic device, volume control method, volume control program, and recording medium | |
JP5707963B2 (en) | Audio amplifier | |
US8634578B2 (en) | Multiband dynamics compressor with spectral balance compensation | |
WO2009110087A1 (en) | Signal processing device | |
EP1709734A1 (en) | System for audio signal processing | |
JP5345067B2 (en) | Hearing sensitivity correction device | |
JP5168208B2 (en) | Audio signal processing device and speaker device | |
JP2009296298A (en) | Sound signal processing device and method | |
JP5841405B2 (en) | Dynamic range expansion device | |
JP5715910B2 (en) | Dynamic range expansion device | |
JP2014030140A (en) | Ambient noise estimation device, sound volume adjusting device, ambient noise estimation method, and ambient noise estimation program | |
EP3379847B1 (en) | Audio device, speaker device, and audio signal processing method | |
JP6155132B2 (en) | Low frequency complement device and low frequency complement method | |
WO2017183405A1 (en) | Acoustic processing device and acoustic processing method | |
JP2021190965A (en) | Acoustic signal processing device and acoustic signal processing program | |
JP4803193B2 (en) | Audio signal gain control apparatus and gain control method | |
JP2011035573A (en) | Sound signal processing apparatus and sound signal processing method | |
JP2012100117A (en) | Acoustic processing apparatus and method | |
JP6807769B2 (en) | Sound equipment and sound quality adjustment method | |
JP6531418B2 (en) | Signal processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141031 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150512 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150818 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151027 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5841405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |