JP5841405B2 - Dynamic range expansion device - Google Patents

Dynamic range expansion device Download PDF

Info

Publication number
JP5841405B2
JP5841405B2 JP2011241092A JP2011241092A JP5841405B2 JP 5841405 B2 JP5841405 B2 JP 5841405B2 JP 2011241092 A JP2011241092 A JP 2011241092A JP 2011241092 A JP2011241092 A JP 2011241092A JP 5841405 B2 JP5841405 B2 JP 5841405B2
Authority
JP
Japan
Prior art keywords
value
envelope
signal
detection
dynamic range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011241092A
Other languages
Japanese (ja)
Other versions
JP2013098832A (en
Inventor
一智 福江
一智 福江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP2011241092A priority Critical patent/JP5841405B2/en
Publication of JP2013098832A publication Critical patent/JP2013098832A/en
Application granted granted Critical
Publication of JP5841405B2 publication Critical patent/JP5841405B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

本発明は、ダイナミックレンジ拡張装置に関し、より詳細には、ダイナミックレンジを圧縮して平坦化したオーディオ信号をスピーカなどから出力する場合に、出力音のメリハリ感と臨場感とを発現させることができ、音質を向上させることが可能なダイナミックレンジ拡張装置に関する。   The present invention relates to a dynamic range expansion device, and more specifically, when an audio signal that has been flattened by compressing a dynamic range is output from a speaker or the like, the sharpness and presence of the output sound can be expressed. The present invention relates to a dynamic range expansion device capable of improving sound quality.

一般に、コンサートホールや録音用スタジオにおいて演奏される楽器やボーカル等の音量レベルの範囲は非常に大きい。このため、音量レベルの範囲が非常に大きい楽器やボーカルの音を収録機器で録音する場合には、収録機器のダイナミックレンジを超えるような過大な音が収録機器に対して入力されるおそれがあった。   In general, the range of volume levels of musical instruments and vocals played in concert halls and recording studios is very large. For this reason, when recording a musical instrument or vocal sound with a very large volume level on the recording device, it is possible that an excessive sound exceeding the dynamic range of the recording device may be input to the recording device. It was.

ここで、ダイナミックレンジとは、識別可能な信号の最小値と最大値の比率を意味している。例えば、CDのように分解能が16bitに規定される場合は、ダイナミックレンジが96dBとなり、DVDのように分解能が24bitに規定される場合には、ダイナミックレンジが144dBとなる。   Here, the dynamic range means the ratio between the minimum value and the maximum value of the identifiable signal. For example, when the resolution is defined as 16 bits as in a CD, the dynamic range is 96 dB, and when the resolution is defined as 24 bits as in a DVD, the dynamic range is 144 dB.

ダイナミックレンジを超えた音を収録機器に収録すると、収録音に大きな歪が発生し、音質劣化の原因となってしまう。このような問題を解決する手段として、一般にコンプレッサやリミッタが適用されている(例えば、非特許文献1,非特許文献2参照)。   If sound exceeding the dynamic range is recorded on the recording device, large distortion occurs in the recorded sound, resulting in deterioration of sound quality. As a means for solving such a problem, a compressor and a limiter are generally applied (for example, see Non-Patent Document 1 and Non-Patent Document 2).

図16(a)は、コンプレッサに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示し、図16(b)は、リミッタに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示している。   FIG. 16A shows an input / output operation example showing the relationship between the signal level of the input signal to the compressor and the output level of the output signal, and FIG. 16B shows the signal level and output signal of the input signal to the limiter. An input / output operation example showing the relationship with the output level is shown.

コンプレッサは、可変式ゲインアンプとして機能するものである。コンプレッサは、図16(a)に示すように、入力信号の信号レベルに対する出力信号の信号レベルの増加割合を、予め設定されるスレッシホールドのレベルを超える前に比べて、スレッシホールドのレベルを超えた後の方が低くなるようにして、出力信号の信号レベルを抑制する役割を有している。すなわち、コンプレッサは、オーディオ信号を常時モニタし、設定されたスレッシホールドのレベルよりも音が大きくならないように自動的にゲインをコントロールするものである。   The compressor functions as a variable gain amplifier. As shown in FIG. 16A, the compressor sets the threshold level of the output signal relative to the signal level of the input signal as compared with the level before the threshold level exceeds a preset threshold level. It has a role of suppressing the signal level of the output signal by lowering the value after exceeding. That is, the compressor constantly monitors the audio signal and automatically controls the gain so that the sound does not become louder than the set threshold level.

一方で、リミッタは、高い圧縮レシオを持ったコンプレッサとして機能するものである。リミッタは、入力信号の信号レベルがスレッシホールドのレベルを大きく超えても出力レベルを一定に保つ役割を有している。   On the other hand, the limiter functions as a compressor having a high compression ratio. The limiter has a role of keeping the output level constant even when the signal level of the input signal greatly exceeds the threshold level.

コンプレッサとリミッタは、いずれも自動的にゲイン(信号レベル)が高い部分を抑圧し、所定のダイナミックレンジ内に収める役割を有している。しかしながら、コンプレッサは、スレッシホールドのレベルを超えた入力信号レベルの増加量をゆるやかに抑える(減少させる)ものであり、リミッタは設定したスレッシホールドのレベルを超えた信号をカットするものである点で、大きく相違する。   Both the compressor and the limiter have a role of automatically suppressing a portion with a high gain (signal level) and keeping it within a predetermined dynamic range. However, the compressor gently suppresses (decreases) the increase of the input signal level exceeding the threshold level, and the limiter cuts the signal exceeding the set threshold level. This is a big difference.

図17は、CDに記録されたオーディオ信号の信号波形の一例を示した図である。上述したように、CDではダイナミックレンジが96dBとなり、ダイナミックレンジが96dBに収まらないオーディオ信号の信号レベルは抑制されることになる。図17の破線Cで囲んだ部分は、信号レベルが高くなっている箇所に該当し、オーディオ信号のレンジ内における振幅の最大値が、コンプレッサおよびリミッタにより±1に正規化された(クリップされた)箇所に該当する。図17の最小分解能は、1/(2(16−1))、つまり、3.05×10−5となっている。 FIG. 17 is a diagram illustrating an example of a signal waveform of an audio signal recorded on a CD. As described above, the CD has a dynamic range of 96 dB, and the signal level of the audio signal whose dynamic range does not fit within 96 dB is suppressed. A portion surrounded by a broken line C in FIG. 17 corresponds to a portion where the signal level is high, and the maximum value of the amplitude within the range of the audio signal is normalized to ± 1 by the compressor and the limiter (clipped). ) The minimum resolution in FIG. 17 is 1 / (2 (16-1) ), that is, 3.05 × 10 −5 .

特に、図17の破線Aおよび破線Bで示される部分は、CDに記録されるオーディオ信号の振幅が±1に抑制されて振幅形状が矩形形状となっている。このため、フルスケールの信号は、矩形形状部分において振幅が±1に制限され、音源のダイナミックレンジが圧縮される。   In particular, the portions indicated by the broken lines A and B in FIG. 17 have a rectangular shape in which the amplitude of the audio signal recorded on the CD is suppressed to ± 1. For this reason, the amplitude of the full-scale signal is limited to ± 1 in the rectangular portion, and the dynamic range of the sound source is compressed.

岩宮眞一郎著、「図解入門よくわかる最新音響の基本と応用」、秀和システム、2011年3月、p. 242−243Iwamiya Soichiro, “Basics and Applications of the Newest Sounds to Understand the Illustration”, Hidekazu System, March 2011, p. 242-243 「最強コンプレッサーマニュアル」、p.5-8、[online]、株式会社サウンドハウス、[平成23年8月10日検索]、<URL:http://www.soundhouse.co.jp/download/sonota/comp.pdf>“The Strongest Compressor Manual”, p.5-8, [online], Soundhouse Co., Ltd. [searched on August 10, 2011], <URL: http://www.soundhouse.co.jp/download/sonota /comp.pdf>

ところで、このようなダイナミックレンジが圧縮されたCD音源を、ボリューム設定で音量を増大した後にスピーカから再生(出力)し、または、CD音源を増幅するパワーアンプ等を介してスピーカから再生(出力)する場合が多く存在する。このようにボリューム設定やパワーアンプ等による出力音の音量増大が行われると、CDに記録された状態において、既に信号出力が抑制されて平坦化されているため(ダイナミックレンジが圧縮されて、クリップされているため)、音のメリハリ感が大きく低減され、また、臨場感も低下してしまうという問題があった。   By the way, a CD sound source having such a compressed dynamic range is reproduced (output) from the speaker after the volume is increased by volume setting, or is reproduced (output) from the speaker via a power amplifier that amplifies the CD sound source. There are many cases to do. When the volume of the output sound is increased by the volume setting or the power amplifier in this way, the signal output is already suppressed and flattened in the state recorded on the CD (the dynamic range is compressed, the clip Therefore, there is a problem that the sharpness of the sound is greatly reduced and the sense of reality is also lowered.

また、図17の破線Aおよび破線Bで囲んだ部分のように、オーディオ信号の振幅が±1でクリップされた場合には、信号波形が矩形状になるため、不要な高調波が発生し易くなり、音質の劣化が発生するという問題があった。このため、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号の出力音に対して、ダイナミックレンジを拡張することに対する要望が高まっている。   Further, when the audio signal is clipped with an amplitude of ± 1 as shown by a broken line A and a broken line B in FIG. 17, the signal waveform becomes rectangular, and unnecessary harmonics are easily generated. Therefore, there is a problem that sound quality is deteriorated. For this reason, there is an increasing demand for extending the dynamic range of the output sound of the audio signal that has been flattened by compressing the dynamic range.

一方で、ダイナミックレンジの圧縮が行われていない場合において、ダイナミックレンジの拡張が行われてしまうと、音質の劣化を招いてしまうおそれがあるという問題がある。   On the other hand, when the dynamic range is not compressed, there is a problem that the sound quality may be deteriorated if the dynamic range is expanded.

さらに、インターネットラジオのような音声配信サービスでは、信号がフルスケールに満たない場合(スピーカなどの出力レンジに余裕がある場合)であっても、ダイナミックレンジの圧縮が行われてしまっている場合もあり得る。同楽曲でありながら、フルスケールに満たない場合の信号とフルスケールである場合の信号に対し、ダイナミックレンジの拡張処理を行った結果、振幅スケールの違いから、補完された信号の変動形状が異なることがないよう配慮すべきである。   Furthermore, in audio distribution services such as Internet radio, the dynamic range may be compressed even if the signal is less than full scale (when the output range of speakers, etc. is sufficient). possible. As a result of dynamic range expansion processing for signals that are the same song but less than full scale and signals that are full scale, the variation shape of the complemented signal differs due to the difference in amplitude scale Care should be taken so that nothing happens.

本発明は、上記課題に鑑みてなされたものであり、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号の出力音に対して、当該オーディオ信号がフルスケールに満たない信号であっても、フルスケールを満たす信号であっても、メリハリ感と臨場感とを発現させ、音質を向上させることが可能なダイナミックレンジ拡張装置を提供することを課題とする。   The present invention has been made in view of the above problems, and even if the audio signal is less than full scale with respect to the output sound of the audio signal whose dynamic range has been compressed and flattened, the signal is not full. It is an object of the present invention to provide a dynamic range expansion device capable of improving the sound quality by expressing sharpness and presence even if the signal satisfies the scale.

上記課題を解決するために、本発明に係るダイナミックレンジ拡張装置は、音源から出力されるオーディオ信号の最大値変化状態に基づいて第1包絡線の検出を行う第1包絡線検出手段と、該第1包絡線検出手段により検出された前記第1包絡線における所定時間の平均的な振幅の値を振幅平均値Ymeanとして算出する平均値算出手段と、前記第1包絡線検出手段により検出された前記第1包絡線の前記所定時間における振幅の最大値を振幅最大値Ymaxとして算出する最大値算出手段と、前記平均値算出手段により算出された振幅平均値Ymeanと前記最大値算出手段により算出された振幅最大値Ymaxと基づいて、検出ゲインを決定する検出ゲイン決定手段と、該検出ゲイン決定手段により決定された前記検出ゲインを下限値として、前記音源から出力されるオーディオ信号の最大値変化状態を求めて第2包絡線の検出を行う第2包絡線検出手段と、該第2包絡線検出手段により検出された前記第2包絡線をデシベル変換するデシベル変換手段と、該デシベル変換手段によりデシベル変換された前記第2包絡線を微分処理することにより、前記第2包絡線の変化量を示す変化量信号を生成する微分手段と、前記微分手段により生成された変化量信号に−1を乗算することにより信号の反転を行う反転手段と、該反転手段により反転された前記変化量信号をリニアな信号に変換することにより検出信号を生成するリニア変換手段と、前記オーディオ信号に前記検出信号を乗算した信号を、前記オーディオ信号から減算することにより補完信号を生成する補完信号生成手段と、該補完信号生成手段により生成された補完信号を、前記オーディオ信号に加算する加算手段とを備え、前記検出ゲイン決定手段は、前記振幅最大値Ymaxに対する前記振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、前記検出ゲインを0[dB]に決定し、前記比の値が前記第1閾値である場合に、前記検出ゲインを10logYmax [dB]に決定し、前記比の値が前記第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logYmax [dB]より低減させた値を前記検出ゲインに決定し、前記比の値が前記第2閾値より大きい場合に、低減された前記検出ゲインにおける前記第2閾値の値を前記検出ゲインに決定することを特徴とする。 In order to solve the above problem, a dynamic range expansion device according to the present invention includes first envelope detection means for detecting a first envelope based on a maximum value change state of an audio signal output from a sound source, Average value calculating means for calculating an average amplitude value for a predetermined time in the first envelope detected by the first envelope detecting means as an amplitude average value Y mean , and detected by the first envelope detecting means Further, a maximum value calculating means for calculating the maximum value of the amplitude of the first envelope at the predetermined time as an amplitude maximum value Y max , an amplitude average value Y mean calculated by the average value calculating means, and the maximum value calculating means based the calculated maximum amplitude value Y max, the detection gain determining means for determining a detection gain, as the lower limit of the detection gain which has been determined by the detection gain determination unit, the sound source A second envelope detecting means for detecting a second envelope by obtaining a maximum value change state of the audio signal output from the signal, and decibel transforming the second envelope detected by the second envelope detecting means. A decibel transforming means, a differentiating means for generating a change amount signal indicating a change amount of the second envelope by differentiating the second envelope transformed by the decibel transforming means, and the differentiating means Inversion means for inverting the signal by multiplying the generated change amount signal by −1, and linear conversion for generating a detection signal by converting the change amount signal inverted by the inversion means into a linear signal Means, a complementary signal generating means for generating a complementary signal by subtracting a signal obtained by multiplying the audio signal by the detection signal from the audio signal, and the complementary signal Complementary signal generated by formation means, and an adding means for adding to the audio signal, the detection gain determination means, the value of the ratio of the average amplitude value Y mean for the amplitude maximum value Y max is 0. The detection gain is determined to be 0 [dB] when smaller than a first threshold value set to a value smaller than 5, and when the ratio value is the first threshold value, the detection gain is set to 10 log Y max 2 [DB], and when the ratio value is equal to or greater than the first threshold value and equal to or less than a second threshold value set to a value greater than 0.5, the ratio value is equal to the first threshold value. When the detection gain is determined to be a value reduced from 10 logY max 2 [dB] in an inverse proportion to the increase from the threshold value to the second threshold value, and the ratio value is greater than the second threshold value Reduced detection gain The value of the second threshold value in is determined as the detection gain.

本発明に係るダイナミックレンジ拡張装置は、第2包絡線検出手段においてオーディオ信号の最大値変化状態に基づいて第2包絡線の検出を行い、微分手段により第2包絡線の変化量を示す変化量信号の生成を行う。   The dynamic range extending apparatus according to the present invention detects the second envelope based on the maximum value change state of the audio signal in the second envelope detecting means, and the change amount indicating the change amount of the second envelope by the differentiating means. Generate a signal.

このため、第2包絡線における最大値変化が大きい場合には、変化量信号の変化量が大きくなり、第2包絡線における最大値変化が小さい場合には、変化量信号の変化量が小さくなる。反転手段で第2包絡線の変化量が示された変化量信号の反転を行った後にオーディオ信号に乗算し、乗算処理された信号を、オーディオ信号から減算することにより、圧縮されて平坦化されたオーディオ信号のダイナミックレンジを拡張するための補完信号を生成することができる。   For this reason, when the maximum value change in the second envelope is large, the change amount of the change amount signal is large, and when the maximum value change in the second envelope is small, the change amount of the change amount signal is small. . The inversion means inverts the change amount signal indicating the change amount of the second envelope and then multiplies the audio signal, and subtracts the multiplied signal from the audio signal to compress and flatten it. It is possible to generate a complementary signal for extending the dynamic range of the audio signal.

従って、加算手段において補完信号生成手段により生成された補完信号を、オーディオ信号に加算することにより、ダイナミックレンジが圧縮されて平坦化された箇所のダイナミックレンジを拡張することができ、出力されるオーディオ信号のメリハリ感と臨場感とを発現させることが可能となる。   Therefore, by adding the complementary signal generated by the complementary signal generating means in the adding means to the audio signal, the dynamic range of the portion where the dynamic range is compressed and flattened can be expanded, and the output audio is output. It is possible to express the sharpness and presence of the signal.

さらに、本発明に係るダイナミックレンジ拡張装置では、検出ゲイン決定手段により決定された検出ゲインを下限値として、オーディオ信号の最大値変化状態に基づいて第2包絡線が求められている。つまり、ダイナミックレンジの拡張処理に用いられる第2包絡線検出の下限値が、検出ゲインに基づいて決定される。   Furthermore, in the dynamic range expansion apparatus according to the present invention, the second envelope is obtained based on the maximum value change state of the audio signal, with the detection gain determined by the detection gain determination means as the lower limit value. That is, the lower limit value of the second envelope detection used for the dynamic range expansion process is determined based on the detection gain.

ここで、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、検出ゲインは0に決定される。つまり、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合には、第2包絡線検出の下限値が0[dB]に決定されることになる。 Here, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is smaller than the first threshold value set to a value smaller than 0.5, the detection gain is determined to be zero. That is, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is relatively small (less than 0.5), the lower limit value of the second envelope detection is determined to be 0 [dB]. become.

一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれが低い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合に、検出ゲイン決定手段が、第2包絡線検出の下限値(検出ゲイン)を0[dB]に決定することにより、第2包絡線が過大に検出されて不必要な補完信号がオーディオ信号に加算され、オーディオ信号の音質が低減されてしまうことを抑制することが可能となる。 In general, when the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is small in the audio signal, the possibility that the dynamic range is compressed is low. For this reason, when the value of the ratio of the amplitude average value Y mean to the maximum amplitude value Y max is relatively small (less than 0.5), the detection gain determination means is the lower limit value (detection gain) of the second envelope detection. Is determined to be 0 [dB], so that it is possible to prevent the second envelope from being excessively detected and an unnecessary complementary signal being added to the audio signal, thereby reducing the sound quality of the audio signal. Become.

一方で、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値よりも小さい場合に、比の値が第1閾値から第2閾値まで増加するのに反比例させるようにして、10logYmax [dB]より低減された値が検出ゲインとして決定される。 On the other hand, when the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is equal to or larger than the first threshold value and smaller than the second threshold value set to a value larger than 0.5, the ratio As a detection gain, a value reduced from 10 logY max 2 [dB] is determined so that the value of is increased in inverse proportion to the increase from the first threshold value to the second threshold value.

一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれが高い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値から第2閾値まで増加するに従って、第1閾値に対応する10logYmax [dB]より低減させた値を第2包絡線検出の下限値に決定することにより、ダイナミックレンジの圧縮が行われたオーディオ信号に適切な補完信号を加算することができ、オーディオ信号の音質向上を図ることが可能となる。 In general, when the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is large in the audio signal, there is a high possibility that the dynamic range is being compressed. For this reason, as the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max increases from the first threshold value to the second threshold value, a value reduced from 10 log Y max 2 [dB] corresponding to the first threshold value is increased. By determining the lower limit value of the two envelope detection, an appropriate complementary signal can be added to the audio signal whose dynamic range has been compressed, and the sound quality of the audio signal can be improved.

さらに、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第2閾値より大きい場合には、比の値に反比例して低減された第2閾値における検出ゲインを、第2包絡線検出の下限値(検出ゲイン)に決定することにより、第2包絡線における最大値変化が過大に検出されてしまって、オーディオ信号に不適切な補完信号が加算されてしまうことを防止することができる。 Further, when the ratio value of the average amplitude value Y mean with respect to the maximum amplitude value Y max is larger than the second threshold value, the detection gain at the second threshold value reduced in inverse proportion to the ratio value is detected as the second envelope. By determining the lower limit value (detection gain), it is possible to prevent the maximum change in the second envelope from being excessively detected and adding an inappropriate complementary signal to the audio signal. .

また、本発明に係るダイナミックレンジ拡張装置では、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値に基づいてダイナミックレンジの圧縮の程度を判断するため、ダイナミックレンジの圧縮が行われたオーディオ信号がフルスケールである場合であっても、フルスケールに満たない場合であっても、その出力レベルに左右されることなくダイナミックレンジの拡張処理を行うことができる。このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われている信号に対し、ダイナミックレンジの拡張処理が行われない可能性を排除することができる。 Further, in the dynamic range expansion device according to the present invention, the dynamic range compression audio is performed in order to determine the degree of compression of the dynamic range based on the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max . Whether the signal is full scale or less than full scale, the dynamic range can be expanded regardless of the output level. For this reason, it is possible to eliminate the possibility that the dynamic range expansion processing is not performed on a signal that is less than full scale and that has undergone dynamic range compression.

また、上述したダイナミックレンジ拡張装置において、前記検出ゲイン決定手段は、前記比の値が前記第1閾値以上であって、かつ、前記第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記検出ゲインを、前記10logYmax [dB]から−30+10logYmax [dB]まで低減させ、前記比の値が前記第2閾値より大きい場合に、前記検出ゲインを−30+10logYmax [dB]に決定するものであってもよい。 Further, in the above-described dynamic range expansion apparatus, the detection gain determination unit may determine that the ratio value is the first threshold value when the ratio value is equal to or greater than the first threshold value and equal to or less than the second threshold value. The detection gain is reduced from 10 logY max 2 [dB] to −30 + 10 log Y max 2 [dB] in an inverse proportion to the increase from 1 threshold to the second threshold, and the value of the ratio is the second When it is larger than the threshold value, the detection gain may be determined to be −30 + 10 logY max 2 [dB].

CDやDVD等においてダイナミックレンジが圧縮された状態で記録されるオーディオ信号では、第2包絡線検出の検出範囲を−30[dB]〜0[dB]に設定した上でダイナミックレンジを拡張することにより、効果的な音質向上を図ることが好ましい。   For an audio signal recorded with a dynamic range compressed on a CD, DVD, or the like, the dynamic range is expanded after setting the detection range of the second envelope detection to -30 [dB] to 0 [dB]. Therefore, it is preferable to improve the sound quality effectively.

このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値以上であって、かつ、第2閾値以下である場合には、比の値が前記第1閾値から第2閾値まで増加するのに反比例させるようにして、検出ゲインを、10logYmax [dB]から−30+10logYmax [dB]まで低減させ、比の値が第2閾値より大きい場合には、検出ゲインを−30+10logYmax [dB]に決定することにより、CDやDVD等に記録されるオーディオ信号に適したダイナミックレンジの拡張処理を行うことが可能となる。 For this reason, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is equal to or larger than the first threshold value and equal to or smaller than the second threshold value, the ratio value is changed from the first threshold value to the second threshold value. When the detection gain is reduced from 10 log Y max 2 [dB] to −30 + 10 log Y max 2 [dB] in an inverse proportion to the increase to the threshold, and the ratio value is greater than the second threshold, the detection gain is By determining -30 + 10 log Y max 2 [dB], it is possible to perform a dynamic range expansion process suitable for an audio signal recorded on a CD, a DVD, or the like.

また、上述したダイナミックレンジ拡張装置は、前記補完信号生成手段により生成された補完信号のゲインを増幅又は減衰することによりゲイン調節を行うゲイン調節手段を有し、前記加算手段は、前記ゲイン調節手段によりゲイン調節された前記補完信号を、前記オーディオ信号に加算するものであってもよい。   In addition, the above-described dynamic range extending apparatus has gain adjusting means for performing gain adjustment by amplifying or attenuating the gain of the complementary signal generated by the complementary signal generating means, and the adding means is the gain adjusting means. The complementary signal that has been gain-adjusted according to the above may be added to the audio signal.

補完信号は、包絡線における最大値変化に基づいて生成されるため、ダイナミックレンジが圧縮されて平坦化された箇所におけるゲイン(振幅)を拡張することが可能である。しかしながら、拡張すべきダイナミックレンジのゲインは、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号ごとに異なり、そのまま補完信号をオーディオ信号に加算しても、十分なダイナミックレンジの補完(拡張)を行えなかったり、ダイナミックレンジの補完(拡張)量が多すぎたりして、かえって音質の低下を招いてしまうおそれもある。   Since the complementary signal is generated based on the maximum value change in the envelope, it is possible to expand the gain (amplitude) at the location where the dynamic range is compressed and flattened. However, the gain of the dynamic range that should be expanded differs for each audio signal that has been flattened by compressing the dynamic range, and even if the complementary signal is added to the audio signal as it is, sufficient dynamic range can be supplemented (expanded). There is also a possibility that the sound quality is deteriorated because there is not enough or the amount of complementation (expansion) of the dynamic range is too large.

このため、オーディオ信号の圧縮状態などに応じて、ゲイン調節手段で予め補完信号のゲインを増幅又は減衰しておくことにより、加算手段で補完信号が加算されたオーディオ信号のダイナミックレンジを、適切に拡張することが可能となる。   Therefore, according to the compression state of the audio signal, the gain adjustment means amplifies or attenuates the gain of the complementary signal in advance, thereby appropriately adjusting the dynamic range of the audio signal to which the complementary signal is added by the adding means. It becomes possible to expand.

また、上述したダイナミックレンジ拡張装置において、前記微分手段は、ハイパスフィルタを用いて前記オーディオ信号のフィルタリング処理を行うことによって微分処理を行い、該フィルタリング処理により求められる前記変化量の変化時間は、前記ハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することにより調整されるものであってもよい。   Further, in the above-described dynamic range expansion device, the differentiating unit performs a differentiation process by performing a filtering process of the audio signal using a high-pass filter, and the change time of the amount of change obtained by the filtering process is It may be adjusted by changing the set value of the normalized cutoff frequency in the high-pass filter.

上述したように、微分手段における微分処理は、オーディオ信号に対して、ハイパスフィルタを用いたフィルタリング処理を行うことによって実現される。また、このハイパスフィルタの正規化カットオフ周波数の設定値を変更することにより、フィルタリング処理により求められる変化量の変化時間を調整することが可能となる。   As described above, the differentiation process in the differentiation unit is realized by performing a filtering process using a high-pass filter on the audio signal. Further, by changing the set value of the normalized cutoff frequency of the high-pass filter, it is possible to adjust the change time of the change amount obtained by the filtering process.

例えば、ダイナミックレンジが圧縮されて振幅が平坦化される状態は、コンプレッサやリミッタにおける設定により異なり、また、CDとDVDとではダイナミックレンジの圧縮状態が異なったものとなる。従って、オーディオ信号におけるダイナミックレンジの圧縮状態に応じて正規化カットオフ周波数を調整することにより、ダイナミックレンジの圧縮状態に適したダイナミックレンジの拡張時間の調整を行うことが可能となる。   For example, the state where the dynamic range is compressed and the amplitude is flattened differs depending on the setting in the compressor and limiter, and the compression state of the dynamic range differs between CD and DVD. Therefore, by adjusting the normalized cutoff frequency according to the compression state of the dynamic range in the audio signal, it is possible to adjust the expansion time of the dynamic range suitable for the compression state of the dynamic range.

本発明に係るダイナミックレンジ拡張装置は、検出ゲイン決定手段により決定された検出ゲインを下限値として、オーディオ信号の最大値変化状態に基づいて第2包絡線が求められている。つまり、ダイナミックレンジの拡張処理に用いられる第2包絡線検出の下限値が、検出ゲインに基づいて決定される。   In the dynamic range expansion apparatus according to the present invention, the second envelope is obtained based on the maximum value change state of the audio signal with the detection gain determined by the detection gain determination means as the lower limit value. That is, the lower limit value of the second envelope detection used for the dynamic range expansion process is determined based on the detection gain.

ここで、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、検出ゲインは0に決定される。つまり、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合には、第2包絡線検出の下限値が0[dB]に決定されることになる。 Here, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is smaller than the first threshold value set to a value smaller than 0.5, the detection gain is determined to be zero. That is, when the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is relatively small (less than 0.5), the lower limit value of the second envelope detection is determined to be 0 [dB]. become.

一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれが低い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が比較的小さい(0.5より小さい)場合に、検出ゲイン決定手段が、第2包絡線検出の下限値(検出ゲイン)を0[dB]に決定することにより、第2包絡線が過大に検出されて不必要な補完信号がオーディオ信号に加算され、オーディオ信号の音質が低減されてしまうことを抑制することが可能となる。 In general, when the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is small in the audio signal, the possibility that the dynamic range is compressed is low. For this reason, when the value of the ratio of the amplitude average value Y mean to the maximum amplitude value Y max is relatively small (less than 0.5), the detection gain determination means is the lower limit value (detection gain) of the second envelope detection. Is determined to be 0 [dB], so that it is possible to prevent the second envelope from being excessively detected and an unnecessary complementary signal being added to the audio signal, thereby reducing the sound quality of the audio signal. Become.

一方で、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が、第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値よりも小さい場合に、比の値が第1閾値から第2閾値まで増加するのに反比例させるようにして、10logYmax [dB]より低減された値が検出ゲインとして決定される。 On the other hand, when the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is equal to or larger than the first threshold value and smaller than the second threshold value set to a value larger than 0.5, the ratio As a detection gain, a value reduced from 10 logY max 2 [dB] is determined so that the value of is increased in inverse proportion to the increase from the first threshold value to the second threshold value.

一般に、オーディオ信号において振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれが高い。このため、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第1閾値から第2閾値まで増加するに従って、第1閾値に対応する10logYmax [dB]より低減させた値を第2包絡線検出の下限値に決定することにより、ダイナミックレンジの圧縮が行われたオーディオ信号に適切な補完信号を加算することができ、オーディオ信号の音質向上を図ることが可能となる。 In general, when the ratio of the average amplitude value Y mean to the maximum amplitude value Y max is large in the audio signal, there is a high possibility that the dynamic range is being compressed. For this reason, as the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max increases from the first threshold value to the second threshold value, a value reduced from 10 log Y max 2 [dB] corresponding to the first threshold value is increased. By determining the lower limit value of the two envelope detection, an appropriate complementary signal can be added to the audio signal whose dynamic range has been compressed, and the sound quality of the audio signal can be improved.

さらに、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値が第2閾値より大きい場合には、比の値に反比例して低減された第2閾値における検出ゲインを、第2包絡線検出の下限値(検出ゲイン)に決定することにより、第2包絡線における最大値変化が過大に検出されてしまって、オーディオ信号に不適切な補完信号が加算されてしまうことを防止することができる。 Further, when the ratio value of the average amplitude value Y mean with respect to the maximum amplitude value Y max is larger than the second threshold value, the detection gain at the second threshold value reduced in inverse proportion to the ratio value is detected as the second envelope. By determining the lower limit value (detection gain), it is possible to prevent the maximum change in the second envelope from being excessively detected and adding an inappropriate complementary signal to the audio signal. .

また、本発明に係るダイナミックレンジ拡張装置では、振幅最大値Ymaxに対する振幅平均値Ymeanの比の値に基づいてダイナミックレンジの圧縮の程度を判断するため、ダイナミックレンジの圧縮が行われたオーディオ信号がフルスケールである場合であってもフルスケールに満たない場合であっても、その出力レベルに左右されることなくダイナミックレンジの拡張処理を行うことができる。このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われていない信号などに対して、不要なダイナミックレンジの拡張処理が行われてしまうことを抑制することが可能となる。 Further, in the dynamic range expansion device according to the present invention, the dynamic range compression audio is performed in order to determine the degree of compression of the dynamic range based on the value of the ratio of the average amplitude value Y mean to the maximum amplitude value Y max . Whether the signal is full scale or less than full scale, the dynamic range can be expanded regardless of the output level. For this reason, it is possible to suppress an unnecessary dynamic range expansion process from being performed on an audio signal that is less than full scale and has not been subjected to dynamic range compression. .

実施の形態に係るダイナミックレンジ拡張装置の概略構成を示したブロック図である。It is the block diagram which showed schematic structure of the dynamic range expansion apparatus which concerns on embodiment. 実施の形態に係る楽曲分析部の概略構成を示したブロック図である。It is the block diagram which showed schematic structure of the music analysis part which concerns on embodiment. 包絡線検出の下限値f(Ymean,Ymax)と、包絡線の振幅最大値に対する振幅平均値の比(Ymean/Ymax)との関係を示したグラフである。It is the graph which showed the relationship between the lower limit f ( Ymean , Ymax ) of envelope detection, and ratio ( Ymean / Ymax ) of the amplitude average value with respect to the amplitude maximum value of an envelope. (a)は、リミッタ処理によりダイナミックレンジの圧縮が行われる前のオーディオ信号の振幅変化を示した図であり、(b)は、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号の振幅変化を示した図である。(A) is the figure which showed the amplitude change of the audio signal before dynamic range compression is performed by the limiter process, (b) is the audio signal after the dynamic range compression is performed by the limiter process. It is the figure which showed the amplitude change. ダイナミックレンジが大きく圧縮されて多数のクリップが発生するオーディオ信号が、実施の形態に係るダイナミックレンジ拡張装置に入力された場合におけるグラフを示し、(a)は、3秒間のオーディオ信号の振幅変化を示し、(b)は、第1スムージング部によって算出された包絡線と、平均値ホールド部において算出される包絡線の振幅平均値と、第2最大値ホールド部において算出される包絡線の振幅最大値の変化を示し、(c)は、包絡線の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値を示したグラフである。The graph in the case where the audio signal in which the dynamic range is greatly compressed and a large number of clips are generated is input to the dynamic range expansion apparatus according to the embodiment is shown in (a), and the amplitude change of the audio signal for 3 seconds is shown. (B) shows the envelope calculated by the first smoothing unit, the average amplitude of the envelope calculated by the average value holding unit, and the maximum amplitude of the envelope calculated by the second maximum value holding unit. (C) is a graph showing the ratio of the average amplitude value to the maximum amplitude value of the envelope (Y mean / Y max ). ダイナミックレンジが図5に比べて小さく圧縮されてクリップが散見されるオーディオ信号が、実施の形態に係るダイナミックレンジ拡張装置に入力された場合におけるグラフであって、図5(a)〜(b)に対応するグラフである。FIG. 5A is a graph in a case where an audio signal whose dynamic range is compressed smaller than that in FIG. 5 and a clip is scattered is input to the dynamic range expansion apparatus according to the embodiment. Is a graph corresponding to. ダイナミックレンジの圧縮が行われていないオーディオ信号が、実施の形態に係るダイナミックレンジ拡張装置に入力された場合におけるグラフであって、図5(a)〜(b)に対応するグラフである。FIG. 6 is a graph when an audio signal that has not been compressed in the dynamic range is input to the dynamic range expansion apparatus according to the embodiment, and corresponds to FIGS. 実施の形態に係る第1変動検出部の概略構成を示したブロック図である。It is the block diagram which showed schematic structure of the 1st fluctuation | variation detection part which concerns on embodiment. 実施の形態に係る第1重み付け部の概略構成を示したブロック図である。It is the block diagram which showed schematic structure of the 1st weighting part which concerns on embodiment. 実施の形態に係るダイナミックレンジ拡張装置の動作例を説明するために設定された各機能部の動作パラメータを示した表である。It is the table | surface which showed the operation parameter of each function part set in order to demonstrate the operation example of the dynamic range expansion apparatus which concerns on embodiment. (a)は、実施の形態に係るダイナミックレンジ拡張装置に、ダイナミックレンジが圧縮されて振幅が平坦化されたオーディオ信号が入力される場合の振幅変化状態を示した図であり、(b)は、実施の形態に係る第1変動検出部および第2変動検出部の第2最大値検出部において、検出の下限値を−30[dB]に固定した場合におけるダイナミックレンジ拡張装置の出力信号の振幅変化状態を示した図であり、(c)は、実施の形態に係る第2最大値検出部における検出の下限値を−30+10logYmax [dB]として変動させた場合におけるダイナミックレンジ拡張装置の出力信号の振幅変化状態を示した図である。(A) is the figure which showed the amplitude change state when the audio signal by which the dynamic range was compressed and the amplitude was flattened is input into the dynamic range expansion apparatus which concerns on embodiment, (b). The amplitude of the output signal of the dynamic range expansion apparatus when the lower limit value of detection is fixed to −30 [dB] in the second maximum value detection unit of the first fluctuation detection unit and the second fluctuation detection unit according to the embodiment. is a diagram showing a change state, (c), the output of the dynamic range expansion apparatus in the case of varying the lower limit of detection as -30 + 10logY max 2 [dB] in the second maximum value detection unit according to the embodiment It is the figure which showed the amplitude change state of the signal. (a)は、実施の形態に係るダイナミックレンジ拡張装置に、ダイナミックレンジが圧縮されていないオーディオ信号が入力される場合の振幅変化状態を示した図であり、(b)は、第2最大値検出部における検出の下限値を−30[dB]に固定した場合における出力信号の振幅変化状態を示した図であり、(c)は、検出の下限値を−30+10logYmax [dB]として変動させた場合における出力信号の振幅変化状態を示した図である。(A) is the figure which showed the amplitude change state in case the audio signal in which the dynamic range is not compressed is input into the dynamic range expansion apparatus which concerns on embodiment, (b) is the 2nd maximum value. a view showing the amplitude variation state of the output signal in case of fixing the lower limit of detection in the detecting portion -30 [dB], (c), the variation lower limit value of the detection as -30 + 10logY max 2 [dB] It is the figure which showed the amplitude change state of the output signal in the case of making it. (a)は、図11(a)に示すダイナミックレンジが圧縮されたオーディオ信号がダイナミックレンジ拡張装置に入力されて図11(c)に示す信号が出力される場合において、第1スムージング部より算出された入力信号の包絡線と、平均値ホールド部で求められた振幅平均値と、第2最大値ホールド部で求められた振幅最大値との変化状態と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化と、包絡線検出の下限値の変動状態とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示した図であり、(b)は、図12(a)に示すダイナミックレンジが圧縮されていないオーディオ信号がダイナミックレンジ拡張装置に入力されて図12(c)の信号が出力される場合における(a)と同様の変動状態を、30秒間検出した結果を示している。(A) is calculated by the first smoothing unit when the audio signal with the compressed dynamic range shown in FIG. 11 (a) is input to the dynamic range expansion apparatus and the signal shown in FIG. 11 (c) is output. The change of the envelope of the input signal, the average amplitude value obtained by the average value hold unit, the maximum amplitude value obtained by the second maximum value hold unit, and the ratio of the average amplitude value to the maximum amplitude value It is the figure which showed the result of having detected the state change of the value of ( Ymean / Ymax ) and the fluctuation state of the lower limit of envelope detection from the head of the music of the input audio signal for 30 seconds, (b) Is the same change as (a) in the case where an audio signal whose dynamic range is not compressed shown in FIG. 12 (a) is input to the dynamic range extender and the signal of FIG. 12 (c) is output. State shows the result of detection 30 seconds. (a)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールのオーディオ信号の振幅変動状態を示した図であり、(b)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールに満たないオーディオ信号の振幅変動状態を示した図であり、(c)は、(a)に示されるオーディオ信号のダイナミックレンジが実施の形態に係るダイナミックレンジ拡張装置で拡張されたオーディオ信号の振幅変動状態を示した図であり、(d)は、(b)に示されるオーディオ信号のダイナミックレンジがダイナミックレンジ拡張装置で拡張されたオーディオ信号の振幅変動状態を示した図である。(A) is the figure which showed the amplitude fluctuation state of the full-scale audio signal by which the dynamic range was compressed and the amplitude was flattened, (b) is the dynamic range was compressed and the amplitude was flattened It is the figure which showed the amplitude fluctuation state of the audio signal which is less than full scale, (c) is the audio signal by which the dynamic range of the audio signal shown by (a) was expanded with the dynamic range expansion apparatus which concerns on embodiment (D) is a diagram showing the amplitude variation state of the audio signal in which the dynamic range of the audio signal shown in (b) is expanded by the dynamic range expansion device. (a)は、図14(a)に示すダイナミックレンジが圧縮されたフルスケールのオーディオ信号がダイナミックレンジ拡張装置に入力されて、図14(c)の信号が出力される場合において、第1スムージング部より算出された入力信号の包絡線と、平均値ホールド部で求められた振幅平均値と、第2最大値ホールド部で求められた振幅最大値との変化状態と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化と、包絡線検出の下限値の変動状態とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示し、(b)は、図14(b)に示すダイナミックレンジが圧縮されたフルスケールに満たないオーディオ信号がダイナミックレンジ拡張装置に入力されて図14(d)の信号が出力される場合における(a)と同様の変動状態を、30秒間検出した結果を示している。(A) shows the first smoothing in the case where the full-scale audio signal in which the dynamic range shown in FIG. 14 (a) is compressed is input to the dynamic range expansion apparatus and the signal of FIG. 14 (c) is output. The input signal envelope calculated by the unit, the amplitude average value obtained by the average value hold unit, the change state of the amplitude maximum value obtained by the second maximum value hold unit, and the amplitude average for the amplitude maximum value (B) shows the result of detecting the state change of the value ratio (Y mean / Y max ) and the fluctuation state of the lower limit value of the envelope detection for 30 seconds from the beginning of the music of the input audio signal. FIG. 14B shows a case where an audio signal whose dynamic range is less than full scale and whose dynamic range is compressed is input to the dynamic range expansion apparatus and the signal shown in FIG. 14D is output. Similar variation state (a), showing the results of detection 30 seconds. (a)は、コンプレッサに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示し、(b)は、リミッタに対する入力信号の信号レベルと出力信号の出力レベルとの関係を示した入出力動作例を示した図である。(A) shows an input / output operation example showing the relationship between the signal level of the input signal to the compressor and the output level of the output signal, and (b) shows the signal level of the input signal to the limiter and the output level of the output signal. It is the figure which showed the input / output operation example which showed this relationship. CDに記録されたオーディオ信号の信号波形の一例を示した図である。It is the figure which showed an example of the signal waveform of the audio signal recorded on CD.

以下、本発明に係るダイナミックレンジ拡張装置の一例について、図面を示して詳細について説明する。   Hereinafter, an example of a dynamic range expansion apparatus according to the present invention will be described in detail with reference to the drawings.

[ダイナミックレンジ拡張装置]
図1は、本実施の形態に係るダイナミックレンジ拡張装置1の概略構成を示したブロック図である。ダイナミックレンジ拡張装置1は、ダイナミックレンジの圧縮により平坦化された状態となったオーディオ信号のゲイン(信号レベル)を拡張する(補完する)役割を有している。
[Dynamic range expansion device]
FIG. 1 is a block diagram showing a schematic configuration of a dynamic range expansion apparatus 1 according to the present embodiment. The dynamic range expansion device 1 has a role of expanding (complementing) the gain (signal level) of an audio signal that has been flattened by compression of the dynamic range.

ダイナミックレンジ拡張装置1は、LPF部(ローパスフィルタ部)10と、HPF部(ハイパスフィルタ部)11と、第1変動検出部12と、第2変動検出部13と、第1重み付け部14と、第2重み付け部15と、合成部(加算手段)16と、楽曲分析部17とを有している。   The dynamic range expansion apparatus 1 includes an LPF unit (low-pass filter unit) 10, an HPF unit (high-pass filter unit) 11, a first variation detection unit 12, a second variation detection unit 13, a first weighting unit 14, A second weighting unit 15, a synthesis unit (adding unit) 16, and a music analysis unit 17 are included.

ダイナミックレンジ拡張装置1には、ダイナミックレンジの圧縮されたオーディオ信号(例えば、CDなどへの記録に伴ってダイナミックレンジが圧縮されたオーディオ信号)が入力される。入力されたオーディオ信号は、図1に示すように、ダイナミックレンジ拡張装置1のLPF部10と、HPF部11と、合成部16と、楽曲分析部17に対してそれぞれ出力される。   The dynamic range expansion device 1 receives an audio signal with a compressed dynamic range (for example, an audio signal with a dynamic range compressed with recording on a CD or the like). As shown in FIG. 1, the input audio signal is output to the LPF unit 10, the HPF unit 11, the synthesis unit 16, and the music analysis unit 17 of the dynamic range expansion apparatus 1.

[楽曲分析部]
楽曲分析部17は、入力されるオーディオ信号(ダイナミックレンジの圧縮が行われたオーディオ信号)より包絡線(第1包絡線)の検出を行い、検出された包絡線に基づいて、第1変動検出部12および第2変動検出部13に対する包絡線(第2包絡線)の検出の下限値(検出ゲイン)を動的に決定(設定)する役割を有している。
[Music analysis section]
The music analysis unit 17 detects an envelope (first envelope) from an input audio signal (an audio signal on which dynamic range compression has been performed), and detects a first variation based on the detected envelope. It has a role of dynamically determining (setting) a lower limit value (detection gain) of detection of an envelope (second envelope) with respect to the unit 12 and the second variation detection unit 13.

楽曲分析部17は、図2に示すように、第1最大値検出部(第1包絡線検出手段)21と、第1最大値ホールド部(第1包絡線検出手段)22と、第1スムージング部(第1包絡線検出手段)23と、モノラル変換部24と、平均値ホールド部(平均値算出手段)25と、第2最大値ホールド部(最大値算出手段)26と、検出ゲイン算出部(検出ゲイン決定手段)27とを有している。   As shown in FIG. 2, the music analysis unit 17 includes a first maximum value detection unit (first envelope detection unit) 21, a first maximum value hold unit (first envelope detection unit) 22, and a first smoothing. Section (first envelope detection means) 23, monaural conversion section 24, average value hold section (average value calculation means) 25, second maximum value hold section (maximum value calculation means) 26, and detection gain calculation section (Detection gain determination means) 27.

第1最大値検出部21は、入力されたLチャネルおよびRチャネルのそれぞれのオーディオ信号の振幅を絶対値化した後に、所定の時間(mサンプル)内の最大値を検出して、それぞれのチャネル毎に出力する役割を有している。従って、第1最大値検出部21において所定の時間(mサンプル)ごとに最大値が更新されて、第1最大値ホールド部22に出力される。ただし、第2最大値検出部31(図8参照)に対する入力信号として、所定の周波数でサンプリングされたデータが用いられている。   The first maximum value detection unit 21 detects the maximum value within a predetermined time (m samples) after converting the amplitudes of the input audio signals of the L channel and the R channel into absolute values, and detects each channel. It has a role to output every time. Accordingly, the first maximum value detection unit 21 updates the maximum value every predetermined time (m samples) and outputs it to the first maximum value hold unit 22. However, data sampled at a predetermined frequency is used as an input signal to the second maximum value detector 31 (see FIG. 8).

第1最大値ホールド部22は、第1最大値検出部21において所定の時間(mサンプル)ごとに更新されるそれぞれのチャネルの最大値を受信した場合において、受信した最新の最大値だけでなく、その最大値を含む過去n回分の最大値(n個の最大値)の中で、最も大きな値を示す最大値の値を、それぞれのチャネル毎に求める。そして、第1最大値ホールド部22は、求められた各チャネルの最大値を、所定の時間(mサンプル)ごとに、第1スムージング部23へ出力する。   The first maximum value hold unit 22 receives not only the latest maximum value received when the first maximum value detection unit 21 receives the maximum value of each channel updated every predetermined time (m samples). Among the maximum values (n maximum values) for the past n times including the maximum value, the maximum value indicating the largest value is obtained for each channel. Then, the first maximum value holding unit 22 outputs the obtained maximum value of each channel to the first smoothing unit 23 every predetermined time (m samples).

つまり、第1最大値ホールド部22は、第1最大値検出部21から所定の時間(mサンプル)ごとに所定の時間(mサンプル)の内で最も大きな値の最大値を取得し、さらに、取得した最大値を含む過去n回分の最大値の中で最も値の大きな最大値(つまり、n×mサンプルの間における最も値の高い最大値)を検出して、所定の時間(mサンプル)ごとに、第1スムージング部23へ出力する。なお、第1最大値ホールド部22から第1スムージング部23へと出力されるn×mサンプルの中で最も高い値の最大値は、所定の時間(mサンプル)だけ値がホールド(保持)された状態で出力される。   That is, the first maximum value hold unit 22 acquires the maximum value of the largest value within a predetermined time (m samples) from the first maximum value detection unit 21 every predetermined time (m samples). A maximum value having the largest value among the maximum values for the past n times including the acquired maximum value (that is, the maximum value having the highest value among n × m samples) is detected, and a predetermined time (m samples) For each output to the first smoothing unit 23. The maximum value of the highest value among n × m samples output from the first maximum value hold unit 22 to the first smoothing unit 23 is held (held) for a predetermined time (m samples). It is output in the state.

第1スムージング部23は、第1最大値ホールド部22より取得した各チャネルの最大値の信号を積分処理することにより、最大値の変動を滑らかにする(スムージング処理する)役割を有している。このようにして第1最大値ホールド部22より取得した信号を滑らかにすることにより、オーディオ信号に対する包絡線(第1包絡線)の信号検出をチャネル毎(LチャネルおよびRチャネル)に行う。この包絡線(第1包絡線)の検出信号は、リニアな信号特性(振幅でゲインが示される特性)を有している。このようにして検出された包絡線(第1包絡線)の検出信号を第1の包絡線信号という。   The first smoothing unit 23 has a role of smoothing the fluctuation of the maximum value (smoothing process) by integrating the signal of the maximum value of each channel acquired from the first maximum value holding unit 22. . By smoothing the signal acquired from the first maximum value hold unit 22 in this way, signal detection of the envelope (first envelope) for the audio signal is performed for each channel (L channel and R channel). The detection signal of the envelope (first envelope) has linear signal characteristics (characteristics indicating gain by amplitude). The detection signal of the envelope (first envelope) detected in this way is referred to as a first envelope signal.

モノラル変換部24は、第1スムージング部23において求められたLチャネルおよびRチャネルの第1の包絡線信号の平均を算出する役割を有している。算出された平均の包絡線信号は、平均値ホールド部25と第2最大値ホールド部26とのそれぞれに出力される。   The monaural conversion unit 24 has a role of calculating an average of the first envelope signals of the L channel and the R channel obtained by the first smoothing unit 23. The calculated average envelope signal is output to each of the average value hold unit 25 and the second maximum value hold unit 26.

平均値ホールド部25は、モノラル変換部24より取得した第1の包絡線信号の平均値(振幅平均値)を、オーディオ信号の入力が行われている間(オーディオ信号が特定の楽曲である場合には、その楽曲が終了するまでの間:所定時間)算出してホールド(保持・維持)する役割を有している。つまり、オーディオ信号が入力されて間もない時間においては、入力から間もない時間が経過するまでの振幅の平均値が算出されてホールドされ、その後、入力からしばらく時間が経過した場合には、入力からしばらく時間が経過するまでの振幅の平均値が算出されてホールドされることになる。   The average value holding unit 25 calculates the average value (amplitude average value) of the first envelope signal acquired from the monaural conversion unit 24 while the audio signal is being input (when the audio signal is a specific music piece). Has a role of calculating and holding (holding / maintaining) until the music ends. That is, in a short time after the audio signal is input, the average value of the amplitude until the short time elapses from the input is calculated and held, and then after a while has passed since the input, The average value of the amplitude until a certain period of time elapses from the input is calculated and held.

また、第2最大値ホールド部26は、モノラル変換部24より取得した第1の包絡線信号の最大値(振幅最大値)を、入力されたオーディオ信号の入力が行われている間(オーディオ信号が特定の楽曲である場合には、その楽曲が終了するまでの間:所定時間)算出してホールドする役割を有している。従って、オーディオ信号が入力されて間もない時間においては、入力から間もない時間が経過するまでの振幅の最大値が算出されてホールドされ、その後、入力からしばらく時間が経過した場合には、入力からしばらく時間が経過するまでの振幅の最大値が算出されてホールドされることになる。   The second maximum value hold unit 26 uses the maximum value (amplitude maximum value) of the first envelope signal acquired from the monaural conversion unit 24 while the input audio signal is being input (audio signal). Has a role of calculating and holding until the music ends (predetermined time). Therefore, in a short time after the audio signal is input, the maximum value of the amplitude until the short time elapses from the input is calculated and held, and then after a while has elapsed from the input, The maximum value of the amplitude until a certain time elapses from the input is calculated and held.

平均値ホールド部25において算出された包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26において算出された包絡線(第1包絡線)の振幅最大値は、それぞれ検出ゲイン算出部27へ出力される。   The average amplitude value of the envelope (first envelope) calculated in the average value hold unit 25 and the maximum amplitude value of the envelope (first envelope) calculated in the second maximum value hold unit 26 are detected. It is output to the gain calculation unit 27.

検出ゲイン算出部27は、平均値ホールド部25で算出された包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26で算出された包絡線(第1包絡線)の振幅最大値とを用いて、第1変動検出部12および第2変動検出部13における包絡線検出(第2包絡線の検出)の下限値[dB]を動的に算出する(決定する)役割を有している。   The detection gain calculation unit 27 includes the average amplitude value of the envelope (first envelope) calculated by the average value hold unit 25 and the envelope (first envelope) calculated by the second maximum value hold unit 26. Role of dynamically calculating (determining) the lower limit [dB] of envelope detection (detection of the second envelope) in the first variation detector 12 and the second variation detector 13 using the maximum amplitude value. have.

平均値ホールド部25で算出された包絡線(第1包絡線)の振幅平均値をYmeanとし、第2最大値ホールド部26で算出された包絡線(第1包絡線)の振幅最大値をYmaxとすると、包絡線検出(第2包絡線の検出)の下限値[dB]を示すf(Ymean,Ymax)は、

Figure 0005841405
・・・・式1
で求められる。 The average amplitude value of the envelope (first envelope) calculated by the average value hold unit 25 is Y mean, and the maximum amplitude value of the envelope (first envelope) calculated by the second maximum value hold unit 26 is When Y max, f (Y mean, Y max) which indicates the lower limit value [dB] of the envelope detection (detection of the second envelope) is
Figure 0005841405
.... Formula 1
Is required.

mean/Ymaxが0.45(第1閾値)より小さい値である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に決定され、Ymean/Ymaxが0.60(第2閾値)より大きい値である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が、−30+10logYmax [dB]に決定され、Ymean/Ymaxが0.45以上で0.60以下である場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が、−200・Ymean/Ymax+90+10logYmax [dB]に決定される。なお、10logYmax には、包絡線(第1包絡線)の振幅の最大値をデシベル値に変換するための変換式(変換関係)を示している。 When Y mean / Y max is a value smaller than 0.45 (first threshold value), the lower limit f (Y mean , Y max ) of envelope detection (detection of the second envelope) is 0 [dB]. When Y mean / Y max is a value greater than 0.60 (second threshold), the lower limit f (Y mean , Y max ) of envelope detection (second envelope detection) is -30 + 10 log Y max 2 [dB], and when Y mean / Y max is 0.45 or more and 0.60 or less, the lower limit f (Y of the envelope detection (detection of the second envelope)) mean , Y max ) is determined to be −200 · Y mean / Y max + 90 + 10 log Y max 2 [dB]. Note that 10 logY max 2 indicates a conversion formula (conversion relation) for converting the maximum value of the amplitude of the envelope (first envelope) into a decibel value.

図3は、上述した式1に基づいて、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)と、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)との関係を示したグラフである。図3に示すように比の値(Ymean/Ymax)が0.45より小さい場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に維持(決定・設定)されるが、比の値(Ymean/Ymax)が0.45になると、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が10logYmax の値(−200・Ymean/Ymax+90+10logYmax においてYmean/Ymaxに0.45を代入した値)[dB]となる。その後、比の値(Ymean/Ymax)が0.45から0.60まで増加するのに反比例して、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が減少し、比の値(Ymean/Ymax)が0.60以上になった場合には、包絡線検出の下限値f(Ymean,Ymax)が−30+10logYmax の値(−200・Ymean/Ymax+90+10logYmax においてYmean/Ymaxに0.60を代入した値)[dB]に維持(決定・設定)される。 FIG. 3 shows the lower limit value f (Y mean , Y max ) of envelope detection (detection of the second envelope) and the amplitude relative to the maximum amplitude value of the envelope (first envelope) based on the above-described equation 1. It is the graph which showed the relationship with ratio ( Ymean / Ymax ) of an average value. As shown in FIG. 3, when the ratio value (Y mean / Y max ) is smaller than 0.45, the lower limit f (Y mean , Y max ) of envelope detection (second envelope detection) is 0. [DB] is maintained (determined / set), but when the ratio value (Y mean / Y max ) becomes 0.45, the lower limit f (Y mean , envelope detection (detection of the second envelope)) Y max) is Y value obtained by substituting a 0.45 to mean / Y max) [dB] in 10logY max 2 values (-200 · Y mean / Y max + 90 + 10logY max 2. Thereafter, the lower limit f (Y mean , Y max ) of envelope detection (detection of the second envelope) is inversely proportional to the ratio value (Y mean / Y max ) increasing from 0.45 to 0.60. ) Decreases and the ratio value (Y mean / Y max ) becomes 0.60 or more, the lower limit f (Y mean , Y max ) of envelope detection is a value of −30 + 10 log Y max 2 (− 200 · Y mean / Y max + 90 + 10 log Y max 2 is a value obtained by substituting 0.60 into Y mean / Y max ) [dB] (determined / set).

このように、比の値(Ymean/Ymax)の0.45と0.60とが閾値(第1閾値:0.45、第2閾値:0.60)となり、比の値(Ymean/Ymax)が0.00〜0.45の間では、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が0[dB]に維持(決定・設定)され、比の値(Ymean/Ymax)が0.45〜0.60の間では、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が比の値(Ymean/Ymax)に反比例して低減され、比の値(Ymean/Ymax)が0.60以上になる場合には、包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)が−30+10logYmax [dB]に維持される。 Thus, the ratio values (Y mean / Y max ) of 0.45 and 0.60 become threshold values (first threshold value: 0.45, second threshold value: 0.60), and the ratio value (Y mean / Y max ) is between 0.00 and 0.45, the lower limit f (Y mean , Y max ) of envelope detection (detection of the second envelope) is maintained at 0 [dB] (decision / setting) When the ratio value (Y mean / Y max ) is between 0.45 and 0.60, the lower limit f (Y mean , Y max ) of envelope detection (detection of the second envelope) is the ratio value. When it is reduced in inverse proportion to (Y mean / Y max ) and the ratio value (Y mean / Y max ) is 0.60 or more, the lower limit f of envelope detection (detection of the second envelope) (Y mean, Y max) is maintained at -30 + 10logY max 2 [dB] .

図4(a)は、リミッタ処理によりダイナミックレンジの圧縮が行われる前のオーディオ信号の振幅変化を示した図であり、(b)は、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号の振幅変化を示した図である。   FIG. 4A is a diagram showing an amplitude change of an audio signal before the dynamic range is compressed by the limiter process, and FIG. 4B is an audio after the dynamic range is compressed by the limiter process. It is the figure which showed the amplitude change of the signal.

図4(a)に示すように、ダイナミックレンジの圧縮が行われる前のオーディオ信号では、振幅の振れ幅が大きいため、振幅最大値と振幅平均値との差が大きくなる。しかしながら、図4(b)に示すように、リミッタ処理によりダイナミックレンジの圧縮が行われた後のオーディオ信号では、振幅最大値がリミッタ処理により制限されてクリップが発生するため、振幅最大値が低く抑えられる。   As shown in FIG. 4 (a), in the audio signal before the dynamic range compression is performed, the amplitude fluctuation is large, so that the difference between the maximum amplitude value and the average amplitude value is large. However, as shown in FIG. 4B, in the audio signal after the dynamic range compression is performed by the limiter process, the maximum amplitude value is limited by the limiter process and a clip is generated. Therefore, the maximum amplitude value is low. It can be suppressed.

また、振幅最大値が抑えられることから、振幅平均値が相対的に高い値を示すことなり、振幅最大値と振幅平均値との差が小さくなる。このため、ダイナミックレンジの圧縮が行われる前のオーディオ信号とダイナミックレンジの圧縮が行われた後のオーディオ信号とで、振幅最大値に対する振幅平均値の比の値(第1包絡線の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に対応する)とを比べると、ダイナミックレンジの圧縮が行われる前の方が比の値が小さく、ダイナミックレンジの圧縮が行われた後の方が比の値が大きくなる傾向が生ずる。 Further, since the maximum amplitude value is suppressed, the average amplitude value shows a relatively high value, and the difference between the maximum amplitude value and the average amplitude value becomes small. Therefore, the ratio of the average amplitude value to the maximum amplitude value (the maximum amplitude value of the first envelope) between the audio signal before the dynamic range compression and the audio signal after the dynamic range compression are performed. Compared to the ratio of the amplitude average value to Y (corresponding to the value of Y mean / Y max ), the ratio value is smaller before the dynamic range compression is performed, and after the dynamic range compression is performed. There is a tendency that the ratio value becomes larger.

従って、振幅最大値に対する振幅平均値の比の値が大きい場合には、ダイナミックレンジの圧縮が行われているおそれの高いオーディオ信号であると判断することができる。比の値が小さい場合には、ダイナミックレンジの圧縮が行われているおそれの低いオーディオ信号であると判断することができる。   Accordingly, when the ratio of the average amplitude value to the maximum amplitude value is large, it can be determined that the audio signal is highly likely to be compressed in the dynamic range. When the value of the ratio is small, it can be determined that the audio signal is less likely to be compressed in the dynamic range.

図5は、ダイナミックレンジが大きく圧縮されて多数のクリップが発生するオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。図6は、ダイナミックレンジが図5に比べて小さく圧縮されているがクリップが散見されるオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。図7は、ダイナミックレンジの圧縮が行われていないオーディオ信号が楽曲分析部17に入力された場合におけるグラフである。   FIG. 5 is a graph when an audio signal in which a large dynamic range is compressed and a large number of clips are generated is input to the music analysis unit 17. FIG. 6 is a graph in the case where an audio signal in which a dynamic range is compressed smaller than that in FIG. 5 but a clip is scattered is input to the music analysis unit 17. FIG. 7 is a graph when an audio signal not subjected to dynamic range compression is input to the music analysis unit 17.

具体的に、図5〜図7において(a)は、オーディオ信号の3秒間の振幅変化を示したグラフである。(b)は、第1スムージング部23によって算出された包絡線と、平均値ホールド部25において算出される包絡線(第1包絡線)の振幅平均値と、第2最大値ホールド部26において算出される包絡線(第1包絡線)の振幅最大値の変化を示したグラフである。(c)は、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値を示したグラフである。 Specifically, in FIGS. 5 to 7, (a) is a graph showing an amplitude change of an audio signal for 3 seconds. (B) is calculated by the first smoothing unit 23, the average amplitude value of the envelope (first envelope) calculated by the average value holding unit 25, and the second maximum value holding unit 26. It is the graph which showed the change of the amplitude maximum value of the envelope (1st envelope) to be performed. (C) is the graph which showed the value of the ratio ( Ymean / Ymax ) of the amplitude average value with respect to the amplitude maximum value of an envelope (1st envelope).

図5(a)に示されるオーディオ信号はダイナミックレンジの圧縮が大きいため、ほぼ連続的に振幅が±1に制限(維持)された状態となっており、連続的にクリップが発生している。このため、図5(b)に示すように、包絡線(第1包絡線)の振幅値と振幅最大値とがほぼ1の値(振幅)を維持し、また、振幅平均値も振幅最大値に近い値を示している。従って、図5(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、0.9程度の高い値を示している。 Since the audio signal shown in FIG. 5A has a large dynamic range compression, the amplitude is almost continuously limited (maintained) to ± 1, and clips are continuously generated. For this reason, as shown in FIG. 5B, the amplitude value and the maximum amplitude value of the envelope (first envelope) maintain a value of about 1 (amplitude), and the average amplitude value is also the maximum amplitude value. It shows a value close to. Accordingly, as shown in FIG. 5C, the ratio (Y mean / Y max ) of the amplitude average value to the amplitude maximum value of the envelope (first envelope) is high (about 0.9). The value is shown.

一方で、図6(a)に示されるオーディオ信号はダイナミックレンジの圧縮が小さいため、一部分の振幅だけが±1に制限(維持)された状態となっており、クリップが散見される状態である。このため、図6(b)に示すように、包絡線(第1包絡線)の振幅値が、クリップの発生していない箇所において変動した状態となっている。従って、図6(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、図5(c)に比べて低減されて、0.7程度の値を示している。 On the other hand, since the audio signal shown in FIG. 6A has a small dynamic range compression, only a part of the amplitude is limited (maintained) to ± 1, and a clip is scattered. . For this reason, as shown in FIG.6 (b), the amplitude value of an envelope (1st envelope) is in the state fluctuate | varied in the location where the clip does not generate | occur | produce. Accordingly, as shown in FIG. 6C, the ratio (Y mean / Y max ) of the average amplitude value to the maximum amplitude value of the envelope (first envelope) (Y mean / Y max ) is shown in FIG. Compared to this, the value is about 0.7.

また、図7(a)に示されるオーディオ信号はダイナミックレンジの圧縮が行われていないため、振幅の最大値が±1の範囲に制限されており、クリップが全く発生していない。このため、図7(b)に示すように、包絡線(第1包絡線)の振幅値が図5(b)、図6(b)に比べて大きく変動した状態を保っており、振幅平均値も、図5(b)、図6(b)に比べて低い値となっている。従って、図7(c)に示すように、包絡線(第1包絡線)の振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値(比率)は、図5(c)、図6(c)に比べて低減されて、0.3程度の値を示している。 Further, since the audio signal shown in FIG. 7A is not compressed in the dynamic range, the maximum value of the amplitude is limited to a range of ± 1, and no clip is generated. For this reason, as shown in FIG. 7 (b), the amplitude value of the envelope (first envelope) is largely changed compared to FIGS. 5 (b) and 6 (b), and the amplitude average is maintained. The value is also lower than those in FIGS. 5B and 6B. Therefore, as shown in FIG. 7C, the ratio (Y mean / Y max ) of the average amplitude value to the maximum amplitude value of the envelope (first envelope) (Y mean / Y max ) is as shown in FIG. Compared to FIG. 6C, the value is reduced to about 0.3.

図5〜図7に示したように、ダイナミックレンジの圧縮が大きい程、振幅最大値に対する振幅平均値の比の値が大きな値を示し、ダイナミックレンジの圧縮が小さくなるに従って、振幅最大値に対する振幅平均値の比の値が低減し、ダイナミックレンジの圧縮が行われていない場合には、振幅最大値に対する振幅平均値の比の値が低くなる。   As shown in FIGS. 5 to 7, the larger the compression of the dynamic range, the larger the ratio of the average amplitude value to the maximum amplitude value, and the smaller the dynamic range compression, the smaller the amplitude relative to the maximum amplitude value. When the ratio of the average values is reduced and the dynamic range is not compressed, the ratio of the average amplitude value to the maximum amplitude value is low.

このため、楽曲分析部17では、比(Ymean/Ymax)の値に応じて、包絡線検出(第2包絡線の検出)の下限値を一定の範囲内で(上述した式1においては、0〜−30+10logYmax [dB]の範囲内で)で低減変動させる。例えば、比(Ymean/Ymax)の値が高くて、ダイナミックレンジの圧縮が行われているおそれが高い場合には、ダイナミックレンジの拡張を行う包絡線(第2包絡線)の下限値を低い値に設定(決定)し、クリップが生じ得るオーディオ信号のダイナミックレンジが効果的に拡張されるようにする。 For this reason, the music analysis unit 17 sets the lower limit of envelope detection (detection of the second envelope) within a certain range according to the value of the ratio (Y mean / Y max ) (in the above-described equation 1, 0 to −30 + 10 log Y max 2 [dB]). For example, when the value of the ratio (Y mean / Y max ) is high and there is a high possibility that compression of the dynamic range is being performed, the lower limit value of the envelope (second envelope) for expanding the dynamic range is set. It is set (determined) to a low value so that the dynamic range of the audio signal where clipping can occur is effectively expanded.

一方で、比(Ymean/Ymax)の値が低くて、ダイナミックレンジの圧縮が行われていないおそれが高い場合には、ダイナミックレンジの拡張を行う包絡線(第2包絡線)の下限値を高い値に設定(決定)することによって、クリップが生じていないオーディオ信号のダイナミックレンジが過剰に拡張されてしまうことを防止する。 On the other hand, when the value of the ratio (Y mean / Y max ) is low and there is a high possibility that the dynamic range is not compressed, the lower limit value of the envelope (second envelope) for expanding the dynamic range By setting (determining) to a high value, it is possible to prevent the dynamic range of an audio signal in which clipping has not occurred from being excessively expanded.

その後、楽曲分析部17の検出ゲイン算出部27において算出された包絡線検出(第2包絡線の検出)の下限値f(Ymean,Ymax)の値は、第1変動検出部12および第2変動検出部13のそれぞれの第2最大値検出部31(図8参照)へと、リアルタイム(連続的)に出力される。 Thereafter, the value of the lower limit f (Y mean , Y max ) of the envelope detection (detection of the second envelope) calculated by the detection gain calculation unit 27 of the music analysis unit 17 is the first variation detection unit 12 and the first variation detection unit 12. The output is output in real time (continuously) to each second maximum value detection unit 31 (see FIG. 8) of the two fluctuation detection unit 13.

[LPF部およびHPF部]
LPF部10は、入力されたオーディオ信号(ダイナミックレンジの圧縮が行われたオーディオ信号)に対して、ローパスフィルタリング処理を行うことにより、入力されたオーディオ信号の低域成分を抽出する役割を有している。一方で、HPF部11は、入力されたオーディオ信号に対して、ハイパスフィルタリング処理を行うことにより、入力されたオーディオ信号の高域成分を抽出する役割を有している。
[LPF part and HPF part]
The LPF unit 10 has a role of extracting a low frequency component of the input audio signal by performing a low-pass filtering process on the input audio signal (an audio signal subjected to dynamic range compression). ing. On the other hand, the HPF unit 11 has a role of extracting a high frequency component of the input audio signal by performing a high-pass filtering process on the input audio signal.

[第1変動検出部および第2変動検出部]
第1変動検出部12は、LPF部10より入力された低域のオーディオ信号の包絡線を求め、求められた包絡線(第2包絡線)が小さい信号から大きい信号に変化する量を検出信号として検出して、第1重み付け部14へと出力する役割を有している。また、第2変動検出部13も同様に、HPF部11より入力された高域のオーディオ信号の包絡線(第2包絡線)を求め、求められた包絡線(第2包絡線)が小さい信号から大きい信号に変化する量を検出信号として検出して、第2重み付け部15へと出力する役割を有している。
[First variation detection unit and second variation detection unit]
The first fluctuation detection unit 12 obtains an envelope of the low-frequency audio signal input from the LPF unit 10, and detects the amount by which the obtained envelope (second envelope) changes from a small signal to a large signal. And output to the first weighting unit 14. Similarly, the second fluctuation detection unit 13 obtains an envelope (second envelope) of the high frequency audio signal input from the HPF unit 11, and a signal with a small obtained envelope (second envelope). The amount of change from 1 to a large signal is detected as a detection signal and output to the second weighting unit 15.

図8は、第1変動検出部12の概略構成を示したブロック図である。第1変動検出部12は、図8に示すように、第2最大値検出部(第2包絡線検出手段)31と、第3最大値ホールド部(第2包絡線検出手段)32と、第2スムージング部(第2包絡線検出手段)33と、デシベル変換部(デシベル変換手段)34と、微分部(微分手段)35と、反転部(反転手段)36と、レベル制限部37と、リニア変換部(リニア変換手段)38とを有している。   FIG. 8 is a block diagram showing a schematic configuration of the first fluctuation detecting unit 12. As shown in FIG. 8, the first fluctuation detecting unit 12 includes a second maximum value detecting unit (second envelope detecting unit) 31, a third maximum value holding unit (second envelope detecting unit) 32, 2 smoothing unit (second envelope detection unit) 33, decibel conversion unit (decibel conversion unit) 34, differentiation unit (differentiation unit) 35, inversion unit (inversion unit) 36, level limiting unit 37, linear And a conversion unit (linear conversion means) 38.

第2最大値検出部31は、LPF部10によって低域成分が抽出されたオーディオ信号の振幅を絶対値化した後に、所定の時間(mサンプル)内の最大値を検出して出力する役割を有している。第2最大値検出部31は、第1最大値検出部21と同様の処理を行う。従って、第2最大値検出部31においても、第1最大値検出部21と同様に、所定の時間(mサンプル)ごとに最大値が更新されて、第3最大値ホールド部32に出力される。ただし、第2最大値検出部31に対する入力信号として、所定の周波数でサンプリングされたデータが用いられている。   The second maximum value detection unit 31 serves to detect and output the maximum value within a predetermined time (m samples) after the amplitude of the audio signal from which the low frequency component has been extracted by the LPF unit 10 is converted to an absolute value. Have. The second maximum value detection unit 31 performs the same process as the first maximum value detection unit 21. Accordingly, in the second maximum value detection unit 31, as in the first maximum value detection unit 21, the maximum value is updated every predetermined time (m samples) and output to the third maximum value hold unit 32. . However, data sampled at a predetermined frequency is used as an input signal to the second maximum value detector 31.

なお、第2最大値検出部31または第3最大値ホールド部32においては、最大値検出における検出範囲が予め設定されており、設定された検出範囲以下(所定値以下)の信号レベルの検出は行なわれない。ここで、第2最大値検出部31には、楽曲分析部17の検出ゲイン算出部27より包絡線検出(第2包絡線の検出)の下限値(検出ゲイン)がリアルタイムに入力される。第2最大値検出部31は、検出ゲイン算出部27より取得した包絡線検出(第2包絡線の検出)の下限値に基づいて、設定された検出範囲の下限値をリアルタイムに(動的に)変動させて最大値の検出を行う。   In the second maximum value detection unit 31 or the third maximum value hold unit 32, a detection range in maximum value detection is set in advance, and detection of a signal level below the set detection range (below a predetermined value) is performed. Not done. Here, the lower limit value (detection gain) of envelope detection (detection of the second envelope) is input to the second maximum value detection unit 31 from the detection gain calculation unit 27 of the music analysis unit 17 in real time. Based on the lower limit value of the envelope detection (detection of the second envelope) acquired from the detection gain calculation unit 27, the second maximum value detection unit 31 sets the lower limit value of the set detection range in real time (dynamically). ) Change the maximum value.

第3最大値ホールド部32は、第2最大値検出部31において所定の時間(mサンプル)ごとに更新される最大値を受信した場合において、受信した最新の最大値だけでなく、その最大値を含む過去n回分の最大値(n個の最大値)の中で、最も大きな値を示す最大値の値を求める。そして、第3最大値ホールド部32は、求められた最大値を所定の時間(mサンプル)ごとに、第2スムージング部33へ出力する。   When the second maximum value detecting unit 31 receives the maximum value updated every predetermined time (m samples), the third maximum value holding unit 32 not only receives the latest maximum value but also the maximum value. Among the maximum values (n maximum values) for the past n times including the maximum value indicating the largest value. Then, the third maximum value holding unit 32 outputs the obtained maximum value to the second smoothing unit 33 every predetermined time (m samples).

ここで、第3最大値ホールド部32も第1最大値ホールド部22と同様の処理を行う。このため、第3最大値ホールド部32も、第1最大値ホールド部22と同様に、第2最大値検出部31から所定の時間(mサンプル)ごとに所定の時間(mサンプル)の内で最も大きな値の最大値を取得し、さらに、取得した最大値を含む過去n回分の最大値の中で最も値の大きな最大値(つまり、n×mサンプルの間における最も値の高い最大値)を検出して、所定の時間(mサンプル)ごとに、第2スムージング部33へ出力する。なお、第3最大値ホールド部32から第2スムージング部33へと出力されるn×mサンプルの中で最も高い値の最大値は、所定の時間(mサンプル)だけ値がホールド(保持)された状態で出力される。   Here, the third maximum value hold unit 32 performs the same processing as the first maximum value hold unit 22. For this reason, the third maximum value hold unit 32 also, like the first maximum value hold unit 22, within a predetermined time (m samples) every predetermined time (m samples) from the second maximum value detection unit 31. The maximum value of the largest value is acquired, and further, the maximum value having the largest value among the past n maximum values including the acquired maximum value (that is, the highest value among the n × m samples). Is output to the second smoothing unit 33 every predetermined time (m samples). Note that the maximum value of the highest value among n × m samples output from the third maximum value hold unit 32 to the second smoothing unit 33 is held (held) for a predetermined time (m samples). It is output in the state.

第2スムージング部33は、第3最大値ホールド部32より取得した最大値の信号を積分処理することにより、最大値の変動を滑らかにする(スムージング処理する)役割を有している。第2スムージング部33も、第1スムージング部23と同様の処理を行う。第2スムージング部33が、第3最大値ホールド部32より取得した信号を滑らかにすることにより、低域のオーディオ信号に対する包絡線(第2包絡線)の信号検出を行うことが可能となる。   The second smoothing unit 33 has a role of smoothing the fluctuation of the maximum value (smoothing process) by integrating the signal of the maximum value acquired from the third maximum value holding unit 32. The second smoothing unit 33 also performs the same process as the first smoothing unit 23. Since the second smoothing unit 33 smoothes the signal acquired from the third maximum value holding unit 32, it is possible to detect the envelope (second envelope) signal for the low-frequency audio signal.

デシベル変換部34は、第2スムージング部33においてスムージング処理することにより求められた包絡線信号(第2包絡線:この第2包絡線信号は、リニアな信号特性(振幅でゲインが示される特性)を有している)を、デシベルの包絡線信号(ゲインがデシベル単位で示される信号特性の包絡線信号)へと変換する役割を有している。デシベル変換部34によりデシベルの包絡線信号へと変換された信号は、微分部35へ出力される。   The decibel conversion unit 34 has an envelope signal (second envelope: the second envelope signal obtained by performing the smoothing process in the second smoothing unit 33). Has a role of converting into a decibel envelope signal (envelope signal having a signal characteristic whose gain is expressed in decibels). The signal converted into the decibel envelope signal by the decibel converter 34 is output to the differentiator 35.

微分部35は、デシベル変換部34より取得したデシベルの包絡線信号(第2包絡線信号)を微分することにより、変化量検出を行う役割を有している。微分部35によって、包絡線信号(第2包絡線信号)に対して微分処理がなされた信号は、ゲイン(デシベル値)の変化量が大きい場合に高い値を示すことになり、変化量が小さい場合には低い値を示すことになる。微分部35によって微分処理された信号は反転部36へと出力される。   The differentiating unit 35 has a role of performing change amount detection by differentiating the decibel envelope signal (second envelope signal) acquired from the decibel transform unit 34. A signal obtained by differentiating the envelope signal (second envelope signal) by the differentiating unit 35 shows a high value when the amount of change in gain (decibel value) is large, and the amount of change is small. In some cases, it will show a low value. The signal subjected to differentiation processing by the differentiating unit 35 is output to the inverting unit 36.

なお、微分部35における微分処理は、LPF部10で低域成分の抽出が行われたオーディオ信号に対して、ハイパスフィルタを用いたフィルタリング処理を行うことによって実現される。また、このハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することによりフィルタリング処理により求められる変化量の変化時間を調整することが可能となっている。   The differentiation process in the differentiation unit 35 is realized by performing a filtering process using a high-pass filter on the audio signal from which the low-frequency component has been extracted by the LPF unit 10. Further, it is possible to adjust the change time of the change amount obtained by the filtering process by changing the set value of the normalized cutoff frequency in the high-pass filter.

例えば、ダイナミックレンジが圧縮されて振幅が平坦化される状態は、コンプレッサやリミッタにおける設定により異なり、また、CDとDVDとでは、既に説明したように、ダイナミックレンジの圧縮状態が異なったものとなる。従って、オーディオ信号におけるダイナミックレンジの圧縮状態に応じて正規化カットオフ周波数を調整することにより、ダイナミックレンジの圧縮状態に適したダイナミックレンジの拡張時間の調整を行うことが可能となる。   For example, the state in which the dynamic range is compressed and the amplitude is flattened differs depending on the settings in the compressor and limiter, and as described above, the compression state of the dynamic range differs between CD and DVD. . Therefore, by adjusting the normalized cutoff frequency according to the compression state of the dynamic range in the audio signal, it is possible to adjust the expansion time of the dynamic range suitable for the compression state of the dynamic range.

反転部36は、微分部35より取得された信号(変化量信号)に−1を乗算することにより信号の反転を行う役割を有している。さらに、レベル制限部37は、反転部36において反転された信号のマイナス側の変化量を制限し、プラス側の変化量のみを検出して、リニア変換部38へ出力する。リニア変換部38は、レベル制限部37においてプラス側の変化量のみ検出された信号を、リニアな信号に変換して検出信号として第1重み付け部14へと出力する。   The inverting unit 36 has a role of inverting the signal by multiplying the signal (change amount signal) acquired from the differentiating unit 35 by -1. Further, the level limiting unit 37 limits the minus side change amount of the signal inverted by the inversion unit 36, detects only the plus side change amount, and outputs the detected change amount to the linear conversion unit 38. The linear conversion unit 38 converts the signal detected only by the plus side change amount in the level limiting unit 37 into a linear signal and outputs the signal to the first weighting unit 14 as a detection signal.

このように、第1変動検出部12では、LPF部10によって抽出された低域のオーディオ信号の包絡線(第2包絡線)に基づいて、小さい信号から大きい信号に変化する量を検出信号(低域用検出信号)として検出することができ、検出された検出信号は、大きく変化するほど検出量が大きくなる。   As described above, the first fluctuation detecting unit 12 detects the amount of change from a small signal to a large signal based on the envelope (second envelope) of the low frequency audio signal extracted by the LPF unit 10. Low-frequency detection signal), and the detected amount of detection signal increases as the detected signal changes greatly.

また、第2変動検出部13も、図8に示す第1変動検出部12と同様の機能部を備えている。第2変動検出部13においては、HPF部11によって抽出された高域のオーディオ信号の包絡線(第2包絡線)に基づいて、小さい信号から大きい信号に変化する量を検出信号(高域用検出信号)として検出することができ、検出された検出信号は、大きく変化するほど検出量が大きくなる。第2変動検出部13における機能部の構成およびその役割は、図2に示す第1変動検出部12と同じものであるため、説明を省略する。   Moreover, the 2nd fluctuation | variation detection part 13 is also provided with the function part similar to the 1st fluctuation | variation detection part 12 shown in FIG. The second fluctuation detection unit 13 detects the amount of change from a small signal to a large signal based on the envelope (second envelope) of the high frequency audio signal extracted by the HPF unit 11 as a detection signal (for high frequency). Detection signal), and the detected amount of detection signal increases as the detected signal changes greatly. Since the configuration and the role of the functional unit in the second variation detection unit 13 are the same as those of the first variation detection unit 12 shown in FIG.

なお、第2変動検出部13の第2最大値検出部31に対しても、楽曲分析部17の検出ゲイン算出部27より包絡線検出の下限値(検出ゲイン)がリアルタイムに入力される。このため、第2変動検出部13の第2最大値検出部31も、検出ゲイン算出部27より取得した包絡線検出の下限値(検出ゲイン)に基づいて、設定された検出範囲の下限値をリアルタイムに(動的に)変動させて最大値の検出を行う。   Note that the lower limit value (detection gain) of envelope detection is also input in real time from the detection gain calculation unit 27 of the music analysis unit 17 to the second maximum value detection unit 31 of the second variation detection unit 13. For this reason, the second maximum value detection unit 31 of the second fluctuation detection unit 13 also sets the lower limit value of the set detection range based on the lower limit value (detection gain) of the envelope detection acquired from the detection gain calculation unit 27. The maximum value is detected in real time (dynamically).

[第1重み付け部および第2重み付け部]
図9は、第1重み付け部14の概略構成を示したブロック図である。第1重み付け部14は、図9に示すように、乗算部(補完信号生成手段)41、減算部(補完信号生成手段)42およびゲイン部(ゲイン調節手段)43を有している。
[First weighting unit and second weighting unit]
FIG. 9 is a block diagram illustrating a schematic configuration of the first weighting unit 14. As shown in FIG. 9, the first weighting unit 14 includes a multiplication unit (complementary signal generation unit) 41, a subtraction unit (complementary signal generation unit) 42, and a gain unit (gain adjustment unit) 43.

乗算部41は、LPF部10より入力される低域のオーディオ信号と、第1変動検出部12より入力される低域用検出信号との乗算処理を行う役割を有している。乗算部41の乗算処理により、低域のオーディオ信号において、小さい信号から大きい信号に変化する箇所の信号レベルが検出信号の検出量に対応して増幅されることになる。   The multiplication unit 41 has a role of performing multiplication processing of the low frequency audio signal input from the LPF unit 10 and the low frequency detection signal input from the first fluctuation detection unit 12. By the multiplication process of the multiplication unit 41, the signal level of the portion where the small signal changes to the large signal in the low frequency audio signal is amplified corresponding to the detection amount of the detection signal.

減算部42は、LPF部10より入力される低域のオーディオ信号から、乗算部41によって検出量に対応する増幅処理が行われた低域のオーディオ信号を減算する役割を有している。このように、減算部42で減算処理を行うことにより、低域のオーディオ信号において、小さい信号から大きい信号に変化する箇所における増幅前のオーディオ信号と増幅後のオーディオ信号との信号レベル差を重み付け量として求めることが可能となる。このようにして求められた重み付け量に関する信号(低域用重み付け信号:ゲイン調節手段によりゲイン調節される前の低域補完信号)は、減算部42からゲイン部43へ出力される。   The subtracting unit 42 has a role of subtracting a low-frequency audio signal that has been subjected to amplification processing corresponding to the detection amount by the multiplying unit 41 from the low-frequency audio signal input from the LPF unit 10. In this way, by performing the subtraction process in the subtracting unit 42, the signal level difference between the audio signal before amplification and the audio signal after amplification at the portion where the low signal changes from the small signal to the large signal is weighted. It can be obtained as a quantity. A signal relating to the weighting amount thus obtained (low-frequency weighting signal: low-frequency complementary signal before gain adjustment by the gain adjusting means) is output from the subtracting unit 42 to the gain unit 43.

ゲイン部43は、低域用重み付け信号に対してゲインの増幅および減衰を行うことにより重み付け量の調節を行い、低域用の補完信号(低域補完信号)を生成する役割を有している。生成された低域用の補完信号は、合成部16へ出力される。   The gain unit 43 has a role of adjusting the weighting amount by amplifying and attenuating the gain for the low-frequency weighting signal and generating a low-frequency complementary signal (low-frequency complementary signal). . The generated low band complementary signal is output to the synthesis unit 16.

低域用重み付け信号は、包絡線信号における最大値変化に基づいて生成されるため、ダイナミックレンジが圧縮されて平坦化された箇所におけるゲイン(振幅)を拡張することが可能である。しかしながら、拡張すべきダイナミックレンジのゲインは、ダイナミックレンジが圧縮されて平坦化されたオーディオ信号ごとに異なり、そのまま低域用重み付け信号をオーディオ信号に加算しても、十分なダイナミックレンジの補完(拡張)を行えなかったり、ダイナミックレンジの補完(拡張)量が多すぎたりして、かえって音質の低下を招いてしまうおそれもある。   Since the low-frequency weighting signal is generated based on the maximum value change in the envelope signal, it is possible to expand the gain (amplitude) at a location where the dynamic range is compressed and flattened. However, the gain of the dynamic range to be expanded differs for each audio signal that has been flattened by compressing the dynamic range, and even if the weighting signal for low frequency is added to the audio signal as it is, sufficient complementation of the dynamic range (expansion) ) Cannot be performed, or the amount of complementation (expansion) of the dynamic range is too large, leading to a decrease in sound quality.

このため、オーディオ信号の圧縮状態などに応じて、ゲイン部43で予め低域用重み付け信号にゲインの増幅および減衰を行って、重み付け量の調節をした補完信号を生成することにより、次述する合成部16においてオーディオ信号に補完信号が加算された信号のダイナミックレンジを適切に拡張し、調整することが可能となる。   Therefore, in accordance with the compression state of the audio signal, the gain unit 43 performs gain amplification and attenuation on the low-frequency weighting signal in advance to generate a complementary signal in which the weighting amount is adjusted. It is possible to appropriately expand and adjust the dynamic range of the signal obtained by adding the complementary signal to the audio signal in the synthesis unit 16.

このように、第1重み付け部14では、減算部42で、LPF部10より入力された低域のオーディオ信号から、検出量に対応する増幅処理が行われた低域のオーディオ信号を減算することにより、低域のオーディオ信号における重み付け量を求めるとともに、ゲイン部43で、求められた重み付け量の調整を行うことにより低域補完信号を生成する。   As described above, in the first weighting unit 14, the subtracting unit 42 subtracts the low frequency audio signal subjected to the amplification process corresponding to the detection amount from the low frequency audio signal input from the LPF unit 10. Thus, the weighting amount in the low frequency audio signal is obtained, and the gain unit 43 adjusts the obtained weighting amount to generate the low frequency complementary signal.

また、第2重み付け部15も、図9に示す第1重み付け部14と同様の機能部を備えている。第2重み付け部15では、減算部で、HPF部11より入力された高域のオーディオ信号から、検出量に対応する増幅処理が行われた高域のオーディオ信号を減算することにより、高域のオーディオ信号における重み付け量を求めるとともに、求められた重み付け量の調整を行うことにより高域補完信号を生成する。第2重み付け部15における機能部の構成およびその役割は、図9に示す第1重み付け部14と同じものであるため、説明を省略する。   The second weighting unit 15 also includes a functional unit similar to the first weighting unit 14 shown in FIG. In the second weighting unit 15, the subtracting unit subtracts the high frequency audio signal subjected to the amplification process corresponding to the detection amount from the high frequency audio signal input from the HPF unit 11, thereby obtaining the high frequency audio signal. A high-frequency complementary signal is generated by obtaining a weighting amount in the audio signal and adjusting the obtained weighting amount. The configuration and the role of the functional unit in the second weighting unit 15 are the same as those of the first weighting unit 14 shown in FIG.

[合成部]
合成部16は、ダイナミックレンジ拡張装置1に入力されたオーディオ信号(ダイナミックレンジの圧縮により平坦化された状態となったオーディオ信号)に対して、第1重み付け部14において求められた低域補完信号と、第2重み付け部15において求められた高域補完信号とを加算する処理を行う役割を有している。このように加算処理を行うことによって、ダイナミックレンジの圧縮により平坦化された音源のオーディオ信号に対して、信号の包絡線(第2包絡線)の変化量に応じてゲイン補完がなされた低域成分・高域成分のオーディオ信号が加えられるため、ダイナミックレンジを拡張することができ、聴感上でメリハリ感や臨場感、音質を向上させることができる。
[Combining section]
The synthesizing unit 16 performs the low-frequency complementary signal obtained by the first weighting unit 14 on the audio signal input to the dynamic range extending apparatus 1 (the audio signal that has been flattened by compression of the dynamic range). And a process of adding the high-frequency complementary signal obtained by the second weighting unit 15. By performing the addition process in this manner, the low frequency range in which gain compensation is performed on the audio signal of the sound source flattened by compression of the dynamic range in accordance with the amount of change in the envelope (second envelope) of the signal Since the audio signal of the component / high frequency component is added, the dynamic range can be expanded, and the sharpness, presence and sound quality can be improved in terms of hearing.

なお、本実施の形態に係るダイナミックレンジ拡張装置1では、中域成分に対するダイナミックレンジの拡張処理は行っていない。中域成分は、一般的に、聴覚の感度が高く、ボーカル等の音声成分も多く含まれるため、中域成分におけるダイナミックレンジの拡張を行うと、聴感上の変動感を聴取者に与えてしまうおそれがあるからである。ただし、本実施の形態に係るダイナミックレンジ拡張装置1は、低域成分と高域成分とに対してのみダイナミックレンジの拡張処理を行う場合を一例として示しただけであり、中域成分についてもダイナミックレンジの拡張処理を行う構成とすることも可能である。さらに、低域成分のみ、中域成分のみ、高域成分のみ、低域成分と中域成分のみ、高域成分と中域成分のみなど、様々な組み合わせによってダイナミックレンジの拡張処理を行うことも可能である。   Note that the dynamic range expansion apparatus 1 according to the present embodiment does not perform dynamic range expansion processing on the mid-range component. The mid-range component generally has high auditory sensitivity and includes many voice components such as vocals. Therefore, expanding the dynamic range of the mid-range component gives the listener a sense of variation in audibility. Because there is a fear. However, the dynamic range extending apparatus 1 according to the present embodiment only shows the case where the dynamic range is expanded only for the low frequency component and the high frequency component as an example. It is also possible to adopt a configuration for performing range expansion processing. In addition, it is possible to extend the dynamic range by various combinations such as only the low frequency component, only the mid frequency component, only the high frequency component, only the low frequency component and the mid frequency component, and only the high frequency component and the mid frequency component. It is.

[動作例説明]
次に、上述したダイナミックレンジ拡張装置1の動作例について説明する。図10は、ダイナミックレンジ拡張装置1における動作例を説明するために設定した各機能部の動作パラメータを示した表である。ダイナミックレンジ拡張装置1には、CDに記録されるオーディオ信号が入力されるものとする。
[Explanation of operation example]
Next, an operation example of the dynamic range expansion apparatus 1 described above will be described. FIG. 10 is a table showing operation parameters of each functional unit set for explaining an operation example in the dynamic range expansion apparatus 1. It is assumed that an audio signal recorded on a CD is input to the dynamic range expansion apparatus 1.

図10に示すように、LPF部10およびHPF部11には、2次のバタワースフィルタが用いられており、LPF部10のカットオフ周波数は200Hz、HPF部11のカットオフ周波数は4kHzに設定されている。また、第1変動検出部12、第2変動検出部13および楽曲分析部17に入力されるオーディオ信号は、CDに記録されるオーディオ信号であることから、サンプリング周波数が44.1kHzの音源によるものとなる。このようなオーディオ信号に対して、第1変動検出部12、第2変動検出部13および楽曲分析部17の最大値検出の間隔は、64サンプルに設定される。   As shown in FIG. 10, the LPF unit 10 and the HPF unit 11 use second-order Butterworth filters. The cutoff frequency of the LPF unit 10 is set to 200 Hz, and the cutoff frequency of the HPF unit 11 is set to 4 kHz. ing. In addition, since the audio signal input to the first variation detection unit 12, the second variation detection unit 13, and the music analysis unit 17 is an audio signal recorded on a CD, it is based on a sound source with a sampling frequency of 44.1 kHz. It becomes. For such an audio signal, the maximum value detection intervals of the first variation detection unit 12, the second variation detection unit 13, and the music analysis unit 17 are set to 64 samples.

さらに、第1変動検出部12および第2変動検出部13の第2最大値検出部31による最大値検出の検出範囲は、−30+10logYmax [dB]〜0[dB]の間で動的に変動される設定になっている。この検出範囲の下限値は、検出ゲイン算出部27によって設定された包絡線検出(第2包絡線検出)の下限値(検出ゲイン)により決定される。ただし、最大値検出における検出範囲は−30+10logYmax [dB]〜0[dB]の間であるため、−30+10logYmax [dB]以下となるオーディオ信号に関しては、−30+10logYmax [dB]として出力される。従って、−30+10logYmax [dB]以下のオーディオ信号については、低域補完信号および高域補完信号の生成は行われない。また、楽曲分析部17の第1最大値検出部21における最大値検出のサンプリング周波数、最大値検出の間隔は、第2最大値検出部31と同様である。 Further, the detection range of the maximum value detection by the second maximum value detection unit 31 of the first variation detection unit 12 and the second variation detection unit 13 is dynamically between −30 + 10 log Y max 2 [dB] to 0 [dB]. The setting is variable. The lower limit value of the detection range is determined by the lower limit value (detection gain) of envelope detection (second envelope detection) set by the detection gain calculation unit 27. However, since the detection range in the maximum value detection is between −30 + 10 log Y max 2 [dB] and 0 [dB], an audio signal that is −30 + 10 log Y max 2 [dB] or less is set to −30 + 10 log Y max 2 [dB]. Is output. Therefore, the low-frequency complementary signal and the high-frequency complementary signal are not generated for the audio signal of −30 + 10 log Y max 2 [dB] or less. Further, the sampling frequency of maximum value detection and the interval of maximum value detection in the first maximum value detection unit 21 of the music analysis unit 17 are the same as those of the second maximum value detection unit 31.

また、サンプリング周波数が44.1kHzのオーディオ信号において、最大値検出の間隔が64サンプルに設定されると、第1〜第3最大値ホールド部22、26、32によりホールド処理されるオーディオ信号のサンプリング周波数は、689Hz(44,110Hz÷64サンプル)となる。   Also, in an audio signal with a sampling frequency of 44.1 kHz, if the maximum value detection interval is set to 64 samples, sampling of the audio signal that is held by the first to third maximum value hold units 22, 26, and 32 is performed. The frequency is 689 Hz (44,110 Hz ÷ 64 samples).

さらに、楽曲分析部17の第1スムージング部23、および第1変動検出部12および第2変動検出部13の第2スムージング部33には、1次のバタワース・ローパスフィルタが用いられ、微分部35には、1次のバタワース・ハイパスフィルタが用いられている。なお、楽曲分析部17の第1スムージング部23、および、第1変動検出部12および第2変動検出部13における第2スムージング部33の正規化カットオフ周波数は、689Hzを1.0とした場合に0.1に該当する周波数(68.9Hz)が設定されている。   Further, a first Butterworth low-pass filter is used for the first smoothing unit 23 of the music analysis unit 17 and the second smoothing unit 33 of the first variation detection unit 12 and the second variation detection unit 13, and the differentiation unit 35. A first-order Butterworth high-pass filter is used. In addition, the normalization cutoff frequency of the 1st smoothing part 23 of the music analysis part 17 and the 2nd smoothing part 33 in the 1st fluctuation | variation detection part 12 and the 2nd fluctuation | variation detection part 13 assumes that 689Hz is set to 1.0. Is set to a frequency (68.9 Hz) corresponding to 0.1.

また、第1変動検出部12における微分部35の正規化カットオフ周波数は、689Hzを1.0とした場合に0.0171に該当する周波数が設定され、第2変動検出部13における微分部の正規化カットオフ周波数は、689Hzを1.0とした場合に0.0051に該当する周波数が設定されている。   Further, the normalized cutoff frequency of the differentiating unit 35 in the first fluctuation detecting unit 12 is set to a frequency corresponding to 0.0171 when 689 Hz is 1.0, and the normalization cutoff frequency of the differentiating unit in the second fluctuation detecting unit 13 is set. The normalized cut-off frequency is set to a frequency corresponding to 0.0051 when 689 Hz is 1.0.

微分部35におけるハイパスフィルタのカットオフ周波数を調整することにより、低域用検出信号および高域用検出信号における応答時間を制御することが可能となっている。例えば、カットオフ周波数を高くするほど検出信号の応答時間(検出信号における検出量の変動時間(反映時間))が長くなり、ダイナミックレンジの拡張における低域補完信号および高域補完信号の生成時間(補完信号により増大されるオーディオ信号の増大反映時間)を長くすることができる。   By adjusting the cut-off frequency of the high-pass filter in the differentiating unit 35, it is possible to control the response time in the low-frequency detection signal and the high-frequency detection signal. For example, the higher the cutoff frequency, the longer the response time of the detection signal (the detection amount fluctuation time (reflection time) in the detection signal), and the generation time of the low-frequency complementary signal and the high-frequency complementary signal in the expansion of the dynamic range ( The increase reflection time of the audio signal increased by the complementary signal can be lengthened.

また、第1重み付け部14のゲイン部43では、重み付け量の調整を行うために、入力される低域用重み付け信号に対して6dBのゲイン増幅量が設定されている。また、第2重み付け部15のゲイン部においては、入力される高域用重み付け信号に対して0dBのゲイン増幅量が設定されており、実質的に増減を行わない設定となっている。   Further, in the gain unit 43 of the first weighting unit 14, a gain amplification amount of 6 dB is set for the input low-frequency weighting signal in order to adjust the weighting amount. In the gain section of the second weighting section 15, a gain amplification amount of 0 dB is set for the input high-frequency weighting signal, and is set so as not to increase or decrease substantially.

図11〜図15は、図10に示すように各機能部のパラメータを設定した場合における動作例を示した図である。   FIG. 11 to FIG. 15 are diagrams showing an operation example when the parameters of each functional unit are set as shown in FIG.

図11(a)は、ダイナミックレンジ拡張装置1に、ダイナミックレンジが圧縮されて振幅が平坦化されたオーディオ信号が入力される場合の振幅変化状態を示した図である。一方で、図11(b)は、第1変動検出部12および第2変動検出部13の第2最大値検出部31において、検出の下限値を−30[dB]に固定した場合におけるダイナミックレンジ拡張装置1の出力信号の振幅変化状態を示している。図11(c)は、第2最大値検出部31における検出の下限値を−30+10logYmax [dB]として変動させた場合におけるダイナミックレンジ拡張装置1の出力信号の振幅変化状態を示している。 FIG. 11A is a diagram illustrating an amplitude change state when an audio signal whose dynamic range is compressed and whose amplitude is flattened is input to the dynamic range expansion apparatus 1. On the other hand, FIG. 11B shows the dynamic range when the lower limit value of detection is fixed to −30 [dB] in the second maximum value detector 31 of the first fluctuation detector 12 and the second fluctuation detector 13. The amplitude change state of the output signal of the expansion device 1 is shown. FIG. 11C shows the amplitude change state of the output signal of the dynamic range expansion apparatus 1 when the lower limit value of detection in the second maximum value detection unit 31 is changed as −30 + 10 logY max 2 [dB].

図11(a)では、オーディオ信号が平坦化されているのに対して、(b)(c)は、ダイナミックレンジの拡張が行われて平坦化された振幅部分(クリップ)がなくなり、違和感のないオーディオ出力を得ることが可能となっている。このように、本実施の形態に係るダイナミックレンジ拡張装置1では、低域補完信号および高域補完信号が、低域のオーディオ信号の包絡線(第2包絡線)および高域のオーディオ信号の包絡線(第2包絡線)をそれぞれ微分することにより生成されるため、ダイナミックレンジが圧縮されたオーディオ信号の信号波形が矩形状に近づき変化量が大きくなるほど、生成される低域補完信号および高域補完信号のレベルが大きくなる。このため、ダイナミックレンジの圧縮が大きい部分ほど(平坦化された部分ほど)、信号補完が積極的に行われて平坦部分が低減されて、圧縮の度合い応じた補完信号がオーディオ信号に合成されることになる。従って、いかなるダイナミックレンジの圧縮状態においても、ダイナミックレンジの圧縮処理が行われる前の状態の源音に、ダイナミックレンジを近づけることが可能となる。   In FIG. 11 (a), the audio signal is flattened, whereas in (b) and (c), the dynamic range is expanded and the flattened amplitude portion (clip) disappears, and the sense of incongruity is lost. It is possible to get no audio output. As described above, in the dynamic range expansion apparatus 1 according to the present embodiment, the low-frequency complementary signal and the high-frequency complementary signal are the low-frequency audio signal envelope (second envelope) and the high-frequency audio signal envelope. Since the signal waveform of the audio signal whose dynamic range is compressed approaches a rectangular shape and the amount of change increases, it is generated by differentiating each line (second envelope). The level of the complementary signal increases. For this reason, as the dynamic range compression is larger (the flattened portion), signal interpolation is actively performed to reduce the flat portion, and a complementary signal corresponding to the degree of compression is synthesized with the audio signal. It will be. Therefore, in any dynamic range compression state, it is possible to bring the dynamic range closer to the source sound before the dynamic range compression processing is performed.

また、ダイナミックレンジ拡張装置1におけるダイナミックレンジの拡張処理は、包絡線に基づいて求められる低域補完信号および高域補完信号により行われるため、ダイナミックレンジが圧縮されたオーディオ信号のボリューム設定の大小に係わらず効果的に行うことが可能となる。従って、パワーアンプやスピーカに十分な再生能力がある場合には、CDやDVDのような記録媒体におけるダイナミックレンジの制限によって、ダイナミックレンジが圧縮されたオーディオ信号を、ボリューム設定の音量を増大した後にスピーカから再生(出力)し、または、パワーアンプ等を介してスピーカから再生(出力)しても、出力信号のダイナミックレンジが拡張されているため、出力音のメリハリ感と臨場感を体感することが可能となり、不要な高調波の発生を抑制することが可能となる。   In addition, the dynamic range expansion processing in the dynamic range expansion apparatus 1 is performed using a low-frequency complementary signal and a high-frequency complementary signal obtained based on the envelope, so that the volume setting of the audio signal whose dynamic range is compressed can be increased or decreased. Regardless, it becomes possible to carry out effectively. Therefore, if the power amplifier or the speaker has sufficient reproduction capability, an audio signal whose dynamic range is compressed due to the limitation of the dynamic range in a recording medium such as a CD or DVD is increased after the volume setting volume is increased. Even if playback (output) from the speaker or playback (output) from the speaker via a power amplifier, etc., the dynamic range of the output signal is expanded, so that you can experience the sharpness and presence of the output sound. It becomes possible to suppress the generation of unnecessary harmonics.

なお、図11(b)(c)のどちらのオーディオ信号も、同様にダイナミックレンジの拡張が行われており、出力される音に高調波などが発生していない。   Note that in both audio signals of FIGS. 11B and 11C, the dynamic range is similarly expanded, and no harmonics are generated in the output sound.

一方で、図12(a)は、ダイナミックレンジ拡張装置1に、ダイナミックレンジが圧縮されていないオーディオ信号が入力される場合の振幅変化状態を示した図である。図12(b)は、第2最大値検出部31における包絡線(第2包絡線)の検出の下限値を−30[dB]に固定した場合における出力信号の振幅変化状態を示し、(c)は、検出の下限値を−30+10logYmax [dB]として変動させた場合における出力信号の振幅変化状態を示している。 On the other hand, FIG. 12A is a diagram illustrating an amplitude change state when an audio signal whose dynamic range is not compressed is input to the dynamic range expansion apparatus 1. FIG. 12B shows the amplitude change state of the output signal when the lower limit value of detection of the envelope (second envelope) in the second maximum value detector 31 is fixed to −30 [dB]. ) Shows the amplitude change state of the output signal when the lower limit of detection is changed as −30 + 10 logY max 2 [dB].

図12(a)では、オーディオ信号のダイナミックレンジの圧縮が行われていないため、信号は平坦化されていない。このようなオーディオ信号に対して、検出の下限値を−30[dB]に固定した状態でダイナミックレンジの拡張処理を行ってしまうと、図12(b)に示すように、本来拡張を行う必要のないダイナミックレンジが拡張されてしまい、音質の低減を招いてしまうおそれがある。   In FIG. 12A, since the dynamic range of the audio signal is not compressed, the signal is not flattened. If such an audio signal is subjected to dynamic range expansion processing in a state where the lower limit of detection is fixed to −30 [dB], as shown in FIG. There is a possibility that the dynamic range without noise will be expanded and the sound quality will be reduced.

一方で、検出の下限値を−30+10logYmax [dB]として変動させた状態でダイナミックレンジの拡張処理を行うと、図12(c)に示すように、ダイナミックレンジが不要に拡張されてしまうことを抑制し、音質の低下を抑制することが可能となる。これは、楽曲分析部17において、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に応じて、包絡線検出の下限値が変動されるためである。 On the other hand, if the dynamic range expansion process is performed in a state where the lower limit of detection is changed as −30 + 10 logY max 2 [dB], the dynamic range is unnecessarily expanded as shown in FIG. Can be suppressed, and deterioration of sound quality can be suppressed. This is because, in the music analysis unit 17, the lower limit value of the envelope detection is changed according to the value of the ratio of the average amplitude value to the maximum amplitude value (Y mean / Y max ).

具体的に、比(Ymean/Ymax)の値が高くて、ダイナミックレンジの圧縮が行われているおそれが高い場合には、ダイナミックレンジの拡張を行うための包絡線(第2包絡線)の下限値を積極的に低い値に設定(決定)して、クリップが生じ得るオーディオ信号のダイナミックレンジが効果的に拡張されるように制御し、比(Ymean/Ymax)の値が低くて、ダイナミックレンジの圧縮が行われていないおそれが高い場合には、楽曲分析部17において、ダイナミックレンジの拡張を行うための包絡線(第2包絡線)の下限値を積極的に高い値に設定(決定)することによって、クリップが生じていないオーディオ信号のダイナミックレンジが過剰に拡張されてしまうことを防止する。 Specifically, when the value of the ratio (Y mean / Y max ) is high and there is a high possibility that the dynamic range is being compressed, an envelope for expanding the dynamic range (second envelope) By actively setting (determining) the lower limit value of the audio signal to a low value so as to effectively extend the dynamic range of the audio signal that can be clipped, the ratio (Y mean / Y max ) is reduced. If there is a high possibility that the dynamic range is not compressed, the music analysis unit 17 positively increases the lower limit value of the envelope (second envelope) for expanding the dynamic range to a high value. By setting (determining), it is possible to prevent the dynamic range of an audio signal that is not clipped from being excessively expanded.

従って、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値に応じて、包絡線検出(第2包絡線検出)の下限値を変動させることにより、ダイナミックレンジの圧縮が行われていないオーディオ信号のダイナミックレンジが、不要に拡張されてしまうことを効果的に抑制することが可能となる。 Therefore, the dynamic range is compressed by changing the lower limit value of envelope detection (second envelope detection) according to the ratio of the average amplitude value to the maximum amplitude value (Y mean / Y max ). It is possible to effectively suppress the dynamic range of the audio signal not being unnecessarily expanded.

図13は、楽曲分析部17において設定される包絡線検出の下限値の変動状態を説明するための図である。図13(a)は、図11(a)に示す圧縮されたオーディオ信号がダイナミックレンジ拡張装置1に入力されて図11(c)の信号が出力される場合において、第1スムージング部23より算出された入力信号の包絡線(第1包絡線)と、平均値ホールド部25で求められた振幅平均値と、第2最大値ホールド部26で求められた振幅最大値との変化状態((a)の上段グラフ参照)と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化((a)の中段グラフ参照)と、包絡線検出(第2包絡線の検出)の下限値の変動状態((a)の下段グラフ参照)とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示している。また、図13(b)は、図12(a)に示す圧縮されていないオーディオ信号がダイナミックレンジ拡張装置1に入力されて図12(c)の信号が出力される場合における同様の変動状態((b)の上・中・下段グラフ参照)を、30秒間検出した結果を示している。 FIG. 13 is a diagram for explaining a variation state of the lower limit value of envelope detection set in the music analysis unit 17. 13A is calculated by the first smoothing unit 23 when the compressed audio signal shown in FIG. 11A is input to the dynamic range expansion apparatus 1 and the signal of FIG. 11C is output. The change state of the envelope of the input signal (first envelope), the amplitude average value obtained by the average value hold unit 25, and the amplitude maximum value obtained by the second maximum value hold unit 26 ((a ), The state change of the ratio of the amplitude average value to the maximum amplitude value (Y mean / Y max ) (see the middle graph of (a)), and envelope detection (detection of the second envelope) ) Of the lower limit value (see the lower graph of (a)) shows the result of detecting for 30 seconds from the beginning of the music of the input audio signal. FIG. 13B shows the same fluctuation state when the uncompressed audio signal shown in FIG. 12A is input to the dynamic range expansion apparatus 1 and the signal of FIG. (B) (see upper, middle, and lower graphs) for 30 seconds.

図13(a)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45(20秒経過後)を上回るに従って、図13(a)の下段グラフにおいて、包絡線検出の下限値が低減される状態が示されている。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものである。一方で、図13(b)の中段グラフにおいては、振幅平均値の比(Ymean/Ymax)の値が0.45を下回っているため、図13(b)の下段グラフには、包絡線検出の下限値は示されていない。 In the middle graph of FIG. 13A, as the ratio of the average amplitude value to the maximum amplitude value (Y mean / Y max ) exceeds 0.45 (after 20 seconds), the lower graph of FIG. FIG. 3 shows a state where the lower limit value of envelope detection is reduced. The fluctuation of the lower limit value of the envelope detection with respect to the value of this ratio (Y mean / Y max ) corresponds to the graph shown in FIG. On the other hand, in the middle graph of FIG. 13B, the value of the ratio of average amplitude values (Y mean / Y max ) is less than 0.45, so the lower graph of FIG. The lower limit of line detection is not shown.

図14(a)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールのオーディオ信号の振幅変動状態を示し、(b)は、ダイナミックレンジが圧縮されて振幅が平坦化されたフルスケールに満たない(フルスケール未満)のオーディオ信号の振幅変動状態を示している。また、図14(c)は、(a)に示されるフルスケールのオーディオ信号のダイナミックレンジをダイナミックレンジ拡張装置1において拡張したオーディオ信号の振幅変動状態を示し、図14(d)は、(b)に示されるフルスケール未満のオーディオ信号のダイナミックレンジをダイナミックレンジ拡張装置1において拡張したオーディオ信号の振幅変動状態を示している。   FIG. 14A shows the amplitude fluctuation state of a full-scale audio signal whose dynamic range is compressed and the amplitude is flattened, and FIG. 14B is a full scale whose dynamic range is compressed and the amplitude is flattened. The amplitude fluctuation state of the audio signal that is less than (less than full scale) is shown. FIG. 14C shows the amplitude variation state of the audio signal obtained by extending the dynamic range of the full-scale audio signal shown in FIG. The dynamic range expansion apparatus 1 expands the dynamic range of the audio signal of less than full scale shown in FIG.

具体的に、図14(a)は、CDに収録されたフルスケールのオーディオ信号の振幅変動状態を示している。図14(b)は、フルスケールに満たない信号であって、(a)のオーディオ信号の振幅に1/100(百分の一)を乗算した信号を示している。このため、図14(a)のオーディオ信号では、平坦化された振幅の制限値が±1となっているのに対して、図14(b)のオーディオ信号では、平坦化された振幅の制限値が±0.01となって、図14(a)に示す振幅の百分の一のスケールとなっている。なお、図14(a)のオーディオ信号も、図14(b)のオーディオ信号も、振幅のスケールは異なるが、振幅の変化状態は共通しており、制限される振幅(振幅±1又は振幅±0.01)に基づいて一部の箇所が平坦化された状態となっている。   Specifically, FIG. 14A shows the amplitude fluctuation state of a full-scale audio signal recorded on a CD. FIG. 14B shows a signal that is less than full scale and that is obtained by multiplying the amplitude of the audio signal in FIG. Therefore, in the audio signal in FIG. 14A, the flattened amplitude limit value is ± 1, whereas in the audio signal in FIG. 14B, the flattened amplitude limit is set. The value is ± 0.01, which is one hundredth of the amplitude shown in FIG. It should be noted that the audio signal in FIG. 14A and the audio signal in FIG. 14B have different amplitude scales, but have a common amplitude change state and are limited in amplitude (amplitude ± 1 or amplitude ± 0.01) is partially flattened.

また、図15(a)は、図13(a)と同様に、図14(a)に示す圧縮されたフルスケールのオーディオ信号がダイナミックレンジ拡張装置1に入力されて図14(c)の信号が出力される場合において、第1スムージング部23より算出された入力信号の包絡線と、平均値ホールド部25で求められた振幅平均値と、第2最大値ホールド部26で求められた振幅最大値との変化状態((a)の上段グラフ参照)と、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値の状態変化((a)の中段グラフ参照)と、包絡線検出の下限値の変動状態((a)の下段グラフ参照)とを、入力されるオーディオ信号の楽曲先頭から30秒間検出した結果を示している。また、図15(b)は、図14(b)に示す圧縮されたフルスケール未満のオーディオ信号がダイナミックレンジ拡張装置1に入力されて、図14(d)の信号が出力される場合における同様の変動状態((b)の上・中・下段グラフ参照)を、30秒間検出した結果を示している。 15 (a) is similar to FIG. 13 (a), the compressed full-scale audio signal shown in FIG. 14 (a) is input to the dynamic range expansion apparatus 1 and the signal shown in FIG. 14 (c). Is output, the envelope of the input signal calculated by the first smoothing unit 23, the average amplitude value obtained by the average value holding unit 25, and the maximum amplitude value obtained by the second maximum value holding unit 26. Change state (see the upper graph of (a)), change in the value of the ratio of the average amplitude value to the maximum amplitude value (Y mean / Y max ) (see the middle graph of (a)), and the envelope The fluctuation state of the lower limit of detection (see the lower graph of (a)) shows the result of detecting for 30 seconds from the beginning of the music of the input audio signal. 15B is the same as that in the case where the compressed audio signal of less than full scale shown in FIG. 14B is input to the dynamic range expansion apparatus 1 and the signal of FIG. 14D is output. The fluctuation state (see the upper, middle and lower graphs in (b)) is shown for 30 seconds.

本実施の形態に係るダイナミックレンジ拡張装置1に、図14(a)に示す圧縮されたフルスケールのオーディオ信号が入力されると、図14(c)に示すように、ダイナミックレンジの拡張が行われて、±1に平坦化されていた振幅が±1以上に補正され、ダイナミックレンジの拡張が行われる。このとき、図15(a)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45を上回る(20秒以降になる)と、図15(a)の下段グラフに示すように、包絡線検出の下限値が低減された状態となる。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものであるが、図15(a)において入力されるオーディオ信号の振幅最大値は、図14(a)・図15(a)上段に示すように1であるため、比の値(Ymean/Ymax)が0.45を上回る場合には、包絡線検出の下限値f(Ymean,Ymax)が−10[dB]程度の値(−200・Ymean/Ymax+90+10logYmax において、Ymean/Ymaxに0.45を代入し、Ymaxに1を代入した値)に低減(変動)されることになる。 When the compressed full-scale audio signal shown in FIG. 14A is input to the dynamic range extending apparatus 1 according to the present embodiment, the dynamic range is extended as shown in FIG. 14C. Thus, the amplitude flattened to ± 1 is corrected to ± 1 or more, and the dynamic range is expanded. At this time, in the middle graph of FIG. 15A, when the ratio of the amplitude average value to the maximum amplitude value (Y mean / Y max ) exceeds 0.45 (after 20 seconds), FIG. ) As shown in the lower graph, the lower limit value of the envelope detection is reduced. The fluctuation of the lower limit value of the envelope detection with respect to the value of this ratio (Y mean / Y max ) corresponds to the graph shown in FIG. 3 and Equation 1, but the audio signal input in FIG. The amplitude maximum value of 1 is 1 as shown in the upper part of FIGS. 14 (a) and 15 (a). Therefore, when the ratio value (Y mean / Y max ) exceeds 0.45, envelope detection is performed. When the lower limit value f (Y mean , Y max ) is about −10 [dB] (−200 · Y mean / Y max + 90 + 10 log Y max 2) , 0.45 is substituted for Y mean / Y max and Y max (Value substituted with 1)).

一方で、本実施の形態に係るダイナミックレンジ拡張装置1に、図14(b)に示す圧縮されたフルスケール未満のオーディオ信号が入力されると、図14(d)に示すように、ダイナミックレンジの拡張が行われて、±0.01に平坦化されていた振幅が±0.01以上に補正され、ダイナミックレンジの拡張が行われる。このとき、図15(b)の中段グラフにおいて、振幅最大値に対する振幅平均値の比(Ymean/Ymax)の値が0.45を上回る場合には、図15(b)の下段グラフに示すように、包絡線検出の下限値が一気に−40[dB]まで低減された後に緩やかに低減される傾向を示す。この比(Ymean/Ymax)の値に対する包絡線検出の下限値の変動は、図3に示したグラフおよび式1に対応するものであるが、図15(b)において入力されるオーディオ信号の振幅最大値は、図14(b)、図15(b)の上段の振幅最大値に示すように0.01であるため、比の値(Ymean/Ymax)が0.45の場合には、包絡線検出の下限値f(Ymean,Ymax)が−40[dB]程度の値(−200・Ymean/Ymax+90+10logYmax において、Ymean/Ymaxに0.45を代入し、Ymaxに0.01を代入した値)に低減(変動)されることになる。 On the other hand, when an audio signal less than the compressed full scale shown in FIG. 14B is input to the dynamic range extending apparatus 1 according to the present embodiment, as shown in FIG. Thus, the amplitude flattened to ± 0.01 is corrected to ± 0.01 or more, and the dynamic range is extended. At this time, in the middle graph of FIG. 15B, when the ratio of the average amplitude value to the maximum amplitude value (Y mean / Y max ) exceeds 0.45, the lower graph of FIG. As shown, the lower limit value of envelope detection tends to be gradually reduced after being reduced to −40 [dB] at once. The fluctuation of the lower limit value of the envelope detection with respect to the value of this ratio (Y mean / Y max ) corresponds to the graph shown in FIG. 3 and Equation 1, but the audio signal input in FIG. 14 is 0.01 as shown in the upper amplitude maximum values in FIGS. 14B and 15B, and the ratio value (Y mean / Y max ) is 0.45. The envelope detection lower limit value f (Y mean , Y max ) is about −40 [dB] (−200 · Y mean / Y max + 90 + 10 log Y max 2 , Y mean / Y max is set to 0.45) Substituted and reduced (varied) to a value obtained by substituting 0.01 for Y max .

このように、本実施の形態に係るダイナミックレンジ拡張装置1では、包絡線検出(第2包絡線検出)の下限値が振幅最大値に応じて(logYmax の値に応じて)変動されるため、入力されるオーディオ信号がフルスケールに満たない場合であって制限される振幅の値が低い場合であっても、入力されるオーディオ信号がフルスケールであって制限される振幅の値が高い場合であっても、その制限される振幅値(振幅最大値)に応じて適切にダイナミックレンジの拡張処理が行われることになる。 Thus, in the dynamic range expansion apparatus 1 according to the present embodiment, the lower limit value of envelope detection (second envelope detection) is varied according to the maximum amplitude value (according to the value of log Y max 2 ). Therefore, even when the input audio signal is less than full scale and the restricted amplitude value is low, the input audio signal is full scale and the restricted amplitude value is high. Even in this case, dynamic range expansion processing is appropriately performed according to the limited amplitude value (maximum amplitude value).

このため、フルスケールに満たないオーディオ信号であって、ダイナミックレンジの圧縮が行われている信号に対し、ダイナミックレンジの拡張処理が行われない可能性を排除することができる。   For this reason, it is possible to eliminate the possibility that the dynamic range expansion processing is not performed on a signal that is less than full scale and that has undergone dynamic range compression.

以上、本発明に係るダイナミックレンジ拡張装置について、実施の形態において一例を示して説明を行ったが、本発明に係るダイナミックレンジ拡張装置は、上述した実施の形態に示す例には限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。   The dynamic range extending apparatus according to the present invention has been described with reference to an example in the embodiment. However, the dynamic range extending apparatus according to the present invention is not limited to the example shown in the above-described embodiment. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.

例えば、本実施の形態に係るダイナミックレンジ拡張装置1では、入力されたオーディオ信号を、LPF部10とHPF部11とでそれぞれ低域成分および高域成分を抽出してダイナミックレンジの拡張を行う場合について説明を行ったが、ダイナミックレンジの拡張は必ずしも低域成分と高域成分とに分割する場合には限定されない。高域成分と低域成分との2つに分割するだけでなく3つ以上の帯域に分割してそれぞれダイナミックレンジの拡張を行う構成とするものであってもよく、また、全く帯域分割することなくダイナミックレンジの拡張を行う構成とするものであってもよい。   For example, in the dynamic range extending apparatus 1 according to the present embodiment, when the LPF unit 10 and the HPF unit 11 extract the low frequency component and the high frequency component from the input audio signal, respectively, the dynamic range is extended. However, the expansion of the dynamic range is not necessarily limited to the case where the low frequency component and the high frequency component are divided. In addition to dividing into high frequency components and low frequency components, it may be configured to divide into three or more bands and expand the dynamic range, respectively, or to divide the bands completely. Alternatively, the dynamic range may be extended.

1 …ダイナミックレンジ拡張装置
10 …LPF部
11 …HPF部
12 …第1変動検出部
13 …第2変動検出部
14 …第1重み付け部
15 …第2重み付け部
16 …合成部(加算手段)
17 …楽曲分析部
21 …第1最大値検出部(第1包絡線検出手段)
22 …第1最大値ホールド部(第1包絡線検出手段)
23 …第1スムージング部(第1包絡線検出手段)
24 …モノラル変換部
25 …平均値ホールド部(平均値算出手段)
26 …第2最大値ホールド部(最大値算出手段)
27 …検出ゲイン算出部(検出ゲイン決定手段)
31 …第2最大値検出部(第2包絡線検出手段)
32 …第3最大値ホールド部(第2包絡線検出手段)
33 …第2スムージング部(第2包絡線検出手段)
34 …デシベル変換部(デシベル変換手段)
35 …微分部(微分手段)
36 …反転部(反転手段)
37 …レベル制限部
38 …リニア変換部(リニア変換手段)
41 …乗算部(補完信号生成手段)
42 …減算部(補完信号生成手段)
43 …ゲイン部(ゲイン調節手段)
DESCRIPTION OF SYMBOLS 1 ... Dynamic range expansion apparatus 10 ... LPF part 11 ... HPF part 12 ... 1st fluctuation | variation detection part 13 ... 2nd fluctuation | variation detection part 14 ... 1st weighting part 15 ... 2nd weighting part 16 ... Synthesis | combination part (adding means)
17 ... music analysis unit 21 ... first maximum value detection unit (first envelope detection means)
22 ... 1st maximum value hold part (1st envelope detection means)
23 ... 1st smoothing part (1st envelope detection means)
24 ... monaural conversion unit 25 ... average value hold unit (average value calculation means)
26 ... 2nd maximum value hold part (maximum value calculation means)
27: Detection gain calculation unit (detection gain determination means)
31 ... 2nd maximum value detection part (2nd envelope detection means)
32 ... 3rd maximum value hold part (2nd envelope detection means)
33 ... 2nd smoothing part (2nd envelope detection means)
34. Decibel conversion unit (decibel conversion means)
35 ... Differential part (differentiating means)
36 ... reversing part (reversing means)
37 ... level limiter 38 ... linear converter (linear converter)
41 ... Multiplication unit (complementary signal generating means)
42 Subtracting unit (complementary signal generating means)
43 ... Gain section (gain adjusting means)

Claims (4)

音源から出力されるオーディオ信号の最大値変化状態に基づいて第1包絡線の検出を行う第1包絡線検出手段と、
該第1包絡線検出手段により検出された前記第1包絡線における所定時間の平均的な振幅の値を振幅平均値Ymeanとして算出する平均値算出手段と、
前記第1包絡線検出手段により検出された前記第1包絡線の前記所定時間における振幅の最大値を振幅最大値Ymaxとして算出する最大値算出手段と、
前記平均値算出手段により算出された振幅平均値Ymeanと前記最大値算出手段により算出された振幅最大値Ymax基づいて、検出ゲインを決定する検出ゲイン決定手段と、
前記音源から出力されるオーディオ信号のうち、前記検出ゲイン決定手段により決定された前記検出ゲインよりも高い値を満たすオーディオ信号の最大値変化状態を求めて第2包絡線の検出を行う第2包絡線検出手段と、
該第2包絡線検出手段により検出された前記第2包絡線をデシベル変換するデシベル変換手段と、
該デシベル変換手段によりデシベル変換された前記第2包絡線を微分処理することにより、前記第2包絡線の変化量を示す変化量信号を生成する微分手段と、
前記微分手段により生成された変化量信号に−1を乗算することにより信号の反転を行う反転手段と、
該反転手段により反転された前記変化量信号をリニアな信号に変換することにより検出信号を生成するリニア変換手段と、
前記オーディオ信号に前記検出信号を乗算した信号を、前記オーディオ信号から減算することにより補完信号を生成する補完信号生成手段と、
該補完信号生成手段により生成された補完信号を、前記オーディオ信号に加算する加算手段と
を備え、
前記検出ゲイン決定手段は、
前記振幅最大値Ymaxに対する前記振幅平均値Ymeanの比の値が、0.5より小さい値に設定される第1閾値よりも小さい場合に、前記検出ゲインを0[dB]に決定し、
前記比の値が前記第1閾値である場合に、前記検出ゲインを10logYmax [dB]に決定し、
前記比の値が前記第1閾値以上であって、かつ、0.5より大きい値に設定される第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logYmax [dB]より低減させた値を前記検出ゲインに決定し、
前記比の値が前記第2閾値より大きい場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記10logY max [dB]より低減させた値のうち最も低い値を前記検出ゲインに決定する
ことを特徴とするダイナミックレンジ拡張装置。
First envelope detecting means for detecting the first envelope based on the maximum value change state of the audio signal output from the sound source;
Average value calculating means for calculating an average amplitude value for a predetermined time in the first envelope detected by the first envelope detecting means as an amplitude average value Y mean ;
Maximum value calculating means for calculating the maximum value of the amplitude of the first envelope detected by the first envelope detecting means at the predetermined time as an amplitude maximum value Y max ;
Wherein on the basis of the amplitude maximum value Y max is calculated by the amplitude average value Y mean and the maximum value calculation means calculated by the average value calculating means, and the detection gain determining means for determining a detection gain,
A second envelope for detecting a second envelope by obtaining a maximum value change state of an audio signal satisfying a value higher than the detection gain determined by the detection gain determination means among the audio signals output from the sound source. Line detection means;
A decibel transforming means for decibel transforming the second envelope detected by the second envelope detecting means;
Differentiating means for generating a change amount signal indicating a change amount of the second envelope by differentiating the second envelope converted by the decibel conversion means;
Inversion means for inverting the signal by multiplying the change amount signal generated by the differentiating means by -1.
Linear conversion means for generating a detection signal by converting the change amount signal inverted by the inversion means into a linear signal;
Complementary signal generation means for generating a complementary signal by subtracting a signal obtained by multiplying the audio signal by the detection signal from the audio signal;
Adding means for adding the complementary signal generated by the complementary signal generating means to the audio signal;
The detection gain determining means includes
When the value of the ratio of the amplitude average value Y mean to the amplitude maximum value Y max is smaller than a first threshold set to a value smaller than 0.5, the detection gain is determined to be 0 [dB];
When the value of the ratio is the first threshold, the detection gain is determined to be 10 logY max 2 [dB],
When the ratio value is equal to or greater than the first threshold value and equal to or less than a second threshold value set to a value greater than 0.5, the ratio value ranges from the first threshold value to the second threshold value. A value reduced from the 10 log Y max 2 [dB] is determined as the detection gain so as to be inversely proportional to the increase,
When the value of the ratio is larger than the second threshold value, the ratio value is decreased in proportion to the increase from the first threshold value to the second threshold value, so that the value is less than 10 logY max 2 [dB]. A dynamic range expansion device, wherein the lowest value among the values is determined as the detection gain.
前記検出ゲイン決定手段は、
前記比の値が前記第1閾値以上であって、かつ、前記第2閾値以下である場合に、前記比の値が前記第1閾値から前記第2閾値まで増加するのに反比例させるようにして、前記検出ゲインを、前記10logYmax [dB]から−30+10logYmax [dB]まで低減させ、
前記比の値が前記第2閾値より大きい場合に、前記検出ゲインを−30+10logYmax [dB]に決定する
ことを特徴とする請求項1に記載のダイナミックレンジ拡張装置。
The detection gain determining means includes
When the value of the ratio is greater than or equal to the first threshold and less than or equal to the second threshold, the ratio is increased in inverse proportion to increasing from the first threshold to the second threshold. Reducing the detection gain from 10 log Y max 2 [dB] to −30 + 10 log Y max 2 [dB],
2. The dynamic range expansion device according to claim 1, wherein when the value of the ratio is larger than the second threshold, the detection gain is determined to be −30 + 10 logY max 2 [dB].
前記補完信号生成手段により生成された補完信号のゲインを増幅又は減衰することによりゲイン調節を行うゲイン調節手段を有し、
前記加算手段は、前記ゲイン調節手段によりゲイン調節された前記補完信号を、前記オーディオ信号に加算すること
を特徴とする請求項1または請求項2に記載のダイナミックレンジ拡張装置。
Gain adjusting means for performing gain adjustment by amplifying or attenuating the gain of the complementary signal generated by the complementary signal generating means;
The dynamic range extending apparatus according to claim 1, wherein the adding unit adds the complementary signal whose gain is adjusted by the gain adjusting unit to the audio signal.
前記微分手段は、ハイパスフィルタを用いて、前記デシベル変換手段によりデシベル変換された前記第2包絡線のフィルタリング処理を行うことによって微分処理を行い、
該フィルタリング処理により求められる前記変化量の変化時間は、前記ハイパスフィルタにおける正規化カットオフ周波数の設定値を変更することにより調整されること
を特徴とする請求項1乃至請求項3のいずれか1項に記載のダイナミックレンジ拡張装置。


The differentiating means performs a differentiation process by performing a filtering process of the second envelope transformed by the decibel transform means by using the high-pass filter,
4. The change time of the change amount obtained by the filtering process is adjusted by changing a set value of a normalized cutoff frequency in the high-pass filter. 5. The dynamic range expansion device as described in the paragraph.


JP2011241092A 2011-11-02 2011-11-02 Dynamic range expansion device Active JP5841405B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011241092A JP5841405B2 (en) 2011-11-02 2011-11-02 Dynamic range expansion device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011241092A JP5841405B2 (en) 2011-11-02 2011-11-02 Dynamic range expansion device

Publications (2)

Publication Number Publication Date
JP2013098832A JP2013098832A (en) 2013-05-20
JP5841405B2 true JP5841405B2 (en) 2016-01-13

Family

ID=48620324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011241092A Active JP5841405B2 (en) 2011-11-02 2011-11-02 Dynamic range expansion device

Country Status (1)

Country Link
JP (1) JP5841405B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106887233B (en) * 2015-12-15 2020-01-24 广州酷狗计算机科技有限公司 Audio data processing method and system
KR102483222B1 (en) * 2017-11-17 2023-01-02 삼성전자주식회사 Audio system and method of controlling the same

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5814613A (en) * 1981-07-17 1983-01-27 Sanyo Electric Co Ltd Expanding circuit of signal level
JP5715910B2 (en) * 2011-09-01 2015-05-13 クラリオン株式会社 Dynamic range expansion device

Also Published As

Publication number Publication date
JP2013098832A (en) 2013-05-20

Similar Documents

Publication Publication Date Title
CN110326308B (en) Distortion sensing, anti-distortion, and distortion aware bass enhancement
JP5898534B2 (en) Acoustic signal processing apparatus and acoustic signal processing method
JP5295238B2 (en) Sound processor
JP6711881B2 (en) Device and method for tuning a frequency dependent damping stage
EP1680781B1 (en) System and method for audio signal processing
JP6186470B2 (en) Acoustic device, volume control method, volume control program, and recording medium
JP5707963B2 (en) Audio amplifier
US8634578B2 (en) Multiband dynamics compressor with spectral balance compensation
WO2009110087A1 (en) Signal processing device
EP1709734A1 (en) System for audio signal processing
JP5345067B2 (en) Hearing sensitivity correction device
JP5168208B2 (en) Audio signal processing device and speaker device
JP2009296298A (en) Sound signal processing device and method
JP5841405B2 (en) Dynamic range expansion device
JP5715910B2 (en) Dynamic range expansion device
JP2014030140A (en) Ambient noise estimation device, sound volume adjusting device, ambient noise estimation method, and ambient noise estimation program
EP3379847B1 (en) Audio device, speaker device, and audio signal processing method
JP6155132B2 (en) Low frequency complement device and low frequency complement method
WO2017183405A1 (en) Acoustic processing device and acoustic processing method
JP2021190965A (en) Acoustic signal processing device and acoustic signal processing program
JP4803193B2 (en) Audio signal gain control apparatus and gain control method
JP2011035573A (en) Sound signal processing apparatus and sound signal processing method
JP2012100117A (en) Acoustic processing apparatus and method
JP6807769B2 (en) Sound equipment and sound quality adjustment method
JP6531418B2 (en) Signal processor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150512

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150818

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151027

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151113

R150 Certificate of patent or registration of utility model

Ref document number: 5841405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250