JP2016530765A - オーディオ信号を圧縮するためのデジタルコンプレッサ - Google Patents

オーディオ信号を圧縮するためのデジタルコンプレッサ Download PDF

Info

Publication number
JP2016530765A
JP2016530765A JP2016524706A JP2016524706A JP2016530765A JP 2016530765 A JP2016530765 A JP 2016530765A JP 2016524706 A JP2016524706 A JP 2016524706A JP 2016524706 A JP2016524706 A JP 2016524706A JP 2016530765 A JP2016530765 A JP 2016530765A
Authority
JP
Japan
Prior art keywords
compression
audio signal
filter
signal
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016524706A
Other languages
English (en)
Other versions
JP6388457B2 (ja
Inventor
ペーター・グロッシュ
ユエ・ラン
チン・ジャン
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2016530765A publication Critical patent/JP2016530765A/ja
Application granted granted Critical
Publication of JP6388457B2 publication Critical patent/JP6388457B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression

Abstract

本発明は、入力オーディオ信号を圧縮するためのデジタルコンプレッサ(100)に関し、デジタルコンプレッサ(100)は、圧縮利得パラメータを提供するための圧縮利得制御(101)と、圧縮利得パラメータから圧縮比を決定するための圧縮パラメータ決定器(103)であって、圧縮比を取得するために所定の重み係数によって、圧縮利得パラメータに重み付けするように構成された圧縮パラメータ決定器(103)と、第1の補助信号を取得するために圧縮比に依存して入力オーディオ信号を操作するための補助信号ジェネレータ(105)と、第2の補助信号を取得するために第1の補助信号を圧縮利得パラメータと組み合わせ、圧縮されたオーディオ信号を取得するために入力オーディオ信号を第2の補助信号と組み合わせるための結合器ユニット(107)とを含む。

Description

本発明は、オーディオ信号処理の分野に関する。
オーディオ信号のダイナミックレンジの縮小は、録音、音声再生、およびブロードキャストの分野において重要な主題である。ダイナミックレンジの縮小は、用いられるオーディオ装置の物理的能力においてオーディオ信号の特性を適合させるのに適している場合がある。
オーディオ信号のダイナミックレンジを縮小するために、コンプレッサが用いられ得る。コンプレッサの圧縮特性は、オーディオ信号の認知される品質に著しく影響を及ぼす可能性がある複数の圧縮パラメータによって制御され得る。
コンプレッサのパラメータの調整は、典型的には、経験を積んだユーザによって手作業で実行される。オーディオ信号の高い認知される品質を維持すると同時に、オーディオ信号の圧縮を制御するための直感的なメカニズムは存在しない。
G. W. McNally、「Dynamic Range Control of Digital Audio Signals」、Journal of the Audio Engineering Society、vol. 32、pp. 316〜327、1984年において、コンプレッサを使用するダイナミックレンジ圧縮が記述されている。
本発明は、入力オーディオ信号の圧縮を制御するための効率的なメカニズムを用いて入力オーディオ信号を圧縮するためのデジタルコンプレッサを提供することを目的とする。
この目的は、独立請求項に記載の特徴によって達成される。他の実装形態は、従属請求項、記述、および図から明白である。
本発明は、入力オーディオ信号の圧縮のための複数の圧縮パラメータは、単一の圧縮利得パラメータから導出できるという発見に基づいている。複数の圧縮パラメータは、圧縮されたオーディオ信号の高い認知された品質が達成され得るように導出することができる。圧縮利得パラメータは、継続的に選択され得、入力オーディオ信号の異なる程度の圧縮がもたらされ得る。したがって、入力オーディオ信号の圧縮を制御するための直感的なメカニズムが提供され得る。
第1の態様によると、本発明は、入力オーディオ信号を圧縮するためのデジタルコンプレッサに関し、デジタルコンプレッサは、圧縮利得パラメータを提供するための圧縮利得制御と、圧縮利得パラメータからの圧縮比を決定するための圧縮パラメータ決定器であって、圧縮比を取得するために所定の重み係数によって、圧縮利得パラメータに重み付けするように構成されている圧縮パラメータ決定器と、第1の補助信号を取得するために圧縮比に依存して入力オーディオ信号を操作するための補助信号ジェネレータと、第2の補助信号を取得するために、第1の補助信号を圧縮利得パラメータに組み合わせ、圧縮されたオーディオ信号を取得するために、入力オーディオ信号を第2の補助信号に組み合わせるための結合器ユニットとを含む。したがって、単一の圧縮利得パラメータによって制御され得るデジタルコンプレッサが提供され得る。
入力オーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。入力オーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
圧縮利得制御は、圧縮利得パラメータを提供するためにスライディング制御を含むことができる。圧縮利得パラメータは、対数目盛、たとえば0dB、3dB、6dB、または12dBで提供され得る。
圧縮パラメータ決定器は、所定の重み係数によって圧縮利得パラメータに重み付けすることによって、圧縮利得パラメータからの圧縮比を決定することができる。圧縮比は、線形目盛、たとえば1、2、5、または10で提供され得る。所定の重み係数は、対数目盛、たとえば2dB、または線形目盛、たとえば1.5で提供され得る。
補助信号ジェネレータは、第1の補助信号を取得するために、圧縮比に依存して入力オーディオ信号を操作することができる。操作は、入力オーディオ信号からの第1の補助信号の導出または第1の補助信号を取得するための入力オーディオ信号の処理に関係する場合がある。第1の補助信号は、時間依存の実数値の信号の場合がある。
結合器ユニットは、第2の補助信号を取得するために、第1の補助信号を圧縮利得パラメータと組み合わせることができる。結合器ユニットは、圧縮されたオーディオ信号を取得するために、入力オーディオ信号を第2の補助信号とさらに組み合わせることができる。第2の補助信号は、時間依存の実数値の信号の場合がある。
圧縮されたオーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。圧縮されたオーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。圧縮されたオーディオ信号のダイナミックレンジは、入力オーディオ信号のダイナミックレンジに関して縮小され得る。
そのような第1の態様によるデジタルコンプレッサの第1の実装形態では、圧縮パラメータ決定器は、以下の等式:
R=G/K、またはR≒G/K
により圧縮比を決定するように構成される。
ここにおいて、Gは、圧縮利得パラメータを示し、Kは、所定の重み係数を示し、Rは、圧縮比を示している。したがって、圧縮比は、効率的に決定され得る。
所定の重み係数は、対数の範囲内、たとえば1.5dBから3dB、または線形領域内、たとえば1.4から2で選択され得る。圧縮比は、所定の偏差範囲、たとえば±10%内で等式の決定された値から外れる場合がある。
そのような第1の態様によるデジタルコンプレッサの第2の実装形態、または第1の態様の第1の実装形態では、圧縮パラメータ決定器は、以下の等式:
τA=A1・G+A2
により圧縮利得パラメータからアタックフィルタ時間定数を決定するようにさらに構成される。
ここにおいて、Gは、対数目盛での圧縮利得パラメータを示し、A1は、第1の所定のアタック定数を示し、A2は、第2の所定のアタック定数を示し、τAは、アタックフィルタ時間定数を示し、ここにおいて、補助信号ジェネレータは、第1の補助信号を取得するためにアタックフィルタ時間定数に依存して入力オーディオ信号をフィルタするように構成される。したがって、アタックフィルタ時間定数は、効率的に決定され得る。
アタックフィルタ時間定数は、アタック段階内で入力オーディオ信号をフィルタするためにフィルタリング特性を規定することができる。アタック段階は、入力オーディオ信号の振幅が増加する時間間隔に関係する場合がある。
第1の所定のアタック定数は、圧縮利得パラメータに依存してアタックフィルタ時間定数の増加または減少に関係する傾斜の場合がある。第1の所定のアタック定数は、たとえば-0.0002秒/dBの場合がある。第2の所定のアタック定数は、アタックフィルタ時間定数に関係するオフセットの場合がある。第2の所定のアタック定数は、たとえば0.006秒の場合がある。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第3の実装形態では、圧縮パラメータ決定器は、以下の等式:
τR=B1・G+B2
により圧縮利得パラメータからリリースフィルタ時間定数を決定するようにさらに構成される。
ここにおいて、Gは、対数目盛での圧縮利得パラメータを示し、B1は、第1の所定のリリース定数を示し、B2は、第2の所定のリリース定数を示し、τRは、リリースフィルタ時間定数を示し、ここにおいて、補助信号ジェネレータは、第1の補助信号を取得するためにリリースフィルタ時間定数に依存して入力オーディオ信号をフィルタするように構成される。したがって、リリースフィルタ時間定数は、効率的に決定され得る。
リリースフィルタ時間定数は、リリース段階内で入力オーディオ信号をフィルタするためのフィルタリング特性を規定することができる。リリース段階は、入力オーディオ信号の振幅が減少する時間間隔に関係する場合がある。
第1の所定のリリース定数は、圧縮利得パラメータに依存してリリースフィルタ時間定数の増加または減少に関係する傾斜の場合がある。第1の所定のリリース定数は、たとえば-0.0033秒/dBの場合がある。第2の所定のリリース定数は、リリースフィルタ時間定数に関係するオフセットの場合がある。第2の所定のリリース定数は、たとえば0.12秒の場合がある。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第4の実装形態では、圧縮パラメータ決定器は、以下の等式:
T=Pmax-G・λ(1+1/R)
により圧縮利得パラメータから圧縮しきい値を決定するようにさらに構成される。
ここにおいて、Gは、対数目盛での圧縮利得パラメータを示し、λは、許容係数を示し、Rは、圧縮比を示し、Pmaxは、対数目盛での入力オーディオ信号の最大強度を示し、Tは、対数目盛での圧縮しきい値を示し、ここにおいて、補助信号ジェネレータは、第1の補助信号を取得するために、入力オーディオ信号を圧縮しきい値と比較するように構成される。したがって、圧縮しきい値は効率的に決定され得る。
圧縮しきい値は、入力オーディオ信号を圧縮するためのしきい値を規定することができる。入力オーディオ信号の圧縮は、圧縮しきい値を超える入力オーディオ信号の強度または振幅に対して実行され得る。圧縮しきい値は、たとえば-15dBの場合がある。
許容係数は、アタックフィルタ時間定数から圧縮しきい値の依存関係を導入することができる。許容係数は、たとえば、λ=1.122+65・1/秒・τAにより決定され得て、ここにおいて、τAは、アタックフィルタ時間定数を示す。許容係数は、実数、たとえば1.2または1.5の場合がある。
入力オーディオ信号の最大強度は、圧縮パラメータ決定器によって決定され得る。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第5の実装形態では、補助信号ジェネレータは、デジタルフィルタによって入力オーディオ信号をフィルタするように構成され、デジタルフィルタは、周波数を通じて強度を持つ周波数伝達関数を含み、強度は、人間の耳の等ラウドネス曲線によって形成される。したがって、入力オーディオ信号の圧縮は、主に、入力オーディオ信号の部分において実行され得て、人間の耳は、より感知しにくい。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第6の実装形態では、補助信号ジェネレータは、デジタル低域フィルタによって入力オーディオ信号をフィルタするように構成され、デジタル低域フィルタは、時間領域においてフィルタステップ応答を含む。したがって、入力オーディオ信号は、平滑化され得て、圧縮アーティファクトは低減され得る。
フィルタステップ応答は、入力オーディオ信号の強度を増加させ、入力オーディオ信号の強度を減少させるために異なる時間定数を含むことができる。フィルタステップ応答の立ち上がり時間は、アタックフィルタ時間定数によって決定され得る。フィルタステップ応答の立ち下り時間は、リリースフィルタ時間定数によって決定され得る。
第1の態様の第6の実装形態によるデジタルコンプレッサの第7の実装形態では、デジタル低域フィルタは、以下の等式:
Figure 2016530765
および
αR=e-1/τRA=e-1/τA
により入力オーディオ信号をフィルタするように構成される。
ここにおいて、τAは、アタックフィルタ時間定数を示し、τRは、リリースフィルタ時間定数を示し、αAは、指数関数的なアタック定数を示し、αRは、指数関数的なリリース定数を示し、tは、サンプリング時間インデックスを示し、Pxは、対数目盛での入力オーディオ信号の強度を示し、PSは、対数目盛でのフィルタされたオーディオ信号の強度を示している。したがって、デジタル低域フィルタは、効率的に実装され得る。
指数関数的なアタック定数は、単位がない(unit-less)か、または正規化されたアタックフィルタ時間定数から決定され得る。指数関数的なリリース定数は、単位がないか、または正規化されたリリースフィルタ時間定数から決定され得る。サンプリング時間インデックスは、入力オーディオ信号のサンプリング時間を示すことができる。サンプリング時間インデックスは、自然数、たとえば2または128の場合がある。
デジタル低域フィルタは、一次デジタル低域フィルタに関係する場合がある。デジタル低域フィルタは、1極の再帰的な無限インパルス応答(IIR)フィルタの場合がある。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第8の実装形態では、補助信号ジェネレータは、以下の等式:
Figure 2016530765
により第1の補助信号の強度を決定するように構成される。ここにおいて、Rは、圧縮比を示し、Tは、対数目盛での圧縮しきい値を示し、PSは、対数目盛での入力オーディオ信号の強度を示し、tは、時間を示し、g(t)は、対数目盛での第1の補助信号の強度を示している。したがって、第1の補助信号の強度は効率的に決定され得る。
第1の補助信号の強度は、デジタルコンプレッサの区分的線形の圧縮特性により決定することができる。圧縮しきい値は、区分的線形の圧縮特性の角レベル(corner level)の場合がある。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第9の実装形態では、結合器ユニットは、第2の補助信号を取得するために、第1の補助信号に圧縮利得パラメータを掛けるように構成される。したがって、オーディオ信号圧縮によって引き起こされる圧縮のヘッドルームは補償され得る。
乗算は、線形目盛で第2の補助信号を取得するために、第1の補助信号および圧縮利得パラメータの線形目盛の場合に実行され得る。さらに、加算は、対数目盛で第2の補助信号を取得するために、第1の補助信号および圧縮利得パラメータの対数目盛の場合に実行され得る。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第10の実装形態では、結合器ユニットは、圧縮されたオーディオ信号を取得するために、入力オーディオ信号に第2の補助信号を掛けるように構成される。したがって、入力オーディオ信号の圧縮は、効率的に実行され得る。
乗算は、線形目盛で圧縮されたオーディオ信号を取得するために、入力オーディオ信号および第2の補助信号の線形目盛の場合に実行され得る。さらに、加算は、対数目盛で圧縮されたオーディオ信号を取得するために、入力オーディオ信号および第2の補助信号の対数目盛の場合に実行され得る。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第11の実装形態では、デジタルコンプレッサは、圧縮されたオーディオ信号をフィルタするための等化フィルタをさらに含み、等化フィルタは、周波数を通じて強度を持つ周波数伝達関数を含み、強度は、人間の耳の等ラウドネス曲線によって形成される。したがって、デジタルコンプレッサの平坦な周波数レスポンスが達成され得る。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
そのような第1の態様または第1の態様の任意の先行する実装形態によるデジタルコンプレッサの第12の実装形態では、デジタルコンプレッサは、時間領域において圧縮されたオーディオ信号の最大強度を低減するためのピークリミッタをさらに含む。したがって、圧縮されたオーディオ信号のクリッピング効果が緩和され得る。
ピークリミッタは、高圧縮しきい値および/または高圧縮比を有するダイナミックレンジコンプレッサとして実現され得る。
第2の態様によると、本発明は、入力オーディオ信号を圧縮するためのデジタル圧縮方法に関し、デジタル圧縮方法は、圧縮利得パラメータを提供するステップと、圧縮比を取得するために、所定の重み係数によって圧縮利得パラメータに重み付けすることによって、圧縮利得パラメータからの圧縮比を決定するステップと、第1の補助信号を取得するために、圧縮比に依存して入力オーディオ信号を操作するステップと、第2の補助信号を取得するために、第1の補助信号を圧縮利得パラメータと組み合わせるステップと、圧縮されたオーディオ信号を取得するために、入力オーディオ信号を第2の補助信号と組み合わせるステップとを含む。したがって、単一の圧縮利得パラメータを使用するデジタル圧縮方法が提供され得る。
デジタル圧縮方法は、そのような第1の態様または第1の態様の任意の実装形態によるデジタルコンプレッサによって実行され得る。デジタル圧縮方法の他の特徴は、そのような第1の態様または第1の態様の任意の実装形態によるデジタルコンプレッサの機能から直接的に生じ得る。
第3の態様によると、本発明は、コンピュータで実行されたときに、そのような第2の態様によりデジタル圧縮方法を実行するためのプログラムコードを含むコンピュータプログラムに関する。したがって、デジタル圧縮方法は、自動的かつ反復可能な方法で適用され得る。
コンピュータプログラムは、機械可読のプログラムコードの形態で提供され得る。プログラムコードは、コンピュータのプロセッサに対する一連のコマンドを含むことができる。コンピュータのプロセッサは、プログラムコードを実行するように構成され得る。
本発明は、ハードウェアおよび/またはソフトウェアにおいて実装され得る。
本発明の他の実施形態について、以下の図に関して記述する。
実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサを示す図である。 実装形態により入力オーディオ信号を圧縮するためのデジタル圧縮方法を示す図である。 実装形態により入力オーディオ信号をフィルタするためのデジタルフィルタを示す図である。 実装形態により高ダイナミックレンジのオーディオ信号および圧縮されたオーディオ信号を示す図である。 実装形態によるダイナミックレンジ圧縮の原理を示す図である。 実装形態による指数関数型減衰を使用する時間的な平滑化を示す図である。 実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサを示す図である。 実装形態による異なる等ラウドネス曲線を示す図である。 実装形態により入力オーディオ信号をフィルタするためのデジタルフィルタを示す図である。 実装形態による人間の耳のラウドネスに対する感度をモデル化するために使用されるデジタルフィルタの周波数レスポンスを示す図である。 実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサを示す図である。 実装形態による等化フィルタの周波数レスポンスを示す図である。 実装形態による入力オーディオ信号に対するデジタルコンプレッサの効果を示す図である。 実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサを示す図である。 実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサを示す図である。 実装形態により入力オーディオ信号をフィルタするためのデジタルフィルタを示す図である。
図1は、実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサ100の図を示している。
デジタルコンプレッサ100は、圧縮利得パラメータを提供するための圧縮利得制御101と、圧縮利得パラメータから圧縮比を決定するための圧縮パラメータ決定器103であって、圧縮比を取得するために、所定の重み係数によって、圧縮利得パラメータに重み付けするように構成された圧縮パラメータ決定器103と、第1の補助信号を取得するために、圧縮比に依存して入力オーディオ信号を操作するための補助信号ジェネレータ105と、第2の補助信号を取得するために、第1の補助信号を圧縮利得パラメータと組み合わせ、圧縮されたオーディオ信号を取得するために、入力オーディオ信号を第2の補助信号と組み合わせるための結合器ユニット107とを含む。
入力オーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。入力オーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
圧縮利得制御101は、圧縮利得パラメータを提供するためにスライディング制御を含むことができる。圧縮利得パラメータは、対数目盛、たとえば0dB、3dB、6dB、または12dBで提供され得る。
圧縮パラメータ決定器103は、所定の重み係数によって圧縮利得パラメータに重み付けすることによって、圧縮利得パラメータから圧縮比を決定することができる。圧縮比は、線形目盛、たとえば1、2、5、または10で提供され得る。所定の重み係数は、対数目盛、たとえば2dB、または線形目盛、たとえば1.5で提供され得る。
補助信号ジェネレータ105は、第1の補助信号を取得するために、圧縮比に依存して入力オーディオ信号を操作することができる。操作は、入力オーディオ信号からの第1の補助信号の導出に、または第1の補助信号を取得するための入力オーディオ信号の処理に関係する場合がある。第1の補助信号は、時間依存の実数値の信号の場合がある。
結合器ユニット107は、第2の補助信号を取得するために、第1の補助信号を圧縮利得パラメータと組み合わせることができる。結合器ユニット107は、圧縮されたオーディオ信号を取得するために、入力オーディオ信号を第2の補助信号とさらに組み合わせることができる。第2の補助信号は、時間依存の実数値の信号の場合がある。
圧縮されたオーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。圧縮されたオーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。圧縮されたオーディオ信号のダイナミックレンジは、入力オーディオ信号のダイナミックレンジに関して縮小され得る。
図2は、実装形態により入力オーディオ信号を圧縮するためのデジタル圧縮方法200の図を示している。
デジタル圧縮方法200は、圧縮利得パラメータを提供するステップ201と、圧縮比を取得するために所定の重み係数によって、圧縮利得パラメータに重み付けすることによって、圧縮利得パラメータから圧縮比を決定するステップ203と、第1の補助信号を取得するために、圧縮比に依存して入力オーディオ信号を操作するステップ205と、第2の補助信号を取得するために、第1の補助信号を圧縮利得パラメータと組み合わせるステップ207と、圧縮されたオーディオ信号を取得するために、入力オーディオ信号を第2の補助信号と組み合わせるステップ209とを含む。
デジタル圧縮方法200は、図1のデジタルコンプレッサ100によって実行され得る。デジタル圧縮方法200の他の特徴は、図1のデジタルコンプレッサ100の機能から直接的に生じ得る。
図3は、実装形態により入力オーディオ信号をフィルタするためのデジタルフィルタ300の図を示している。
補助信号ジェネレータは、デジタルフィルタ300によって入力オーディオ信号をフィルタするように構成され得て、デジタルフィルタ300は、周波数を通じて強度を持つ周波数伝達関数を含み、強度は、人間の耳の等ラウドネス曲線によって形成される。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
図4は、実装形態による、高ダイナミックレンジオーディオ信号および圧縮されたオーディオ信号の図を示している。左側において、ピーク振幅1のオリジナルの高ダイナミックレンジオーディオ信号が描写されている。右側において、ピーク振幅1だが縮小されたダイナミックレンジの圧縮されたオーディオ信号が描写されている。
タブレットまたはスマートフォンなどのモバイルデバイスは、典型的には、小型で低品質のマイクロスピーカおよび低出力の増幅器を装備している。その結果、そのようなデバイスの電気音響システムによって再生され得る音の品質は制限され得る。特に、作られ得る最大音圧レベルは制限され得る。この結果として、より高いレベルおよび制限されたダイナミックレンジの信号歪みが生じる可能性がある。
さらに、そのようなデバイスは、多くの場合、高い出力レベルが要求される可能性がある騒々しい環境において音を再生するために使用される。さらに、スピーカ間の短い距離を補償するためにステレオ拡張(stereo widening)などの他の処理のために、最大出力レベルがさらに下がる可能性がある。
この問題の解決策の1つとして、より高品質のスピーカおよびより高い出力を備えた増幅器の統合があり得る。しかしながら、これには、小さなモバイルデバイスに統合できない場合があるより大きなスピーカおよびバッテリからより多くのエネルギを消費する増幅器が要求される可能性がある。したがって、そのようなモバイルデバイスによって作られた音響信号の認知されたラウドネスを増強することができる信号処理技術に対する需要がある場合がある。オーディオ信号のダイナミックレンジ圧縮(DRC)は、ラウドネス増強のための1つの技術になり得る。DRCの目標として、電気音響システムの能力によって課された制限内にピークエネルギを維持しながら、中間信号エネルギを増加させることがあり得る。この効果を達成するために、弱い信号成分のレベルを増強することが1つの戦略であり得る。
オーディオ信号のダイナミックレンジ圧縮の効果は、図4に示されている。左の図は、典型的な音楽の実施例の信号振幅を示している。定期的に発生する高振幅ピークは、典型的には、ドラムの打撃に対応する。信号は、電気音響システムによって扱われ得る最大振幅に対応し得るピーク振幅1を取得するために正規化され得る。デジタルオーディオ信号の振幅は、典型的には、間隔[-1;1]に抑制される。これらの制限を超える振幅の結果として、クリッピングが生じる場合がある。すなわち、それらはこの制限へと制限され得る。これにより高い信号歪みが生じる場合がある。このピーク振幅は、高ダイナミックレンジのオーディオ信号にまれにしか発生しない場合があるため、信号の全体的な出力レベルを限定する可能性がある。信号の大部分は、低振幅を持つ可能性がある。この信号に対して実行されたダイナミックレンジ圧縮動作の結果として、図4の右側の振幅プロットが得られる。結果として生じる信号のピーク振幅は、今までどおり1の可能性があるが、認知される平均的なラウドネスを規定する中間振幅は、はるかに高い可能性がある。特に、低振幅を有する成分は、大きく増強され得る。低エネルギ成分と高エネルギ成分の比率として規定され得るダイナミックレンジは、縮小することができる。
図5は、例示的な実装形態によるダイナミックレンジ圧縮原理の図を示している。ピーク振幅検出に基づく静的な圧縮カーブを使用するダイナミックレンジ圧縮の基本原理が示されている。圧縮なしの場合については、実線で示されている。-15dBの圧縮しきい値および3:1の圧縮比を使用する圧縮の場合は、破線で示されている。
入力信号のxと圧縮された信号χcの間の伝達関数は、以下の振る舞いを示している。入力信号xのレベルがdBで指定された所与のしきい値Tを下回る場合、それは修正されない。圧縮された信号χcは、xと同一である。入力信号xのレベルがしきい値Tを超える場合、χcは、所与の圧縮比Rだけ低減される。圧縮比は、入力信号のレベルまたはレベル変更を出力信号のレベルまたはレベル変更に関連づけるものである。この実施例では、R=3の圧縮比は、入力信号において3dBだけしきい値Tを超えるレベルは、出力信号においてしきい値を1dBのみ上回るレベルに減らされることを示している。その結果、圧縮された信号のレベルPχcは、時間変化利得g(t)により、入力信号のレベルPxと比較して下がる。
等式1は、以下のように与えられ得る。
Figure 2016530765
これは、ダイナミックレンジ圧縮の基本原理であり得る。DRCは、音楽の録音および生産において重要なテーマになり得るため、アナログ領域においてさえ、多くの異なる実装および拡張が適用され得る。特に、図5に示す区分的線形圧縮カーブは、たとえば、屈曲部(knee)を伴う柔軟な圧縮カーブ、またはシグモイドなど飽和する圧縮カーブと取り替えられ得る。
図6は、実装形態により指数関数型減衰を使用する時間的な平滑化の図を示している。指数関数型減衰を使用する時間的な平滑化は、アタックおよび/または減衰の時間をモデル化するのに用いられ得る。実線は、Pxを示している。破線は、30msのアタックフィルタ時間定数および150msのリリースフィルタ時間定数を使用するPSを示している。
出力信号のレベルが迅速に変化しすぎる可能性があるので、時間的な平滑化なしで、ダイナミックレンジ圧縮は多くのアーティファクトを導入できる。出力信号は、入力信号の特性に似ていない場合がある。DRCの可聴アーティファクトを低減するために、圧縮利得は、ゆっくり変化している可能性がある。
この効果を達成する手法として、図6に示されるようにアタックおよびリリースの時間に対する指数関数型減衰を追加することによって、ピーク振幅の検出を平滑化することがあり得る。アタック、インデックスA、およびリリース、インデックスRに対して異なる時間定数τARを指定することで、音響イベントの異なる状態において平滑作用を制御することを可能にすることができる。アタックは、信号レベルにおける増加に付随するイベントの開始を表すことができる。リリースは、典型的により遅いこのイベントのエネルギ減衰を表すことができる。アタックおよびリリースに対する指数関数型減衰は、以下のように計算され得る。
τARは、アタックおよびリリースに対して終値の63%に到達するための時間として規定され得る:
αR=e-1/τRおよびαA=e-1/τA
等式2は、以下のように与えられ得る。
Figure 2016530765
次いで、Ps(t)は、Pχ(t)に代わる時間変化利得g(t)の演算のために、等式1または2で使用され得る。
たとえば、分断(decoupled)、分岐(branching)、フィードフォワード、フィードバック、サイドチェーン、バイアス、および/またはポスト利得の実装など、異なる実装が使用され得る。
時間的に平滑化するパラメータ設定は、関連する場合があり、圧縮の量とオーディオ品質、すなわちアーティファクトの間のトレードオフをなす可能性がある。特に、それらは、ドラムまたは過渡の結果として生じる振幅ピークが、どのように影響され得るかに影響する可能性がある。長いリリース時間定数の場合には、ピークまたは過渡の後に、信号は、長い間、減衰され得る可能性があり、Pyは、低減されすぎる可能性がある。短いリリース時間定数の場合には、過渡の後に信号レベルのジャンプが発生する可能性がある。長いアタック時間定数の場合には、過渡は、アタック時間より短い可能性があるため減衰されない場合があり、ピークレベルは、それまでどおり高い可能性がある。短いアタック時間定数の場合には、過渡はつぶされる(squash)場合があり、明瞭さの欠如につながり、レベルが下げられすぎる可能性があり、過渡のレベルは、過渡の直前の信号のレベルと同じ可能性がある。
異なるソリューションがDRCに対して適用され得る。DRCアルゴリズムを評価するための主な4つの基準は、音質、圧縮率、計算の複雑度、およびユーザの可制御性であり得る。高圧縮は、典型的には、低い音質につながり得るため、圧縮と品質の間にトレードオフがある可能性がある。たとえば、過渡またはアタックなど、波形のピークは、高圧縮利得を取得するために減衰され得る。この結果として、知覚できる明瞭さの欠如につながり得る。たとえば、テレビおよびラジオ放送で使用されるような高品質のダイナミックレンジ圧縮システムは、典型的には、周波数領域において、またはフルバンド信号のサブバンド分解に対して機能することができる。この結果として、高い計算の複雑度につながり得る。特にモバイルデバイスについては、計算およびエネルギのリソースは制限され得る。
パラメータ設定は、高いオーディオ品質を維持しながら、大量の圧縮を取得することに適している可能性がある。最適なパラメータ設定は、また、特定のオーディオ信号および聴取環境に依存する可能性がある。消費者デバイスのアプリケーションに対して、パラメータは、典型的には、控えめなまたは最適度が低い設定を使用して事前規定され得る。ユーザは、オンまたはオフを除いていかなる制御機構も持たない場合がある。
図7は、実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサ100の図を示している。デジタルコンプレッサ100は、ダイナミックレンジ圧縮システムを含むことができる。
デジタルコンプレッサ100は、圧縮利得制御101、圧縮パラメータ決定器103、補助信号ジェネレータ105、結合器ユニット107、等化フィルタ701およびピークリミッタ703を含む。圧縮パラメータ決定器103は、パラメータの指定に使用され得る。圧縮パラメータ決定器103は、補助信号ジェネレータ105に、圧縮しきい値、圧縮比、アタックフィルタ時間定数、およびリリースフィルタ時間定数を提供することができる。補助信号ジェネレータ105は、デジタルフィルタ300および利得推定ユニット705を含むことができる。
多くの手法が音楽制作アプリケーションに焦点を当てている。本発明の実施形態は、特にモバイル音声再生シナリオに取り組むものであり、目標は、高い音質および低い計算の複雑度、および低電力消費または低バッテリ電力消費を維持しながら、リアルタイムにスマートフォンおよび/またはタブレットなど、モバイルデバイスのスピーカによって作られる平均出力レベルを増加させることであり得る。
本発明の実施形態は、たとえば、図7に示すような拡張されたデジタルコンプレッサ100またはダイナミックレンジ圧縮システムに関する。デジタルコンプレッサ100またはシステムは、人間の耳の感度の周波数特性を考慮するために人間の音知覚のモデルを含むことができる。すなわち、フィルタ等価ラウドネスモジュールである。デジタルコンプレッサ100またはシステムは、信号の明瞭さを維持しながら過渡のレベルを下げるために直列化されたダイナミックレンジ圧縮システムを含むことができる。すなわち、ピークリミッタモジュールを用いて直列化されたダイナミックレンジ圧縮モジュールである。デジタルコンプレッサ100またはシステムは、継続的な方法でユーザまたは消費者によって制御され得る圧縮利得Gに対する単一の制御パラメータを含むことができる。デジタルコンプレッサ100またはシステムは、モバイルデバイスのリアルタイムアプリケーションに対する時間領域において複雑度の低いフルバンド実装を含むことができる。
デジタルコンプレッサ100またはシステムのフローチャートを図7に描写している。入力信号のx(t)を想定すると、デジタルコンプレッサ100またはシステムは、以下のステップを実行することができる。
最初に、デジタルフィルタ300またはフィルタ等価ラウドネスモジュールが適用され得る。すなわち、ラウドネスが等価された入力信号xl(t)を取得するために、等ラウドネス曲線を用いて入力信号x(t)をフィルタすることによって、簡素化されたラウドネスモデルを適用する前処理演算である。前処理の目標は、人間の耳がそれほど感度がよくない信号の周波数を強調することであり得る。第2に、ダイナミックレンジ圧縮モジュールが適用され得る。それは、圧縮パラメータ決定器103またはパラメータ指定モジュールを含むことができる。外部的に、たとえば、ユーザが指定した望まれる圧縮利得をdBで想定すると、内部ダイナミックレンジ圧縮パラメータT,R,τARは、最適な方法で調整され得る。それは、ラウドネスが等価された入力信号xl(t)から時間変化利得g(t)を推定することができる利得推定ユニット705または利得推定モジュールをさらに含むことができる。取得された圧縮は、人間の耳がそれほど感度がよくない区域に対応できる等化によって強調された区域においてより強くなる可能性がある。その結果、ダイナミックレンジ圧縮のアーティファクトは、可聴性が低くなり得、より強い圧縮が適用され得る。入力信号x(t)のダイナミックレンジ圧縮は、圧縮信号xc(t)を取得するために、信号x(t)に時間変化利得g(t)および望まれる圧縮利得Gを適用することによって実行され得る。第3に、周波数依存の圧縮に対して補正し、信号xe(t)の平坦な周波数レスポンスを再作成するために、xc(t)に等化を適用することができる等化フィルタ701または等化モジュールが任意に適用され得る。これは、また、スピーカの周波数レスポンスを考慮に入れることができる。第4に、ピークリミッタ703が任意に適用され得る。出力信号y(t)を取得するために強いアタック段階においてクリッピングを防ぐために、ピークおよび/または過渡のソフトリミッティングが適用され得る。
図8は、実装形態による異なる等ラウドネス曲線の図を示している。
耳は、すべての周波数に等しく感度がよいとはかぎらない場合がある。図8は、等しいラウドネスとして認知された音圧のレベルを示す1組の曲線として、全体的な可聴範囲を通じて異なる周波数に対する応答を示している。低周波数および高周波数に対して、音圧のレベルは、中央周波数と同じ認知されたラウドネスを取得するためにはるかに高い場合がある。曲線は、4kHzのくぼみを有する2から5kHzまでの範囲において最低の場合があり、耳は、この範囲の周波数に最も感度がよい可能性があることを示している。同じ印象のラウドネスを作成するために、より高いか、またはより低い音の強さのレベルを実質的に上げることができる。この発見は、出力信号のより高い音質を達成するために利用され得る。考え方は、人間の耳がそれほど感度がよくない周波数域においてより強いダイナミックレンジ圧縮を適用することであり得る。
図9は、実装形態により入力オーディオ信号をフィルタするためのデジタルフィルタ300の図を示している。デジタルフィルタ300は、フィルタ等価ラウドネスモジュールを含むことができる。
デジタルフィルタ300は、決定ユニット901およびフィルタリングユニット903を含むことができる。決定ユニット901は、フィルタパラメータ指定に使用され得て、等ラウドネス曲線は、フィルタパラメータを取得するために決定ユニット901に提供され得る。フィルタリングユニット903は、ラウドネスが等価された信号xl(t)を取得するために、フィルタパラメータに基づいて入力信号x(t)をフィルタすることができる。
ラウドネスモデルは、等ラウドネス曲線を用いてフィルタリングすることによって人間の耳の感度をモデル化するために適用され得る。これにより、人間の耳がそれほど感度がよくない周波数を増強することができ、人間の耳が非常に感度のよい周波数を減衰させることができる。
図10は、実装形態による人間の耳のラウドネス感度をモデル化するために使用されるデジタルフィルタの周波数レスポンスの図を示している。低周波数においては、増幅は制限され得て、スピーカによって再生されない場合がある。高周波数においては、増幅は制限され得て、典型的にはスピーカによって増強される。
以下の処理は、この効果を得るために使用され得る。図9を参照されたい。等ラウドネス曲線に似ているフィルタ応答を用いてフィルタリングを実行する。これにより、人間の耳がそれほど感度がよくない周波数においてレベルを増強することができ、人間の耳が非常に感度のよい周波数を減衰させることができる。次いで、続くダイナミックレンジ圧縮は、人間の耳がそれほど感度がよくない周波数域に集中され得る。すなわち、高周波数および低周波数である。その結果、圧縮アーティファクトは、可聴性が低くなる可能性がある。特に、周波数範囲2〜5kHzまたは2〜6kHzは、ダイナミックレンジ圧縮によってほとんど修正され得ない。この範囲は、音の明瞭さにとって最も重要たり得る。
図10に示すようなフィルタ応答は、等ラウドネス曲線に基づく場合があるが、複数の態様により修正され得る。マイクロスピーカの特性および能力を考慮すると、最低および最高の周波数の増幅は、上限を導入することによって制限され得る。この制限に対する動機は、小さなスピーカを使用する考慮されたアプリケーションシナリオに基づく場合がある。ここでは、最低周波数は、スピーカによって再生されない場合があり、高周波数は、典型的には、そのようなスピーカによって増幅され得る。増幅の制限は、これを考慮に入れる可能性がある。増幅の全体的な範囲、すなわちフィルタ応答の最小と最大の差は、ちょうど範囲15dBに限定され得る。図8から、単一の等ラウドネス曲線の音圧のレベルの最小値と最大値の間の差が、最大80dBに到達する可能性があることが見てとれる。ダイナミックレンジ圧縮では、しきい値Tは、典型的なアプリケーションシナリオでは、6から20dBの間の値に設定され得る。その結果、他と比較して80dBだけ特定の周波数を増幅することができる等化を適用することは、これらの周波数だけが高度に圧縮されることにつながり得る。しかしながら、他はしきい値に到達せず、したがって、全く圧縮されない場合がある。増幅の全体的な範囲を抑制することにより、異なる周波数域においてダイナミックレンジ圧縮の強度を制御することが可能になる場合がある。
図11は、実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサ100の図を示している。デジタルコンプレッサ100は、ダイナミックレンジ圧縮モジュールを含むことができる。
デジタルコンプレッサ100は、圧縮パラメータ決定器103、補助信号ジェネレータ105、および結合器ユニット107を含む。デジタルコンプレッサ100の圧縮利得制御は、図11に描写されていない。圧縮パラメータ決定器103は、パラメータの指定に使用され得る。圧縮パラメータ決定器103は、補助信号ジェネレータ105に、圧縮しきい値、圧縮比、アタックフィルタ時間定数、およびリリースフィルタ時間定数を提供することができる。補助信号ジェネレータ105は、利得推定ユニット705を含むことができる。ラウドネスが等価された信号xl(t)は、補助信号ジェネレータ105に提供され得る。入力オーディオ信号x(t)は、結合器ユニット107に提供され得る。圧縮されたオーディオ信号xc(t)は、結合器ユニット107によって提供され得る。
次に、ダイナミックレンジ圧縮は、図11に示すように入力信号に適用され得る。ダイナミックレンジ圧縮は、一般的な記述に従うことができ、同じ表記法を使用することができる。
第1に、たとえば、ユーザによって指定された望まれる圧縮利得パラメータGを想定すると、導入されるようなダイナミックレンジ圧縮のためのパラメータT、R、τA、τRは、以下のように導出することができる。目標は、Gのヘッドルームがxc(t)の最大振幅または振幅と、クリッピングなしで再生され得る最大値Pmaxの間で作成されるように信号を圧縮することであり得る。
Figure 2016530765
発見は、望まれる圧縮利得パラメータGを取得するために、RおよびTに対して異なる値が可能であることであり得る。しきい値を低下させることは、より高いGを取得することを可能にする可能性があるが、同時に、また、ダイナミックレンジ圧縮(DRC)によって影響される信号成分の量を増加させる可能性がある。圧縮比Rを増加させると、しきい値を上回る成分はより強く圧縮される可能性がある。知覚品質に関して最適であるRおよびTの値を選択することは、困難な作業の可能性がある。発見は、しきい値Tと圧縮比Rの間の特定の関係が、高品質を得るのに望ましいということである。さらに、大規模な聴取テストの結果、ほぼ
R≒G/(2dB)
である場合、ダイナミックレンジ圧縮の知覚品質は最適であることが明らかになった。
フィルタ時間定数または時間的な平滑化定数τA、τRは、高い知覚品質を取得するために重要になり得る時間的な継続性を保証するために、圧縮の量を減らすことによってDRC結果に影響する場合がある。その結果、達成される最終的な圧縮は、望まれるGより低い場合がある。平滑化がより強いほど、すなわち時間定数τA、τRが大きいほど、達成される圧縮は低くなる。最良の可能な知覚品質を得るために、フィルタ時間定数に対するパラメータ値は、望まれる圧縮利得パラメータGに依存して選択される。
τA≒-0.0002秒/dB・G+0.006秒
τR≒-0.0033秒/dB・G+0.12秒
知覚の聴取テストにより、フィルタ時間定数とGの間の線形の依存関係が、最良の結果につながることが明らかになった。Gの値を増加させるために、フィルタ時間定数は、直線的に低下させられ得る。
平滑化の結果、PS<Pχの場合がある。したがって、望まれる圧縮利得パラメータGが達成され得ることを保証するために、許容係数λ≧1の加算が望ましい場合がある。許容係数は、高速な過渡は、アタック減衰によって見落とされる(miss)ことがあり、高い信号のピークを生じる可能性があることを考慮に入れることができる。したがって、許容係数の値は、アタックフィルタ時間定数により選択され得る。
λ=1.122+65・1/秒・τA
最適なパラメータ設定を導出した後に、時間変化利得g(t)は、ラウドネスが等価された信号χl(t)から推定され得る。
Figure 2016530765
ここで
Figure 2016530765
および
αR=e-1/τR、αA=e-1/τA
最後に、利得は、望まれる圧縮利得パラメータGを掛けるか、または増幅することができ、最後に、ラウドネスが等価された信号にではなく、オリジナルの入力信号x(t)へと増大される。オリジナルの信号は、ラウドネスモデルによってではなく、ラウドネスを修正された利得によってのみ変更され得るため、これにより、最良の可能な品質を提供することができる。
χc(t)=χ(t)・10G/20・g(t)
図12は、実装形態による等化フィルタの周波数レスポンスの図を示している。
任意の後処理ステップとして、等化フィルタが信号に適用され得る。等化は、周波数依存のダイナミックレンジ圧縮を補償するために望まれる可能性がある。ラウドネスモデルによって拡張される周波数範囲は、より強く圧縮され得るため、ラウドネスモデルによって減衰される周波数より低いレベルを受信することができる。この手法により、ダイナミックレンジ圧縮は、人間の耳が圧縮アーティファクトにそれほど感度がよくない周波数範囲に集中され得ることを保証することができるが、平坦な周波数レスポンスを持たない出力信号が生じる可能性もある。この効果を補償するために、再び、等ラウドネス曲線の変化を有するフィルタリングが使用され得る。
図12に示すようなフィルタ応答は、利得g(t)の演算に影響を及ぼす等しいラウドネスに対する前処理フィルタから生じる非線形の圧縮を補償するために調整され得る。利得g(t)はラウドネスが等価された信号から導出されるが、オリジナルの入力信号に適用されるので、圧縮された信号は、典型的には、平坦な周波数レスポンスを持たない場合がある。特に、低周波数および高周波数は減衰され得る。図12に示すフィルタ応答は、しきい値T=12dBおよび2:1の比率を使用する例示的な圧縮の場合には、この効果を補償するために設計され得て、結果として6dBの圧縮利得Gが得られる。この場合、低周波数および高周波数は、平坦な周波数レスポンスを達成するために、約2dBだけ増幅され得る。Gの異なる値については、応答は直線的に変動させられ得る。
等化は、周波数依存のダイナミックレンジ圧縮を補償するために望ましい可能性がある。等ラウドネス曲線の変化を有するフィルタリングが使用され得る。潜在的に、等化は、圧縮利得に依存している。また、ターゲット出力デバイスは、等化を規定するために考慮され得る。
図13は、実装形態による入力オーディオ信号に対するデジタルコンプレッサの効果を示す図を示している。デジタルコンプレッサは、ダイナミックレンジ圧縮システムを含むことができる。第1の波形は、入力信号x(t)を示し、第2の波形は、ステップ3、すなわち等化後のオーディオ信号xe(t)を示し、第3の波形は、ステップ4、つまりピークリミッティング後のオーディオ信号y(t)を示している。
最終ステップとして、ピークリミッタは、出力信号においてクリッピングを防ぐために適用され得る。クリッピングは、可能な最大値Pmaxを超える信号の振幅を表すことができる。時間定数τR、τAを用いて実行される時間的な平滑化のために、高速で強い過渡、たとえばドラムの打撃は、圧縮されない場合がある。その結果、信号レベルの迅速な変更は、高い知覚品質または信号の明瞭さを保証するために重要な側面になり得る出力信号において維持され得る。しかしながら、これらのピークは、また、望まれる圧縮利得Gが、クリッピングを導入せずに達成され得ることを防ぐことができる。この問題の1つの簡単な解決策は、ダイナミックレンジ圧縮モジュールにおいて使用される時間定数を減少させることであり得る。しかし、これにより品質が低下する可能性がある。
最終的な処理ステップとしてピークリミッタを追加するときにクリッピングを回避しながら高音質が達成され得る。ピークリミッタは、信号の残りのピークにのみ影響するように調整され得るダイナミックレンジコンプレッサであり得る。このために、しきい値Tは、高いしきい値、たとえば、T=-1dBに設定され得て、圧縮比も、たとえば、R=60:1など高くなる可能性がある。アタックおよびリリース時間定数に対する小さな値と共に、これらの設定は、しきい値を超え、したがってクリッピングにつながるいかなるピークも、非常に大きな比率、たとえばR=60:1だけ圧縮され得ることを保証することができる。その結果、しきい値を超えるピークは、このしきい値を超えないことを保証するために、強く圧縮され得るか、またはソフトクリッピングされ得る。
ダイナミックレンジ圧縮モジュールによって実行される遅いダイナミックレンジ圧縮は、オーディオ信号の長期的および中期的な特性をゆっくり展開させることが、圧縮によって維持され得ること、および高速に反応するピークリミッタは、クリッピングを防ぐためだけにソフトクリッピングを実行できることを保証することができる。組み合わせると、信号品質、特に信号の明瞭さは、高圧縮利得を保証しながらも可能なかぎり維持され得る。
図13では、入力信号x(t)を等化後の圧縮された信号xe(t)だけでなく、ピークリミッティング後の最終出力信号y(t)と比較している。
ダイナミックレンジ圧縮の後に、信号の中期的なレベル特性は維持され得るが、[-1;+1]の振幅値を超えるピークは、信号xe(t)のままである可能性がある。これらは、最後に、信号y(t)を取得するためにピークリミッタによってソフトクリッピングされ得る。
図14は、実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサ100の図を示している。デジタルコンプレッサ100は、ダイナミックレンジ圧縮システムを含むことができる。
デジタルコンプレッサ100は、圧縮利得制御101と、内部パラメータ適応のための圧縮パラメータ決定器103と、ラウドネスモデルを使用する補助信号ジェネレータ105と、ダイナミックレンジ圧縮のための結合器ユニット107と、等化フィルタ701と、ピークリミッタ703とを含む。入力オーディオ信号は、補助信号ジェネレータ105および結合器ユニット107に提供され得る。圧縮された出力オーディオ信号は、ピークリミッタ703によって提供され得る。
簡素化されたラウドネスモデル、すなわち、等ラウドネス曲線を有するフィルタの適用は、人間の耳がそれほど感度がよくない周波数を強調することができる。ダイナミックレンジ圧縮が達成され得る。ラウドネスモデルのために、圧縮は、耳がそれほど感度がよくなく、圧縮アーティファクトの可聴性が低い可能性がある区域においてより強くなる可能性がある。周波数依存の圧縮を修正し、平坦な周波数レスポンスを再作成するために等化を適用することが望ましい場合がある。強いアタック段階においてクリッピングを防ぐためにピークリミッタが用いられ得る。
図15は、実装形態により入力オーディオ信号を圧縮するためのデジタルコンプレッサ100の図を示している。デジタルコンプレッサ100は、ダイナミックレンジ圧縮システムを含むことができる。
デジタルコンプレッサ100は、パラメータ指定のための圧縮パラメータ決定器103と、利得推定ユニット705を備えた補助信号ジェネレータ105と、結合器ユニット107とを含むことができる。圧縮パラメータ決定器103は、補助信号ジェネレータ105に、圧縮しきい値、圧縮比、アタックフィルタ時間定数、およびリリースフィルタ時間定数を提供することができる。ラウドネスが等価されたオーディオ信号は、補助信号ジェネレータ105に提供され得る。入力オーディオ信号は、結合器ユニット107に提供され得る。圧縮されたオーディオ信号y(t)は、結合器ユニット107によって提供され得る。
ダイナミックレンジ圧縮が達成され得る。利得は、ラウドネスが等価された信号から推定し、オリジナルの入力信号に適用され得る。ダイナミックレンジ圧縮のパラメータ設定の簡素化が望ましい場合がある。ユーザは、継続的な方法で望まれる圧縮利得Gを指定することができる。ダイナミックレンジ圧縮のためのパラメータT、R、τA、τRが導出可能であり、DRCアルゴリズムに提供され得る。PS<Pχである可能性があるので、許容係数λ≧1は、望まれる圧縮利得パラメータGを取得するために追加され得る。
図16は、実装形態により入力オーディオ信号をフィルタするためのデジタルフィルタ300の図を示している。デジタルフィルタ300は、フィルタ等価ラウドネスモジュールを含むことができる。
デジタルフィルタ300は、等ラウドネス曲線を使用する決定ユニット901、およびフィルタリングユニット903を含むことができる。フィルタリングユニット903は、ラウドネスが等価されたオーディオ信号を提供するために、入力オーディオ信号をフィルタすることができる。デジタルフィルタ300は、ラウドネスモデルに基づくことができる。
本発明は、特に、制限された電気音響システム、処理能力、および電力消費を備えるモバイルデバイスのアプリケーションに対して調整され得る。
より高音質が提供され得る。圧縮アーティファクトは、人間の耳の感度がより低い周波数範囲に集中され得る。低速圧縮および高速ピークリミッティングの組み合わせは、可能なかぎり、信号の低速および高速の成分の両方のオリジナルのプロパティを維持することができる。知覚の明瞭さが維持され得る。圧縮のユーザ制御可能な強度が提供され得る。望まれる圧縮利得を指定する単一の圧縮利得パラメータが用いられ得る。信号のコンテンツおよび/または聴取環境への適応は継続的に調整可能な場合がある。計算上の簡単な実装が提供され得る。周波数領域の代わりにフルバンド処理および/またはサブバンド処理が用いられ得る。周波数変換および/またはサブバンド分解が用いられ得ないため、低遅延が達成され得る。
実装形態では、本発明は、人間の耳の感度の周波数特性を考慮するための、人間の音知覚のフルバンドモデルを含むオーディオ信号の拡張されたダイナミックレンジ圧縮、ならびに、信号の明瞭さを維持しながら過渡のレベルを下げるための直列化されたダイナミックレンジ圧縮およびソフトクリッピングシステムのための方法および装置に関する。
実装形態では、本発明は、ユーザに継続的な方法で圧縮利得に対する単一の制御パラメータを制御させるユニットと、指定された圧縮利得パラメータから最適なパラメータ設定を導出する内部変換器とをさらに含む方法および装置に関する。
実装形態では、本発明は、端末および/または復号器の機能に関する。
100 デジタルコンプレッサ
101 圧縮利得制御
103 圧縮パラメータ決定器
105 補助信号ジェネレータ
107 結合器ユニット
300 デジタルフィルタ
701 等化フィルタ
703 ピークリミッタ
705 利得推定ユニット
901 決定ユニット
903 フィルタリングユニット

Claims (15)

  1. 入力オーディオ信号を圧縮するためのデジタルコンプレッサ(100)であって、
    圧縮利得パラメータを提供するための圧縮利得制御(101)と、
    前記圧縮利得パラメータから圧縮比を決定するための圧縮パラメータ決定器(103)であって、前記圧縮比を取得するために所定の重み係数によって、前記圧縮利得パラメータに重み付けするように構成されている圧縮パラメータ決定器(103)と、
    第1の補助信号を取得するために前記圧縮比に依存して前記入力オーディオ信号を操作するための補助信号ジェネレータ(105)と、
    第2の補助信号を取得するために前記第1の補助信号を前記圧縮利得パラメータと組み合わせ、前記圧縮されたオーディオ信号を取得するために前記入力オーディオ信号を前記第2の補助信号と組み合わせるための結合器ユニット(107)と
    を含むデジタルコンプレッサ(100)。
  2. 前記圧縮パラメータ決定器(103)は、以下の等式
    R=G/KまたはR≒G/K
    により前記圧縮比を決定するように構成され、
    Gは、前記圧縮利得パラメータを示し、Kは、前記所定の重み係数を示し、Rは、前記圧縮比を示している請求項1に記載のデジタルコンプレッサ(100)。
  3. 前記圧縮パラメータ決定器(103)は、以下の等式
    τA=A1・G+A2
    により前記圧縮利得パラメータからアタックフィルタ時間定数を決定するようにさらに構成され、
    Gは、対数目盛での前記圧縮利得パラメータを示し、A1は、第1の所定のアタック定数を示し、A2は、第2の所定のアタック定数を示し、τAは、前記アタックフィルタ時間定数を示し、前記補助信号ジェネレータ(105)は、前記第1の補助信号を取得するために、前記アタックフィルタ時間定数に依存して前記入力オーディオ信号をフィルタするように構成される
    請求項1または2に記載のデジタルコンプレッサ(100)。
  4. 前記圧縮パラメータ決定器(103)は、以下の等式
    τR=B1・G+B2
    により前記圧縮利得パラメータからリリースフィルタ時間定数を決定するようにさらに構成され、
    Gは、対数目盛での前記圧縮利得パラメータを示し、B1は、第1の所定のリリース定数を示し、B2は、第2の所定のリリース定数を示し、τRは、前記リリースフィルタ時間定数を示し、前記補助信号ジェネレータ(105)は、前記第1の補助信号を取得するために前記リリースフィルタ時間定数に依存して前記入力オーディオ信号をフィルタするように構成される
    請求項1から3のいずれか一項に記載のデジタルコンプレッサ(100)。
  5. 前記圧縮パラメータ決定器(103)は、以下の等式
    T=Pmax-G・λ(1+1/R)
    により前記圧縮利得パラメータから圧縮しきい値を決定するようにさらに構成され、
    Gは、対数目盛での前記圧縮利得パラメータを示し、λは、許容係数を示し、Rは、前記圧縮比を示し、Pmaxは、対数目盛での前記入力オーディオ信号の最大強度を示し、Tは、対数目盛での前記圧縮しきい値を示し、前記補助信号ジェネレータ(105)は、前記第1の補助信号を取得するために前記入力オーディオ信号を前記圧縮しきい値と比較するように構成される
    請求項1から4のいずれか一項に記載のデジタルコンプレッサ(100)。
  6. 前記補助信号ジェネレータ(105)は、デジタルフィルタ(300)によって前記入力オーディオ信号をフィルタするように構成され、前記デジタルフィルタ(300)は、周波数を通じて強度を持つ周波数伝達関数を含み、前記強度は、人間の耳の等ラウドネス曲線によって形成される請求項1から5のいずれか一項に記載のデジタルコンプレッサ(100)。
  7. 前記補助信号ジェネレータ(105)は、デジタル低域フィルタによって前記入力オーディオ信号をフィルタするように構成され、前記デジタル低域フィルタは、時間領域においてフィルタステップ応答を含む請求項1から6のいずれか一項に記載のデジタルコンプレッサ(100)。
  8. 前記デジタル低域フィルタは、以下の等式
    Figure 2016530765
    および
    αR=e-1/τR、αA=e-1/τA
    により前記入力オーディオ信号をフィルタするように構成され、
    τAは、前記アタックフィルタ時間定数を示し、τRは、前記リリースフィルタ時間定数を示し、αAは、指数関数的なアタック定数を示し、αRは、指数関数的なリリース定数を示し、tは、サンプリング時間インデックスを示し、PXは、対数目盛での前記入力オーディオ信号の強度を示し、PSは、対数目盛での前記フィルタされたオーディオ信号の強度を示している
    請求項7に記載のデジタルコンプレッサ(100)。
  9. 前記補助信号ジェネレータ(105)は、以下の等式
    Figure 2016530765
    により前記第1の補助信号の強度を決定するように構成され、
    Rは、前記圧縮比を示し、Tは、対数目盛での圧縮しきい値を示し、PSは、対数目盛での前記入力オーディオ信号の強度を示し、tは、時間を示し、g(t)は、対数目盛での前記第1の補助信号の強度を示している
    請求項1から8のいずれか一項に記載のデジタルコンプレッサ(100)。
  10. 前記結合器ユニット(107)は、前記第2の補助信号を取得するために前記第1の補助信号に前記圧縮利得パラメータを掛けるように構成される請求項1から9のいずれか一項に記載のデジタルコンプレッサ(100)。
  11. 前記結合器ユニット(107)は、前記圧縮されたオーディオ信号を取得するために前記入力オーディオ信号に前記第2の補助信号を掛けるように構成される請求項1から10のいずれか一項に記載のデジタルコンプレッサ(100)。
  12. 前記圧縮されたオーディオ信号をフィルタするための等化フィルタ(701)であって、周波数を通じて強度を持つ周波数伝達関数を含む等化フィルタ(701)をさらに含み、前記強度は、人間の耳の等ラウドネス曲線によって形成される請求項1から11のいずれか一項に記載のデジタルコンプレッサ(100)。
  13. 時間領域において前記圧縮されたオーディオ信号の最大強度を低減するためのピークリミッタ(703)をさらに含む請求項1から12のいずれか一項に記載のデジタルコンプレッサ(100)。
  14. 入力オーディオ信号を圧縮するためのデジタル圧縮方法(200)であって、
    圧縮利得パラメータを提供するためのステップ(201)と、
    前記圧縮比を取得するために、所定の重み係数によって前記圧縮利得パラメータに重み付けすることによって、前記圧縮利得パラメータから圧縮比を決定するステップ(203)と、
    第1の補助信号を取得するために、前記圧縮比に依存して前記入力オーディオ信号を操作するステップ(205)と、
    第2の補助信号を取得するために、前記第1の補助信号を前記圧縮利得パラメータと組み合わせるステップ(207)と、
    前記圧縮されたオーディオ信号を取得するために、前記入力オーディオ信号を前記第2の補助信号と組み合わせるステップ(209)と
    を含むデジタル圧縮方法(200)。
  15. コンピュータで実行されたときに、請求項14に記載のデジタル圧縮方法(200)を実行するためのプログラムコードを含むコンピュータプログラム。
JP2016524706A 2014-01-30 2014-01-30 オーディオ信号を圧縮するためのデジタルコンプレッサ Active JP6388457B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2014/051795 WO2015113602A1 (en) 2014-01-30 2014-01-30 A digital compressor for compressing an audio signal

Publications (2)

Publication Number Publication Date
JP2016530765A true JP2016530765A (ja) 2016-09-29
JP6388457B2 JP6388457B2 (ja) 2018-09-12

Family

ID=50030299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016524706A Active JP6388457B2 (ja) 2014-01-30 2014-01-30 オーディオ信号を圧縮するためのデジタルコンプレッサ

Country Status (10)

Country Link
US (1) US9985597B2 (ja)
EP (1) EP2995000B1 (ja)
JP (1) JP6388457B2 (ja)
KR (1) KR101855969B1 (ja)
CN (1) CN105612692B (ja)
BR (1) BR112016001809A2 (ja)
ES (1) ES2627227T3 (ja)
MX (1) MX356305B (ja)
PL (1) PL2995000T3 (ja)
WO (1) WO2015113602A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022521811A (ja) * 2019-03-14 2022-04-12 ブームクラウド 360 インコーポレイテッド 優先度を持つ空間認識マルチバンド圧縮システム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10236850B2 (en) * 2016-06-15 2019-03-19 Ess Technology, Inc. Signal processor using multiple frequency bands
KR102356625B1 (ko) * 2017-06-19 2022-01-28 삼성전자주식회사 아날로그 출력의 특성을 향상시키기 위해 이득 제어 및 이득 압축을 수행하는 전자 회로 및 그것을 포함하는 전자 장치
CN107277042B (zh) * 2017-07-21 2020-08-07 中国地质大学(武汉) 一种信号压缩传输的方法、装置及其存储装置
US11011180B2 (en) * 2018-06-29 2021-05-18 Guoguang Electric Company Limited Audio signal dynamic range compression
JP7344058B2 (ja) * 2019-09-10 2023-09-13 株式会社東海理化電機製作所 制御装置、制御方法、及びプログラム
JP7252866B2 (ja) * 2019-09-10 2023-04-05 株式会社東海理化電機製作所 制御装置、制御方法、及びプログラム
CN113470692B (zh) * 2020-03-31 2024-02-02 抖音视界有限公司 音频处理方法、装置、可读介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09130184A (ja) * 1995-08-28 1997-05-16 Victor Co Of Japan Ltd デジタル信号処理装置
JPH11225398A (ja) * 1998-02-05 1999-08-17 Matsushita Electric Ind Co Ltd ラウドネス調整方法および補聴器
US20050175194A1 (en) * 2004-02-06 2005-08-11 Cirrus Logic, Inc. Dynamic range reducing volume control
JP2008131646A (ja) * 2006-11-17 2008-06-05 Akg Acoustics Gmbh オーディオコンプレッサ
JP2010130288A (ja) * 2008-11-27 2010-06-10 Yamaha Corp 増幅器
JP2013512632A (ja) * 2009-12-09 2013-04-11 ヴェーデクス・アクティーセルスカプ 補聴器における信号処理方法,補聴器をフィッティングする方法および補聴器
WO2014011959A2 (en) * 2012-07-12 2014-01-16 Dts, Inc. Loudness control with noise detection and loudness drop detection

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5706352A (en) * 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US6757396B1 (en) * 1998-11-16 2004-06-29 Texas Instruments Incorporated Digital audio dynamic range compressor and method
GB2409389B (en) * 2003-12-09 2005-10-05 Wolfson Ltd Signal processors and associated methods
CN101048935B (zh) * 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
CN103533485A (zh) * 2006-03-22 2014-01-22 日本电气株式会社 音频电路
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09130184A (ja) * 1995-08-28 1997-05-16 Victor Co Of Japan Ltd デジタル信号処理装置
JPH11225398A (ja) * 1998-02-05 1999-08-17 Matsushita Electric Ind Co Ltd ラウドネス調整方法および補聴器
US20050175194A1 (en) * 2004-02-06 2005-08-11 Cirrus Logic, Inc. Dynamic range reducing volume control
JP2008131646A (ja) * 2006-11-17 2008-06-05 Akg Acoustics Gmbh オーディオコンプレッサ
JP2010130288A (ja) * 2008-11-27 2010-06-10 Yamaha Corp 増幅器
JP2013512632A (ja) * 2009-12-09 2013-04-11 ヴェーデクス・アクティーセルスカプ 補聴器における信号処理方法,補聴器をフィッティングする方法および補聴器
WO2014011959A2 (en) * 2012-07-12 2014-01-16 Dts, Inc. Loudness control with noise detection and loudness drop detection

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022521811A (ja) * 2019-03-14 2022-04-12 ブームクラウド 360 インコーポレイテッド 優先度を持つ空間認識マルチバンド圧縮システム
JP7354275B2 (ja) 2019-03-14 2023-10-02 ブームクラウド 360 インコーポレイテッド 優先度を持つ空間認識マルチバンド圧縮システム

Also Published As

Publication number Publication date
CN105612692B (zh) 2018-06-26
EP2995000A1 (en) 2016-03-16
CN105612692A (zh) 2016-05-25
ES2627227T3 (es) 2017-07-27
MX2016001168A (es) 2016-04-29
EP2995000B1 (en) 2017-03-29
KR20160014027A (ko) 2016-02-05
PL2995000T3 (pl) 2017-09-29
KR101855969B1 (ko) 2018-06-25
MX356305B (es) 2018-05-23
US20160211821A1 (en) 2016-07-21
BR112016001809A2 (pt) 2017-08-01
US9985597B2 (en) 2018-05-29
JP6388457B2 (ja) 2018-09-12
WO2015113602A1 (en) 2015-08-06

Similar Documents

Publication Publication Date Title
JP6388457B2 (ja) オーディオ信号を圧縮するためのデジタルコンプレッサ
US9712916B2 (en) Bass enhancement system
JP2017506038A (ja) オーディオ信号を圧縮するためのオーディオ圧縮システム
US9171552B1 (en) Multiple range dynamic level control
US9055367B2 (en) Integrated psychoacoustic bass enhancement (PBE) for improved audio
US20170294890A1 (en) System and method for dynamic equalization of audio data
CN108989950B (zh) 自适应低音处理系统
JP2015177290A (ja) レベル調整方法およびレベル調整装置
EP4074068A1 (en) Multiband limiter modes and noise compensation methods
EP3379847B1 (en) Audio device, speaker device, and audio signal processing method
JP2006324786A (ja) 音響信号処理装置およびその方法
US9900689B2 (en) Adaptive detector and auto mode for dynamics processor
CN115312071A (zh) 一种语音数据的处理方法、装置、电子设备和存储介质
Stedman Technology review of dynamic range compression
JP2009094991A (ja) 包絡線生成技術

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180813

R150 Certificate of patent or registration of utility model

Ref document number: 6388457

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250