JP2020517179A - 入力音響信号を処理する装置および対応する方法 - Google Patents

入力音響信号を処理する装置および対応する方法 Download PDF

Info

Publication number
JP2020517179A
JP2020517179A JP2019555777A JP2019555777A JP2020517179A JP 2020517179 A JP2020517179 A JP 2020517179A JP 2019555777 A JP2019555777 A JP 2019555777A JP 2019555777 A JP2019555777 A JP 2019555777A JP 2020517179 A JP2020517179 A JP 2020517179A
Authority
JP
Japan
Prior art keywords
volume
determined
lra
acoustic signal
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019555777A
Other languages
English (en)
Other versions
JP6833062B2 (ja
Inventor
マバンデ,エドウィン
ケッヒ,ファビアン
クラツシュマー,ミハエル
マイヤー,ミハエル
ノイゲバウアー,ベルンハルト
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2020517179A publication Critical patent/JP2020517179A/ja
Application granted granted Critical
Publication of JP6833062B2 publication Critical patent/JP6833062B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • H03G3/301Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers the gain being continuously variable
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G2201/00Indexing scheme relating to subclass H03G
    • H03G2201/10Gain control characterised by the type of controlled element
    • H03G2201/103Gain control characterised by the type of controlled element being an amplifying element

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

入力音響信号(100)を処理する装置(1)は、入力音響信号(100)の音量を評価して音量範囲(LRAin)および実際の音量値を決定する評価器(10)を備えている。計算機(11)は、決定された音量範囲(LRAin)と、目標音量範囲(LRAdes)と、決定された実際の音量値とに基づいて、圧縮機伝達関数を決定する。計算機(11)はさらに、決定された圧縮機伝達関数に基づいて少なくとも1つの音量範囲制御ゲインを決定する。調整器(12)は、入力音響信号(100)と少なくとも1つの決定された音量範囲制御ゲインとに基づいて出力音響信号(101)を提供する。計算機(11)は、出力音響信号(101)の平均音量(μout)と入力音響信号(100)の平均音量(μin)との差が最小になるように、圧縮機伝達関数を決定するように構成されている。対応する方法も提供される。【選択図】図3

Description

本発明は、入力音響信号を処理する装置に関する。本発明はまた、対応する方法およびコンピュータプログラムにも関する。
本発明は、音響信号を処理する分野に関し、より具体的には、音響信号の音量範囲を制御する、すなわち、所望の目標音量範囲に一致するように音響信号の音量範囲を調整するアプローチに関する。
音量範囲[1]は、音響信号の強弱の尺度である。[1]に記載されているように、本出願の意味において、音量範囲は、時間変化する音量測定値の変動を定量化する。したがって、音量範囲は、測定された瞬間音量値の統計的分布を表す。
音量範囲を制御することは、幅広いシナリオ、例えば、
・音響再生システムの機能に制約がある装置での再生、
・深夜モードなどの特別な表示モードでの再生、
・周囲ノイズが高い環境での再生、
・リアルタイムの音量正規化のための前処理、
の場合に望ましい。
音響信号の音量範囲を制御して目標音量範囲を達成できる方法は、ここでは音量範囲制御(Loudness Range Control:LRAC)法と呼ばれる。文献では、大部分の方法が音響信号のダイナミックレンジの制御、つまりダイナミック・レンジ・コントロール(Dynamic Range Control:DRC)を求めている。音量範囲の定義は標準化されている[1]が、ダイナミックレンジの定義は時々異なる。もちろん、ダイナミックレンジの制御は、音量範囲の制御に関連している。したがって、簡単にするために、両方をLRAC法として扱うことができる。
自動ゲイン制御(Automatic gain control:AGC)は、音響信号の全体的なレベルの制御に関連する方法を表す。ゲインは通常、時間変化するという事実により、これは通常、ダイナミックレンジの変更につながり、つまり、ダイナミックレンジは通常減少する。ただし、ダイナミックレンジの変化量は予測できず、つまり、出力信号のダイナミックレンジは不明であり、望ましい方法で制御することはできない。
もちろん、予め選択された固定の伝達関数(プロファイルとも呼ばれる)を備えた圧縮機を適用する目的は、音響信号の音量範囲を変更することである。伝達関数の選択は、表示モードなどの予め定義された基準に基づいている。ただし、予め定義された圧縮機伝達関数を適用しても、出力において目標音量範囲が達成されることを保証することはできない。
所望の目標音量範囲を達成するために、特定の音響信号に固有の伝達関数が決定される。次に、伝達関数が音響信号に適用され、音量範囲が制御された音響が生成される。さらに、伝達関数は、音響信号品質の低下を最小限に抑えながら、所望の目標音量範囲を達成するように設計する必要がある。
最新技術では、さまざまな方法が知られている。
予め定義された/固定の伝達関数:
伝達関数は予め定義されており、映画、ニュース、音楽などの予想される再生コンテンツに基づいて、または深夜モードなどのリスニングモードに基づいて選択される。
基準信号ベースの伝達関数:
他の方法[2]は、測定された基準信号、例えば、リスニング環境のバックグラウンドノイズのレベルと、再生装置の音量制御設定の組み合わせを使用することを提案している。
パラメータベースの伝達関数:
ここでは、伝達関数はユーザ定義の入力パラメータのみに基づいて設計されている。
[3]で提案されている方法では、入力音響信号の平均レベルとダイナミックレンジとが決定される。平均レベルとユーザの希望するダイナミックレンジの設定とに基づいて、伝達関数が計算され、入力音響信号に適用される。
図1は、スライダベースの望ましいダイナミックレンジの許容範囲と対応する伝達関数とを示している。図のx軸には[dB]の入力音量が、y軸には[dB]の出力音量が表示される。左側の例のスライダでは、伝達関数の形式に影響を与える「ダイナミックレンジの許容範囲」を設定できる。入力音量の低い領域は、ノイズフロアの上限に達する。この後に、一定の出力音量を持つセクションが続く。この場合、ダイナミックレンジの許容範囲は、所望のダイナミックレンジに対応する。伝達関数の線形部分は、時間に依存し、出力音量が一定のもう一つ続くセクションが平均信号レベル(水平シフト)に配置される。
測定されたダイナミックレンジは伝達関数の計算には使用されず、つまり、入力音響信号のダイナミックレンジまたは音量範囲の専用制御は不可能である。
[4]では、平均音量からの平均絶対偏差である動的拡散が制御される。図2(出力音量対入力音量)に示すように、2つの線分を持つ特定の圧縮機が使用される。推定される2つのパラメータは、圧縮機のしきい値(黒い点で示されている)と勾配(つまり、破線で示された線形曲線からの偏差)である。しきい値はユーザによってパーセンタイルとして指定され、ダイナミクスプロファイル[dB vs パーセンタイル]を使用してdBに変換される。勾配は、動的拡散の変化と勾配の変化との間に線形関係があるという仮定に基づいて計算される。

Figure 2020517179

(1)
ここで、SdesおよびDdesはそれぞれ所望の勾配および動的拡散であり、Dinは測定された動的拡散である。
通常、Smin=Dmin=0、Smax=1、およびDmax=Dinであり、したがって、
Figure 2020517179
(2)
伝達関数は、反復プロセスを介して適応される。
最初に、伝達関数は、達成された動的拡散を決定するために、音響データの入力ヒストグラムまたは音響データに適用される。次に、伝達関数の勾配が調整され、所望の動的拡散が達成されるまで手順が繰り返される。
ダイナミック・レンジ・コントロールに対するこのアプローチには、2つの欠点がある。
1)伝達関数の勾配のみが決定され、原点に対する位置、つまり入力/出力レベルが広がる平面のシフトは決定されない。したがって、結果のゲインの範囲は予測できない。
2)最初の伝達関数から最終的な伝達関数を取得するための反復プロセスは計算上非常に複雑であり、ユーザ定義のしきい値を使用して初期伝達関数を選択すると、見込まれる最終伝達関数の特性が制限されるため、必ずしも最良の結果にならない場合がある。
メイクアップゲインは、最終伝達関数を入力ヒストグラムに適用し、続いて入力ヒストグラムから出力音量を近似することによって計算される。
本発明の目的は、特に最新技術の欠点を被らない出力信号の音量に関する入力音響信号を処理するための装置および方法を提供することである。
この目的は、評価器、計算機、および調整器を含む、入力音響信号を処理するための装置によって達成される。評価器は、入力音響信号の音量を評価して、音量範囲と実際の音量値とを決定するように構成されている。音量範囲は、一実施形態では、入力音響信号全体に対して決定され、別の実施形態では、入力音響信号の所与の期間(例えば時間枠)に対して決定される。実際の音量値は、例えば入力音響信号の瞬間的または短期的な音量値[6]である。前述の実際の音量測定値の代わりに、入力音響信号の少なくとも一定期間のレベルまたは出力、例えば平均出力の適切な測定値を示すまたは提供する任意の測定値を使用できることは明らかである。計算機は、決定された音量範囲、目標音量範囲、および決定された実際の音量値に基づいて、圧縮機の伝達関数を決定するように構成されている。いくつかの実施形態では、圧縮機伝達関数はさらに、音量値の決定された統計モーメントに基づいている。統計モーメントは、例えばITU−R BS.1770 [5]に準拠した音響入力の音量値または統合されたゲート音量の平均である。計算機は、決定された圧縮機伝達関数に基づいて、少なくとも1つの音量範囲制御ゲインを決定するように構成されている。調整器は、入力音響信号と少なくとも1つの決定された音量範囲制御ゲインとに基づいて出力音響信号を提供するように構成されている。別の実施形態では、計算機は、出力音響信号を提供するために、調整器に音量範囲制御ゲインを提供する。
一実施形態では、評価器は、入力音響信号の音量を評価して、音量値の統計モーメントを決定するように構成される。さらに、計算機は、決定された音量範囲、目標音量範囲、および決定された実際の音量値と決定された音量値の統計モーメントとの差に基づいて、圧縮機伝達関数を決定するように構成される。
別の実施形態では、計算機は、曲線およびシフトに基づいて圧縮機伝達関数を決定するように構成され、計算機は、決定された音量範囲および目標音量範囲に基づいて曲線を決定するように構成され、計算機は、音量値の決定された統計モーメントに基づいてシフトを決定するように構成される。
一実施形態によれば、計算機は、勾配およびシフトに基づいて圧縮機伝達関数を決定するように構成され、計算機は、決定された音量範囲および目標音量範囲に基づいて勾配を決定するように構成され、計算機は、音量値の決定された統計モーメントに基づいてシフトを決定するように構成される。
一実施形態では、決定された圧縮機伝達関数は、入力音響信号全体に対して有効である。
一実施形態によれば、評価器は、入力音響信号全体の音量を評価するように構成される。
一実施形態では、評価器は、入力音響信号の少なくともある期間の音量を評価するように構成される。
一実施形態によれば、評価器は、瞬間的または短期的な音量値を実際の音量値として決定するように構成される。
一実施形態では、評価器は、音量値の統計モーメントとして平均音量を決定するように構成される。
別の実施形態では、評価器は、統合されたゲート音量を音量値の統計モーメントとして決定するように構成される。
一実施形態によれば、計算機は、出力音響信号の平均音量と決定された入力音響信号の平均音量とが等しくなるように、圧縮機伝達関数を決定するように構成される。
一実施形態では、計算機は、決定された音量範囲制御ゲインを調整器に提供するように構成される。
一実施形態では、計算機は、計算された音量範囲制御ゲインが最大ゲイン値以下である場合にのみ、決定された音量範囲制御ゲインを調整器に提供するように構成される。一実施形態によれば、決定された音量範囲制御ゲインが最大ゲイン値よりも大きい場合、計算機は、調整器に最大ゲイン値を提供するように構成される。代替実施形態では、決定された音量範囲制御ゲインが最大ゲイン値よりも大きい場合、計算機は調整器にゲインを提供せず、調整器は最大ゲイン値を仮定するか、そのような状況のために保存されたゲインを使用する。
さらなる実施形態において、計算機は、決定された圧縮機伝達関数および最大ゲイン値に基づいて音量範囲制御ゲインを決定し、決定された音量範囲制御ゲインが最大ゲイン値以下になるように構成される。したがって、計算機は、例えば、実際に決定されたゲイン値の最小値と最大ゲイン値とを計算することにより、決定された音量範囲制御ゲインを調整器に送るよう決定する。
一実施形態によれば、最大ゲイン値は、ユーザ入力によって設定される。代替実施形態では、最大ゲイン値は、入力音響信号の目標音量範囲と決定された音量範囲との差に依存する。
一実施形態によれば、装置は、目標音量範囲の値を受信するように構成された入力インターフェースをさらに備える。したがって、ユーザは入力インターフェースを介して、所望の目標音量範囲を入力する。
装置およびそれに応じた方法のいくつかのさらなる実施形態は以下のとおりである。
一実施形態では、評価器は、入力音響信号の音量を評価して、音量範囲および平均音量を決定するように構成される。計算機は、入力音響信号の目標音量範囲と決定された音量範囲との間の比に比例する勾配値を計算するように構成される。計算機は、入力音響信号の決定された平均音量に依存するシフト値を計算するように構成される(一実施形態では、シフトは、決定された平均音量に1と勾配の差を掛けたものに依存する)。計算機は、計算されたシフト値と計算された勾配値に依存する線形伝達関数に基づいて音量範囲制御データを計算するように構成されている。最後に、調整器は、入力音響信号と音量範囲制御データとに基づいて出力音響信号を提供するように構成されている。
一実施形態では、線形伝達関数は、入力音響信号全体に対して有効である。この実施形態では、1つの線形伝達関数が入力音響信号全体、すなわちすべての音量値に使用される。一実施形態では、線形伝達関数は、非常に高いおよび/または低い音量値を除いて、入力音響信号全体に対して有効である。
一実施形態によれば、評価器は、入力音響信号全体の音量範囲および平均音量を決定するように構成される。この実施形態は、入力音響信号のオフライン処理に特に関連している。
一実施形態では、評価器は、入力音響信号の少なくとも一部の音量範囲および平均音量を決定するように構成される。
一実施形態によれば、計算機は、比例定数と入力音響信号の目標音量範囲と決定された音量範囲との間の比との積として勾配値を計算するように構成される。目標音量範囲はユーザによって入力され、出力音響信号の音量範囲を指し、決定された音量範囲は入力音響信号によって与えられる。
一実施形態では、比例定数は1に設定される。したがって、勾配値は、目標音量範囲と決定された音量範囲との比によって与えられる。
一実施形態によれば、計算機は、出力音響信号の平均音量と入力音響信号の決定された平均音量とが等しくなるようにシフト値を計算するように構成される。
一実施形態では、計算機は、以下の式を使用してシフト値を計算するように構成される:a=μin*(1−b)。シフト値はaで与えられ、入力音響信号の決定された平均音量はμinで示され、bは計算された勾配値である。
一実施形態によれば、計算機は、音量範囲制御ゲインを提供するように構成され、調整器は、音量範囲制御ゲインを入力音響信号に適用するように構成される。
一実施形態では、評価器は、短期持続時間を有する入力音響信号のフレームの入力音量値を決定するように構成される。計算機は、入力音響信号のフレームに対応する出力音響信号のフレームの出力音量値を提供するように構成されている。さらに、計算機は、次の式を使用して出力音量値を計算するように構成されている:Nout(k)=a+b*Nin(k)。ここで、Nout(k)は出力音量値、aはシフト値、bは勾配値、Nin(k)は入力音響信号の対応するフレームの決定された入力音量値、kはフレームの指標である。したがって、フレームは音量範囲および/または平均音量が決定される入力信号の一部である。
一実施形態によれば、計算機は、出力音響信号のフレームの計算された音量値と入力音響信号の対応するフレームの決定された音量値との差として音量範囲制御ゲインを提供するように構成される。
一実施形態では、計算機は、以下の式を使用して音量範囲制御ゲインを提供するように構成されている:G(k)=a+(b−1)*Nin(k)。G(k)は音量範囲制御ゲイン、aは計算されたシフト値、bは計算された勾配値、Nin(k)は入力音響信号のフレームの決定された入力音量値、kはフレームの指標である。したがって、音量範囲制御ゲインは、調整器によって使用される音量範囲制御データの例である。
一実施形態によれば、調整器は、音量範囲制御ゲインを入力音響信号に適用して出力音響信号を提供するように構成される。
一実施形態では、計算機は、調整器に計算された音量範囲制御ゲインを提供するように構成される。一実施形態によれば、提供される計算された音量範囲制御ゲインは、最大ゲイン値以下である。
一実施形態によれば、最大ゲイン値は、ユーザ入力によって設定される。
一実施形態では、最大ゲイン値は、目標音量範囲と入力音響信号の決定された音量範囲との差に依存する。
一実施形態によれば、計算機は、調整器に計算された音量範囲制御ゲインを提供するように構成される。提供される計算された音量範囲制御ゲインは、一実施形態では、最小ゲイン値以上である。
一実施形態では、評価器は、入力音響信号の統合音量を決定するように構成される。さらに、計算機は、入力音響信号の決定された統合音量および出力信号の目標統合音量に基づいてメイクアップゲイン値を計算するように構成される。最後に、調整器は、メイクアップゲイン値を適用することにより、出力音響信号の音量を変更するように構成されている。
一実施形態によれば、評価器は、入力音響信号の統合音量を決定するように構成される。計算機は、シフト値、勾配値、および決定された統合音量に基づいてメイクアップゲイン値を計算するように構成されている。調整器は、メイクアップゲイン値を適用することにより、出力音響信号の音量を変更するように構成されている。
一実施形態では、計算機は、次の式を使用してメイクアップゲイン値を計算するように構成される:Gmu=a+(b−1)Iin
muはメイクアップゲイン値、aはシフト値、bは勾配値、Iinは、入力音響信号の決定された統合音量である。
この目的は、入力音響信号を処理する方法によっても達成される。表現入力音響信号は、発話信号と同様に音響信号を含む。
入力音響信号を処理する方法は、少なくとも、
・入力音響信号の音量を評価して、音量範囲と実際の音量値を決定するステップと、
・決定された音量範囲、目標音量範囲、決定された実際の音量値、および決定された音量値の統計モーメントに基づいて、圧縮機伝達関数を決定するステップと、
・決定された圧縮機伝達関数に基づいて、少なくとも1つの音量範囲制御ゲインを決定するステップと、
・入力音響信号および少なくとも1つの決定された音量範囲制御ゲインに基づいて出力音響信号を提供するステップと、
を備えている。
別の実施形態では、
・入力音響信号の音量を評価して、音量範囲と平均音量とを決定するステップと、
・目標音量範囲と決定された音量範囲との比に比例する勾配値を計算するステップと、
・決定された平均音量に依存するシフト値を計算するステップと、
・計算されたシフト値と計算された勾配値に依存する線形伝達関数とに基づいて音量範囲制御データを計算ステップと、
・入力音響信号および音量範囲制御データに基づいて出力音響信号を提供するステップと、
が実行される。
上記の装置の実施形態は、この方法にも有効である。
本発明はまた、コンピュータまたはプロセッサで動作しているときに、入力音響信号を処理する方法を実行するためのコンピュータプログラムに関する。
本発明は、添付の図面および添付の図面に示される実施形態に関して以下に説明される。
最先端のLRACの伝達関数を示す。 は、最先端のLRACの異なる伝達関数を示す。 入力音響信号を処理するための装置のブロック図を示す。 入力音響信号を処理する方法のステップの異なるブロック図を示している。 勾配(図5a)と勾配およびシフト(図5b)の伝達関数を示す。 (上図)映画の1時間の音響セグメントの短期音量ヒストグラムと(下図)2つの異なる伝達関数とを示す。 例示的なヒストグラム、最新技術による異なる伝達関数、および本発明による伝達関数を示す。
図1および図2は、最新技術による伝達関数を示す。
図3は、入力音響信号100を処理し、出力音響信号101を提供する装置1の例示的な実施形態を示す。評価器10は、この示された実施形態において、入力音響信号100の音量範囲LRAinおよび平均音量μinを決定するために、入力音響信号100の音量を評価する。この示された実施形態では、評価器10は、入力音響信号100の統合音量Iinおよび入力音響信号100の異なるフレームkの入力音量値Nin(k)も決定する。
決定された値は計算機11に送信され、計算機11は、入力インターフェース13を介してユーザによって入力された所望の目標音量範囲LRAdesも参照する。
計算機11は、調整器12、すなわち音量の調整器、によって使用される音量範囲制御データを計算し、入力音響信号100に作用し、出力音響信号101を提供する。さらに、計算機11は、音量範囲制御ゲインGの形で音量範囲制御データを提供し、ここでも、メイクアップゲインGmuを提供する。これは、圧縮機伝達関数を決定した結果である。
本実施形態では、本発明のLRACは、出力音響信号101の音量範囲制御を達成するために、入力音響信号100に線形変換を適用する。
本発明のLRACのさらなる実施形態のブロック図が図4に示されている。
この実施形態では、ステップは次のとおりである。
・音響を取得、つまり、入力音響信号を取得する。これは、次のxで示される。
・瞬間音量を計算する。
・計算された瞬間音量は、ユーザが設定した目標音量に依存するメイクアップゲインを計算するステップに使用される。
・計算された瞬間音量は、短期音量を計算するステップと、それに続く、ユーザが設定した目標音量範囲に依存する伝達関数を決定するステップにも使用される。
・決定された伝達関数は、上記のメイクアップゲインを計算するステップと、LRACゲインを計算する次のステップに送信される。
・LRACゲインおよびメイクアップゲインは、音響、つまり入力音響信号の次のステップで適用される。
・ここでyと名付けられた出力音響信号を出力する。
出力音響信号yは次のように取得される。
y=g(LRAin,LRAdes,Nin)x (3)
ここで、gは、音量範囲を制御するために入力音響信号xに適用されるゲインである。ゲインgは、入力音響LRAinの音量範囲、所望の目標音量範囲LRAdes、および期間Ninにわたる音量測定値、例えば短期または瞬間音量に基づいて取得される。これは、評価器または入力音響信号の音量を評価するステップによって決定される実際の音量値とも呼ばれる。音量測定値Ninは、通常、時間変化する。一実施形態では、ゲインは、音量値の決定された統計モーメントに基づいてさらに取得される。統計モーメントは、例えば、ITU−R BS.1770[5]による音響入力の音量値または統合されたゲート音量の平均である。
dB単位のゲインは
G(LRAin,LRAdes,Nin)=10log10(g(LRAin,LRAdes,Nin)) (4)
である。
一実施形態では、ゲインGは、入力音響LRAinの音量範囲、所望の目標音量範囲LRAdes、および音量測定値の統計モーメントと音量測定値との差ΔNに基づくマッピング関数Qから得られる。
G(LRAin,LRAdes,Nin)=Q(LRAin,LRAdes,△N) (5)
一実施形態では、ΔNの実現は、音響入力μinの平均音量(または代替として、ITU−R BS.1770[5]による音響入力の統合ゲート音量)と期間Ninの音量測定値との差、つまり次の式によって与えられる。
ΔN=μin−Nin
期間Ninの音量測定値は、入力音響信号の期間またはフレームの実際の音量値のそのような例である。
以下では、μinは入力音響信号の平均音量の一例である。別の実施形態では、μinは、ITU−R BS.1770[5]または長期の音量測定値を決定するための同様の規則による統合されたゲート音量を指す。一般に、μinは入力音響信号の音量値の統計モーメントである。
あるいは、Gは、曲線KとシフトKshiftとの重ね合わせで構成される以下のマッピング関数に基づいて取得される。曲線はLRAinとLRAdesに依存し、シフトはμinに依存する。
G(LRAin,LRAdes,Nin)=K(LRAin,LRAdes,Nin)+Kshift(μin) (6)
曲線Kの適切な選択は、例えば、シグモイド関数である。式(6)は、曲線Kが勾配Sで指定されている場合にさらに制限できる。
G(LRAin,LRAdes,Nin)=S(LRAin,LRAdes)Nin+Kshift(μin) (7)
ご覧のように、マッピング関数は勾配SとシフトKshiftによって決定される。
音量値が低い信号の過剰な増幅を回避するために、ゲインGは、最終的なゲインを取得するようにその後、制限される。
G(LRAin,LRAdes,Nin)=min(G(LRAin,LRAdes,Nin),Gmax) (8)
ここで、Gmaxは最大許容ゲインである。この最大ゲインは、例えばユーザによって事前に定義するか、または入力音響信号に基づいて決定することができる。
以下では、オフラインおよびオンラインLRACの実施形態について説明する。
オフライン版では、入力音響信号全体が利用可能である。ここで、本発明のLRACは、音量範囲制御を達成するために、フレームごとに音響信号に線形変換を適用することに基づいている。この場合、曲線は決定された勾配を持つ線である。
いくつかの理論的な考慮事項について説明する。
標準偏差σおよび平均μの正規分布確率変数wが与えられた場合、勾配bおよびシフトaを持つ線形伝達関数の適用により、正規分布確率変数が得られる。
z=a+bw、(9)
確率変数zの標準偏差はσ=bσであり、平均μ=a+bμである。
2つの仮定が行われる。
1)音量測定値Nin(つまり、入力音響信号の決定された実際の音量値)は、正規分布確率変数である。
2)入力標準偏差と出力標準偏差の比率は、入力LRAと出力LRAの比率に比例する。
Figure 2020517179
(10)

ここで、ξは比例定数で、モデルへの音響信号の偏差を補正するために使用できる。通常、LRAは減少するため、LRA<LRAである。
LRACゲインを決定する手順は次のとおりである。
最初に、時間依存音量測定値Nin(k)(kは音響フレームインデックス)、音量の平均μin、および入力音量範囲(LRA)LRAinは、入力音響信号から計算される。
選択される:
Figure 2020517179
一実施形態では、ξ=1が設定される。
ゲインは、次の2つの例示的な方法を使用して計算できる。
〈方法1〉
式(5)を考慮すると、関数Qは次のように定義される。
Figure 2020517179
(11)
および
△N(k)=μin−Nin(k) (12)
一実施形態では、正規化項β(k)は時間変化する。一実施形態では、以下によって実現される。
Figure 2020517179

ここで、γ>0は実数値であり、パラメータGmaxは、一実施形態では、例えばユーザによって、事前に定義されるか、または入力音響信号に基づいて決定される。例えば、
max=|LRAdes−LRAin| (13)
したがって、この場合、ゲインは次のように決定できる。

Figure 2020517179
(14)

別の実施形態では、正規化パラメータは省略される、すなわち、β(k)=1である。
〈方法2〉
式(7)を考慮すると、関数SとKshiftは次のように定義できる。
S(LRAin,LRAdes)=b−1 (15)
および
shift(μin)=a (16)
ここで、式(16)のaは、次のように決定できる。
a=(1−b)μin
これにより、μout=μin、つまり、音量処理の前と後での統合音量の差が最小化される。
したがって、この場合、ゲインは次のように決定できる。

G(LRAin,LRAdes,Nin(k))=(b−1)Nin(k)+a (17)
a=(1−b)μinおよびb=LRAdes/LRAinを選択すると、上記の式は代わりに次のように表せる。
G(LRAin,LRAdes,Nin(k))=(1−b)△N(k) (18)
これは、入力LRAと出力LRAの比率、および入力音響信号の平均音量μinと実際の音量値(例えば、短期または瞬間音量測定値)の差ΔN(k)に依存するマッピング関数に対応する。
次に、決定されたゲインの値は、望ましい最大値に制限される。
G(LRAin,LRAdes,Nin(k))=min(G(LRAin,LRAdes,Nin(k)),Gmax) (19)
〈決定された音量範囲制御ゲインの適用〉
フレームごとの出力信号は次の式で与えられる。
y(k)=g(LRAin,LRAdes,Nin(k))x(k) (20)
ここで、式(20)のgは、以下の式(21)で表される。
Figure 2020517179
(21)
LRAC処理による統合音量の変化をさらに低減するために、一実施形態では、例えば次のように入力統合音量Iinに直接変換を適用することにより、メイクアップゲインが計算される。
mu=(b−1)Iin+a (22)
次に、ゲイン

Figure 2020517179

が音響信号yに適用される。このメイクアップゲインを適用すると、通常、2LU未満の統合音量偏差が得られる。
さらなる実施形態では、変換を適用すると、出力短期音量は次の式で与えられ、
out(k)=a+bNin(k)
ここで、kはフレームインデックスである。
上記に基づいて、LRACゲインが計算される。
dB単位のLRACゲインは次のように計算される。
G(k)=Nout(k)−Nin(k)=a+(b−1)Nin(k)
短期間の音量値が低い信号の過剰な増幅を避けるため、一実施形態では、ゲインはその後、次のように制限される。
G(k)=min(G(k),Gmax
ここで、Gmaxは最大許容ゲインである。この最大ゲインは、実施形態に応じて、推測的に定義されるか、音響信号に基づいて決定される。
max=|LRAdes−LRAin
LRAC処理による統合音量の変化をさらに低減するために、一実施形態では、次のように入力統合音量Iinに直接変換を適用することにより、メイクアップゲインが計算される。
mu=a+(b−1)Iin
このメイクアップゲインGmuは、音響信号に適用される。
オフライン処理のいくつかの側面は次のとおりである。
線形伝達関数は、図5に示すように、音響信号の統計分析から決定された勾配bとシフトaで計算される。音量範囲制御(LRAC)ゲインは、この伝達関数に基づいて計算される。
線形伝達関数の勾配bは、入力LRAとユーザが設定した所望の目標LRAの関数である。図5a)に示すように、入力音響信号に対する勾配のみに依存する伝達関数に基づいてLRACゲインを計算し入力音響信号に適用すると、LRAを制御するという望ましい効果が得られる。ただし、これにより、入力音量と出力音量との間に大きな違いが生じる。さらに、低音量レベルのセグメントの非常に高い増幅と、処理された入力音響信号のクリッピングまたは望ましくない変調アーチファクトにつながる可能性のある高音量レベルのセグメントの増幅につながる。
勾配bとシフトaとの組み合わせにより、図5bに示す伝達関数が得られる。最終的なLRACゲインは、この伝達関数から決定される。シフトaにより、音量分布の平均が維持されるため、結果として生じる入力音量と出力音量との差は小さくなる。さらに、これにより、低音量レベルのセグメントに適用されるゲインが自動的に減少し、高音量レベルのセグメントの増幅が回避されるため、クリッピングおよび変調が回避される。
いくつかの実施形態における決定されたLRACゲインのその後の制約は、バックグラウンドノイズなどの低レベル音響が過度に増幅されないことを保証する後処理ステップである。シフトaにより、得られたゲインは最初から妥当な範囲に留まり、適切な最大ゲインを推測的に定義できる。
映画の音響抜粋の短期音量値の例示的なヒストグラムと、異なる所望のLRAに対応するゲイン関数とを図6に示す。示されているのは、LRAが22.8LUの映画の1時間の音響セグメントの短期音量ヒストグラムである(一番上の行)。また、それぞれ10LUと15LUの2つの所望のLRAの伝達関数も示している(下段)。
一実施形態では、音量正規化ゲインが計算される。
本発明のLRAC方法の適用は、音響の統合音量の変化をもたらし得る。ゲインを計算して、所望の目標の統合音量を達成できる。
所望の目標音量が入力音量と等しくなるように選択された場合、測定された入力統合音量Iinと測定または推定された出力統合音量との差を計算することにより、正規化ゲインを得ることができる。出力統合音量は、入力瞬時音量値に変換を適用して得られる出力瞬時音量値を使用して推定できる。そうでない場合、正規化ゲインは、推定または測定された出力統合音量と所望の目標統合音量との差から計算される。
オンラインLRACは、オフライン版から派生できる。オンライン版は、入力LRAの音響信号の時間セグメントと、音響信号全体ではなく平均音量評価を考慮する。この場合、パラメータは時間依存になる。つまり、a(k)=(1−b(k))μin(k)で、入力音量の統計モーメントが対応する出力音量の統計モーメントに等しくなるようにする。例えば平均音量値:μout(k)=μin(k)。さらに、b(k)=ξLRAdes/LRAin(k)である。
したがって、2つのオンライン方法は次のとおりである。
〈方法1〉
関数は次のように定義される。
Figure 2020517179
(23)
および

△N(k)=μin(k)−Nin(k) (24)
および
Figure 2020517179

ここで、γ>0は実数値であり、パラメータGmax(k)は、一実施形態では、時間に依存しないユーザが定義したパラメータGmax(k)=Gmaxとして定義されるか、信号依存パラメータGmax(k)=|LRAdes−LRAin(k)|である。
したがって、この場合、ゲインは次のように決定できる。

Figure 2020517179
(25)
〈方法2〉
関数SとKshift(μin(k))は次のように定義される
S(LRAdes,LRAin(k))=b(k)−1 (26)
そして
shift(μin(k))=a(k) (27)
LRACゲインは次のように計算される。
G(LRAdes,LRAin(k),Nin(k))=(b(k)−1)Nin(k)+a(k) (28)
過度の増幅を避けるため、その後ゲインは次のように制限される。
G(LRAdes,LRAin(k),Nin(k))=min(G(LRAdes,LRAin(k),Nin(k)),Gmax(k)) (29)
さらなる実施形態では、変換パラメータは次のように計算される。

Figure 2020517179

そして
a(k)=(1−b(k))μin(k)、これにより、μout(k)=μin(k)が保証される。
変換を適用すると、出力の短期音量は次のようになる。
out(k)=a(k)+b(k)Nin(k)
次にLRACゲインは次のように計算される。
G(k)=Nout(k)−Nin(k)=a(k)+(b(k)−1)Nin(k)
短期間の音量値が低い信号の過剰な増幅を避けるため、一実施形態では、ゲインはその後次のように制限される。
G(k)=min(G(k)、Gmax(k))
ここで、Gmax(k)は一実施形態であり、時間に依存しない固定のユーザが定義したパラメータGmax(k)=Gmaxであり、別の実施形態では信号依存パラメータGmax(k)=|LRAdes−LRAin(k)|である。したがって、オンラインLRACは、入力音響信号の期間全体ではなく、入力音響信号の時間的セグメントを考慮する。
本発明の方法の一実施形態は、以下のステップを含む。
1)入力音響信号を受信するステップ。
2)音響フレームのシーケンスについて、実際の音量値の例として、瞬間的または短期的な音量値を計算するステップ。
3)計算された瞬間的または短期的な音量値の集合から入力音量範囲(LRA)を決定するステップ。
4)勾配bとシフトaとに基づいて圧縮機伝達関数を決定するステップ。入力LRAと所望の目標LRAとから勾配bを決定し、音量値の統計モーメントからシフトaを決定する。
または、入力LRA、所望のLRA、および瞬間的または短期的な音量値と音量値の統計モーメントとの差に基づいて、圧縮機伝達関数を決定する。
または、曲線とシフトとに基づいて圧縮機伝達関数を決定する。入力LRAと所望のLRAとから曲線を決定し、音量値の統計モーメントからのシフトを決定する。
5)決定された圧縮機伝達関数に基づいて、時間変化するLRACゲインを計算するステップ。
6)入力音響信号の音響サンプルにLRACゲインを適用して、出力音響信号を決定するステップ。
一実施形態では、勾配およびシフトに基づいて圧縮機伝達関数を決定するステップ、および入力LRAと所望のLRAとから勾配を決定し、計算された瞬間的または短期の音量値からシフトを決定するステップを含む。
一実施形態は、以下のステップを含む。それより下では、伝達関数が、入力および所望の出力LRAから決定される勾配とは異なる勾配を有する、圧縮機伝達関数の閾値点を決定する。これは、最小圧縮機ゲインに制約をかけることに対応する。
さらなる実施形態は、計算されたLRACゲインに適用される最大ゲイン制約を(発見的に)決定または定義するステップを含む。
別の実施形態では、以下のステップが含まれる。瞬間的な音量値およびLRACゲインに基づいて、出力信号の所望の目標音量を得るために音量制御ゲインを計算する。入力音響信号の音響サンプルにLRACゲインと音量制御ゲイン(または両方の組み合わせ)とを適用して、出力音響信号を決定する。
図7では、例示的なヒストグラムが上の図に示されている。中央の図は、最新の[4]動的拡散制御方法の伝達関数を示している。下図は、本発明による伝達関数を示している。伝達関数は、x軸に入力音量、y軸に出力音量を持つ図に示されている。3つの図すべてにマークされているのは平均音量である。
[4]で提案されている方法には、2つのパラメータ、つまり、しきい値ポイントと勾配が必要である。しきい値ポイント(点と矢印でマーク)は、音量分布のパーセンタイルとして選択されるユーザ定義のパラメータである。これは、入力音響の種類ごとにしきい値がdB単位で変化することを意味する。ただし、選択したしきい値ポイントが平均値に近い場合、伝達関数の非線形部分により、音響にアーチファクトが生じる可能性がある。さらに、高いしきい値を選択した場合、望ましい動的拡散を実現するには、より大きな勾配が必要になる。ただし、勾配は入力と所望の動的拡散に基づいて計算され、選択したしきい値ポイントに依存しない。上記の考慮事項は、選択したしきい値によってはこれでは不十分な場合があることを示している。そのため、勾配の反復計算が必要である。
提案された発明は、適切な伝達関数を決定するためにユーザまたは反復処理を必要としない。必要なパラメータはすべて、入力信号と所望のLRAから自動的に決定される。
いくつかの態様を装置の文脈で説明したが、これらの態様は対応する方法の説明も表し、ブロックまたは装置が方法ステップまたは方法ステップの特徴に対応することは明らかである。同様に、方法ステップの文脈で説明される態様は、対応するブロックまたはアイテムまたは対応する装置の機能の説明も表す。方法ステップの一部またはすべては、例えばマイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって(または使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちのいくつかの1つ以上が、そのような装置によって実行され得る。
本発明の送信または符号化された信号は、デジタル記憶媒体に格納することができ、または無線伝送媒体またはインターネットなどの有線伝送媒体などの伝送媒体で送信することができる。
特定の実行要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実行することができる。電子的に読み取り可能な制御信号が保存されたデジタル記憶媒体、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して実行できる。その上で、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協力する(または協力することができる)。したがって、デジタル記憶媒体はコンピュータで読み取り可能であってもよい。
本発明によるいくつかの実施形態は、本明細書に記載の方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法の1つを実行するように動作する。プログラムコードは、例えば、機械読み取り可能なキャリアに保存されてもよい。
他の実施形態は、機械読み取り可能なキャリアに格納された、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを含む。
言い換えれば、したがって、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本書に記載されている方法のうちの1つを実行するためのコンピュータプログラムを記録したデータキャリア(またはデジタル記憶媒体などの非一時的記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は通常、有形および/または非一時的である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号シーケンスは、例えば、データ通信接続、例えばインターネットを介して転送されるように構成することができる。
さらなる実施形態は、本明細書に記載の方法の1つを実行するように構成または適合された処理手段、例えばコンピュータまたはプログラム可能な論理デバイスを含む。
さらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。
本発明によるさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを受信機に(例えば、電子的または光学的に)転送するように構成された装置またはシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えてもよい。
いくつかの実施形態では、プログラマブル・ロジック・デバイス(例えば、フィールド・プログラマブル・ゲート・アレイ)を使用して、本明細書に記載の方法の機能性の一部またはすべてを実行することができる。いくつかの実施形態では、フィールド・プログラマブル・ゲート・アレイは、本明細書に記載の方法の1つを実行するためにマイクロプロセッサと協働してもよい。一般に、これらの方法は、任意のハードウェア装置によって実行されることが好ましい。
上述の実施形態は、本発明の原理の単なる実例である。本明細書に記載の配置および詳細の修正および変更は、当業者には明らかであることを理解されたい。したがって、本明細書の実施形態の説明および説明として提示される特定の詳細によってではなく、差し迫った特許請求の範囲によってのみ制限されることが意図されている。
[1]EBU Tech Doc 3342 Loudness Range:A Descriptor to supplement Loudness Normalization in accordance with EBU R 128(2016)
[5]ITU−R、勧告ITU−R BS.1770−3.音響プログラムの音量とトゥルーピーク音響レベルを測定するアルゴリズム、2012年8月(Algorithm to measure audio programme loudness and true−peak audio level,08/2012.)。
[6]EBU Tech Doc 3341音量メータリング:EBU R 128に従って音量の正規化を補完する「EBUモード」メータリング
[2]米国特許第8229125号明細書
[3]米国特許出願公開第2014/0369527号明細書
[4]米国特許第7848531号明細書

Claims (15)

  1. 入力音響信号(100)を処理する装置(1)であって、
    評価器(10)と、計算機(11)と、調整器(12)と、を備え、
    前記評価器(10)は、前記入力音響信号(100)の音量を評価して、音量範囲(LRAin)および実際の音量値を決定するように構成されており、
    前記計算機(11)は、前記決定された音量範囲(LRAin)と、目標音量範囲(LRAdes)と、前記決定された実際の音量値とに基づいて、圧縮機伝達関数を決定するように構成されており、
    前記計算機(11)は、前記決定された圧縮機伝達関数に基づいて少なくとも1つの音量範囲制御ゲインを決定するように構成されており、
    前記調整器(12)は、前記入力音響信号(100)および少なくとも1つの前記決定された音量範囲制御ゲインに基づいて出力音響信号(101)を提供するように構成されており、
    前記計算機(11)は、前記出力音響信号(101)の平均音量(μout)と前記入力音響信号(100)の平均音量(μin)との差が最小になるように、前記圧縮機伝達関数を決定するように構成されている、
    装置(1)。
  2. 前記評価器(10)は、前記入力音響信号(100)の前記音量を評価して前記音量値の統計モーメントを決定するように構成されており、
    前記計算機(11)は、前記決定された音量範囲(LRAin)と、前記目標音量範囲(LRAdes)と、前記決定された実際の音量値と前記音量値の前記決定された統計モーメントとの差とに基づいて、前記圧縮機伝達関数を決定するように構成されている、
    請求項1に記載の装置(1)。
  3. 前記計算機(11)は、曲線およびシフトに基づいて前記圧縮機伝達関数を決定するように構成されており、
    前記計算機(11)は、前記決定された音量範囲(LRAin)および前記目標音量範囲(LRAdes)に基づいて前記曲線を決定するように構成されており、
    前記計算機(11)は、前記音量値の前記決定された統計モーメントに基づいて前記シフトを決定するように構成されている、
    請求項2に記載の装置(1)。
  4. 前記計算機(11)は、勾配およびシフトに基づいて前記圧縮機伝達関数を決定するように構成されており、
    前記計算機(11)は、前記決定された音量範囲(LRAin)と前記目標音量範囲(LRAdes)とに基づいて前記勾配を決定するように構成されており、
    前記計算機(11)は、前記音量値の前記決定された統計モーメントに基づいて前記シフトを決定するように構成されている、
    請求項2または3に記載の装置(1)。
  5. 前記決定された圧縮機伝達関数は、前記入力音響信号(100)全体に対して有効である、
    請求項4に記載の装置(1)。
  6. 前記評価器(10)は、前記入力音響信号(100)全体の前記音量を評価するように構成されている、
    請求項1〜5のいずれか一項に記載の装置(1)。
  7. 前記評価器(10)は、前記入力音響信号(100)の少なくともある期間の前記音量を評価するように構成されている、
    請求項1〜5のいずれか一項に記載の装置(1)。
  8. 前記評価器(10)は、前記実際の音量値として瞬間的または短期的な音量値を決定するように構成されている、
    請求項1〜7のいずれか一項に記載の装置(1)。
  9. 前記評価器(10)が、前記音量値の前記統計モーメントとして平均音量を決定するように構成されている、
    または
    前記評価器(10)が、統合されたゲート音量を前記音量値の前記統計モーメントとして決定するように構成されている、
    請求項2〜8のいずれか一項に記載の装置(1)。
  10. 前記計算機(11)は、前記出力音響信号(101)の前記平均音量(μout)と前記入力音響信号(100)の前記平均音量(μin)とが等しくなるように前記圧縮機伝達関数を決定するように構成されている、
    請求項1〜9のいずれか一項に記載の装置(1)。
  11. 前記計算機(11)は、前記決定された圧縮機伝達関数および最大ゲイン値(Gmax)に基づいて、決定された前記音量範囲制御ゲインが前記最大ゲイン値(Gmax)以下になるように前記音量範囲制御ゲインを決定するように構成されている、
    請求項1〜10のいずれか一項に記載の装置(1)。
  12. 前記最大ゲイン値(Gmax)がユーザ入力によって設定され、
    または
    前記最大ゲイン値(Gmax)が、前記入力音響信号(100)の前記目標音量範囲(LRAdes)と前記決定された音量範囲(LRAin)との差に依存する、
    請求項11に記載の装置(1)。
  13. 入力インターフェース(13)をさらに備え、
    前記入力インターフェース(13)は、前記目標音量範囲(LRAdes)の値を受信するように構成されている、
    請求項1〜12のいずれか一項に記載の装置(1)。
  14. 入力音響信号(100)を処理する方法であって、
    前記入力音響信号(100)の音量を評価して、音量範囲(LRAin)と実際の音量値とを決定することと、
    前記決定された音量範囲(LRAin)と、目標音量範囲(LRAdes)と、前記音量値の決定された統計モーメントとに基づいて、圧縮機伝達関数を決定することと、
    前記決定された圧縮機伝達関数に基づいて、少なくとも1つの音量範囲制御ゲインを決定することと、
    前記入力音響信号(100)と少なくとも1つの前記決定された音量範囲制御ゲインとに基づいて出力音響信号(101)を提供することと、を含み、
    前記圧縮機伝達関数は、前記出力音響信号(101)の平均音量(μout)と前記入力音響信号(100)の平均音量(μin)との差が最小になるように決定される、
    方法。
  15. コンピュータまたはプロセッサで動作するときに請求項14に記載の方法を実行するためのコンピュータプログラム。
JP2019555777A 2017-04-13 2018-04-10 入力音響信号を処理する装置および対応する方法 Active JP6833062B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17166448.5 2017-04-13
EP17166448.5A EP3389183A1 (en) 2017-04-13 2017-04-13 Apparatus for processing an input audio signal and corresponding method
PCT/EP2018/025106 WO2018188812A1 (en) 2017-04-13 2018-04-10 Apparatus for processing an input audio signal and corresponding method

Publications (2)

Publication Number Publication Date
JP2020517179A true JP2020517179A (ja) 2020-06-11
JP6833062B2 JP6833062B2 (ja) 2021-02-24

Family

ID=58714892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019555777A Active JP6833062B2 (ja) 2017-04-13 2018-04-10 入力音響信号を処理する装置および対応する方法

Country Status (16)

Country Link
US (1) US10886883B2 (ja)
EP (2) EP3389183A1 (ja)
JP (1) JP6833062B2 (ja)
KR (1) KR102370107B1 (ja)
CN (1) CN110754040B (ja)
AR (1) AR111639A1 (ja)
AU (1) AU2018253130B2 (ja)
BR (1) BR112019021377A2 (ja)
CA (1) CA3059618C (ja)
ES (1) ES2872880T3 (ja)
MX (1) MX2019012195A (ja)
RU (1) RU2734741C1 (ja)
SG (1) SG11201909415TA (ja)
TW (1) TWI657436B (ja)
WO (1) WO2018188812A1 (ja)
ZA (1) ZA201907360B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102107746B1 (ko) 2018-05-15 2020-05-07 한국원자력연구원 펌핑 구조가 구비된 열 전달 장치
CN115335901A (zh) * 2020-03-27 2022-11-11 杜比实验室特许公司 语音内容的自动调平
CN113470692B (zh) * 2020-03-31 2024-02-02 抖音视界有限公司 音频处理方法、装置、可读介质及电子设备
CN114466285B (zh) * 2022-02-16 2023-09-29 深圳万兴软件有限公司 音频信号的响度调节方法、装置、设备及存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU4278300A (en) * 1999-04-26 2000-11-10 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US7848531B1 (en) 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
CA2492091C (en) * 2002-07-12 2009-04-28 Widex A/S Hearing aid and a method for enhancing speech intelligibility
US7515072B2 (en) 2003-09-25 2009-04-07 International Rectifier Corporation Method and apparatus for converting PCM to PWM
US7336716B2 (en) * 2004-06-30 2008-02-26 Intel Corporation Power amplifier linearization methods and apparatus using predistortion in the frequency domain
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US20070121966A1 (en) * 2005-11-30 2007-05-31 Microsoft Corporation Volume normalization device
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
KR101459319B1 (ko) * 2008-01-29 2014-11-07 삼성전자주식회사 오디오 볼륨 자동 조절 방법 및 장치
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
JP2010087811A (ja) * 2008-09-30 2010-04-15 Sharp Corp 音声出力装置
EP2352225A1 (en) * 2008-10-17 2011-08-03 Sharp Kabushiki Kaisha Audio signal adjustment device and audio signal adjustment method
US8229125B2 (en) 2009-02-06 2012-07-24 Bose Corporation Adjusting dynamic range of an audio system
JP2011135218A (ja) * 2009-12-22 2011-07-07 Sharp Corp 音声信号処理装置、音声信号処理方法、プログラム、及び、記録媒体
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
EP2367286B1 (en) * 2010-03-12 2013-02-20 Harman Becker Automotive Systems GmbH Automatic correction of loudness level in audio signals
EP2541542A1 (en) 2011-06-27 2013-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal
WO2013041875A2 (en) * 2011-09-22 2013-03-28 Earsoft Limited Dynamic range control
EP2837094B1 (en) * 2012-04-12 2016-03-30 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
EP2693635A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
US9991861B2 (en) * 2012-08-10 2018-06-05 Bellevue Investments Gmbh & Co. Kgaa System and method for controlled dynamics adaptation for musical content
US9565508B1 (en) * 2012-09-07 2017-02-07 MUSIC Group IP Ltd. Loudness level and range processing
US9413322B2 (en) * 2012-11-19 2016-08-09 Harman International Industries, Incorporated Audio loudness control system
RU2639663C2 (ru) * 2013-01-28 2017-12-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах
KR101603992B1 (ko) * 2013-04-03 2016-03-16 인텔렉추얼디스커버리 주식회사 오디오 신호 크기 제어 방법 및 장치
CN107093991B (zh) * 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
US9832562B2 (en) * 2013-11-07 2017-11-28 Gn Hearing A/S Hearing aid with probabilistic hearing loss compensation
US9590580B1 (en) * 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
US10341770B2 (en) * 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC
TWI590239B (zh) * 2016-12-09 2017-07-01 宏碁股份有限公司 語音信號處理裝置及語音信號處理方法

Also Published As

Publication number Publication date
EP3389183A1 (en) 2018-10-17
ES2872880T3 (es) 2021-11-03
AU2018253130A1 (en) 2019-12-05
CN110754040B (zh) 2023-08-11
US10886883B2 (en) 2021-01-05
CA3059618A1 (en) 2018-10-18
KR20200004319A (ko) 2020-01-13
TWI657436B (zh) 2019-04-21
MX2019012195A (es) 2019-12-11
RU2734741C1 (ru) 2020-10-22
TW201842495A (zh) 2018-12-01
CN110754040A (zh) 2020-02-04
KR102370107B1 (ko) 2022-03-04
US20200112294A1 (en) 2020-04-09
AR111639A1 (es) 2019-08-07
SG11201909415TA (en) 2019-11-28
EP3610572A1 (en) 2020-02-19
ZA201907360B (en) 2021-04-28
BR112019021377A2 (pt) 2020-05-05
CA3059618C (en) 2021-06-01
WO2018188812A1 (en) 2018-10-18
AU2018253130B2 (en) 2021-03-11
JP6833062B2 (ja) 2021-02-24
EP3610572B1 (en) 2021-04-14

Similar Documents

Publication Publication Date Title
JP6833062B2 (ja) 入力音響信号を処理する装置および対応する方法
US11122374B2 (en) Systems and methods for providing personalized audio replay on a plurality of consumer devices
TWI440301B (zh) 對於音訊動態處理具限制之階層式控制路徑
TWI517562B (zh) 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP7266916B2 (ja) ラウドネスレベルを制御するオーディオ信号処理方法及び装置
CN104221284B (zh) 用于调平音频信号的响度变化的系统及方法
US9712934B2 (en) System and method for calibration and reproduction of audio signals based on auditory feedback
US20150207479A1 (en) Dynamic range control with large look-ahead
US20160260445A1 (en) Audio Loudness Adjustment
US8965756B2 (en) Automatic equalization of coloration in speech recordings
JP2010534030A (ja) 聴覚情景分析とスペクトルの歪みを用いた音響処理
RU2683489C1 (ru) Устройство и способ обработки аудиосигнала для модификации стереоскопического изображения стереосигнала
CN103248982B (zh) 基于信号响度调适信号增益时的峰值检测
US9614486B1 (en) Adaptive gain control
JP2023521849A (ja) オーディオディスクリプションの自動ミキシング
CN115335901A (zh) 语音内容的自动调平
US12101070B2 (en) Method and system for processing audio signal
KR101741614B1 (ko) LD Budget 기반의 오디오 LD 자동 제어 방법 및 시스템
CN116614668A (zh) 一种直播音量的自适应控制方法、系统、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200923

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210202

R150 Certificate of patent or registration of utility model

Ref document number: 6833062

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250