JP7138814B2 - ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 - Google Patents
ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 Download PDFInfo
- Publication number
- JP7138814B2 JP7138814B2 JP2022035109A JP2022035109A JP7138814B2 JP 7138814 B2 JP7138814 B2 JP 7138814B2 JP 2022035109 A JP2022035109 A JP 2022035109A JP 2022035109 A JP2022035109 A JP 2022035109A JP 7138814 B2 JP7138814 B2 JP 7138814B2
- Authority
- JP
- Japan
- Prior art keywords
- loudness
- audio
- gain
- channel configuration
- downmix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 102
- 238000000034 method Methods 0.000 claims description 101
- 238000009499 grossing Methods 0.000 claims description 46
- 230000000670 limiting effect Effects 0.000 claims description 24
- 238000010606 normalization Methods 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 20
- 230000001419 dependent effect Effects 0.000 claims description 11
- 230000006835 compression Effects 0.000 description 85
- 238000007906 compression Methods 0.000 description 85
- 238000012545 processing Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 33
- 238000005259 measurement Methods 0.000 description 21
- 238000013459 approach Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 14
- 230000008859 change Effects 0.000 description 11
- 230000007704 transition Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 241000610375 Sparisoma viride Species 0.000 description 9
- 230000003068 static effect Effects 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 230000002265 prevention Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 230000036962 time dependent Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000002730 additional effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010021403 Illusion Diseases 0.000 description 1
- 244000050403 Iris x germanica Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 210000000721 basilar membrane Anatomy 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本願は2013年9月12日に出願された米国仮特許出願第61/877,230号、2013年10月15日に出願された米国仮特許出願第61/891,324号、2014年2月10日に出願された米国仮特許出願第61/938,043号および2013年10月17日に出願された米国仮特許出願第61/892,313号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
本発明は、概括的にはオーディオ信号の処理に、より詳細にはダイナミックレンジ制御および他の型のオーディオ処理動作を幅広い多様な再生環境のうちの任意のものにおいてオーディオ信号に適用することに使用されうる技法に関する。
1.全般的概観
2.ダイナミックレンジ制御
3.オーディオ・デコーダ
4.オーディオ・エンコーダ
5.ダイナミックレンジ圧縮曲線
6.DRC利得、利得制限および利得平滑化
7.入力平滑化および利得平滑化
8.複数周波数帯域にわたるDRC
9.ラウドネス領域でのボリューム調整
10.ダウンミックス・ラウドネス調整
11.利得に関係した追加的動作
12.特定的およびブロードバンド(または広帯域)のラウドネス・レベル
13.チャネルの個々の部分集合のための個々の利得
14.聴覚シーン解析
15.ラウドネス・レベル遷移
16.リセット
17.エンコーダによって提供される利得
18.例示的なシステムおよびプロセス・フロー
19.実装機構――ハードウェアの概観
20.等価物、拡張、代替その他。
この概観は、本発明の実施形態のいくつかの側面の基本的な記述を提示する。この概観は該実施形態の諸側面の包括的ないし網羅的な要約ではないことは注意しておくべきである。さらに、この概観は、該実施形態の何らかの特に有意な側面もしくは要素を特定するものと理解されることも、一般には本発明の、特に該実施形態の何らかの範囲を画定するものと理解されることも、意図されていないことを注意しておくべきである。この概観は単に、その例示的実施形態に関係するいくつかの概念を凝縮された単純化された形式で提示するものであり、単に後続の例示的な諸実施形態のより詳細な説明への概念的な導入部として理解されるべきである。別個の諸実施形態が本稿において論じられるが、本稿で論じられる実施形態および/または部分実施形態の任意の組み合わせがさらなる実施形態をなすよう組み合わされてもよいことを注意しておく。
カスタマイズされたダイナミックレンジ制御なしでは、入力オーディオ情報(たとえばPCMサンプル、QMFマトリクスにおける時間‐周波数サンプルなど)はしばしば、再生装置の特定の再生環境(すなわち、装置の物理的および/または機械的な再生限界を含む)には不適切なラウドネス・レベルで再生される。再生装置の特定の再生環境は、エンコードされたオーディオ・コンテンツがエンコード装置において符号化されたときに目標とされた再生環境とは異なることがありうるからである。
図1Aは、データ抽出器104、ダイナミックレンジ・コントローラ106、オーディオ・レンダラー108などを有する例示的なオーディオ・デコーダ100を示している。
図1Bは例示的なエンコーダ150を示している。エンコーダ(150)は、オーディオ・コンテンツ・インターフェース152、ダイアログ・ラウドネス解析器154、DRC参照貯蔵部156、オーディオ信号エンコーダ158などを有していてもよい。エンコーダ150は、放送システム、インターネット・ベースのコンテンツ・サーバー、無線経由(over-the-air)ネットワーク事業者システム、映画制作システムなどの一部であってもよい。
図2Aおよび図2Bは、入力ラウドネス・レベルからDRC利得を導出するためにデコーダ(100)中のDRC利得ユニット(104)によって使用されることのできる例示的なダイナミックレンジ圧縮曲線を示している。図のように、ダイナミックレンジ圧縮曲線は、特定の再生環境のために適切な全体的な利得を提供するために、プログラムにおける参照ラウドネス・レベルを中心としていてもよい。ダイナミックレンジ圧縮曲線の例示的な定義データ(たとえば、エンコードされたオーディオ信号102のメタデータ内など)(たとえば、これだけに限られないが、ブースト比、カット比、アタック時間、リリース時間などを含む)が下記の表に示される。ここで、複数のプロファイル(たとえば、フィルム・スタンダード(film standard)、フィルム・ライト(film light)、音楽スタンダード(music standard)、音楽ライト(music light)、発話(speech)など)における各プロファイルは、(たとえばデコーダ100などにおける)特定の再生環境を表わす。
図3は、組み合わされたDRCおよび制限利得の決定/計算の例示的な処理論理を示す。処理論理は、デコーダ(100)、エンコーダ(150)などによって実装されてもよい。単に例解のため、デコーダ(たとえば100など)におけるDRC利得ユニット(たとえば114)が該処理論理を実装するために使われてもよい。
DRC利得平滑化に加えて、さまざまな実施形態において、本稿に記載される技法のもとでの他の平滑化プロセスが実装されてもよい。一例では、入力平滑化が使われてもよく、エンコードされたオーディオ信号(102)から抽出された入力オーディオ・データをたとえば単純な単極平滑化フィルタを用いて平滑化して、入力平滑化なしの特定的ラウドネス・レベルのスペクトルよりよい時間的特性をもつ(たとえば、時間的によりなめらかである、時間的にスパイクがより少ない、など)特定的ラウドネス・レベルのスペクトルを得てもよい。
いくつかの実施形態では、特定的な諸周波数帯域における特定的な諸ラウドネス・レベルが、それらの特定の周波数帯域における対応するDRC利得を導出するために使われることができる。しかしながら、これは、音色の変化につながることがある。それらの特定的ラウドネス・レベルは異なる帯域において著しく変わることがあり、よって、たとえ全周波数帯域にわたるブロードバンド(または広帯域)ラウドネス・レベルが一定のままであるときでも、異なるDRC利得を被ることがあるからである。
本稿に記載される技法を実装しない他のアプローチのもとでのオーディオ励起信号にボリューム調整のための線形処理を適用することは、低い可聴信号レベルを聞こえなくすることがありうる(たとえば、人間の聴覚系の周波数依存の聴覚閾値を下回るなど)。
いくつかの実施形態では、オーディオ・コンテンツ(152)は、前記エンコードされたオーディオ信号(102)において、複数のオーディオ・チャネルまたはスピーカーを含む参照スピーカー構成(たとえばサラウンドサウンド構成、5.1スピーカー構成など)のためにエンコードされている。
本稿に記載される技法のもとでは、動的等化、ノイズ補償などといった他の処理も、物理領域(または物理領域を表わすデジタル領域)ではなくラウドネス(たとえば知覚的)領域で実行されることができる。
伝送フィルタ、聴覚的フィルタバンク、合成フィルタバンク、短時間フーリエ変換などといった一つまたは複数のオーディオ処理要素、ユニット、コンポーネントなどが、本稿に記載されるオーディオ処理動作を実行するためにエンコーダまたはデコーダによって使われてもよい。
いくつかの実施形態では、特定のスピーカー構成がマルチチャネル構成であるとき、物理領域(または物理領域を表わすデジタル領域)からラウドネス領域への変換の前にすべてのチャネルの励起信号をまず加算することによって、全体的ラウドネス・レベルが得られてもよい。しかしながら、特定のスピーカー構成におけるすべてのチャネルに同じ利得を適用することは、その特定のスピーカー構成の異なるチャネルの間の空間的バランス(異なるチャネルの間の相対的なラウドネス・レベルなどに関するバランス)を保存しないことがある。
いくつかの実施形態では、本稿に記載されるエンコーダは、(たとえばエンコードされたオーディオ信号102中にエンコードされているなどの)オーディオ・コンテンツにおける聴覚イベント境界を検出し、一つまたは複数のASAパラメータを生成し、該一つまたは複数のASAパラメータを、下流の装置(たとえばデコーダ100など)に送達されるエンコードされたオーディオ信号(たとえば102など)の一部としてフォーマットするために、コンピュータ・ベースの聴覚シーン解析(ASA)を実装してもよい。ASAパラメータは、これだけに限られるものではないが、聴覚イベント境界の位置、聴覚イベント確実性指標の値(下記でさらに説明する)などを含みうる。
ここで、bは帯域を示し、tは時間またはオーディオ・フレーム・インデックスを示し、maxb{N[b,t]}はすべての周波数帯域にわたる最大の特定的ラウドネス・レベルである。
差分絶対値和は、次のように、0から1の値範囲をもつ聴覚イベント確実性指標にマッピングされる。
ラウドネス・レベル遷移はたとえば、二つのプログラムの間、プログラムとラウドなコマーシャルの間などで起こりうる。いくつかの実施形態では、デコーダ(100)は、(たとえば、過去4秒にわたってエンコードされたオーディオ信号102から受領されたなどの)過去のオーディオ・コンテンツに基づく瞬時ラウドネス・レベルのヒストグラムを維持するよう構成される。ラウドネス・レベル遷移前からラウドネス・レベル遷移後にかけての時間区間にわたって、高められた確率をもつ二つの領域がヒストグラムに記録されうる。それらの領域の一方は、前のラウドネス・レベルを中心としており、一方、それらの領域の他方は、新しいラウドネス・レベルを中心としている。
いくつかの実施形態では、本稿に記載されるエンコーダ(たとえば150など)は、リセット・イベントを検出し、該リセット・イベントの指標を、エンコードされたオーディオ信号(たとえば102など)に含めるよう構成される。第一の例では、エンコーダ(150)は、相対的な無音の連続的な(たとえばシステムおよび/またはユーザーによって構成設定可能な250ミリ秒など)期間が生じると判別することに応答してリセット・イベントを検出する。第二の例では、エンコーダ(150)は、すべての周波数帯域を横断して励起レベルの大きな瞬間的な降下が生じることを判別するのに応答してリセット・イベントを検出する。第三の例では、エンコーダは、リセットを要求する、コンテンツ遷移(たとえばプログラム開始/終了、シーン変化など)が生じるところで入力(たとえばユーザー入力、システム制御されるメタデータなど)を与えられる。
いくつかの実施形態では、オーディオ・デコーダは、エンコードされたオーディオ信号中にエンコードされるべきオーディオ・コンテンツの個々の部分(たとえば、オーディオ・データ・ブロック、オーディオ・データ・フレームなど)について利得(たとえばDRC利得など)の一つまたは複数の集合を計算するよう構成されることができる。オーディオ・エンコーダによって生成された利得のそれらの集合は、すべてのチャネル(たとえば左前方、右前方、低域効果もしくはLFE、中央、左サラウンド、右サラウンドなど)についての単一のブロードバンド(または広帯域)利得を含む利得の第一の集合;チャネルの個々の部分集合についての個々のブロードバンド(または広帯域)利得を含む利得の第二の集合;チャネルの個々の部分集合についておよび第一の数(たとえば二つなど)の個々の帯域(たとえば各チャネルにおける二つの帯域など)のそれぞれについての個々のブロードバンド(または広帯域)利得を含む利得の第三の集合;チャネルの個々の部分集合についておよび第二の数(たとえば四つなど)の個々の帯域(たとえば各チャネルにおける四つの帯域など)のそれぞれについての個々のブロードバンド(または広帯域)利得を含む利得の第四の集合;などを含んでいてもよい。ここに記載されるチャネルの部分集合は、左前方、右前方およびLFEチャネルを含む部分集合、中央チャネルを含む部分集合、左サラウンドおよび右サラウンド・チャネルを含む部分集合などの一つであってもよい。
図5は、限定しない例示的実施形態における例示的なコーデック・システムを示している。150などのようなオーディオ・エンコーダ内の処理ユニットであってもよいコンテンツ・クリエーターは、オーディオ・コンテンツ(「オーディオ」)をエンコーダ・ユニット(「NGCエンコーダ」)に提供するよう構成される。エンコーダ・ユニットは、オーディオ・コンテンツをオーディオ・データ・ブロックおよび/またはフレームにフォーマットし、オーディオ・データ・ブロックおよび/またはフレームをエンコードされたオーディオ信号にエンコードする。コンテンツ・クリエーターは、オーディオ・コンテンツにおける一つまたは複数のプログラム、コマーシャルなどの一つまたは複数のダイアログ・ラウドネス・レベル(「dialnorm」)および一つまたは複数のダイナミックレンジ圧縮曲線識別子(「圧縮曲線ID」)を確立/生成するようにも構成される。コンテンツ・クリエーターは、オーディオ・コンテンツにおける一つまたは複数のダイアログ・オーディオ・トラックからダイアログ・ラウドネス・レベルを決定してもよい。ダイナミックレンジ圧縮曲線識別子は、少なくとも部分的にはユーザー入力、システム構成設定パラメータなどに基づいて選択されてもよい。コンテンツ・クリエーターは、オーディオ・コンテンツおよびdialnormを生成するためにツールを使う人間(たとえばアーチスト、オーディオ・エンジニアなど)であってもよい。
ある実施形態によれば、本稿に記載される技法は、一つまたは複数の特殊目的コンピューティング装置によって実装される。特殊目的コンピューティング装置は、本技法を実行するよう固定構成とされていてもよいし、あるいは一つまたは複数の特定用途向け集積回路(ASIC)またはフィールド・プログラマブル・ゲート・アレイ(FPGA)のような、本技法を実行するよう持続的にプログラムされたデジタル電子デバイスを含んでいてもよいし、あるいはファームウェア、メモリ、他の記憶または組み合わせにおけるプログラム命令に従って本技法を実行するようプログラムされた一つまたは複数の汎用ハードウェア・プロセッサを含んでいてもよい。そのような特殊目的コンピューティング装置は、カスタムの固定構成論理、ASICまたはFPGAをカスタムのプログラミングと組み合わせて本技法を達成してもよい。特殊目的コンピューティング装置はデスクトップ・コンピュータ・システム、ポータブル・コンピュータ・システム、ハンドヘルド装置、ネットワーキング装置または本技法を実装するために固定構成および/またはプログラム論理を組み込んでいる他の任意の装置であってもよい。
以上の明細書では、本発明の例示的実施形態について、実装によって変わりうる数多くの個別的詳細に言及しつつ述べてきた。このように、何が本発明であるか、何が出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは特性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。
〔態様1〕
参照スピーカー構成のために符号化されたオーディオ・コンテンツを生成する段階と;
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツを、特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスする段階と;
前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツの個々の部分に対して一つまたは複数の利得調整を実行する段階と;
前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対してラウドネス測定を実行する段階と;
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツと、少なくとも部分的には前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対する前記ラウドネス測定に基づいて生成されたダウンミックス・ラウドネス・メタデータとを含むオーディオ信号を生成する段階とを含む、
一つまたは複数のコンピューティング装置によって実行される方法。
〔態様2〕
前記参照スピーカー構成はサラウンド・スピーカー構成であり、前記特定のスピーカー構成は二チャネル構成である、態様1記載の方法。
〔態様3〕
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツは、一つまたは複数のダウンミックスの式に基づいて、前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツにダウンミックスされる、態様1または2記載の方法。
〔態様4〕
前記ダウンミックス・ラウドネス・メタデータは、ダウンミックス・ラウドネス・パラメータの一つまたは複数の集合を含み、ダウンミックス・ラウドネス・パラメータの前記一つまたは複数の集合の各集合は、ダウンミックス・ラウドネス・パラメータの前記一つまたは複数の集合が対応するダウンミックス動作の一つまたは複数の型のうちのある個別の型のダウンミックス動作に対応する、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記一つまたは複数の型のダウンミックス動作は、LtRtダウンミックス動作またはLoRoダウンミックス動作の少なくとも一方を含む、態様4記載の方法。
〔態様6〕
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツを特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスすることは、一つまたは複数の型のダウンミックス動作に基づき、
前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対してラウドネス測定を実行することは、前記一つまたは複数の型のダウンミックス動作のそれぞれに関係する前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対してラウドネス測定を実行することを含む、態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記一つまたは複数の利得調整が、ダイアログ正規化、ダイナミックレンジ圧縮またはダウンミックス過負荷に対して保護するための固定された減衰のうちの一つまたは複数に関係する少なくとも一つの利得調整を含む、態様1ないし6のうちいずれか一項記載の方法。
〔態様8〕
前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対する前記ラウドネス測定は、前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対して前記一つまたは複数の利得調整が適用されたあとに実行される、態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
前記一つまたは複数の利得調整は、前記オーディオ・コンテンツの前記個々の部分のうち少なくとも二つの部分について異なる利得調整パラメータ値を使う、態様1ないし8のうちいずれか一項記載の方法。
〔態様10〕
前記オーディオ・コンテンツの前記個々の部分のうち前記少なくとも二つの部分は、少なくとも二つの異なる時間におけるオーディオ・コンテンツ部分を表わす、態様9記載の方法。
〔態様11〕
前記特定のスピーカー構成のための前記ダウンミックスされたオーディオ・コンテンツが、前記オーディオ信号においてエンコードされないようにすることをさらに含む、態様1ないし10のうちいずれか一項記載の方法。
〔態様12〕
前記ラウドネス測定は、ラウドネス・K重み付けフルスケール(LKFS)標準に基づく、態様1ないし11のうちいずれか一項記載の方法。
〔態様13〕
前記ラウドネス測定は、ラウドネス・K重み付けフルスケール(LKFS)標準以外のラウドネス標準に基づく、態様1ないし11のうちいずれか一項記載の方法。
〔態様14〕
前記ダウンミックス・ラウドネス・メタデータが、前記オーディオ信号においてエンコードされている全体的なオーディオ・メタデータの一部を表わす、態様1ないし13のうちいずれか一項記載の方法。
〔態様15〕
前記ダウンミックス・ラウドネス・メタデータは、ダウンミックス・ラウドネス・オフセットを示すデータ・フィールドを有する、態様1ないし14のうちいずれか一項記載の方法。
〔態様16〕
前記エンコードされたオーディオ信号はオーディオビジュアル信号の一部である、態様1ないし15のうちいずれか一項記載の方法。
〔態様17〕
特定のスピーカー構成とともに動作するオーディオ・デコーダによって、参照スピーカー構成のために符号化されたオーディオ・コンテンツおよびダウンミックス・ラウドネス・メタデータを含むオーディオ信号を受領する段階と;
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツを、前記特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスする段階と;
前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツの個々の部分に対して一つまたは複数の利得調整を実行する段階であって、前記一つまたは複数の利得調整は、ダウンミックス・ラウドネス・メタデータに基づくのではない、段階と;
前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対して一つまたは複数の追加的な利得調整を実行する段階であって、前記一つまたは複数の追加的な利得調整は、前記ダウンミックス・ラウドネス・メタデータに基づく、段階とを含む、
一つまたは複数のコンピューティング装置によって実行される方法。
〔態様18〕
前記参照スピーカー構成はサラウンド・スピーカー構成であり、前記特定のスピーカー構成は二チャネル構成である、態様17記載の方法。
〔態様19〕
一つまたは複数の選択因子に基づいて特定の型のダウンミックス動作を決定する段階と;
該特定の型のダウンミックス動作を、前記参照スピーカー構成のために符号化されたオーディオ・コンテンツを前記特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスすることにおいて適用する段階と;
前記ダウンミックス・ラウドネス・メタデータにおけるダウンミックス・ラウドネス・パラメータの一つまたは複数の集合から、前記特定の型のダウンミックス動作が対応する、ダウンミックス・ラウドネス・パラメータの特定の集合を決定する段階と;
少なくとも部分的にはダウンミックス・ラウドネス・パラメータの前記特定の集合に基づいて、前記特定のスピーカー構成について符号化された前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対して前記一つまたは複数の追加的な利得調整を実行する段階とをさらに含む、
態様17または18記載の方法。
〔態様20〕
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツは、一つまたは複数のダウンミックスの式に基づいて、前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツにダウンミックスされ、前記一つまたは複数のダウンミックスの式は、前記オーディオ信号を生成するオーディオ・エンコーダによって使用されるのと同じダウンミックスの式である、態様17ないし19のうちいずれか一項記載の方法。
〔態様21〕
前記一つまたは複数の利得調整が、ダイアログ正規化、ダイナミックレンジ圧縮またはダウンミックス過負荷に対して保護するための固定された減衰のうちの一つまたは複数に関係する少なくとも一つの利得調整を含む、態様17ないし20のうちいずれか一項記載の方法。
〔態様22〕
前記一つまたは複数の利得調整は、ヌル利得の集合、ダイナミックレンジ圧縮(DRC)に関係する利得調整を含む利得調整の集合、DRCに関係する利得調整を除外する利得調整の集合、ダイアログ正規化に関係する利得調整を含む利得調整の集合、ダイアログ正規化に関係する利得調整を除外する利得調整の集合またはDRCおよびダイアログ正規化両方に関係する利得調整を含む利得調整の集合のうちの一つまたは複数から決定される利得調整の特定の集合を表わす、態様17ないし21のうちいずれか一項記載の方法。
〔態様23〕
前記一つまたは複数の利得調整は、前記オーディオ・コンテンツの前記個々の部分のうち少なくとも二つの部分について異なる利得調整パラメータ値を使う、態様17ないし22のうちいずれか一項記載の方法。
〔態様24〕
前記ダウンミックス・ラウドネス・メタデータが、前記オーディオ信号においてエンコードされている全体的なオーディオ・メタデータの一部を表わす、態様17ないし23のうちいずれか一項記載の方法。
〔態様25〕
前記ダウンミックス・ラウドネス・メタデータは、ダウンミックス・ラウドネス・オフセットを示すデータ・フィールドを有し、前記一つまたは複数の追加的な利得調整は、少なくとも部分的には前記ダウンミックス・ラウドネス・オフセットに基づいてなされる、態様17記載の方法。
〔態様26〕
前記一つまたは複数の利得調整は、前記ダウンミックス・オーディオ・コンテンツの前記一つまたは複数の個々の部分のうちの少なくとも一つの個々の部分についてダウンミックス音出力における期待されるラウドネスを生成せず、前記ダウンミックス・オーディオ・コンテンツの前記一つまたは複数の個々の部分のうちの前記少なくとも一つの個々の部分についてダウンミックス音出力における期待されるラウドネスを生成するために、前記一つまたは複数の追加的な利得調整が実行される、態様17ないし25のうちいずれか一項記載の方法。
〔態様27〕
前記エンコードされたオーディオ信号はオーディオビジュアル信号の一部である、態様17ないし26のうちいずれか一項記載の方法。
〔態様28〕
態様1ないし27のうちいずれか一項記載の方法の任意のものを実行するよう構成されたメディア処理システム。
〔態様29〕
態様1ないし27のうちいずれか一項記載の方法の任意のものを実行するよう構成された、プロセッサを有する装置。
〔態様30〕
一つまたは複数のプロセッサによって実行されたときに、態様1ないし27のうちいずれか一項記載の方法の実行を引き起こすソフトウェア命令を含む非一時的なコンピュータ可読記憶媒体。
Claims (8)
- エンコーダで生成されたラウドネス・メタデータに基づいてオーディオ信号を利得調整する方法であって:
参照チャネル構成とは異なる再生チャネル構成で動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号は前記参照チャネル構成の各チャネルについてのオーディオ・サンプル・データおよび前記エンコーダで生成されたラウドネス・メタデータを含み、前記エンコーダで生成されたラウドネス・メタデータは前記再生チャネル構成および前記参照チャネル構成を含む複数のチャネル構成についてのラウドネス・メタデータを含む、段階と;
前記複数のチャネル構成についてのラウドネス・メタデータから、前記再生チャネル構成についてのラウドネス・メタデータを選択する段階と;
前記再生チャネル構成についてのラウドネス・メタデータからラウドネス調整利得を決定する段階と;
前記ラウドネス調整利得を前記オーディオ・サンプル・データに適用される全体的な利得の一部として適用して、前記再生チャネル構成の各チャネルについて出力オーディオ・サンプル・データを生成する段階とを含み、
前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、参照ラウドネス・レベルとに依存し、
前記再生チャネル構成は、前記参照チャネル構成とは異なる数のオーディオ・チャネルをもつ、
方法。 - 前記全体的な利得は:ダウンミックスに関係した利得、前記オーディオ・サンプル・データの入力ダイナミックレンジが変換された元のダイナミックレンジを復元することに関係した利得、利得制限に関係した利得、利得平滑化に関係した利得またはダイアログ・ラウドネス正規化に関係した利得のうちの一つまたは複数を含む、請求項1に記載の方法。
- 前記全体的な利得は、前記再生チャネル構成におけるチャネルの部分集合に適用される利得を含む、請求項1に記載の方法。
- 前記再生チャネル構成は2チャネル構成である、請求項1に記載の方法。
- 前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、前記参照ラウドネス・レベルとの間の差に依存する、請求項1に記載の方法。
- 前記オーディオ・デコーダは、前記参照ラウドネス・レベルを設定する、請求項1に記載の方法。
- ソフトウェア命令を記憶している非一時的なコンピュータ読み取り可能記憶媒体であって、前記ソフトウェア命令は、一つまたは複数のプロセッサによって実行されると:
参照チャネル構成とは異なる再生チャネル構成で動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号は前記参照チャネル構成の各チャネルについてのオーディオ・サンプル・データおよびエンコーダで生成されたラウドネス・メタデータを含み、前記エンコーダで生成されたラウドネス・メタデータは前記再生チャネル構成および前記参照チャネル構成を含む複数のチャネル構成についてのラウドネス・メタデータを含む、段階と;
前記複数のチャネル構成についてのラウドネス・メタデータから、前記再生チャネル構成についてのラウドネス・メタデータを選択する段階と;
前記再生チャネル構成についてのラウドネス・メタデータからラウドネス調整利得を決定する段階と;
前記ラウドネス調整利得を前記オーディオ・サンプル・データに適用される全体的な利得の一部として適用して、前記再生チャネル構成の各チャネルについて出力オーディオ・サンプル・データを生成する段階とを実行させるものであり、
前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、参照ラウドネス・レベルとに依存し、
前記再生チャネル構成は、前記参照チャネル構成とは異なる数のオーディオ・チャネルをもつ、
媒体。 - エンコーダで生成されたラウドネス・メタデータに基づいてオーディオ信号を利得調整するためのオーディオ信号処理装置であって、当該オーディオ信号処理装置は:
参照チャネル構成とは異なる再生チャネル構成で動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号は前記参照チャネル構成の各チャネルについてのオーディオ・サンプル・データおよび前記エンコーダで生成されたラウドネス・メタデータを含み、前記エンコーダで生成されたラウドネス・メタデータは前記再生チャネル構成および前記参照チャネル構成を含む複数のチャネル構成についてのラウドネス・メタデータを含む、段階と;
前記複数のチャネル構成についてのラウドネス・メタデータから、前記再生チャネル構成についてのラウドネス・メタデータを選択する段階と;
前記再生チャネル構成についてのラウドネス・メタデータからラウドネス調整利得を決定する段階と;
前記ラウドネス調整利得を前記オーディオ・サンプル・データに適用される全体的な利得の一部として適用して、前記再生チャネル構成の各チャネルについて出力オーディオ・サンプル・データを生成する段階とを実行し、
前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、参照ラウドネス・レベルとに依存し、
前記再生チャネル構成は、前記参照チャネル構成とは異なる数のオーディオ・チャネルをもつ、
オーディオ信号処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022141114A JP7413470B2 (ja) | 2013-09-12 | 2022-09-06 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2023220176A JP2024029123A (ja) | 2013-09-12 | 2023-12-27 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877230P | 2013-09-12 | 2013-09-12 | |
US61/877,230 | 2013-09-12 | ||
US201361891324P | 2013-10-15 | 2013-10-15 | |
US61/891,324 | 2013-10-15 | ||
US201361892313P | 2013-10-17 | 2013-10-17 | |
US61/892,313 | 2013-10-17 | ||
US201461938043P | 2014-02-10 | 2014-02-10 | |
US61/938,043 | 2014-02-10 | ||
JP2020208417A JP7038788B2 (ja) | 2013-09-12 | 2020-12-16 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020208417A Division JP7038788B2 (ja) | 2013-09-12 | 2020-12-16 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022141114A Division JP7413470B2 (ja) | 2013-09-12 | 2022-09-06 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022066478A JP2022066478A (ja) | 2022-04-28 |
JP7138814B2 true JP7138814B2 (ja) | 2022-09-16 |
Family
ID=51589538
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016542041A Active JP6506764B2 (ja) | 2013-09-12 | 2014-09-09 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2019065463A Active JP6633239B2 (ja) | 2013-09-12 | 2019-03-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2019223670A Active JP6743265B2 (ja) | 2013-09-12 | 2019-12-11 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020128182A Active JP6812599B2 (ja) | 2013-09-12 | 2020-07-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020208417A Active JP7038788B2 (ja) | 2013-09-12 | 2020-12-16 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2022035109A Active JP7138814B2 (ja) | 2013-09-12 | 2022-03-08 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2022141114A Active JP7413470B2 (ja) | 2013-09-12 | 2022-09-06 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2023220176A Pending JP2024029123A (ja) | 2013-09-12 | 2023-12-27 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016542041A Active JP6506764B2 (ja) | 2013-09-12 | 2014-09-09 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2019065463A Active JP6633239B2 (ja) | 2013-09-12 | 2019-03-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2019223670A Active JP6743265B2 (ja) | 2013-09-12 | 2019-12-11 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020128182A Active JP6812599B2 (ja) | 2013-09-12 | 2020-07-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020208417A Active JP7038788B2 (ja) | 2013-09-12 | 2020-12-16 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022141114A Active JP7413470B2 (ja) | 2013-09-12 | 2022-09-06 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2023220176A Pending JP2024029123A (ja) | 2013-09-12 | 2023-12-27 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Country Status (6)
Country | Link |
---|---|
US (9) | US9521501B2 (ja) |
EP (3) | EP4379714A3 (ja) |
JP (8) | JP6506764B2 (ja) |
CN (6) | CN110675884B (ja) |
HK (1) | HK1222255A1 (ja) |
WO (1) | WO2015038522A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110675884B (zh) * | 2013-09-12 | 2023-08-08 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
CN109903776B (zh) | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
AU2014339086B2 (en) | 2013-10-22 | 2017-12-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
ES2710774T3 (es) | 2013-11-27 | 2019-04-26 | Dts Inc | Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales |
EP2879131A1 (en) * | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
KR102243654B1 (ko) * | 2014-04-25 | 2021-04-23 | 엘지전자 주식회사 | 공기조화장치 |
JPWO2016052191A1 (ja) * | 2014-09-30 | 2017-07-20 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
EP3467827B1 (en) | 2014-10-01 | 2020-07-29 | Dolby International AB | Decoding an encoded audio signal using drc profiles |
JP6510870B2 (ja) * | 2015-04-20 | 2019-05-08 | 日本放送協会 | 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム |
DE102015005007B4 (de) | 2015-04-21 | 2017-12-14 | Kronoton Gmbh | Verfahren zur Verbesserung der Klangqualität einer Audiodatei |
PT3311379T (pt) | 2015-06-17 | 2023-01-06 | Fraunhofer Ges Forschung | Controlo de intensidade sonora para interatividade de utilizador em sistemas de codificação de áudio |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9590580B1 (en) * | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
US10341770B2 (en) * | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
US10535355B2 (en) * | 2016-11-18 | 2020-01-14 | Microsoft Technology Licensing, Llc | Frame coding for spatial audio data |
TWI590239B (zh) * | 2016-12-09 | 2017-07-01 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
US9860644B1 (en) | 2017-04-05 | 2018-01-02 | Sonos, Inc. | Limiter for bass enhancement |
CN107994879B (zh) * | 2017-12-04 | 2022-07-08 | 北京小米移动软件有限公司 | 响度控制方法及装置 |
WO2019161191A1 (en) * | 2018-02-15 | 2019-08-22 | Dolby Laboratories Licensing Corporation | Loudness control methods and devices |
US10466959B1 (en) * | 2018-03-20 | 2019-11-05 | Amazon Technologies, Inc. | Automatic volume leveler |
IL307898A (en) | 2018-07-02 | 2023-12-01 | Dolby Laboratories Licensing Corp | Methods and devices for encoding and/or decoding embedded audio signals |
CN112384976B (zh) * | 2018-07-12 | 2024-10-11 | 杜比国际公司 | 动态eq |
US11335357B2 (en) * | 2018-08-14 | 2022-05-17 | Bose Corporation | Playback enhancement in audio systems |
EP4220639A1 (en) * | 2018-10-26 | 2023-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Directional loudness map based audio processing |
US11347470B2 (en) | 2018-11-16 | 2022-05-31 | Roku, Inc. | Detection of media playback loudness level and corresponding adjustment to audio during media replacement event |
CN109889170B (zh) * | 2019-02-25 | 2021-06-04 | 珠海格力电器股份有限公司 | 音频信号的控制方法和装置 |
BR112021020151A2 (pt) * | 2019-04-18 | 2021-12-14 | Dolby Laboratories Licensing Corp | Detector de diálogo |
EP3761672B1 (en) * | 2019-07-02 | 2023-04-05 | Dolby International AB | Using metadata to aggregate signal processing operations |
KR102390643B1 (ko) * | 2019-10-10 | 2022-04-27 | 가우디오랩 주식회사 | 오디오 라우드니스 메타데이터 생성 방법 및 이를 위한 장치 |
CN111261194A (zh) * | 2020-04-29 | 2020-06-09 | 浙江百应科技有限公司 | 一种基于pcm技术的音量分析方法 |
CN111698631B (zh) * | 2020-05-22 | 2021-10-15 | 深圳市东微智能科技股份有限公司 | 音频设备自动调试方法、音频设备以及音频系统 |
CN111640446B (zh) * | 2020-06-24 | 2023-03-10 | 北京百瑞互联技术有限公司 | 一种基于音频编码器的响度均衡方法、编码器及蓝牙设备 |
US11521623B2 (en) | 2021-01-11 | 2022-12-06 | Bank Of America Corporation | System and method for single-speaker identification in a multi-speaker environment on a low-frequency audio recording |
US20220270626A1 (en) * | 2021-02-22 | 2022-08-25 | Tencent America LLC | Method and apparatus in audio processing |
EP4320615A1 (en) * | 2021-04-06 | 2024-02-14 | Dolby International AB | Encoding of envelope information of an audio downmix signal |
EP4392970A1 (en) * | 2021-08-26 | 2024-07-03 | Dolby Laboratories Licensing Corporation | Method and apparatus for metadata-based dynamic processing of audio data |
AU2022405503A1 (en) * | 2021-12-07 | 2024-06-20 | Dolby International Ab | Method and apparatus for processing of audio data |
CN114267382B (zh) * | 2021-12-28 | 2024-02-13 | 深圳万兴软件有限公司 | 音乐音效处理的限制器控制方法、装置、设备及介质 |
CN118471239B (zh) * | 2024-07-12 | 2024-08-30 | 世优(北京)科技股份有限公司 | 音频信号的处理方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011030228A (ja) | 2004-04-16 | 2011-02-10 | Dolby Internatl Ab | レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法 |
Family Cites Families (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
US7266501B2 (en) | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
WO2005069272A1 (fr) * | 2003-12-15 | 2005-07-28 | France Telecom | Procede de synthese et de spatialisation sonores |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US20060106472A1 (en) * | 2004-11-16 | 2006-05-18 | Romesburg Eric D | Method and apparatus for normalizing sound recording loudness |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
DE602007011594D1 (de) * | 2006-04-27 | 2011-02-10 | Dolby Lab Licensing Corp | Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
JP5254983B2 (ja) * | 2007-02-14 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
CN101542597B (zh) * | 2007-02-14 | 2013-02-27 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
WO2008134590A1 (en) | 2007-04-26 | 2008-11-06 | Mushroom Networks | Link aggregation methods and devices |
US20090074209A1 (en) | 2007-08-16 | 2009-03-19 | Jeffrey Thompson | Audio Processing for Compressed Digital Television |
US9275648B2 (en) * | 2007-12-18 | 2016-03-01 | Lg Electronics Inc. | Method and apparatus for processing audio signal using spectral data of audio signal |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
JP2009296298A (ja) * | 2008-06-05 | 2009-12-17 | Panasonic Corp | 音声信号処理装置および方法 |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
EP2329492A1 (en) | 2008-09-19 | 2011-06-08 | Dolby Laboratories Licensing Corporation | Upstream quality enhancement signal processing for resource constrained client devices |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
US8422699B2 (en) * | 2009-04-17 | 2013-04-16 | Linear Acoustic, Inc. | Loudness consistency at program boundaries |
JP5531486B2 (ja) | 2009-07-29 | 2014-06-25 | ヤマハ株式会社 | オーディオ機器 |
EP2465200B1 (en) * | 2009-08-11 | 2015-02-25 | Dts Llc | System for increasing perceived loudness of speakers |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI443646B (zh) * | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
JP5658506B2 (ja) | 2010-08-02 | 2015-01-28 | 日本放送協会 | 音響信号変換装置及び音響信号変換プログラム |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
JP2013034295A (ja) | 2011-08-01 | 2013-02-14 | Kobe Steel Ltd | 発電設備に設けられた電圧安定化装置 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
ES2565394T3 (es) | 2011-12-15 | 2016-04-04 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, método y programa informático para evitar artefactos de recorte |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
RU2639663C2 (ru) | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
CN110675884B (zh) * | 2013-09-12 | 2023-08-08 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
CN109903776B (zh) * | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
AU2014339086B2 (en) | 2013-10-22 | 2017-12-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
KR101967810B1 (ko) | 2014-05-28 | 2019-04-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 데이터 프로세서 및 사용자 제어 데이터의 오디오 디코더들과 렌더러들로의 전송 |
RU2019122989A (ru) | 2014-05-30 | 2019-09-16 | Сони Корпорейшн | Устройство обработки информации и способ обработки информации |
US20180165358A1 (en) | 2014-06-30 | 2018-06-14 | Sony Corporation | Information processing apparatus and information processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
ES2870749T3 (es) | 2015-05-29 | 2021-10-27 | Fraunhofer Ges Forschung | Dispositivo y procedimiento para el control de volumen |
PT3311379T (pt) | 2015-06-17 | 2023-01-06 | Fraunhofer Ges Forschung | Controlo de intensidade sonora para interatividade de utilizador em sistemas de codificação de áudio |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2014
- 2014-09-09 CN CN201911020133.4A patent/CN110675884B/zh active Active
- 2014-09-09 EP EP24171710.7A patent/EP4379714A3/en active Pending
- 2014-09-09 CN CN201480050050.9A patent/CN105531759B/zh active Active
- 2014-09-09 EP EP14772025.4A patent/EP3044786B1/en active Active
- 2014-09-09 WO PCT/US2014/054718 patent/WO2015038522A1/en active Application Filing
- 2014-09-09 CN CN202410171725.0A patent/CN118016076A/zh active Pending
- 2014-09-09 CN CN202310944485.9A patent/CN116741189A/zh active Pending
- 2014-09-09 JP JP2016542041A patent/JP6506764B2/ja active Active
- 2014-09-09 EP EP24171711.5A patent/EP4379715A3/en active Pending
- 2014-09-09 US US14/916,522 patent/US9521501B2/en active Active
- 2014-09-09 CN CN201911020119.4A patent/CN110675883B/zh active Active
- 2014-09-09 CN CN201911020105.2A patent/CN110648677B/zh active Active
-
2016
- 2016-04-05 US US15/091,373 patent/US9681247B2/en active Active
- 2016-04-05 US US15/091,366 patent/US9686624B2/en active Active
- 2016-09-02 HK HK16110472.8A patent/HK1222255A1/zh unknown
-
2017
- 2017-06-16 US US15/625,749 patent/US10070243B2/en active Active
-
2018
- 2018-08-28 US US16/115,292 patent/US10368181B2/en active Active
-
2019
- 2019-03-29 JP JP2019065463A patent/JP6633239B2/ja active Active
- 2019-07-08 US US16/505,448 patent/US10674302B2/en active Active
- 2019-12-11 JP JP2019223670A patent/JP6743265B2/ja active Active
-
2020
- 2020-05-26 US US16/882,745 patent/US10993062B2/en active Active
- 2020-07-29 JP JP2020128182A patent/JP6812599B2/ja active Active
- 2020-12-16 JP JP2020208417A patent/JP7038788B2/ja active Active
-
2021
- 2021-04-26 US US17/240,901 patent/US11533575B2/en active Active
-
2022
- 2022-03-08 JP JP2022035109A patent/JP7138814B2/ja active Active
- 2022-09-06 JP JP2022141114A patent/JP7413470B2/ja active Active
- 2022-12-19 US US18/084,447 patent/US20230188918A1/en active Pending
-
2023
- 2023-12-27 JP JP2023220176A patent/JP2024029123A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011030228A (ja) | 2004-04-16 | 2011-02-10 | Dolby Internatl Ab | レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7138814B2 (ja) | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 | |
JP7118302B2 (ja) | 多様な再生環境のためのダイナミックレンジ制御 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7138814 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |