JP2016534669A - ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 - Google Patents
ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 Download PDFInfo
- Publication number
- JP2016534669A JP2016534669A JP2016542041A JP2016542041A JP2016534669A JP 2016534669 A JP2016534669 A JP 2016534669A JP 2016542041 A JP2016542041 A JP 2016542041A JP 2016542041 A JP2016542041 A JP 2016542041A JP 2016534669 A JP2016534669 A JP 2016534669A
- Authority
- JP
- Japan
- Prior art keywords
- downmix
- loudness
- audio
- audio content
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 96
- 238000005259 measurement Methods 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims description 98
- 230000006835 compression Effects 0.000 claims description 86
- 238000007906 compression Methods 0.000 claims description 86
- 238000012545 processing Methods 0.000 claims description 42
- 238000003860 storage Methods 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 18
- 241000610375 Sparisoma viride Species 0.000 claims description 9
- 230000009471 action Effects 0.000 claims description 3
- 230000014509 gene expression Effects 0.000 claims 3
- 238000009499 grossing Methods 0.000 description 52
- 230000008569 process Effects 0.000 description 31
- 238000013459 approach Methods 0.000 description 20
- 230000000670 limiting effect Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 15
- 230000008859 change Effects 0.000 description 12
- 230000007704 transition Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 9
- 230000003068 static effect Effects 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000036962 time dependent Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000002265 prevention Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 206010021403 Illusion Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本願は2013年9月12日に出願された米国仮特許出願第61/877,230号、2013年10月15日に出願された米国仮特許出願第61/891,324号、2014年2月10日に出願された米国仮特許出願第61/938,043号および2013年10月17日に出願された米国仮特許出願第61/892,313号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
本発明は、概括的にはオーディオ信号の処理に、より詳細にはダイナミックレンジ制御および他の型のオーディオ処理動作を幅広い多様な再生環境のうちの任意のものにおいてオーディオ信号に適用することに使用されうる技法に関する。
1.全般的概観
2.ダイナミックレンジ制御
3.オーディオ・デコーダ
4.オーディオ・エンコーダ
5.ダイナミックレンジ圧縮曲線
6.DRC利得、利得制限および利得平滑化
7.入力平滑化および利得平滑化
8.複数周波数帯域にわたるDRC
9.ラウドネス領域でのボリューム調整
10.ダウンミックス・ラウドネス調整
11.利得に関係した追加的動作
12.特定的およびブロードバンド(または広帯域)のラウドネス・レベル
13.チャネルの個々の部分集合のための個々の利得
14.聴覚シーン解析
15.ラウドネス・レベル遷移
16.リセット
17.エンコーダによって提供される利得
18.例示的なシステムおよびプロセス・フロー
19.実装機構――ハードウェアの概観
20.等価物、拡張、代替その他。
この概観は、本発明の実施形態のいくつかの側面の基本的な記述を提示する。この概観は該実施形態の諸側面の包括的ないし網羅的な要約ではないことは注意しておくべきである。さらに、この概観は、該実施形態の何らかの特に有意な側面もしくは要素を特定するものと理解されることも、一般には本発明の、特に該実施形態の何らかの範囲を画定するものと理解されることも、意図されていないことを注意しておくべきである。この概観は単に、その例示的実施形態に関係するいくつかの概念を凝縮された単純化された形式で提示するものであり、単に後続の例示的な諸実施形態のより詳細な説明への概念的な導入部として理解されるべきである。別個の諸実施形態が本稿において論じられるが、本稿で論じられる実施形態および/または部分実施形態の任意の組み合わせがさらなる実施形態をなすよう組み合わされてもよいことを注意しておく。
カスタマイズされたダイナミックレンジ制御なしでは、入力オーディオ情報(たとえばPCMサンプル、QMFマトリクスにおける時間‐周波数サンプルなど)はしばしば、再生装置の特定の再生環境(すなわち、装置の物理的および/または機械的な再生限界を含む)には不適切なラウドネス・レベルで再生される。再生装置の特定の再生環境は、エンコードされたオーディオ・コンテンツがエンコード装置において符号化されたときに目標とされた再生環境とは異なることがありうるからである。
図1Aは、データ抽出器104、ダイナミックレンジ・コントローラ106、オーディオ・レンダラー108などを有する例示的なオーディオ・デコーダ100を示している。
図1Bは例示的なエンコーダ150を示している。エンコーダ(150)は、オーディオ・コンテンツ・インターフェース152、ダイアログ・ラウドネス解析器154、DRC参照貯蔵部156、オーディオ信号エンコーダ158などを有していてもよい。エンコーダ150は、放送システム、インターネット・ベースのコンテンツ・サーバー、無線経由(over-the-air)ネットワーク事業者システム、映画制作システムなどの一部であってもよい。
図2Aおよび図2Bは、入力ラウドネス・レベルからDRC利得を導出するためにデコーダ(100)中のDRC利得ユニット(104)によって使用されることのできる例示的なダイナミックレンジ圧縮曲線を示している。図のように、ダイナミックレンジ圧縮曲線は、特定の再生環境のために適切な全体的な利得を提供するために、プログラムにおける参照ラウドネス・レベルを中心としていてもよい。ダイナミックレンジ圧縮曲線の例示的な定義データ(たとえば、エンコードされたオーディオ信号102のメタデータ内など)(たとえば、これだけに限られないが、ブースト比、カット比、アタック時間、リリース時間などを含む)が下記の表に示される。ここで、複数のプロファイル(たとえば、フィルム・スタンダード(film standard)、フィルム・ライト(film light)、音楽スタンダード(music standard)、音楽ライト(music light)、発話(speech)など)における各プロファイルは、(たとえばデコーダ100などにおける)特定の再生環境を表わす。
図3は、組み合わされたDRCおよび制限利得の決定/計算の例示的な処理論理を示す。処理論理は、デコーダ(100)、エンコーダ(150)などによって実装されてもよい。単に例解のため、デコーダ(たとえば100など)におけるDRC利得ユニット(たとえば114)が該処理論理を実装するために使われてもよい。
DRC利得平滑化に加えて、さまざまな実施形態において、本稿に記載される技法のもとでの他の平滑化プロセスが実装されてもよい。一例では、入力平滑化が使われてもよく、エンコードされたオーディオ信号(102)から抽出された入力オーディオ・データをたとえば単純な単極平滑化フィルタを用いて平滑化して、入力平滑化なしの特定的ラウドネス・レベルのスペクトルよりよい時間的特性をもつ(たとえば、時間的によりなめらかである、時間的にスパイクがより少ない、など)特定的ラウドネス・レベルのスペクトルを得てもよい。
いくつかの実施形態では、特定的な諸周波数帯域における特定的な諸ラウドネス・レベルが、それらの特定の周波数帯域における対応するDRC利得を導出するために使われることができる。しかしながら、これは、音色の変化につながることがある。それらの特定的ラウドネス・レベルは異なる帯域において著しく変わることがあり、よって、たとえ全周波数帯域にわたるブロードバンド(または広帯域)ラウドネス・レベルが一定のままであるときでも、異なるDRC利得を被ることがあるからである。
本稿に記載される技法を実装しない他のアプローチのもとでのオーディオ励起信号にボリューム調整のための線形処理を適用することは、低い可聴信号レベルを聞こえなくすることがありうる(たとえば、人間の聴覚系の周波数依存の聴覚閾値を下回るなど)。
いくつかの実施形態では、オーディオ・コンテンツ(152)は、前記エンコードされたオーディオ信号(102)において、複数のオーディオ・チャネルまたはスピーカーを含む参照スピーカー構成(たとえばサラウンドサウンド構成、5.1スピーカー構成など)のためにエンコードされている。
本稿に記載される技法のもとでは、動的等化、ノイズ補償などといった他の処理も、物理領域(または物理領域を表わすデジタル領域)ではなくラウドネス(たとえば知覚的)領域で実行されることができる。
伝送フィルタ、聴覚的フィルタバンク、合成フィルタバンク、短時間フーリエ変換などといった一つまたは複数のオーディオ処理要素、ユニット、コンポーネントなどが、本稿に記載されるオーディオ処理動作を実行するためにエンコーダまたはデコーダによって使われてもよい。
いくつかの実施形態では、特定のスピーカー構成がマルチチャネル構成であるとき、物理領域(または物理領域を表わすデジタル領域)からラウドネス領域への変換の前にすべてのチャネルの励起信号をまず加算することによって、全体的ラウドネス・レベルが得られてもよい。しかしながら、特定のスピーカー構成におけるすべてのチャネルに同じ利得を適用することは、その特定のスピーカー構成の異なるチャネルの間の空間的バランス(異なるチャネルの間の相対的なラウドネス・レベルなどに関するバランス)を保存しないことがある。
いくつかの実施形態では、本稿に記載されるエンコーダは、(たとえばエンコードされたオーディオ信号102中にエンコードされているなどの)オーディオ・コンテンツにおける聴覚イベント境界を検出し、一つまたは複数のASAパラメータを生成し、該一つまたは複数のASAパラメータを、下流の装置(たとえばデコーダ100など)に送達されるエンコードされたオーディオ信号(たとえば102など)の一部としてフォーマットするために、コンピュータ・ベースの聴覚シーン解析(ASA)を実装してもよい。ASAパラメータは、これだけに限られるものではないが、聴覚イベント境界の位置、聴覚イベント確実性指標の値(下記でさらに説明する)などを含みうる。
ここで、bは帯域を示し、tは時間またはオーディオ・フレーム・インデックスを示し、maxb{N[b,t]}はすべての周波数帯域にわたる最大の特定的ラウドネス・レベルである。
差分絶対値和は、次のように、0から1の値範囲をもつ聴覚イベント確実性指標にマッピングされる。
ラウドネス・レベル遷移はたとえば、二つのプログラムの間、プログラムとラウドなコマーシャルの間などで起こりうる。いくつかの実施形態では、デコーダ(100)は、(たとえば、過去4秒にわたってエンコードされたオーディオ信号102から受領されたなどの)過去のオーディオ・コンテンツに基づく瞬時ラウドネス・レベルのヒストグラムを維持するよう構成される。ラウドネス・レベル遷移前からラウドネス・レベル遷移後にかけての時間区間にわたって、高められた確率をもつ二つの領域がヒストグラムに記録されうる。それらの領域の一方は、前のラウドネス・レベルを中心としており、一方、それらの領域の他方は、新しいラウドネス・レベルを中心としている。
いくつかの実施形態では、本稿に記載されるエンコーダ(たとえば150など)は、リセット・イベントを検出し、該リセット・イベントの指標を、エンコードされたオーディオ信号(たとえば102など)に含めるよう構成される。第一の例では、エンコーダ(150)は、相対的な無音の連続的な(たとえばシステムおよび/またはユーザーによって構成設定可能な250ミリ秒など)期間が生じると判別することに応答してリセット・イベントを検出する。第二の例では、エンコーダ(150)は、すべての周波数帯域を横断して励起レベルの大きな瞬間的な降下が生じることを判別するのに応答してリセット・イベントを検出する。第三の例では、エンコーダは、リセットを要求する、コンテンツ遷移(たとえばプログラム開始/終了、シーン変化など)が生じるところで入力(たとえばユーザー入力、システム制御されるメタデータなど)を与えられる。
いくつかの実施形態では、オーディオ・デコーダは、エンコードされたオーディオ信号中にエンコードされるべきオーディオ・コンテンツの個々の部分(たとえば、オーディオ・データ・ブロック、オーディオ・データ・フレームなど)について利得(たとえばDRC利得など)の一つまたは複数の集合を計算するよう構成されることができる。オーディオ・エンコーダによって生成された利得のそれらの集合は、すべてのチャネル(たとえば左前方、右前方、低域効果もしくはLFE、中央、左サラウンド、右サラウンドなど)についての単一のブロードバンド(または広帯域)利得を含む利得の第一の集合;チャネルの個々の部分集合についての個々のブロードバンド(または広帯域)利得を含む利得の第二の集合;チャネルの個々の部分集合についておよび第一の数(たとえば二つなど)の個々の帯域(たとえば各チャネルにおける二つの帯域など)のそれぞれについての個々のブロードバンド(または広帯域)利得を含む利得の第三の集合;チャネルの個々の部分集合についておよび第二の数(たとえば四つなど)の個々の帯域(たとえば各チャネルにおける四つの帯域など)のそれぞれについての個々のブロードバンド(または広帯域)利得を含む利得の第四の集合;などを含んでいてもよい。ここに記載されるチャネルの部分集合は、左前方、右前方およびLFEチャネルを含む部分集合、中央チャネルを含む部分集合、左サラウンドおよび右サラウンド・チャネルを含む部分集合などの一つであってもよい。
図5は、限定しない例示的実施形態における例示的なコーデック・システムを示している。150などのようなオーディオ・エンコーダ内の処理ユニットであってもよいコンテンツ・クリエーターは、オーディオ・コンテンツ(「オーディオ」)をエンコーダ・ユニット(「NGCエンコーダ」)に提供するよう構成される。エンコーダ・ユニットは、オーディオ・コンテンツをオーディオ・データ・ブロックおよび/またはフレームにフォーマットし、オーディオ・データ・ブロックおよび/またはフレームをエンコードされたオーディオ信号にエンコードする。コンテンツ・クリエーターは、オーディオ・コンテンツにおける一つまたは複数のプログラム、コマーシャルなどの一つまたは複数のダイアログ・ラウドネス・レベル(「dialnorm」)および一つまたは複数のダイナミックレンジ圧縮曲線識別子(「圧縮曲線ID」)を確立/生成するようにも構成される。コンテンツ・クリエーターは、オーディオ・コンテンツにおける一つまたは複数のダイアログ・オーディオ・トラックからダイアログ・ラウドネス・レベルを決定してもよい。ダイナミックレンジ圧縮曲線識別子は、少なくとも部分的にはユーザー入力、システム構成設定パラメータなどに基づいて選択されてもよい。コンテンツ・クリエーターは、オーディオ・コンテンツおよびdialnormを生成するためにツールを使う人間(たとえばアーチスト、オーディオ・エンジニアなど)であってもよい。
ある実施形態によれば、本稿に記載される技法は、一つまたは複数の特殊目的コンピューティング装置によって実装される。特殊目的コンピューティング装置は、本技法を実行するよう固定構成とされていてもよいし、あるいは一つまたは複数の特定用途向け集積回路(ASIC)またはフィールド・プログラマブル・ゲート・アレイ(FPGA)のような、本技法を実行するよう持続的にプログラムされたデジタル電子デバイスを含んでいてもよいし、あるいはファームウェア、メモリ、他の記憶または組み合わせにおけるプログラム命令に従って本技法を実行するようプログラムされた一つまたは複数の汎用ハードウェア・プロセッサを含んでいてもよい。そのような特殊目的コンピューティング装置は、カスタムの固定構成論理、ASICまたはFPGAをカスタムのプログラミングと組み合わせて本技法を達成してもよい。特殊目的コンピューティング装置はデスクトップ・コンピュータ・システム、ポータブル・コンピュータ・システム、ハンドヘルド装置、ネットワーキング装置または本技法を実装するために固定構成および/またはプログラム論理を組み込んでいる他の任意の装置であってもよい。
以上の明細書では、本発明の例示的実施形態について、実装によって変わりうる数多くの個別的詳細に言及しつつ述べてきた。このように、何が本発明であるか、何が出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは特性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。
Claims (30)
- 参照スピーカー構成のために符号化されたオーディオ・コンテンツを生成する段階と;
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツを、特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスする段階と;
前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツの個々の部分に対して一つまたは複数の利得調整を実行する段階と;
前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対してラウドネス測定を実行する段階と;
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツと、少なくとも部分的には前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対する前記ラウドネス測定に基づいて生成されたダウンミックス・ラウドネス・メタデータとを含むオーディオ信号を生成する段階とを含む、
一つまたは複数のコンピューティング装置によって実行される方法。 - 前記参照スピーカー構成はサラウンド・スピーカー構成であり、前記特定のスピーカー構成は二チャネル構成である、請求項1記載の方法。
- 前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツは、一つまたは複数のダウンミックスの式に基づいて、前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツにダウンミックスされる、請求項1または2記載の方法。
- 前記ダウンミックス・ラウドネス・メタデータは、ダウンミックス・ラウドネス・パラメータの一つまたは複数の集合を含み、ダウンミックス・ラウドネス・パラメータの前記一つまたは複数の集合の各集合は、ダウンミックス・ラウドネス・パラメータの前記一つまたは複数の集合が対応するダウンミックス動作の一つまたは複数の型のうちのある個別の型のダウンミックス動作に対応する、請求項1ないし3のうちいずれか一項記載の方法。
- 前記一つまたは複数の型のダウンミックス動作は、LtRtダウンミックス動作またはLoRoダウンミックス動作の少なくとも一方を含む、請求項4記載の方法。
- 前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツを特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスすることは、一つまたは複数の型のダウンミックス動作に基づき、
前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対してラウドネス測定を実行することは、前記一つまたは複数の型のダウンミックス動作のそれぞれに関係する前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対してラウドネス測定を実行することを含む、請求項1ないし5のうちいずれか一項記載の方法。 - 前記一つまたは複数の利得調整が、ダイアログ正規化、ダイナミックレンジ圧縮またはダウンミックス過負荷に対して保護するための固定された減衰のうちの一つまたは複数に関係する少なくとも一つの利得調整を含む、請求項1ないし6のうちいずれか一項記載の方法。
- 前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対する前記ラウドネス測定は、前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対して前記一つまたは複数の利得調整が適用されたあとに実行される、請求項1ないし7のうちいずれか一項記載の方法。
- 前記一つまたは複数の利得調整は、前記オーディオ・コンテンツの前記個々の部分のうち少なくとも二つの部分について異なる利得調整パラメータ値を使う、請求項1ないし8のうちいずれか一項記載の方法。
- 前記オーディオ・コンテンツの前記個々の部分のうち前記少なくとも二つの部分は、少なくとも二つの異なる時間におけるオーディオ・コンテンツ部分を表わす、請求項9記載の方法。
- 前記特定のスピーカー構成のための前記ダウンミックスされたオーディオ・コンテンツが、前記オーディオ信号においてエンコードされないようにすることをさらに含む、請求項1ないし10のうちいずれか一項記載の方法。
- 前記ラウドネス測定は、ラウドネス・K重み付けフルスケール(LKFS)標準に基づく、請求項1ないし11のうちいずれか一項記載の方法。
- 前記ラウドネス測定は、ラウドネス・K重み付けフルスケール(LKFS)標準以外のラウドネス標準に基づく、請求項1ないし11のうちいずれか一項記載の方法。
- 前記ダウンミックス・ラウドネス・メタデータが、前記オーディオ信号においてエンコードされている全体的なオーディオ・メタデータの一部を表わす、請求項1ないし13のうちいずれか一項記載の方法。
- 前記ダウンミックス・ラウドネス・メタデータは、ダウンミックス・ラウドネス・オフセットを示すデータ・フィールドを有する、請求項1ないし14のうちいずれか一項記載の方法。
- 前記エンコードされたオーディオ信号はオーディオビジュアル信号の一部である、請求項1ないし15のうちいずれか一項記載の方法。
- 特定のスピーカー構成とともに動作するオーディオ・デコーダによって、参照スピーカー構成のために符号化されたオーディオ・コンテンツおよびダウンミックス・ラウドネス・メタデータを含むオーディオ信号を受領する段階と;
前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツを、前記特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスする段階と;
前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツの個々の部分に対して一つまたは複数の利得調整を実行する段階であって、前記一つまたは複数の利得調整は、ダウンミックス・ラウドネス・メタデータに基づくのではない、段階と;
前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対して一つまたは複数の追加的な利得調整を実行する段階であって、前記一つまたは複数の追加的な利得調整は、前記ダウンミックス・ラウドネス・メタデータに基づく、段階とを含む、
一つまたは複数のコンピューティング装置によって実行される方法。 - 前記参照スピーカー構成はサラウンド・スピーカー構成であり、前記特定のスピーカー構成は二チャネル構成である、請求項17記載の方法。
- 一つまたは複数の選択因子に基づいて特定の型のダウンミックス動作を決定する段階と;
該特定の型のダウンミックス動作を、前記参照スピーカー構成のために符号化されたオーディオ・コンテンツを前記特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスすることにおいて適用する段階と;
前記ダウンミックス・ラウドネス・メタデータにおけるダウンミックス・ラウドネス・パラメータの一つまたは複数の集合から、前記特定の型のダウンミックス動作が対応する、ダウンミックス・ラウドネス・パラメータの特定の集合を決定する段階と;
少なくとも部分的にはダウンミックス・ラウドネス・パラメータの前記特定の集合に基づいて、前記特定のスピーカー構成について符号化された前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対して前記一つまたは複数の追加的な利得調整を実行する段階とをさらに含む、
請求項17または18記載の方法。 - 前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツは、一つまたは複数のダウンミックスの式に基づいて、前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツにダウンミックスされ、前記一つまたは複数のダウンミックスの式は、前記オーディオ信号を生成するオーディオ・エンコーダによって使用されるのと同じダウンミックスの式である、請求項17ないし19のうちいずれか一項記載の方法。
- 前記一つまたは複数の利得調整が、ダイアログ正規化、ダイナミックレンジ圧縮またはダウンミックス過負荷に対して保護するための固定された減衰のうちの一つまたは複数に関係する少なくとも一つの利得調整を含む、請求項17ないし20のうちいずれか一項記載の方法。
- 前記一つまたは複数の利得調整は、ヌル利得の集合、ダイナミックレンジ圧縮(DRC)に関係する利得調整を含む利得調整の集合、DRCに関係する利得調整を除外する利得調整の集合、ダイアログ正規化に関係する利得調整を含む利得調整の集合、ダイアログ正規化に関係する利得調整を除外する利得調整の集合またはDRCおよびダイアログ正規化両方に関係する利得調整を含む利得調整の集合のうちの一つまたは複数から決定される利得調整の特定の集合を表わす、請求項17ないし21のうちいずれか一項記載の方法。
- 前記一つまたは複数の利得調整は、前記オーディオ・コンテンツの前記個々の部分のうち少なくとも二つの部分について異なる利得調整パラメータ値を使う、請求項17ないし22のうちいずれか一項記載の方法。
- 前記ダウンミックス・ラウドネス・メタデータが、前記オーディオ信号においてエンコードされている全体的なオーディオ・メタデータの一部を表わす、請求項17ないし23のうちいずれか一項記載の方法。
- 前記ダウンミックス・ラウドネス・メタデータは、ダウンミックス・ラウドネス・オフセットを示すデータ・フィールドを有し、前記一つまたは複数の追加的な利得調整は、少なくとも部分的には前記ダウンミックス・ラウドネス・オフセットに基づいてなされる、請求項17記載の方法。
- 前記一つまたは複数の利得調整は、前記ダウンミックス・オーディオ・コンテンツの前記一つまたは複数の個々の部分のうちの少なくとも一つの個々の部分についてダウンミックス音出力における期待されるラウドネスを生成せず、前記ダウンミックス・オーディオ・コンテンツの前記一つまたは複数の個々の部分のうちの前記少なくとも一つの個々の部分についてダウンミックス音出力における期待されるラウドネスを生成するために、前記一つまたは複数の追加的な利得調整が実行される、請求項17ないし25のうちいずれか一項記載の方法。
- 前記エンコードされたオーディオ信号はオーディオビジュアル信号の一部である、請求項17ないし26のうちいずれか一項記載の方法。
- 請求項1ないし27のうちいずれか一項記載の方法の任意のものを実行するよう構成されたメディア処理システム。
- 請求項1ないし27のうちいずれか一項記載の方法の任意のものを実行するよう構成された、プロセッサを有する装置。
- 一つまたは複数のプロセッサによって実行されたときに、請求項1ないし27のうちいずれか一項記載の方法の実行を引き起こすソフトウェア命令を含む非一時的なコンピュータ可読記憶媒体。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877230P | 2013-09-12 | 2013-09-12 | |
US61/877,230 | 2013-09-12 | ||
US201361891324P | 2013-10-15 | 2013-10-15 | |
US61/891,324 | 2013-10-15 | ||
US201361892313P | 2013-10-17 | 2013-10-17 | |
US61/892,313 | 2013-10-17 | ||
US201461938043P | 2014-02-10 | 2014-02-10 | |
US61/938,043 | 2014-02-10 | ||
PCT/US2014/054718 WO2015038522A1 (en) | 2013-09-12 | 2014-09-09 | Loudness adjustment for downmixed audio content |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019065463A Division JP6633239B2 (ja) | 2013-09-12 | 2019-03-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016534669A true JP2016534669A (ja) | 2016-11-04 |
JP6506764B2 JP6506764B2 (ja) | 2019-04-24 |
Family
ID=51589538
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016542041A Active JP6506764B2 (ja) | 2013-09-12 | 2014-09-09 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2019065463A Active JP6633239B2 (ja) | 2013-09-12 | 2019-03-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2019223670A Active JP6743265B2 (ja) | 2013-09-12 | 2019-12-11 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020128182A Active JP6812599B2 (ja) | 2013-09-12 | 2020-07-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020208417A Active JP7038788B2 (ja) | 2013-09-12 | 2020-12-16 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2022035109A Active JP7138814B2 (ja) | 2013-09-12 | 2022-03-08 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2022141114A Active JP7413470B2 (ja) | 2013-09-12 | 2022-09-06 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2023220176A Pending JP2024029123A (ja) | 2013-09-12 | 2023-12-27 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Family Applications After (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019065463A Active JP6633239B2 (ja) | 2013-09-12 | 2019-03-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2019223670A Active JP6743265B2 (ja) | 2013-09-12 | 2019-12-11 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020128182A Active JP6812599B2 (ja) | 2013-09-12 | 2020-07-29 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2020208417A Active JP7038788B2 (ja) | 2013-09-12 | 2020-12-16 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2022035109A Active JP7138814B2 (ja) | 2013-09-12 | 2022-03-08 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2022141114A Active JP7413470B2 (ja) | 2013-09-12 | 2022-09-06 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
JP2023220176A Pending JP2024029123A (ja) | 2013-09-12 | 2023-12-27 | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Country Status (6)
Country | Link |
---|---|
US (9) | US9521501B2 (ja) |
EP (3) | EP4379715A2 (ja) |
JP (8) | JP6506764B2 (ja) |
CN (6) | CN116741189A (ja) |
HK (1) | HK1222255A1 (ja) |
WO (1) | WO2015038522A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021530723A (ja) * | 2018-07-02 | 2021-11-11 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置 |
JP7449405B2 (ja) | 2021-02-22 | 2024-03-13 | テンセント・アメリカ・エルエルシー | オーディオ処理における方法及び装置 |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015038475A1 (en) | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
WO2015038522A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
JP6588899B2 (ja) | 2013-10-22 | 2019-10-09 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念 |
WO2015081293A1 (en) | 2013-11-27 | 2015-06-04 | Dts, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
KR102243654B1 (ko) * | 2014-04-25 | 2021-04-23 | 엘지전자 주식회사 | 공기조화장치 |
US10856042B2 (en) * | 2014-09-30 | 2020-12-01 | Sony Corporation | Transmission apparatus, transmission method, reception apparatus and reception method for transmitting a plurality of types of audio data items |
CN113257274A (zh) | 2014-10-01 | 2021-08-13 | 杜比国际公司 | 高效drc配置文件传输 |
JP6510870B2 (ja) * | 2015-04-20 | 2019-05-08 | 日本放送協会 | 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム |
DE102015005007B4 (de) | 2015-04-21 | 2017-12-14 | Kronoton Gmbh | Verfahren zur Verbesserung der Klangqualität einer Audiodatei |
PL3311379T3 (pl) | 2015-06-17 | 2023-03-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kontrola głośności dla interaktywności użytkownika w systemach kodowania audio |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9590580B1 (en) * | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
US10341770B2 (en) * | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
US10535355B2 (en) * | 2016-11-18 | 2020-01-14 | Microsoft Technology Licensing, Llc | Frame coding for spatial audio data |
TWI590239B (zh) * | 2016-12-09 | 2017-07-01 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
US9860644B1 (en) | 2017-04-05 | 2018-01-02 | Sonos, Inc. | Limiter for bass enhancement |
CN107994879B (zh) * | 2017-12-04 | 2022-07-08 | 北京小米移动软件有限公司 | 响度控制方法及装置 |
WO2019161191A1 (en) * | 2018-02-15 | 2019-08-22 | Dolby Laboratories Licensing Corporation | Loudness control methods and devices |
US10466959B1 (en) * | 2018-03-20 | 2019-11-05 | Amazon Technologies, Inc. | Automatic volume leveler |
CN112384976A (zh) * | 2018-07-12 | 2021-02-19 | 杜比国际公司 | 动态eq |
US11335357B2 (en) * | 2018-08-14 | 2022-05-17 | Bose Corporation | Playback enhancement in audio systems |
WO2020084170A1 (en) * | 2018-10-26 | 2020-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Directional loudness map based audio processing |
US11347470B2 (en) | 2018-11-16 | 2022-05-31 | Roku, Inc. | Detection of media playback loudness level and corresponding adjustment to audio during media replacement event |
CN109889170B (zh) * | 2019-02-25 | 2021-06-04 | 珠海格力电器股份有限公司 | 音频信号的控制方法和装置 |
CN113748461A (zh) * | 2019-04-18 | 2021-12-03 | 杜比实验室特许公司 | 对话检测器 |
US11545166B2 (en) * | 2019-07-02 | 2023-01-03 | Dolby International Ab | Using metadata to aggregate signal processing operations |
KR102390643B1 (ko) * | 2019-10-10 | 2022-04-27 | 가우디오랩 주식회사 | 오디오 라우드니스 메타데이터 생성 방법 및 이를 위한 장치 |
CN111261194A (zh) * | 2020-04-29 | 2020-06-09 | 浙江百应科技有限公司 | 一种基于pcm技术的音量分析方法 |
CN111698631B (zh) * | 2020-05-22 | 2021-10-15 | 深圳市东微智能科技股份有限公司 | 音频设备自动调试方法、音频设备以及音频系统 |
CN111640446B (zh) * | 2020-06-24 | 2023-03-10 | 北京百瑞互联技术有限公司 | 一种基于音频编码器的响度均衡方法、编码器及蓝牙设备 |
US11521623B2 (en) | 2021-01-11 | 2022-12-06 | Bank Of America Corporation | System and method for single-speaker identification in a multi-speaker environment on a low-frequency audio recording |
US20240161754A1 (en) * | 2021-04-06 | 2024-05-16 | Dolby International Ab | Encoding of envelope information of an audio downmix signal |
IL310650A (en) * | 2021-08-26 | 2024-04-01 | Dolby Laboratories Licensing Corp | Method and device for metadata-based dynamic processing of audio data |
AU2022405503A1 (en) * | 2021-12-07 | 2024-06-20 | Dolby International Ab | Method and apparatus for processing of audio data |
CN114267382B (zh) * | 2021-12-28 | 2024-02-13 | 深圳万兴软件有限公司 | 音乐音效处理的限制器控制方法、装置、设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012525600A (ja) * | 2009-04-28 | 2012-10-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム |
JP2013521539A (ja) * | 2010-03-10 | 2013-06-10 | ドルビー・インターナショナル・アーベー | 単一再生モードにおいてラウドネス測定値を合成するシステム |
Family Cites Families (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
US7266501B2 (en) | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
WO2005069272A1 (fr) * | 2003-12-15 | 2005-07-28 | France Telecom | Procede de synthese et de spatialisation sonores |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US20060106472A1 (en) * | 2004-11-16 | 2006-05-18 | Romesburg Eric D | Method and apparatus for normalizing sound recording loudness |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
KR101200615B1 (ko) * | 2006-04-27 | 2012-11-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 청각 이벤트 검출에 기반한 비-라우드니스를 이용한 자동 이득 제어 |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
CN101542595B (zh) * | 2007-02-14 | 2016-04-13 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
AU2008215231B2 (en) * | 2007-02-14 | 2010-02-18 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
WO2008134590A1 (en) | 2007-04-26 | 2008-11-06 | Mushroom Networks | Link aggregation methods and devices |
US20090074209A1 (en) | 2007-08-16 | 2009-03-19 | Jeffrey Thompson | Audio Processing for Compressed Digital Television |
AU2008339211B2 (en) * | 2007-12-18 | 2011-06-23 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
JP2009296298A (ja) * | 2008-06-05 | 2009-12-17 | Panasonic Corp | 音声信号処理装置および方法 |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
EP2329492A1 (en) | 2008-09-19 | 2011-06-08 | Dolby Laboratories Licensing Corporation | Upstream quality enhancement signal processing for resource constrained client devices |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
US8422699B2 (en) * | 2009-04-17 | 2013-04-16 | Linear Acoustic, Inc. | Loudness consistency at program boundaries |
JP5531486B2 (ja) | 2009-07-29 | 2014-06-25 | ヤマハ株式会社 | オーディオ機器 |
WO2011019339A1 (en) * | 2009-08-11 | 2011-02-17 | Srs Labs, Inc. | System for increasing perceived loudness of speakers |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI443646B (zh) * | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
JP5658506B2 (ja) * | 2010-08-02 | 2015-01-28 | 日本放送協会 | 音響信号変換装置及び音響信号変換プログラム |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
JP2013034295A (ja) | 2011-08-01 | 2013-02-14 | Kobe Steel Ltd | 発電設備に設けられた電圧安定化装置 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
RU2586874C1 (ru) | 2011-12-15 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
BR122022020326B1 (pt) | 2013-01-28 | 2023-03-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
WO2015038522A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
WO2015038475A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
JP6588899B2 (ja) | 2013-10-22 | 2019-10-09 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念 |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
CA3162763A1 (en) | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
RU2678487C2 (ru) | 2014-03-25 | 2019-01-29 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
PL3800898T3 (pl) | 2014-05-28 | 2023-12-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Procesor danych i transport danych kontrolnych użytkownika do dekoderów audio i modułów renderowania |
JPWO2015182491A1 (ja) | 2014-05-30 | 2017-04-20 | ソニー株式会社 | 情報処理装置および情報処理方法 |
CN106471574B (zh) | 2014-06-30 | 2021-10-12 | 索尼公司 | 信息处理装置和信息处理方法 |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
AU2016270282B2 (en) | 2015-05-29 | 2019-07-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for volume control |
PL3311379T3 (pl) | 2015-06-17 | 2023-03-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kontrola głośności dla interaktywności użytkownika w systemach kodowania audio |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2014
- 2014-09-09 WO PCT/US2014/054718 patent/WO2015038522A1/en active Application Filing
- 2014-09-09 CN CN202310944485.9A patent/CN116741189A/zh active Pending
- 2014-09-09 EP EP24171711.5A patent/EP4379715A2/en active Pending
- 2014-09-09 EP EP24171710.7A patent/EP4379714A2/en active Pending
- 2014-09-09 US US14/916,522 patent/US9521501B2/en active Active
- 2014-09-09 CN CN201480050050.9A patent/CN105531759B/zh active Active
- 2014-09-09 CN CN201911020105.2A patent/CN110648677B/zh active Active
- 2014-09-09 CN CN201911020119.4A patent/CN110675883B/zh active Active
- 2014-09-09 CN CN202410171725.0A patent/CN118016076A/zh active Pending
- 2014-09-09 CN CN201911020133.4A patent/CN110675884B/zh active Active
- 2014-09-09 JP JP2016542041A patent/JP6506764B2/ja active Active
- 2014-09-09 EP EP14772025.4A patent/EP3044786B1/en active Active
-
2016
- 2016-04-05 US US15/091,373 patent/US9681247B2/en active Active
- 2016-04-05 US US15/091,366 patent/US9686624B2/en active Active
- 2016-09-02 HK HK16110472.8A patent/HK1222255A1/zh unknown
-
2017
- 2017-06-16 US US15/625,749 patent/US10070243B2/en active Active
-
2018
- 2018-08-28 US US16/115,292 patent/US10368181B2/en active Active
-
2019
- 2019-03-29 JP JP2019065463A patent/JP6633239B2/ja active Active
- 2019-07-08 US US16/505,448 patent/US10674302B2/en active Active
- 2019-12-11 JP JP2019223670A patent/JP6743265B2/ja active Active
-
2020
- 2020-05-26 US US16/882,745 patent/US10993062B2/en active Active
- 2020-07-29 JP JP2020128182A patent/JP6812599B2/ja active Active
- 2020-12-16 JP JP2020208417A patent/JP7038788B2/ja active Active
-
2021
- 2021-04-26 US US17/240,901 patent/US11533575B2/en active Active
-
2022
- 2022-03-08 JP JP2022035109A patent/JP7138814B2/ja active Active
- 2022-09-06 JP JP2022141114A patent/JP7413470B2/ja active Active
- 2022-12-19 US US18/084,447 patent/US20230188918A1/en active Pending
-
2023
- 2023-12-27 JP JP2023220176A patent/JP2024029123A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012525600A (ja) * | 2009-04-28 | 2012-10-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム |
JP2013521539A (ja) * | 2010-03-10 | 2013-06-10 | ドルビー・インターナショナル・アーベー | 単一再生モードにおいてラウドネス測定値を合成するシステム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021530723A (ja) * | 2018-07-02 | 2021-11-11 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置 |
US12020718B2 (en) | 2018-07-02 | 2024-06-25 | Dolby International Ab | Methods and devices for generating or decoding a bitstream comprising immersive audio signals |
JP7449405B2 (ja) | 2021-02-22 | 2024-03-13 | テンセント・アメリカ・エルエルシー | オーディオ処理における方法及び装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7413470B2 (ja) | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 | |
JP7118302B2 (ja) | 多様な再生環境のためのダイナミックレンジ制御 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190329 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6506764 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |