JP2019068485A - 多様な再生環境のためのダイナミックレンジ制御 - Google Patents
多様な再生環境のためのダイナミックレンジ制御 Download PDFInfo
- Publication number
- JP2019068485A JP2019068485A JP2019017758A JP2019017758A JP2019068485A JP 2019068485 A JP2019068485 A JP 2019068485A JP 2019017758 A JP2019017758 A JP 2019017758A JP 2019017758 A JP2019017758 A JP 2019017758A JP 2019068485 A JP2019068485 A JP 2019068485A
- Authority
- JP
- Japan
- Prior art keywords
- gain
- audio
- drc
- default
- gains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 125
- 238000000034 method Methods 0.000 claims description 117
- 238000003860 storage Methods 0.000 claims description 20
- 230000008929 regeneration Effects 0.000 claims description 2
- 238000011069 regeneration method Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 abstract description 110
- 238000007906 compression Methods 0.000 abstract description 110
- 238000009499 grossing Methods 0.000 description 63
- 238000012545 processing Methods 0.000 description 41
- 230000008569 process Effects 0.000 description 33
- 238000013459 approach Methods 0.000 description 20
- 230000000670 limiting effect Effects 0.000 description 19
- 230000004044 response Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 16
- 241000282414 Homo sapiens Species 0.000 description 15
- 230000008859 change Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000007704 transition Effects 0.000 description 14
- 230000003068 static effect Effects 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000036962 time dependent Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 244000050403 Iris x germanica Species 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/12—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/12—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
- H03G9/18—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Control Of Amplification And Gain Control (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本願は2013年9月12日に出願された米国仮特許出願第61/877,230号、2013年10月15日に出願された米国仮特許出願第61/891,324号および2014年2月10日に出願された米国仮特許出願第61/938,043号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
本発明は、概括的にはオーディオ信号の処理に、より詳細にはダイナミックレンジ制御および他の型のオーディオ処理動作を幅広い多様な再生環境のうちの任意のものにおいてオーディオ信号に適用することに使用されうる技法に関する。
1.全般的概観
2.ダイナミックレンジ制御
3.オーディオ・デコーダ
4.オーディオ・エンコーダ
5.ダイナミックレンジ圧縮曲線
6.DRC利得、利得制限および利得平滑化
7.入力平滑化および利得平滑化
8.複数周波数帯域にわたるDRC
9.ラウドネス領域でのボリューム調整
10.差分利得による利得プロファイル
11.利得に関係した追加的動作
12.特定的およびブロードバンド(または広帯域)のラウドネス・レベル
13.チャネルの個々の部分集合のための個々の利得
14.聴覚シーン解析
15.ラウドネス・レベル遷移
16.リセット
17.エンコーダによって提供される利得
18.例示的なシステムおよびプロセス・フロー
19.実装機構――ハードウェアの概観
20.等価物、拡張、代替その他。
この概観は、本発明の実施形態のいくつかの側面の基本的な記述を提示する。この概観は該実施形態の諸側面の包括的ないし網羅的な要約ではないことは注意しておくべきである。さらに、この概観は、該実施形態の何らかの特に有意な側面もしくは要素を特定するものと理解されることも、一般には本発明の、特に該実施形態の何らかの範囲を画定するものと理解されることも、意図されていないことを注意しておくべきである。この概観は単に、その例示的実施形態に関係するいくつかの概念を凝縮された単純化された形式で提示するものであり、単に後続の例示的な諸実施形態のより詳細な説明への概念的な導入部として理解されるべきである。別個の諸実施形態が本稿において論じられるが、本稿で論じられる実施形態および/または部分実施形態の任意の組み合わせがさらなる実施形態をなすよう組み合わされてもよいことを注意しておく。
カスタマイズされたダイナミックレンジ制御なしでは、入力オーディオ情報(たとえばPCMサンプル、QMFマトリクスにおける時間‐周波数サンプルなど)はしばしば、再生装置の特定の再生環境(すなわち、装置の物理的および/または機械的な再生限界を含む)には不適切なラウドネス・レベルで再生される。再生装置の特定の再生環境は、エンコードされたオーディオ・コンテンツがエンコード装置において符号化されたときに目標とされた再生環境とは異なることがありうるからである。
図1Aは、データ抽出器104、ダイナミックレンジ・コントローラ106、オーディオ・レンダラー108などを有する例示的なオーディオ・デコーダ100を示している。
図1Bは例示的なエンコーダ150を示している。エンコーダ(150)は、オーディオ・コンテンツ・インターフェース152、ダイアログ・ラウドネス解析器154、DRC参照貯蔵部156、オーディオ信号エンコーダ158などを有していてもよい。エンコーダ150は、放送システム、インターネット・ベースのコンテンツ・サーバー、無線経由(over-the-air)ネットワーク事業者システム、映画制作システムなどの一部であってもよい。
図2Aおよび図2Bは、入力ラウドネス・レベルからDRC利得を導出するためにデコーダ(100)中のDRC利得ユニット(104)によって使用されることのできる例示的なダイナミックレンジ圧縮曲線を示している。図のように、ダイナミックレンジ圧縮曲線は、特定の再生環境のために適切な全体的な利得を提供するために、プログラムにおける参照ラウドネス・レベルを中心としていてもよい。ダイナミックレンジ圧縮曲線の例示的な定義データ(たとえば、エンコードされたオーディオ信号102のメタデータ内など)(たとえば、これだけに限られないが、ブースト比、カット比、アタック時間、リリース時間などを含む)が下記の表に示される。ここで、複数のプロファイル(たとえば、フィルム・スタンダード(film standard)、フィルム・ライト(film light)、音楽スタンダード(music standard)、音楽ライト(music light)、発話(speech)など)における各プロファイルは、(たとえばデコーダ100などにおける)特定の再生環境を表わす。
図3は、組み合わされたDRCおよび制限利得の決定/計算の例示的な処理論理を示す。処理論理は、デコーダ(100)、エンコーダ(150)などによって実装されてもよい。単に例解のため、デコーダ(たとえば100など)におけるDRC利得ユニット(たとえば114)が該処理論理を実装するために使われてもよい。
DRC利得平滑化に加えて、さまざまな実施形態において、本稿に記載される技法のもとでの他の平滑化プロセスが実装されてもよい。一例では、入力平滑化が使われてもよく、エンコードされたオーディオ信号(102)から抽出された入力オーディオ・データをたとえば単純な単極平滑化フィルタを用いて平滑化して、入力平滑化なしの特定的ラウドネス・レベルのスペクトルよりよい時間的特性をもつ(たとえば、時間的によりなめらかである、時間的にスパイクがより少ない、など)特定的ラウドネス・レベルのスペクトルを得てもよい。
いくつかの実施形態では、特定的な諸周波数帯域における特定的な諸ラウドネス・レベルが、それらの特定の周波数帯域における対応するDRC利得を導出するために使われることができる。しかしながら、これは、音色の変化につながることがある。それらの特定的ラウドネス・レベルは異なる帯域において著しく変わることがあり、よって、たとえ全周波数帯域にわたるブロードバンド(または広帯域)ラウドネス・レベルが一定のままであるときでも、異なるDRC利得を被ることがあるからである。
本稿に記載される技法を実装しない他のアプローチのもとでのオーディオ励起信号にボリューム調整のための線形処理を適用することは、低い可聴信号レベルを聞こえなくすることがありうる(たとえば、人間の聴覚系の周波数依存の聴覚閾値を下回るなど)。
いくつかの実施形態では、本稿に記載されるオーディオ・エンコーダ(たとえば150など)は、下流のオーディオ・デコーダにプロファイル関係メタデータを提供するよう構成される。たとえば、プロファイル関係メタデータは、オーディオ・コンテンツと一緒にオーディオ関係メタデータの一部として、エンコードされたオーディオ信号中で担持されてもよい。
本稿に記載される技法のもとでは、動的等化、ノイズ補償などといった他の処理も、物理領域(または物理領域を表わすデジタル領域)ではなくラウドネス(たとえば知覚的)領域で実行されることができる。
伝送フィルタ、聴覚的フィルタバンク、合成フィルタバンク、短時間フーリエ変換などといった一つまたは複数のオーディオ処理要素、ユニット、コンポーネントなどが、本稿に記載されるオーディオ処理動作を実行するためにエンコーダまたはデコーダによって使われてもよい。
いくつかの実施形態では、特定のスピーカー構成がマルチチャネル構成であるとき、物理領域(または物理領域を表わすデジタル領域)からラウドネス領域への変換の前にすべてのチャネルの励起信号をまず加算することによって、全体的ラウドネス・レベルが得られてもよい。しかしながら、特定のスピーカー構成におけるすべてのチャネルに同じ利得を適用することは、その特定のスピーカー構成の異なるチャネルの間の空間的バランス(異なるチャネルの間の相対的なラウドネス・レベルなどに関するバランス)を保存しないことがある。
いくつかの実施形態では、本稿に記載されるエンコーダは、(たとえばエンコードされたオーディオ信号102中にエンコードされているなどの)オーディオ・コンテンツにおける聴覚イベント境界を検出し、一つまたは複数のASAパラメータを生成し、該一つまたは複数のASAパラメータを、下流の装置(たとえばデコーダ100など)に送達されるエンコードされたオーディオ信号(たとえば102など)の一部としてフォーマットするために、コンピュータ・ベースの聴覚シーン解析(ASA)を実装してもよい。ASAパラメータは、これだけに限られるものではないが、聴覚イベント境界の位置、聴覚イベント確実性指標の値(下記でさらに説明する)などを含みうる。
ここで、bは帯域を示し、tは時間またはオーディオ・フレーム・インデックスを示し、maxb{N[b,t]}はすべての周波数帯域にわたる最大の特定的ラウドネス・レベルである。
差分絶対値和は、次のように、0から1の値範囲をもつ聴覚イベント確実性指標にマッピングされる。
ラウドネス・レベル遷移はたとえば、二つのプログラムの間、プログラムとラウドなコマーシャルの間などで起こりうる。いくつかの実施形態では、デコーダ(100)は、(たとえば、過去4秒にわたってエンコードされたオーディオ信号102から受領されたなどの)過去のオーディオ・コンテンツに基づく瞬時ラウドネス・レベルのヒストグラムを維持するよう構成される。ラウドネス・レベル遷移前からラウドネス・レベル遷移後にかけての時間区間にわたって、高められた確率をもつ二つの領域がヒストグラムに記録されうる。それらの領域の一方は、前のラウドネス・レベルを中心としており、一方、それらの領域の他方は、新しいラウドネス・レベルを中心としている。
いくつかの実施形態では、本稿に記載されるエンコーダ(たとえば150など)は、リセット・イベントを検出し、該リセット・イベントの指標を、エンコードされたオーディオ信号(たとえば102など)に含めるよう構成される。第一の例では、エンコーダ(150)は、相対的な無音の連続的な(たとえばシステムおよび/またはユーザーによって構成設定可能な250ミリ秒など)期間が生じると判別することに応答してリセット・イベントを検出する。第二の例では、エンコーダ(150)は、すべての周波数帯域を横断して励起レベルの大きな瞬間的な降下が生じることを判別するのに応答してリセット・イベントを検出する。第三の例では、エンコーダは、リセットを要求する、コンテンツ遷移(たとえばプログラム開始/終了、シーン変化など)が生じるところで入力(たとえばユーザー入力、システム制御されるメタデータなど)を与えられる。
いくつかの実施形態では、オーディオ・デコーダは、エンコードされたオーディオ信号中にエンコードされるべきオーディオ・コンテンツの個々の部分(たとえば、オーディオ・データ・ブロック、オーディオ・データ・フレームなど)について利得(たとえばDRC利得など)の一つまたは複数の集合を計算するよう構成されることができる。オーディオ・エンコーダによって生成された利得のそれらの集合は、すべてのチャネル(たとえば左前方、右前方、低域効果もしくはLFE、中央、左サラウンド、右サラウンドなど)についての単一のブロードバンド(または広帯域)利得を含む利得の第一の集合;チャネルの個々の部分集合についての個々のブロードバンド(または広帯域)利得を含む利得の第二の集合;チャネルの個々の部分集合についておよび第一の数(たとえば二つなど)の個々の帯域(たとえば各チャネルにおける二つの帯域など)のそれぞれについての個々のブロードバンド(または広帯域)利得を含む利得の第三の集合;チャネルの個々の部分集合についておよび第二の数(たとえば四つなど)の個々の帯域(たとえば各チャネルにおける四つの帯域など)のそれぞれについての個々のブロードバンド(または広帯域)利得を含む利得の第四の集合;などを含んでいてもよい。ここに記載されるチャネルの部分集合は、左前方、右前方およびLFEチャネルを含む部分集合、中央チャネルを含む部分集合、左サラウンドおよび右サラウンド・チャネルを含む部分集合などの一つであってもよい。
図5は、限定しない例示的実施形態における例示的なコーデック・システムを示している。150などのようなオーディオ・エンコーダ内の処理ユニットであってもよいコンテンツ・クリエーターは、オーディオ・コンテンツ(「オーディオ」)をエンコーダ・ユニット(「NGCエンコーダ」)に提供するよう構成される。エンコーダ・ユニットは、オーディオ・コンテンツをオーディオ・データ・ブロックおよび/またはフレームにフォーマットし、オーディオ・データ・ブロックおよび/またはフレームをエンコードされたオーディオ信号にエンコードする。コンテンツ・クリエーターは、オーディオ・コンテンツにおける一つまたは複数のプログラム、コマーシャルなどの一つまたは複数のダイアログ・ラウドネス・レベル(「dialnorm」)および一つまたは複数のダイナミックレンジ圧縮曲線識別子(「圧縮曲線ID」)を確立/生成するようにも構成される。コンテンツ・クリエーターは、オーディオ・コンテンツにおける一つまたは複数のダイアログ・オーディオ・トラックからダイアログ・ラウドネス・レベルを決定してもよい。ダイナミックレンジ圧縮曲線識別子は、少なくとも部分的にはユーザー入力、システム構成設定パラメータなどに基づいて選択されてもよい。コンテンツ・クリエーターは、オーディオ・コンテンツおよびdialnormを生成するためにツールを使う人間(たとえばアーチスト、オーディオ・エンジニアなど)であってもよい。
ある実施形態によれば、本稿に記載される技法は、一つまたは複数の特殊目的コンピューティング装置によって実装される。特殊目的コンピューティング装置は、本技法を実行するよう固定構成とされていてもよいし、あるいは一つまたは複数の特定用途向け集積回路(ASIC)またはフィールド・プログラマブル・ゲート・アレイ(FPGA)のような、本技法を実行するよう持続的にプログラムされたデジタル電子デバイスを含んでいてもよいし、あるいはファームウェア、メモリ、他の記憶または組み合わせにおけるプログラム命令に従って本技法を実行するようプログラムされた一つまたは複数の汎用ハードウェア・プロセッサを含んでいてもよい。そのような特殊目的コンピューティング装置は、カスタムの固定構成論理、ASICまたはFPGAをカスタムのプログラミングと組み合わせて本技法を達成してもよい。特殊目的コンピューティング装置はデスクトップ・コンピュータ・システム、ポータブル・コンピュータ・システム、ハンドヘルド装置、ネットワーキング装置または本技法を実装するために固定構成および/またはプログラム論理を組み込んでいる他の任意の装置であってもよい。
以上の明細書では、本発明の例示的実施形態について、実装によって変わりうる数多くの個別的詳細に言及しつつ述べてきた。このように、何が本発明であるか、何が出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは特性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。
〔態様1〕
オーディオ・コンテンツと、差分利得の一つまたは複数の集合とを含むオーディオ信号を受領する段階と;
差分利得の前記一つまたは複数の集合のうちで、特定の再生環境における利得プロファイルのための差分利得の特定の集合を同定する段階と;
差分利得の前記特定の集合に関係したデフォルト・ダイナミックレンジ圧縮(DRC)曲線に少なくとも基づいてデフォルト利得の集合を生成する段階と;
少なくとも部分的にはデフォルト利得の前記集合と差分利得の前記特定の集合の組み合わせに基づいて、前記オーディオ信号から抽出された前記オーディオ・コンテンツの一つまたは複数の部分に対して一つまたは複数の動作を実行する段階とを含む、
一つまたは複数のコンピュータによって実行される方法。
〔態様2〕
デフォルト利得の前記集合は、少なくとも部分的には前記デフォルトDRC曲線に基づいて一組の利得生成動作を実行することによって生成された非差分利得を含む、態様1記載の方法。
〔態様3〕
前記デフォルトDRC曲線は、デフォルト利得プロファイルを表わす、態様1または2記載の方法。
〔態様4〕
前記デフォルトDRC曲線との関係での差分利得の前記特定の集合は、非デフォルト利得プロファイルを表わす、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記オーディオ信号は、前記非デフォルト利得プロファイルに対応する非デフォルトDRC曲線についての定義データを含まない、態様4記載の方法。
〔態様6〕
差分利得の前記特定の集合は、非デフォルト利得プロファイルについて生成された非差分非デフォルト利得の集合と、前記デフォルトDRC曲線によって表わされた前記デフォルト利得プロファイルについて生成された非差分デフォルト利得の集合との間の利得差を含む、態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記非差分非デフォルト利得の集合と、前記非差分デフォルト利得の集合とは、前記オーディオ信号をエンコードする上流のオーディオ・デコーダによって生成される、態様6記載の方法。
〔態様8〕
前記非差分非デフォルト利得の集合または前記非差分デフォルト利得の集合の少なくとも一方は、前記オーディオ信号の一部として提供されない、態様6記載の方法。
〔態様9〕
前記一つまたは複数のDRC曲線についての前記定義データが、前記一つまたは複数のDRC曲線のうちの少なくとも一つに関係したアタック時間、リリース時間または参照ラウドネス・レベルのうちの一つまたは複数を含む、態様1ないし8のうちいずれか一項記載の方法。
〔態様10〕
前記参照ラウドネス・レベルが、前記オーディオ・コンテンツをオーディオ・デコーダによってレンダリングするための再生レベルの目標とされる範囲を表わす、態様9記載の方法。
〔態様11〕
前記オーディオ・コンテンツの前記一つまたは複数の部分についての一つまたは複数のラウドネス・レベルを計算する段階と;
前記非差分デフォルト利得の集合および差分利得の前記特定の集合に基づいて非差分非デフォルト利得の集合を生成する段階と;
前記オーディオ・コンテンツの前記一つまたは複数の部分に前記非差分非デフォルト利得の集合を適用する段階とをさらに含む、
態様1ないし10のうちいずれか一項記載の方法。
〔態様12〕
前記オーディオ・コンテンツの前記一つまたは複数の部分について計算された前記一つまたは複数のラウドネス・レベルの少なくとも一つが、一つまたは複数の周波数帯域に関する特定的ラウドネス・レベル、ブロードバンド範囲にわたるブロードバンド・ラウドネス・レベル、広帯域範囲にわたる広帯域ラウドネス・レベル、複数の周波数範囲にわたるブロードバンド・ラウドネス・レベルまたは複数の周波数範囲にわたる広帯域ラウドネス・レベルのうちの一つまたは複数である、態様11記載の方法。
〔態様13〕
前記オーディオ・コンテンツの前記一つまたは複数の部分について計算された前記一つまたは複数のラウドネス・レベルの少なくとも一つが、瞬時ラウドネス・レベルまたは一つまたは複数の時間区間にわたって平滑化されたラウドネス・レベルの一つまたは複数である、態様11記載の方法。
〔態様14〕
前記一つまたは複数の動作は、ダイアログ・ラウドネス・レベルを調整すること、利得平滑化、利得制限、ダイナミック等化またはノイズ補償のうちの一つまたは複数に関係する一つまたは複数の動作を含む、態様1ないし13のうちいずれか一項記載の方法。
〔態様15〕
当該方法がオーディオ・デコード装置によって実行され、前記デフォルトDRC曲線が前記オーディオ・デコード装置において定義されている、態様1ないし14のうちいずれか一項記載の方法。
〔態様16〕
一つまたは複数のダイナミックレンジ圧縮(DRC)曲線についての定義データを受領する段階と;
前記一つまたは複数のDRC曲線のうちで、差分利得の前記特定の集合に関係したデフォルトDRC曲線を同定する段階とをさらに含む、
態様1ないし15のうちいずれか一項記載の方法。
〔態様17〕
前記エンコードされたオーディオ信号から一つまたは複数の聴覚シーン解析(ASA)パラメータを抽出する段階と;
前記オーディオ・コンテンツに適用された利得を平滑化することにおいて使われる一つまたは複数の時定数を変化させる段階とをさらに含む、
態様1ないし16のうちいずれか一項記載の方法。
〔態様18〕
リセット・イベントの指標に基づいて前記オーディオ・コンテンツの前記一つまたは複数の部分にリセット・イベントが生じることを判別する段階であって、前記リセットの前記指標は、前記エンコードされたオーディオ信号から抽出される、段階と;
前記オーディオ・コンテンツの前記一つまたは複数の部分に前記リセット・イベントが生じることを判別することに応答して、前記オーディオ・コンテンツの前記一つまたは複数の部分において前記リセット・イベントが生じることを判別する時点において実行されている一つまたは複数の利得平滑化動作に対して一つまたは複数のアクションを行なう段階とをさらに含む、
態様1ないし17のうちいずれか一項記載の方法。
〔態様19〕
前記一つまたは複数の平滑化動作の少なくとも一つが、前記リセット・イベントの前には第一の平滑化時定数を使い、前記一つまたは複数の平滑化動作の前記少なくとも一つが、前記リセット・イベントが生じることを判別することに応答して前記第一の平滑化時定数より小さい第二の平滑化時定数を使う、態様18記載の方法。
〔態様20〕
瞬時ラウドネス・レベルのヒストグラムを維持する段階であって、前記ヒストグラムは前記オーディオ・コンテンツにおけるある時間区間から計算された瞬時ラウドネス・レベルが入れられる、段階と;
特定的ラウドネス・レベルが前記ヒストグラムの高確率領域における閾値より下であるかどうかを判定する段階であって、前記特定的ラウドネス・レベルは前記オーディオ・コンテンツの一部から計算される、段階と;
前記特定的ラウドネス・レベルが前記ヒストグラムの前記高確率領域における前記閾値より下であると判定することに応答して:
ラウドネス遷移が生じていることを判別し、
該ラウドネス遷移を高速化するために利得平滑化において使われる時定数を短くする、段階とをさらに含む、
態様1ないし19のうちいずれか一項記載の方法。
〔態様21〕
差分利得の前記特定の集合は、ある特定のスピーカー構成におけるすべてのチャネルの集合における第一の真部分集合における各チャネルに関係する第一の差分利得を含み、差分利得の前記特定の集合は、前記特定のスピーカー構成におけるすべてのチャネルの前記集合における第二の真部分集合における各チャネルに関係する第二の差分利得を含む、態様1ないし20のうちいずれか一項記載の方法。
〔態様22〕
差分利得の前記特定の集合が第一の周波数帯域に関係する第一の差分利得を含み、差分利得の前記特定の集合が第二の異なる周波数帯域に関係する第二の異なる差分利得を含む、態様1ないし21のうちいずれか一項記載の方法。
〔態様23〕
前記オーディオ・コンテンツの前記一つまたは複数の部分がオーディオ・データ・フレーム、オーディオ・データ・ブロックまたはオーディオ・サンプルの一つまたは複数を含む、態様1ないし22のうちいずれか一項記載の方法。
〔態様24〕
差分利得の前記特定の集合はラウドネス領域で定義される、態様1ないし23のうちいずれか一項記載の方法。
〔態様25〕
前記エンコードされたオーディオ信号がオーディオビジュアル信号の一部である、態様1ないし24のうちいずれか一項記載の方法。
〔態様26〕
源オーディオ・フォーマットにおけるオーディオ・コンテンツを受領する段階と;
少なくとも部分的にはデフォルト・ダイナミックレンジ圧縮(DRC)曲線に基づいてデフォルト利得の集合を生成する段階であって、前記デフォルトDRC曲線はデフォルト利得プロファイルを表わす、段階と;
非デフォルト利得プロファイルについての非デフォルト利得の集合を生成する段階と;
少なくとも部分的にはデフォルト利得の前記集合および非デフォルト利得の前記集合に基づいて、差分利得の前記集合を生成する段階であって、差分利得の前記集合は、前記デフォルトDRC曲線との関係での前記非デフォルト利得プロファイルを表わす、段階と;
前記オーディオ・コンテンツと、差分利得の前記集合を含む差分利得の前記一つまたは複数の集合とを含むオーディオ信号を生成する段階とを含む、
一つまたは複数のコンピューティング装置によって実行される方法。
〔態様27〕
前記非デフォルト利得プロファイルはDRC曲線によって表わされる、態様26記載の方法。
〔態様28〕
前記オーディオ信号は、前記非デフォルト利得プロファイルを表わす前記DRC曲線についての定義データを含まない、態様27記載の方法。
〔態様29〕
前記非デフォルト利得プロファイルは、DRC曲線によって表わされない、態様26ないし28のうちいずれか一項記載の方法。
〔態様30〕
前記一つまたは複数のダイナミックレンジ圧縮曲線についての一つまたは複数の識別子を決定する段階と;
前記一つまたは複数の識別子に基づいて参照データ貯蔵部から前記一つまたは複数のダイナミックレンジ圧縮曲線についての前記定義データを取り出す段階とをさらに含む、
態様26ないし29のうちいずれか一項記載の方法。
〔態様31〕
前記デフォルト利得の集合が、少なくとも部分的には前記デフォルトDRC曲線に基づいて第一の組の利得生成動作を実行することによって生成された第一の非差分利得を含み、前記非デフォルト利得の集合が、前記非デフォルト利得プロファイルについての第二の組の利得生成動作を実行することによって生成された第二の非差分利得を含む、態様26ないし30のうちいずれか一項記載の方法。
〔態様32〕
前記オーディオ・コンテンツの一つまたは複数の部分についての一つまたは複数のダイアログ・ラウドネス・レベルを計算する段階と;
前記一つまたは複数のダイアログ・ラウドネス・レベルを、前記オーディオ・コンテンツの前記一つまたは複数の部分と一緒に、前記エンコードされたオーディオ信号中にエンコードする段階とをさらに含む、
態様26ないし31のうちいずれか一項記載の方法。
〔態様33〕
前記一つまたは複数のダイアログ・ラウドネス・レベルの少なくとも一つが、ダイアログ・オーディオ・コンテンツを含む一つまたは複数のオーディオ・トラックから決定される、態様32記載の方法。
〔態様34〕
前記オーディオ・コンテンツの前記一つまたは複数の部分に対して聴覚シーン解析(ASA)を実行する段階と;
前記オーディオ・コンテンツの前記一つまたは複数の部分に対する前記ASAの結果に基づいて一つまたは複数のASAパラメータを生成する段階と;
前記一つまたは複数のASAパラメータを、前記オーディオ・コンテンツの前記一つまたは複数の部分と一緒に、前記エンコードされたオーディオ信号中にエンコードする段階とをさらに含む、
態様26ないし33のうちいずれか一項記載の方法。
〔態様35〕
前記オーディオ・コンテンツの一つまたは複数の部分において一つまたは複数のリセット・イベントが生起することを判別する段階と;
前記一つまたは複数のリセット・イベントの一つまたは複数の指標を、前記オーディオ・コンテンツの前記一つまたは複数の部分と一緒に、前記エンコードされたオーディオ信号中にエンコードする段階とをさらに含む、
態様26ないし34のうちいずれか一項記載の方法。
〔態様36〕
前記オーディオ・コンテンツの一つまたは複数の部分を、オーディオ・データ・フレームまたはオーディオ・データ・ブロックの一つまたは複数にエンコードする段階をさらに含む、態様26ないし35のうちいずれか一項記載の方法。
〔態様37〕
前記一つまたは複数のダイナミックレンジ圧縮曲線の少なくとも一つはラウドネス領域で定義される、態様26ないし36のうちいずれか一項記載の方法。
〔態様38〕
前記エンコードされたオーディオ信号はオーディオビジュアル信号の一部である、態様26ないし37のうちいずれか一項記載の方法。
〔態様39〕
前記一つまたは複数のダイナミックレンジ圧縮曲線についての前記定義データはパラメータの一つまたは複数の集合を含み、パラメータの前記一つまたは複数の集合における少なくとも一つの集合は、ルックアップテーブル、曲線または複数セグメント区分直線のうちの一つまたは複数を表わす、態様26ないし38のうちいずれか一項記載の方法。
〔態様40〕
前記エンコードされたオーディオ信号が、受領側装置において定義されているDRC曲線を前記デフォルトDRC曲線として選択するための指標を含む、態様26ないし39のうちいずれか一項記載の方法。
〔態様41〕
諸DRC曲線についての定義データを前記エンコードされたオーディオ信号において送る段階と;
前記一つまたは複数のDRC曲線のうちで前記デフォルトDRC曲線を選択するための指標を含める段階とをさらに含む、
態様26ないし40のうちいずれか一項記載の方法。
〔態様42〕
態様1ないし41のうちいずれか一項記載の方法を実行するよう構成されたメディア処理システム。
〔態様43〕
態様1ないし41のうちいずれか一項記載の方法を実行するよう構成された、プロセッサを有する装置。
〔態様44〕
一つまたは複数のプロセッサによって実行されたときに、態様1ないし41のうちいずれか一項記載の方法の実行を引き起こすソフトウェア命令を含む非一時的なコンピュータ可読記憶媒体。
Claims (2)
- オーディオ信号のダイナミックレンジ制御(DRC)のための方法であって:
参照チャネル構成とは異なる特定の再生環境において動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号はオーディオ・サンプル・データおよびエンコーダで生成されたDRCメタデータを含み、前記エンコーダで生成されたDRCメタデータは複数の再生環境のためのDRC利得の複数の集合を含み、DRC利得の前記複数の集合は、前記複数の再生環境における各再生環境についてDRC利得のそれぞれの一つまたは複数の集合を含む、段階と;
前記複数の再生環境のためのDRC利得の前記複数の集合のうちから、前記特定の再生環境に基づいて、前記特定の再生環境に関係するDRC利得の一つまたは複数の集合を選択する段階と;
DRC利得の前記一つまたは複数の集合を、前記オーディオ・サンプル・データに適用される全体的な利得の一部として、前記オーディオ・サンプル・データに適用して、出力DRCオーディオ・データを生成する段階とを含む、
方法。 - ソフトウェア命令を記憶している非一時的なコンピュータ可読記憶媒体であって、前記ソフトウェア命令は、一つまたは複数のプロセッサによって実行されたときに:
参照チャネル構成とは異なる特定の再生環境において動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号はオーディオ・サンプル・データおよびエンコーダで生成されたダイナミックレンジ制御(DRC)メタデータを含み、前記エンコーダで生成されたDRCメタデータは複数の再生環境のためのDRC利得の複数の集合を含み、DRC利得の前記複数の集合は、前記複数の再生環境における各再生環境についてDRC利得のそれぞれの一つまたは複数の集合を含む、段階と;
前記複数の再生環境のためのDRC利得の前記複数の集合のうちから、前記特定の再生環境に基づいて、前記特定の再生環境に関係するDRC利得の一つまたは複数の集合を選択する段階と;
DRC利得の前記一つまたは複数の集合を、前記オーディオ・サンプル・データに適用される全体的な利得の一部として、前記オーディオ・サンプル・データに適用して、出力DRCオーディオ・データを生成する段階とを含む、
方法。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877230P | 2013-09-12 | 2013-09-12 | |
US61/877,230 | 2013-09-12 | ||
US201361891324P | 2013-10-15 | 2013-10-15 | |
US61/891,324 | 2013-10-15 | ||
US201461938043P | 2014-02-10 | 2014-02-10 | |
US61/938,043 | 2014-02-10 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016542033A Division JP6476192B2 (ja) | 2013-09-12 | 2014-09-08 | 多様な再生環境のためのダイナミックレンジ制御 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019223667A Division JP6859420B2 (ja) | 2013-09-12 | 2019-12-11 | 多様な再生環境のためのダイナミックレンジ制御 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019068485A true JP2019068485A (ja) | 2019-04-25 |
JP2019068485A5 JP2019068485A5 (ja) | 2019-06-06 |
JP6633232B2 JP6633232B2 (ja) | 2020-01-22 |
Family
ID=51585228
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016542033A Active JP6476192B2 (ja) | 2013-09-12 | 2014-09-08 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2019017758A Active JP6633232B2 (ja) | 2013-09-12 | 2019-02-04 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2019223667A Active JP6859420B2 (ja) | 2013-09-12 | 2019-12-11 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2021051364A Active JP7049503B2 (ja) | 2013-09-12 | 2021-03-25 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2022049822A Active JP7118302B2 (ja) | 2013-09-12 | 2022-03-25 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2022123273A Active JP7199591B2 (ja) | 2013-09-12 | 2022-08-02 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2022202769A Pending JP2023024570A (ja) | 2013-09-12 | 2022-12-20 | 多様な再生環境のためのダイナミックレンジ制御 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016542033A Active JP6476192B2 (ja) | 2013-09-12 | 2014-09-08 | 多様な再生環境のためのダイナミックレンジ制御 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019223667A Active JP6859420B2 (ja) | 2013-09-12 | 2019-12-11 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2021051364A Active JP7049503B2 (ja) | 2013-09-12 | 2021-03-25 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2022049822A Active JP7118302B2 (ja) | 2013-09-12 | 2022-03-25 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2022123273A Active JP7199591B2 (ja) | 2013-09-12 | 2022-08-02 | 多様な再生環境のためのダイナミックレンジ制御 |
JP2022202769A Pending JP2023024570A (ja) | 2013-09-12 | 2022-12-20 | 多様な再生環境のためのダイナミックレンジ制御 |
Country Status (6)
Country | Link |
---|---|
US (9) | US10095468B2 (ja) |
EP (2) | EP3044876B1 (ja) |
JP (7) | JP6476192B2 (ja) |
CN (6) | CN117767898A (ja) |
HK (1) | HK1221080A1 (ja) |
WO (1) | WO2015038475A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2262108B1 (en) * | 2004-10-26 | 2017-03-01 | Dolby Laboratories Licensing Corporation | Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
JP6506764B2 (ja) * | 2013-09-12 | 2019-04-24 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
US9352701B2 (en) * | 2014-03-06 | 2016-05-31 | Bose Corporation | Managing telephony and entertainment audio in a vehicle audio platform |
WO2016052191A1 (ja) * | 2014-09-30 | 2016-04-07 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
EP4044180A1 (en) | 2014-10-01 | 2022-08-17 | Dolby International AB | Decoding an encoded audio signal using drc profiles |
US9584911B2 (en) * | 2015-03-27 | 2017-02-28 | Cirrus Logic, Inc. | Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9934790B2 (en) * | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
CN108028630A (zh) * | 2015-09-07 | 2018-05-11 | Tdk株式会社 | 集成电路,电路组件和用于其操作的方法 |
US10341770B2 (en) * | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
US10251016B2 (en) | 2015-10-28 | 2019-04-02 | Dts, Inc. | Dialog audio signal balancing in an object-based audio program |
US9883304B1 (en) * | 2016-07-29 | 2018-01-30 | Sonos, Inc. | Lifetime of an audio playback device with changed signal processing settings |
TWI590239B (zh) * | 2016-12-09 | 2017-07-01 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
CN108281148B (zh) * | 2016-12-30 | 2020-12-22 | 宏碁股份有限公司 | 语音信号处理装置及语音信号处理方法 |
US10652689B2 (en) * | 2017-01-04 | 2020-05-12 | That Corporation | Configurable multi-band compressor architecture with advanced surround processing |
EP3574583B1 (en) | 2017-03-31 | 2020-12-09 | Dolby International AB | Inversion of dynamic range control |
KR102565447B1 (ko) * | 2017-07-26 | 2023-08-08 | 삼성전자주식회사 | 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법 |
US10861473B2 (en) * | 2017-09-27 | 2020-12-08 | Gopro, Inc. | Multi-band noise gate |
US10951994B2 (en) * | 2018-04-04 | 2021-03-16 | Staton Techiya, Llc | Method to acquire preferred dynamic range function for speech enhancement |
EP3821430A1 (en) * | 2018-07-12 | 2021-05-19 | Dolby International AB | Dynamic eq |
WO2020020043A1 (en) * | 2018-07-25 | 2020-01-30 | Dolby Laboratories Licensing Corporation | Compressor target curve to avoid boosting noise |
US11282533B2 (en) | 2018-09-28 | 2022-03-22 | Dolby Laboratories Licensing Corporation | Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model |
US11316490B2 (en) * | 2019-03-14 | 2022-04-26 | Gaudio Lab, Inc. | Audio signal processing method and device for controlling loudness level |
JP7275711B2 (ja) | 2019-03-20 | 2023-05-18 | ヤマハ株式会社 | オーディオ信号の処理方法 |
EP3956886B1 (en) * | 2019-04-15 | 2024-05-29 | Dolby International AB | Dialogue enhancement in audio codec |
US11545166B2 (en) | 2019-07-02 | 2023-01-03 | Dolby International Ab | Using metadata to aggregate signal processing operations |
KR102535704B1 (ko) * | 2019-07-30 | 2023-05-30 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 능력을 구비한 디바이스에 걸친 역학 처리 |
CN111327944A (zh) * | 2020-03-09 | 2020-06-23 | 上海电力大学 | 一种基于嵌入式cpu的广播语音响度检测的方法 |
CN114125658B (zh) * | 2020-08-25 | 2023-12-19 | 上海艾为电子技术股份有限公司 | 动态范围控制电路、音频处理芯片及其音频处理方法 |
US11907611B2 (en) | 2020-11-10 | 2024-02-20 | Apple Inc. | Deferred loudness adjustment for dynamic range control |
AU2021385196A1 (en) * | 2020-11-24 | 2023-06-22 | Gaudio Lab, Inc. | Method for normalizing audio signal, and device therefor |
US11394356B1 (en) * | 2021-02-12 | 2022-07-19 | Amazon Technologies, Inc. | Block-based audio limiter |
US11687621B2 (en) * | 2021-03-29 | 2023-06-27 | International Business Machines Corporation | Multi-modal fusion techniques considering inter-modality correlations and computer model uncertainty |
EP4068809A1 (en) * | 2021-04-02 | 2022-10-05 | Arçelik Anonim Sirketi | Smart home appliance and audio control method thereof |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010537233A (ja) * | 2007-08-16 | 2010-12-02 | ディーティーエス・インコーポレイテッド | 圧縮デジタルテレビの音声処理 |
JP2011035459A (ja) * | 2009-07-29 | 2011-02-17 | Yamaha Corp | オーディオ機器 |
US20130054251A1 (en) * | 2011-08-23 | 2013-02-28 | Aaron M. Eppolito | Automatic detection of audio compression parameters |
JP2013519918A (ja) * | 2010-02-11 | 2013-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
JP2013521539A (ja) * | 2010-03-10 | 2013-06-10 | ドルビー・インターナショナル・アーベー | 単一再生モードにおいてラウドネス測定値を合成するシステム |
JP2013157659A (ja) * | 2012-01-26 | 2013-08-15 | Nippon Hoso Kyokai <Nhk> | ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム |
Family Cites Families (130)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297236A (en) | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
JPH0746140Y2 (ja) | 1991-05-15 | 1995-10-25 | 岐阜プラスチック工業株式会社 | かん水栽培方法において使用する水位調整タンク |
US6611607B1 (en) | 1993-11-18 | 2003-08-26 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
JP3186472B2 (ja) | 1994-10-04 | 2001-07-11 | キヤノン株式会社 | ファクシミリ装置およびその記録紙選択方法 |
US7224819B2 (en) | 1995-05-08 | 2007-05-29 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US6233554B1 (en) * | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
JPH11330980A (ja) | 1998-05-13 | 1999-11-30 | Matsushita Electric Ind Co Ltd | 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体 |
US6530021B1 (en) | 1998-07-20 | 2003-03-04 | Koninklijke Philips Electronics N.V. | Method and system for preventing unauthorized playback of broadcasted digital data streams |
US6476745B1 (en) * | 1998-11-25 | 2002-11-05 | Texas Instruments Incorporated | Voice codec automatic gain control |
KR100391935B1 (ko) | 1998-12-28 | 2003-07-16 | 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. | 오디오 신호를 코딩 또는 디코딩하는 방법 및 디바이스 |
US6909743B1 (en) | 1999-04-14 | 2005-06-21 | Sarnoff Corporation | Method for generating and processing transition streams |
US7450734B2 (en) | 2000-01-13 | 2008-11-11 | Digimarc Corporation | Digital asset management, targeted searching and desktop searching using digital watermarks |
EP1249002B1 (en) | 2000-01-13 | 2011-03-16 | Digimarc Corporation | Authenticating metadata and embedding metadata in watermarks of media signals |
US6351733B1 (en) * | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US7266501B2 (en) * | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US8091025B2 (en) | 2000-03-24 | 2012-01-03 | Digimarc Corporation | Systems and methods for processing content objects |
US6959275B2 (en) * | 2000-05-30 | 2005-10-25 | D.S.P.C. Technologies Ltd. | System and method for enhancing the intelligibility of received speech in a noise environment |
US7392287B2 (en) | 2001-03-27 | 2008-06-24 | Hemisphere Ii Investment Lp | Method and apparatus for sharing information using a handheld device |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US6807528B1 (en) | 2001-05-08 | 2004-10-19 | Dolby Laboratories Licensing Corporation | Adding data to a compressed data frame |
AUPR960601A0 (en) | 2001-12-18 | 2002-01-24 | Canon Kabushiki Kaisha | Image protection |
US7535913B2 (en) | 2002-03-06 | 2009-05-19 | Nvidia Corporation | Gigabit ethernet adapter supporting the iSCSI and IPSEC protocols |
CN1643891A (zh) | 2002-03-27 | 2005-07-20 | 皇家飞利浦电子股份有限公司 | 用数字签名对数字对象进行水印处理 |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
TWI404419B (zh) | 2004-04-07 | 2013-08-01 | Nielsen Media Res Inc | 與壓縮過音頻/視頻資料一起使用之資料插入方法、系統、機器可讀取媒體及設備 |
US8131134B2 (en) | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US7624021B2 (en) | 2004-07-02 | 2009-11-24 | Apple Inc. | Universal container for audio data |
EP2262108B1 (en) * | 2004-10-26 | 2017-03-01 | Dolby Laboratories Licensing Corporation | Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US20060106472A1 (en) | 2004-11-16 | 2006-05-18 | Romesburg Eric D | Method and apparatus for normalizing sound recording loudness |
US9639554B2 (en) | 2004-12-17 | 2017-05-02 | Microsoft Technology Licensing, Llc | Extensible file system |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
CN101156209B (zh) | 2005-04-07 | 2012-11-14 | 松下电器产业株式会社 | 记录媒体、再现装置、记录方法、再现方法 |
US8116613B2 (en) | 2005-04-07 | 2012-02-14 | Panasonic Corporation | Recording medium, reproducing device, recording method and reproducing method |
TW200638335A (en) | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
US7177804B2 (en) | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
KR20070025905A (ko) | 2005-08-30 | 2007-03-08 | 엘지전자 주식회사 | 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법 |
CN101292428B (zh) | 2005-09-14 | 2013-02-06 | Lg电子株式会社 | 用于编码/解码的方法和装置 |
WO2007067168A1 (en) | 2005-12-05 | 2007-06-14 | Thomson Licensing | Watermarking encoded content |
US8929870B2 (en) | 2006-02-27 | 2015-01-06 | Qualcomm Incorporated | Methods, apparatus, and system for venue-cast |
US8244051B2 (en) | 2006-03-15 | 2012-08-14 | Microsoft Corporation | Efficient encoding of alternative graphic sets |
JP5129806B2 (ja) * | 2006-04-27 | 2013-01-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 特定ラウドネスに基づく聴覚イベント検出を使用する音声ゲイン制御 |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
US8948206B2 (en) | 2006-08-31 | 2015-02-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Inclusion of quality of service indication in header compression channel |
US20080080722A1 (en) * | 2006-09-29 | 2008-04-03 | Carroll Tim J | Loudness controller with remote and local control |
JP5337941B2 (ja) | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
BRPI0802614A2 (pt) | 2007-02-14 | 2011-08-30 | Lg Electronics Inc | métodos e aparelhos para codificação e decodificação de sinais de áudio baseados em objeto |
CN101689368B (zh) | 2007-03-30 | 2012-08-22 | 韩国电子通信研究院 | 对具有多声道的多对象音频信号进行编码和解码的设备和方法 |
WO2008134590A1 (en) * | 2007-04-26 | 2008-11-06 | Mushroom Networks | Link aggregation methods and devices |
JP4750759B2 (ja) | 2007-06-25 | 2011-08-17 | パナソニック株式会社 | 映像音声再生装置 |
US7961878B2 (en) | 2007-10-15 | 2011-06-14 | Adobe Systems Incorporated | Imparting cryptographic information in network communications |
US9143329B2 (en) | 2008-01-30 | 2015-09-22 | Adobe Systems Incorporated | Content integrity and incremental security |
WO2009109217A1 (en) | 2008-03-03 | 2009-09-11 | Nokia Corporation | Apparatus for capturing and rendering a plurality of audio channels |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
JP2009296298A (ja) * | 2008-06-05 | 2009-12-17 | Panasonic Corp | 音声信号処理装置および方法 |
KR100933003B1 (ko) | 2008-06-20 | 2009-12-21 | 드리머 | Bd-j 기반 채널 서비스 제공 방법 및 이를 실현시키기위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체 |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
WO2010033384A1 (en) * | 2008-09-19 | 2010-03-25 | Dolby Laboratories Licensing Corporation | Upstream quality enhancement signal processing for resource constrained client devices |
JP2010081397A (ja) | 2008-09-26 | 2010-04-08 | Ntt Docomo Inc | データ受信端末、データ配信サーバ、データ配信システム、およびデータ配信方法 |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
EP2353161B1 (en) | 2008-10-29 | 2017-05-24 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
EP2205007B1 (en) | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
KR20100089772A (ko) | 2009-02-03 | 2010-08-12 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US8229125B2 (en) * | 2009-02-06 | 2012-07-24 | Bose Corporation | Adjusting dynamic range of an audio system |
US8302047B2 (en) | 2009-05-06 | 2012-10-30 | Texas Instruments Incorporated | Statistical static timing analysis in non-linear regions |
WO2010138311A1 (en) * | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Equalization profiles for dynamic equalization of audio data |
WO2010143088A1 (en) | 2009-06-08 | 2010-12-16 | Nds Limited | Secure association of metadata with content |
EP2309497A3 (en) | 2009-07-07 | 2011-04-20 | Telefonaktiebolaget LM Ericsson (publ) | Digital audio signal processing system |
CA2777182C (en) * | 2009-10-09 | 2016-11-08 | Dts, Inc. | Adaptive dynamic range enhancement of audio recordings |
CA2781310C (en) | 2009-11-20 | 2015-12-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter |
EA024310B1 (ru) | 2009-12-07 | 2016-09-30 | Долби Лабораторис Лайсэнзин Корпорейшн | Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования |
US8437480B2 (en) * | 2009-12-17 | 2013-05-07 | Stmicroelectronics Asia Pacific Pte Ltd. | Adaptive loudness levelling for digital audio signals |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
JP5658506B2 (ja) | 2010-08-02 | 2015-01-28 | 日本放送協会 | 音響信号変換装置及び音響信号変換プログラム |
US8948406B2 (en) | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium |
JP5650227B2 (ja) * | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8908874B2 (en) | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
BR112013008462B1 (pt) | 2010-10-07 | 2021-11-16 | Fraunhofer-Gesellschaft Zur Forderung Der Angewadten Forschung E.V. | Aparelho e método para estimativa de nivel de estruturas de áudio codificado em um dominio de fluxo de bits |
TWI687918B (zh) * | 2010-12-03 | 2020-03-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
CN102610229B (zh) | 2011-01-21 | 2013-11-13 | 安凯(广州)微电子技术有限公司 | 一种音频动态范围压缩方法、装置及设备 |
US20120262233A1 (en) * | 2011-04-15 | 2012-10-18 | Fairchild Semiconductor Corporation | Mixed signal dynamic range compression |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
SG10201604679UA (en) | 2011-07-01 | 2016-07-28 | Dolby Lab Licensing Corp | System and method for adaptive audio signal generation, coding and rendering |
RU2564681C2 (ru) | 2011-07-01 | 2015-10-10 | Долби Лабораторис Лайсэнзин Корпорейшн | Способы и системы синхронизации и переключения для системы адаптивного звука |
JP2013034295A (ja) | 2011-08-01 | 2013-02-14 | Kobe Steel Ltd | 発電設備に設けられた電圧安定化装置 |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
KR102172279B1 (ko) | 2011-11-14 | 2020-10-30 | 한국전자통신연구원 | 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법 |
EP2783366B1 (en) | 2011-11-22 | 2015-09-16 | Dolby Laboratories Licensing Corporation | Method and system for generating an audio metadata quality score |
BR112014015629B1 (pt) | 2011-12-15 | 2022-03-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Aparelho e método para evitar perturbações de clipagem. |
WO2013118476A1 (ja) | 2012-02-10 | 2013-08-15 | パナソニック株式会社 | 音響/音声符号化装置、音響/音声復号装置、音響/音声符号化方法および音響/音声復号方法 |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
US8793506B2 (en) | 2012-08-31 | 2014-07-29 | Intel Corporation | Mechanism for facilitating encryption-free integrity protection of storage data at computing systems |
US20140074783A1 (en) | 2012-09-09 | 2014-03-13 | Apple Inc. | Synchronizing metadata across devices |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
AU2014207590B2 (en) | 2013-01-21 | 2015-08-13 | Dolby Laboratories Licensing Corporation | Audio encoder and decoder with program loudness and boundary metadata |
RU2639663C2 (ru) | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
US9372531B2 (en) | 2013-03-12 | 2016-06-21 | Gracenote, Inc. | Detecting an event within interactive media including spatialized multi-channel audio content |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
JP6506764B2 (ja) | 2013-09-12 | 2019-04-24 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
PL3522157T3 (pl) | 2013-10-22 | 2022-02-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
KR102513009B1 (ko) | 2013-12-27 | 2023-03-22 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
TR201809427T4 (tr) | 2014-03-25 | 2018-07-23 | Fraunhofer Ges Forschung | Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇ |
RU2653858C1 (ru) | 2014-05-28 | 2018-05-15 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Процессор данных и транспорт данных пользовательского управления на устройства декодирования и воспроизведения аудио |
SG11201609855WA (en) | 2014-05-30 | 2016-12-29 | Sony Corp | Information processing apparatus and information processing method |
EP3163570A4 (en) | 2014-06-30 | 2018-02-14 | Sony Corporation | Information processor and information-processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
BR112017025552B1 (pt) | 2015-05-29 | 2023-01-24 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Dispositivo e método para controle de volume e sintonizador de rádio |
MX2017016333A (es) | 2015-06-17 | 2018-04-24 | Fraunhofer Ges Forschung | Control de intensidad subjetiva para interaccion del usuario en sistemas de codificacion de audio. |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2014
- 2014-09-08 CN CN202311785926.1A patent/CN117767898A/zh active Pending
- 2014-09-08 CN CN201910279663.4A patent/CN109920440B/zh active Active
- 2014-09-08 EP EP14771712.8A patent/EP3044876B1/en active Active
- 2014-09-08 CN CN201910279458.8A patent/CN109785851B/zh active Active
- 2014-09-08 EP EP19168174.1A patent/EP3544181A3/en active Pending
- 2014-09-08 JP JP2016542033A patent/JP6476192B2/ja active Active
- 2014-09-08 US US14/916,509 patent/US10095468B2/en active Active
- 2014-09-08 CN CN201910279136.3A patent/CN109903776B/zh active Active
- 2014-09-08 CN CN201910279135.9A patent/CN109979472B/zh active Active
- 2014-09-08 CN CN201480050047.7A patent/CN105556837B/zh active Active
- 2014-09-08 WO PCT/US2014/054592 patent/WO2015038475A1/en active Application Filing
-
2016
- 2016-04-14 US US15/098,530 patent/US9626149B2/en active Active
- 2016-04-14 US US15/098,511 patent/US9619199B2/en active Active
- 2016-07-28 HK HK16109042.1A patent/HK1221080A1/zh unknown
-
2018
- 2018-10-03 US US16/151,320 patent/US10318235B2/en active Active
-
2019
- 2019-02-04 JP JP2019017758A patent/JP6633232B2/ja active Active
- 2019-04-17 US US16/387,073 patent/US10606550B2/en active Active
- 2019-12-11 JP JP2019223667A patent/JP6859420B2/ja active Active
-
2020
- 2020-03-23 US US16/827,671 patent/US10956121B2/en active Active
-
2021
- 2021-03-22 US US17/209,046 patent/US11429341B2/en active Active
- 2021-03-25 JP JP2021051364A patent/JP7049503B2/ja active Active
-
2022
- 2022-03-25 JP JP2022049822A patent/JP7118302B2/ja active Active
- 2022-08-02 JP JP2022123273A patent/JP7199591B2/ja active Active
- 2022-08-29 US US17/898,358 patent/US11842122B2/en active Active
- 2022-12-20 JP JP2022202769A patent/JP2023024570A/ja active Pending
-
2023
- 2023-12-11 US US18/535,526 patent/US20240168706A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010537233A (ja) * | 2007-08-16 | 2010-12-02 | ディーティーエス・インコーポレイテッド | 圧縮デジタルテレビの音声処理 |
JP2011035459A (ja) * | 2009-07-29 | 2011-02-17 | Yamaha Corp | オーディオ機器 |
JP2013519918A (ja) * | 2010-02-11 | 2013-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
JP2013521539A (ja) * | 2010-03-10 | 2013-06-10 | ドルビー・インターナショナル・アーベー | 単一再生モードにおいてラウドネス測定値を合成するシステム |
US20130054251A1 (en) * | 2011-08-23 | 2013-02-28 | Aaron M. Eppolito | Automatic detection of audio compression parameters |
JP2013157659A (ja) * | 2012-01-26 | 2013-08-15 | Nippon Hoso Kyokai <Nhk> | ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7199591B2 (ja) | 多様な再生環境のためのダイナミックレンジ制御 | |
JP7413470B2 (ja) | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190204 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190206 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6633232 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |