JP6851523B2 - 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 - Google Patents
異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 Download PDFInfo
- Publication number
- JP6851523B2 JP6851523B2 JP2020048672A JP2020048672A JP6851523B2 JP 6851523 B2 JP6851523 B2 JP 6851523B2 JP 2020048672 A JP2020048672 A JP 2020048672A JP 2020048672 A JP2020048672 A JP 2020048672A JP 6851523 B2 JP6851523 B2 JP 6851523B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- loudness
- metadata
- bitstream
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title description 11
- 238000012545 processing Methods 0.000 claims description 186
- 238000000034 method Methods 0.000 claims description 68
- 230000004044 response Effects 0.000 claims description 22
- 238000012546 transfer Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 230000003068 static effect Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims 1
- 238000012805 post-processing Methods 0.000 description 29
- 238000010200 validation analysis Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 25
- 238000012937 correction Methods 0.000 description 18
- 230000006835 compression Effects 0.000 description 17
- 238000007906 compression Methods 0.000 description 17
- 238000009877 rendering Methods 0.000 description 16
- 238000005259 measurement Methods 0.000 description 15
- 230000003044 adaptive effect Effects 0.000 description 14
- 238000007781 pre-processing Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 11
- 230000007774 longterm Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 230000001360 synchronised effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001010 compromised effect Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 101100258328 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) crc-2 gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- ORQBXQOJMQIAOY-UHFFFAOYSA-N nobelium Chemical compound [No] ORQBXQOJMQIAOY-UHFFFAOYSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007727 signaling mechanism Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Otolaryngology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本願は、2013年1月21日に出願された米国仮特許出願第61/754,882号、2013年4月5日に出願された米国仮特許出願第61/809,250号、2013年5月16日に出願された米国仮特許出願第61/824,010号の優先権を主張するものである。
一つまたは複数の実施形態は概括的にはオーディオ信号処理に、より詳細には、再生環境および装置に基づいて、オーディオ・コンテンツのラウドネスおよびダイナミックレンジ特性を示すメタデータをもつオーディオ・データ・ビットストリームを処理することに関する。
請求項を含む本開示を通じて、信号またはデータ「に対して」動作を実行する(たとえば信号またはデータをフィルタリングする、スケーリングする、変換するまたは利得を適用する)という表現は、信号またはデータに対して直接的に、または信号またはデータの処理されたバージョンに対して(たとえば、予備的なフィルタリングまたは前処理を該動作の実行に先立って受けている前記信号のバージョンに対して)該動作を実行することを表わすために広義で使用される。「システム」という表現は、装置、システムまたはサブシステムを表わす広義で使用される。たとえば、デコーダを実装するサブシステムは、デコーダ・システムと称されてもよく、そのようなサブシステムを含むシステム(たとえば、複数の入力に応答してX個の出力信号を生成するシステムであって、前記サブシステムが入力のうちのM個を生成し、他のX−M個の入力は外部源から受領されるもの)もデコーダ・システムと称されることがある。「プロセッサ」という用語は、データ(たとえばオーディオまたはビデオまたは他の画像データ)に対して動作を実行するよう(たとえばソフトウェアまたはファームウェアを用いて)プログラム可能または他の仕方で構成可能であるシステムまたは装置を表わす広義で使用される。プロセッサの例は、フィールド・プログラム可能なゲート・アレイ(または他の構成可能な集積回路またはチップセット)、オーディオまたは他のサウンド・データに対してパイプライン化された処理を実行するようプログラムされたおよび/または他の仕方で構成されたデジタル信号プロセッサ、プログラム可能な汎用プロセッサもしくはコンピュータおよびプログラム可能なマイクロプロセッサ・チップまたはチップセットを含む。
図1は、ある種のメディア処理(たとえば前処理および後処理)コンポーネントを使ういくつかの実施形態のもとでの、ラウドネスおよびダイナミックレンジの最適化を実行するよう構成されていてもよいオーディオ処理システムの実施形態のブロック図である。図1は、例示的なオーディオ処理チェーン(オーディオ・データ処理システム)を示しており、該システムの要素の一つまたは複数は、本発明のある実施形態に基づいて構成されていてもよい。図1のシステム10は、図のように一緒に結合された以下の要素を含む:前処理ユニット12、エンコーダ14、信号解析およびメタデータ補正ユニット16、トランスコーダ18、デコーダ20および後処理ユニット24。図示したシステムに対する諸変形では、要素の一つまたは複数が省略され、あるいは追加的なオーディオ・データ処理ユニットが含められる。たとえば、ある実施形態では、後処理ユニット22は、別個のユニットではなくデコーダ20の一部である。
(たとえば、LPSMがデコーダ202から出力されたオーディオ・データが特定の型のラウドネス処理を受けていることを示し、有効確認器203からの制御ビットがLPSMが有効であることを示すとき)デコーダ202から出力されたデコードされたオーディオ・データが該特定の型のラウドネス処理を受けていることを示す制御ビット;または(たとえば、LPSMがデコーダ202から出力されたオーディオ・データが特定の型のラウドネス処理を受けていないことを示す、またはLPSMがデコーダ202から出力されたオーディオ・データが特定の型のラウドネス処理を受けていることを示すが、有効確認器203からの制御ビットがLPSMが有効でないことを示すとき)デコーダ202から出力されたデコードされたオーディオ・データが該特定の型のラウドネス処理を受けるべきであることを示す制御ビット。
上記の安全なメタデータ符号化および転送方式は、図1に示されるような、異なる再生装置、アプリケーションおよび聴取環境を横断してラウドネスおよびダイナミックレンジを最適化するためのスケーラブルかつ拡張可能なシステムとの関連で使われる。ある実施形態では、システム10は、異なる目標ラウドネス値を必要とし、異なるダイナミックレンジ機能をもつさまざまな装置を横断して入力オーディオ11のラウドネス・レベルおよびダイナミックレンジを正規化するよう構成されている。ラウドネス・レベルおよびダイナミックレンジを正規化するために、システム10は、オーディオ・コンテンツとともに種々の装置プロファイルを含み、正規化はそれらのプロファイルに基づいてなされる。それらのプロファイルは、オーディオ処理チェーン内のオーディオ処理ユニットの一つによって含まれていてもよく、含まれるプロファイルは、オーディオ処理チェーン内の下流の処理ユニットによって、目標装置のための所望される目標ラウドネスおよびダイナミックレンジを決定するために使用されてもよい。追加的な処理コンポーネントが、(以下のパラメータ:ヌル帯域レンジ、真のピーク閾値、ラウドネス・レンジ、高速/低速時定数(係数)および最大ブーストを含む(がそれに限定されない))装置プロファイル管理、利得制御および広帯域および/またはマルチ帯域利得生成機能のための情報を提供または処理してもよい。
先述したように、ラウドネスおよびダイナミックレンジを最適化するためのシステムは、エンコーダとデコーダの間または源とレンダリング/再生装置の間のビットストリームにおいて伝送されるメタデータおよびオーディオ・コンテンツが、互いから分離されたり、あるいは他の仕方でネットワークもしくはサービス・プロバイダー・インターフェースなどのような他の独自の設備を通じた伝送中に損なわれたりしていないことを保証するために、安全な拡張可能なメタデータ・フォーマットを用いる。このビットストリームは、エンコーダおよび/またはデコーダ・コンポーネントが、適切なプロファイル情報を通じてオーディオ・コンテンツおよび出力装置特性に適合するようオーディオ信号のラウドネスおよびダイナミックレンジを適応させるための信号伝達のための機構を提供する。ある実施形態では、システムは、エンコーダとデコーダの間で伝送されるべき低ビットレートのエンコードされたビットストリームを決定するよう構成され、メタデータを通じてエンコードされるラウドネス情報は、一つまたは複数の出力プロファイルのための特性を含む。ある実施形態のもとでの、ラウドネスおよびダイナミックレンジ最適化システムとともに使うためのビットストリーム・フォーマットについて次に述べる。
〔態様1〕
ビットストリームにおいてオーディオ・データに関連付けられたメタデータを受領する段階と;
前記ビットストリーム中の前記メタデータを解析してオーディオ再生装置の第一の群のためのラウドネス・パラメータが前記ビットストリーム中で利用可能であるかどうかを判定する段階と;
前記第一の群のために前記パラメータが存在すると判定するのに応答して、オーディオをレンダリングするために前記パラメータおよびオーディオ・データを使う段階と;
前記第一の群のために前記ラウドネス・パラメータが存在しないと判定するのに応答して、前記第一の群の一つまたは複数の特性を解析し、前記一つまたは複数の特性に基づいて前記パラメータを決定する段階とを含む、
方法。
〔態様2〕
前記一つまたは複数の特性は、前記オーディオ・データの異なるプロファイルについての利得レベルを含む、態様1記載の方法。
〔態様3〕
前記利得レベルは:前記オーディオ・データがある定義されたプログラムのためにどのように再生されるかを制御する芸術的ダイナミックレンジ・プロファイルと、前記定義されたプログラムの諸部分についての過負荷保護を提供する短期ダイナミックレンジ・プロファイルとのうちの少なくとも一つを定義する、態様2記載の方法。
〔態様4〕
オーディオをレンダリングするために前記パラメータおよびオーディオ・データを使う段階が、再生のために前記オーディオをレンダリングする下流のモジュールに前記パラメータおよびオーディオ・データを送信することを含む、態様1記載の方法。
〔態様5〕
オーディオをレンダリングするために前記パラメータおよびオーディオ・データを使う段階が、前記パラメータおよびオーディオ・データに基づいて前記オーディオ・データをレンダリングすることを含む、態様1記載の方法。
〔態様6〕
前記受領されたオーディオ・ストリームをレンダリングする出力装置を判別する段階と;
前記出力装置がオーディオ再生装置の前記第一の群に属するか否かを判定する段階とをさらに含み、ストリーム中のメタデータを解析してオーディオ再生装置の前記第一の群のためのラウドネス・パラメータが利用可能であるかどうかを判定する前記段階は、前記出力装置がオーディオ再生装置の前記第一の群に属することを判別する前記段階の後に実行される、
態様1記載の方法。
〔態様7〕
前記出力装置がオーディオ再生装置の前記第一の群に属することを判別する前記段階は:
前記出力装置の素性を指示するまたは前記出力装置を含む装置の群の素性を指示する前記出力装置に接続されたモジュールからの指標を受領し;
受領された指標に基づいて、前記出力装置がオーディオ再生装置の前記第一の群に属することを判別することを含む、
態様6記載の方法。
〔態様8〕
オーディオ・データに関連付けられたメタデータを含むビットストリームを受領するよう構成されたインターフェースと;
前記ビットストリーム中の前記メタデータを解析してオーディオ再生装置の第一の群のためのラウドネス・パラメータが前記ビットストリーム中で利用可能であるかどうかを判定するよう構成された、前記インターフェースに結合された解析器と;
前記解析器が前記第一の群のために前記パラメータが存在すると判定するのに応答して、オーディオをレンダリングするために前記パラメータおよびオーディオ・データを使うよう構成されたレンダリング・コンポーネントであって、前記解析器が前記第一の群のために前記ラウドネス・パラメータが存在しないと判定するのに応答して、前記第一の群の一つまたは複数の特性を解析し、前記一つまたは複数の特性に基づいて前記パラメータを決定するようさらに構成されている、レンダリング・コンポーネントとを有する、
装置。
〔態様9〕
前記レンダリング・コンポーネントがオーディオをレンダリングするために前記パラメータおよびオーディオ・データを使うことが、前記レンダリング・コンポーネントが、再生のために前記オーディオをレンダリングする下流のモジュールに、前記パラメータおよびオーディオ・データを送信することを含む、態様8記載の装置。
〔態様10〕
前記レンダリング・コンポーネントがオーディオをレンダリングするために前記パラメータおよびオーディオ・データを使うことが、前記レンダリング・コンポーネントが、前記パラメータおよびオーディオ・データに基づいて前記オーディオ・データをレンダリングすることを含む、態様9記載の装置。
〔態様11〕
前記受領されたオーディオ・ストリームをレンダリングする出力装置を判別し、前記出力装置がオーディオ再生装置の前記第一の群に属するか否かを判定するよう構成された第二のコンポーネントをさらに有し、
前記解析器は、ストリーム中のメタデータを解析してオーディオ再生装置の前記第一の群のためのラウドネス・パラメータが利用可能であるかどうかを判定することを、第二のコンポーネントが、前記出力装置がオーディオ再生装置の前記第一の群に属するか否かを判別した後に行なう、
態様10記載の装置。
〔態様12〕
前記出力装置の素性を指示するまたは前記出力装置を含む装置の群の素性を指示する前記出力装置に接続されたモジュールからの指標を受領し、受領された指標に基づいて、前記出力装置がオーディオ再生装置の前記第一の群に属するよう構成されたインターフェースをさらに有する、態様11記載の装置。
〔態様13〕
オーディオ・データおよび前記オーディオ・データに関連付けられたメタデータを受領する段階と;
ビットストリーム中の前記メタデータを解析してオーディオ装置の第一の群のためのラウドネス・パラメータに関連するラウドネス情報が前記ストリーム中で利用可能であるかどうかを判定する段階と;
前記第一の群のために前記ラウドネス情報が存在すると判定するのに応答して、前記ストリームからラウドネス情報を決定し、前記オーディオ・データおよびラウドネス情報をオーディオのレンダリングにおいて使うために送信する段階と;
前記ラウドネス情報が前記第一の群のために存在しないと判定するのに応答して、出力プロファイルに関連付けられたラウドネス情報を決定し、前記出力プロファイルについての決定されたラウドネス情報をオーディオのレンダリングにおいて使うために送信する段階とを含む、
方法。
〔態様14〕
出力プロファイルに関連付けられたラウドネス情報を決定する段階はさらに:
前記出力プロファイルの特性を解析し;
前記特性に基づいて前記パラメータを決定することをさらに含み、
決定されたラウドネス情報を送信することは、決定されたパラメータを送信することを含む、
態様13記載の方法。
〔態様15〕
前記特性は、前記オーディオ・データの異なるプロファイルについての利得レベルを含む、態様14記載の方法。
〔態様16〕
前記利得レベルは:前記オーディオ・データがある定義されたプログラムのためにどのように再生されるかを制御する芸術的ダイナミックレンジ・プロファイルと、前記定義されたプログラムの諸部分についての過負荷保護を提供する短期ダイナミックレンジ・プロファイルとのうちの少なくとも一つを定義する、態様15記載の方法。
〔態様17〕
前記ラウドネス情報が出力プロファイルのためのラウドネス・パラメータを含む、態様13記載の方法。
〔態様18〕
前記ラウドネス情報が前記出力プロファイルの前記特性を含む、態様13記載の方法。
〔態様19〕
送信されるべき低ビットレートのエンコードされたストリームを決定する段階をさらに含み、前記ラウドネス情報は一つまたは複数の出力プロファイルについての特性を含む、態様13記載の方法。
〔態様20〕
一つまたは複数の出力プロファイルがプレミアム・コンテンツ・プロファイルを含まない、態様17記載の方法。
〔態様21〕
オーディオ・データをデコードする装置であって:
前記オーディオ・データおよび前記オーディオ・データに関連付けられたメタデータを受領するインターフェースと;
ビットストリーム中のメタデータを解析してオーディオ装置の第一の群のためのラウドネス・パラメータに関連するラウドネス情報が前記ストリーム中で利用可能であるかどうかを判定する第一のコンポーネントとを有し、前記第一のコンポーネントは、前記第一の群のために前記ラウドネス情報が存在すると判定するのに応答して、前記ストリームからラウドネス情報を決定し、前記オーディオ・データおよびラウドネス情報をオーディオのレンダリングにおいて使うために送信し、前記ラウドネス情報が前記第一の群のために存在しないと判定するのに応答して、出力プロファイルに関連付けられたラウドネス情報を決定し、前記出力プロファイルについての決定されたラウドネス情報をオーディオのレンダリングにおいて使うために送信する、
装置。
〔態様22〕
前記第一のコンポーネントが前記メタデータを解析することが、前記第一のコンポーネントが前記出力プロファイルの特性を解析し、前記特性に基づいて前記パラメータを決定することを含み、前記第一のコンポーネントが決定されたラウドネス情報を送信することが、決定されたパラメータを送信することを含む、
態様21記載の装置。
〔態様23〕
前記ラウドネス情報が出力プロファイルのためのラウドネス・パラメータを含む、態様22記載の装置。
〔態様24〕
前記ラウドネス情報が前記出力プロファイルの前記特性を含む、態様23記載の装置。
〔態様25〕
送信されるべき低ビットレートのエンコードされたストリームを決定する第二のコンポーネントをさらに有し、前記ラウドネス情報は一つまたは複数の出力プロファイルについての特性を含む、態様24記載の装置。
Claims (13)
- エンコードされたオーディオ・ビットストリームの一つまたは複数のフレームをデコードするためのオーディオ処理装置であって、前記エンコードされたオーディオ・ビットストリームはオーディオ・データと、複数のダイナミックレンジ制御(DRC)プロファイルについてのメタデータとを含み、当該オーディオ処理装置は:
前記エンコードされたオーディオ・ビットストリームをパースして、前記エンコードされたオーディオ・データと、前記DRCプロファイルのうちの一つまたは複数についてのメタデータとを抽出するよう構成されたビットストリーム・パーサと;
前記エンコードされたオーディオ・データをデコードし、デコードされたオーディオ・データにDRC利得を適用するよう構成されたオーディオ・デコーダとを有しており、
各DRCプロファイルは少なくとも一つの装置型または聴取環境のために好適であり、
前記オーディオ・デコーダは当該オーディオ処理装置または前記聴取環境についての情報に応答して前記DRCプロファイルのうちの一つまたは複数を選択し;
前記デコードされたオーディオ・データに適用される前記DRC利得は前記一つまたは複数の選択されたDRCプロファイルに対応する、
オーディオ処理装置。 - 前記一つまたは複数の選択されたDRCプロファイルに対応する前記DRC利得は、前記エンコードされたオーディオ・ビットストリームの前記メタデータに含まれる、請求項1記載のオーディオ処理装置。
- 前記一つまたは複数の選択されたDRCプロファイルに対応する前記DRC利得は、前記エンコードされたオーディオ・ビットストリームの前記メタデータに含まれる前記一つまたは複数の選択されたDRCプロファイルについてのDRCパラメータから決定される、請求項1記載のオーディオ処理装置。
- 前記DRCパラメータが、静的な利得伝達特性および利得平滑化時定数を示す、請求項3記載のオーディオ処理装置。
- 前記時定数は、低速および高速アタック時定数ならびに低速および高速リリース時定数を含む、請求項4記載のオーディオ処理装置。
- 前記静的な利得伝達特性は、ヌル帯域レンジおよび最大ブーストを含む、請求項4記載のオーディオ処理装置。
- 前記DRCプロファイルのうちの一つまたは複数は、前記デコードされたオーディオ・データのポータブル装置による再生に対応する、請求項1記載のオーディオ処理装置。
- 前記DRCプロファイルのうちの一つまたは複数は、前記デコードされたオーディオ・データの、騒がしい聴取環境における再生に対応する、請求項1記載のオーディオ処理装置。
- 前記DRCプロファイルのうちの一つまたは複数は、前記デコードされたオーディオ・データの、静かな聴取環境における再生に対応する、請求項1記載のオーディオ処理装置。
- 前記DRCプロファイルのうちの一つまたは複数は、前記デコードされたオーディオ・データの、ヘッドフォンを通じた再生に対応する、請求項1記載のオーディオ処理装置。
- 前記DRCプロファイルのうちの一つまたは複数は、前記デコードされたオーディオ・データの、スピーカーを通じた再生に対応する、請求項1記載のオーディオ処理装置。
- エンコードされたオーディオ・ビットストリームの一つまたは複数のフレームをデコードするための、オーディオ処理装置によって実行される方法であって、前記エンコードされたオーディオ・ビットストリームはオーディオ・データと、複数のダイナミックレンジ制御(DRC)プロファイルについてのメタデータとを含み、当該方法は:
前記エンコードされたオーディオ・ビットストリームをパースして、前記エンコードされたオーディオ・データと、前記DRCプロファイルのうちの一つまたは複数についてのメタデータとを抽出する段階と;
前記エンコードされたオーディオ・データをデコードし、デコードされたオーディオ・データにDRC利得を適用する段階とを含み、
各DRCプロファイルは少なくとも一つの装置型または聴取環境のために好適であり、
前記DRCプロファイルのうちの一つまたは複数は、前記オーディオ処理装置または前記聴取環境についての情報に応答して選択され、
前記デコードされたオーディオ・データに適用される前記DRC利得は前記一つまたは複数の選択されたDRCプロファイルに対応する、
方法。 - オーディオ・デコード装置によって実行されたときに該オーディオ・デコード装置に請求項12記載の方法を実行させる命令のシーケンスを有する、非一時的なコンピュータ可読記憶媒体。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361754882P | 2013-01-21 | 2013-01-21 | |
US61/754,882 | 2013-01-21 | ||
US201361809250P | 2013-04-05 | 2013-04-05 | |
US61/809,250 | 2013-04-05 | ||
US201361824010P | 2013-05-16 | 2013-05-16 | |
US61/824,010 | 2013-05-16 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018229824A Division JP6680858B2 (ja) | 2013-01-21 | 2018-12-07 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021037328A Division JP7133673B2 (ja) | 2013-01-21 | 2021-03-09 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020095290A JP2020095290A (ja) | 2020-06-18 |
JP6851523B2 true JP6851523B2 (ja) | 2021-03-31 |
Family
ID=50071737
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015553800A Active JP6129348B2 (ja) | 2013-01-21 | 2014-01-15 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2017078015A Active JP6450415B2 (ja) | 2013-01-21 | 2017-04-11 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2018229824A Active JP6680858B2 (ja) | 2013-01-21 | 2018-12-07 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2020048672A Active JP6851523B2 (ja) | 2013-01-21 | 2020-03-19 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2021037328A Active JP7133673B2 (ja) | 2013-01-21 | 2021-03-09 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2022136006A Active JP7375138B2 (ja) | 2013-01-21 | 2022-08-29 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2023182909A Pending JP2023175019A (ja) | 2013-01-21 | 2023-10-25 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015553800A Active JP6129348B2 (ja) | 2013-01-21 | 2014-01-15 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2017078015A Active JP6450415B2 (ja) | 2013-01-21 | 2017-04-11 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2018229824A Active JP6680858B2 (ja) | 2013-01-21 | 2018-12-07 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021037328A Active JP7133673B2 (ja) | 2013-01-21 | 2021-03-09 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2022136006A Active JP7375138B2 (ja) | 2013-01-21 | 2022-08-29 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
JP2023182909A Pending JP2023175019A (ja) | 2013-01-21 | 2023-10-25 | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 |
Country Status (11)
Country | Link |
---|---|
US (5) | US9841941B2 (ja) |
EP (2) | EP3193447A1 (ja) |
JP (7) | JP6129348B2 (ja) |
KR (8) | KR102016901B1 (ja) |
CN (3) | CN104937844B (ja) |
BR (3) | BR122020007932B1 (ja) |
ES (1) | ES2624419T3 (ja) |
HK (1) | HK1213374A1 (ja) |
IN (1) | IN2015MN01766A (ja) |
RU (2) | RU2631139C2 (ja) |
WO (1) | WO2014113471A1 (ja) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
WO2014114781A1 (en) * | 2013-01-28 | 2014-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
WO2014148848A2 (ko) * | 2013-03-21 | 2014-09-25 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 크기 제어 방법 및 장치 |
CN104080024B (zh) * | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
WO2014165304A1 (en) * | 2013-04-05 | 2014-10-09 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
EP2802122A1 (en) * | 2013-05-07 | 2014-11-12 | Nagravision S.A. | A Media Player for Receiving Media Content from a Remote Server |
US9831843B1 (en) | 2013-09-05 | 2017-11-28 | Cirrus Logic, Inc. | Opportunistic playback state changes for audio devices |
US20150095320A1 (en) * | 2013-09-27 | 2015-04-02 | Trooclick France | Apparatus, systems and methods for scoring the reliability of online information |
SG11201605015XA (en) | 2013-12-27 | 2016-08-30 | Sony Corp | Decoding device, method, and program |
US9621963B2 (en) | 2014-01-28 | 2017-04-11 | Dolby Laboratories Licensing Corporation | Enabling delivery and synchronization of auxiliary content associated with multimedia data using essence-and-version identifier |
US9525940B1 (en) | 2014-03-05 | 2016-12-20 | Cirrus Logic, Inc. | Multi-path analog front end and analog-to-digital converter for a signal processing system |
US9774342B1 (en) | 2014-03-05 | 2017-09-26 | Cirrus Logic, Inc. | Multi-path analog front end and analog-to-digital converter for a signal processing system |
US9306588B2 (en) | 2014-04-14 | 2016-04-05 | Cirrus Logic, Inc. | Switchable secondary playback path |
US10785568B2 (en) | 2014-06-26 | 2020-09-22 | Cirrus Logic, Inc. | Reducing audio artifacts in a system for enhancing dynamic range of audio signal path |
US9596537B2 (en) | 2014-09-11 | 2017-03-14 | Cirrus Logic, Inc. | Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement |
US10020001B2 (en) | 2014-10-01 | 2018-07-10 | Dolby International Ab | Efficient DRC profile transmission |
US10089991B2 (en) | 2014-10-03 | 2018-10-02 | Dolby International Ab | Smart access to personalized audio |
ES2916254T3 (es) | 2014-10-10 | 2022-06-29 | Dolby Laboratories Licensing Corp | Sonoridad de programa basada en la presentación, independiente de la transmisión |
US9503027B2 (en) | 2014-10-27 | 2016-11-22 | Cirrus Logic, Inc. | Systems and methods for dynamic range enhancement using an open-loop modulator in parallel with a closed-loop modulator |
KR20160052313A (ko) | 2014-11-04 | 2016-05-12 | 삼성전자주식회사 | 송신 장치, 수신 장치 및 그 신호 처리 방법 |
US9948753B2 (en) * | 2014-11-04 | 2018-04-17 | Samsung Electronics Co., Ltd. | Transmitting apparatus and signal processing method thereof |
US9584911B2 (en) | 2015-03-27 | 2017-02-28 | Cirrus Logic, Inc. | Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses |
US10628439B1 (en) * | 2015-05-05 | 2020-04-21 | Sprint Communications Company L.P. | System and method for movie digital content version control access during file delivery and playback |
US9959856B2 (en) | 2015-06-15 | 2018-05-01 | Cirrus Logic, Inc. | Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9496843B1 (en) * | 2015-08-21 | 2016-11-15 | Nagravision S.A. | Smart volume guard |
US9955254B2 (en) | 2015-11-25 | 2018-04-24 | Cirrus Logic, Inc. | Systems and methods for preventing distortion due to supply-based modulation index changes in an audio playback system |
EP3913625B1 (en) * | 2015-12-08 | 2024-04-10 | Sony Group Corporation | Transmitting apparatus, transmitting method, receiving apparatus, and receiving method |
US9543975B1 (en) | 2015-12-29 | 2017-01-10 | Cirrus Logic, Inc. | Multi-path analog front end and analog-to-digital converter for a signal processing system with low-pass filter between paths |
US9880802B2 (en) | 2016-01-21 | 2018-01-30 | Cirrus Logic, Inc. | Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system |
US10573324B2 (en) | 2016-02-24 | 2020-02-25 | Dolby International Ab | Method and system for bit reservoir control in case of varying metadata |
CN106126164B (zh) * | 2016-06-16 | 2019-05-17 | Oppo广东移动通信有限公司 | 一种音效处理方法及终端设备 |
US9998826B2 (en) | 2016-06-28 | 2018-06-12 | Cirrus Logic, Inc. | Optimization of performance and power in audio system |
US10545561B2 (en) | 2016-08-10 | 2020-01-28 | Cirrus Logic, Inc. | Multi-path digitation based on input signal fidelity and output requirements |
US10263630B2 (en) | 2016-08-11 | 2019-04-16 | Cirrus Logic, Inc. | Multi-path analog front end with adaptive path |
US9813814B1 (en) | 2016-08-23 | 2017-11-07 | Cirrus Logic, Inc. | Enhancing dynamic range based on spectral content of signal |
US9762255B1 (en) | 2016-09-19 | 2017-09-12 | Cirrus Logic, Inc. | Reconfiguring paths in a multiple path analog-to-digital converter |
US9780800B1 (en) | 2016-09-19 | 2017-10-03 | Cirrus Logic, Inc. | Matching paths in a multiple path analog-to-digital converter |
US9929703B1 (en) | 2016-09-27 | 2018-03-27 | Cirrus Logic, Inc. | Amplifier with configurable final output stage |
US9967665B2 (en) | 2016-10-05 | 2018-05-08 | Cirrus Logic, Inc. | Adaptation of dynamic range enhancement based on noise floor of signal |
US10924078B2 (en) | 2017-03-31 | 2021-02-16 | Dolby International Ab | Inversion of dynamic range control |
US10321230B2 (en) | 2017-04-07 | 2019-06-11 | Cirrus Logic, Inc. | Switching in an audio system with multiple playback paths |
US10008992B1 (en) | 2017-04-14 | 2018-06-26 | Cirrus Logic, Inc. | Switching in amplifier with configurable final output stage |
US9917557B1 (en) | 2017-04-17 | 2018-03-13 | Cirrus Logic, Inc. | Calibration for amplifier with configurable final output stage |
CN112020827B (zh) | 2018-01-07 | 2024-08-30 | 格雷斯诺特有限公司 | 用于音量调节的方法和装置 |
ES2980359T3 (es) | 2018-11-02 | 2024-10-01 | Dolby Int Ab | Codificador de audio y decodificador de audio |
CN110223244B (zh) * | 2019-05-13 | 2021-08-27 | 浙江大华技术股份有限公司 | 一种图像处理的方法、装置、电子设备和存储介质 |
CN114503432A (zh) * | 2019-09-13 | 2022-05-13 | 杜比实验室特许公司 | 伪声减少的动态范围压缩 |
RU2726326C1 (ru) * | 2019-11-26 | 2020-07-13 | Акционерное общество "ЗАСЛОН" | Способ повышения разборчивости речи пожилыми людьми при приеме звуковых программ на наушники |
KR102287497B1 (ko) * | 2019-12-11 | 2021-08-09 | 네이버 주식회사 | 플랫폼 적응형 오디오 정규화 방법 및 시스템 |
KR20220058124A (ko) | 2020-10-30 | 2022-05-09 | 주식회사 만도 | 조향장치의 동력 전달부재 |
US11726949B2 (en) | 2021-05-28 | 2023-08-15 | Samsung Electronics Co., Ltd. | System and method for selectively reprocessing video streams based on system resources and stream status |
EP4392970A1 (en) * | 2021-08-26 | 2024-07-03 | Dolby Laboratories Licensing Corporation | Method and apparatus for metadata-based dynamic processing of audio data |
Family Cites Families (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1992012607A1 (en) | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
KR0152037B1 (ko) | 1994-09-27 | 1998-11-02 | 김광호 | 다채널 오디오신호의 전송 비트열구조 |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US6704421B1 (en) | 1997-07-24 | 2004-03-09 | Ati Technologies, Inc. | Automatic multichannel equalization control system for a multimedia computer |
US6272153B1 (en) | 1998-06-26 | 2001-08-07 | Lsi Logic Corporation | DVD audio decoder having a central sync-controller architecture |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
GB9909606D0 (en) | 1999-04-26 | 1999-06-23 | Telemedia Systems Ltd | Networked delivery of profiled media files to clients |
US7283965B1 (en) * | 1999-06-30 | 2007-10-16 | The Directv Group, Inc. | Delivery and transmission of dolby digital AC-3 over television broadcast |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
WO2003034724A1 (fr) * | 2001-10-16 | 2003-04-24 | Seiko Epson Corporation | Dispositif de creation de fichier et dispositif de sortie de donnees |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
KR101014309B1 (ko) | 2002-10-23 | 2011-02-16 | 닐슨 미디어 리서치 인코퍼레이티드 | 압축된 오디오/비디오 데이터와 함께 사용하기 위한 디지털데이터 삽입장치 및 방법 |
US7827312B2 (en) | 2002-12-27 | 2010-11-02 | The Nielsen Company (Us), Llc | Methods and apparatus for transcoding metadata |
US20080056504A1 (en) | 2003-06-18 | 2008-03-06 | Frederik Gorges | Dynamic Range Control Of An Audio Signal And Method Of Its Operation |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
WO2005069613A1 (en) | 2004-01-08 | 2005-07-28 | Koninklijke Philips Electronics, N.V. | Graphical representation of programs stored in a personal video recording device |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
US8131134B2 (en) | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
EP1768419B1 (en) | 2004-06-21 | 2010-10-06 | Mitsubishi Electric Corporation | Moving picture encoding device, moving picture recording device, and moving picture reproduction device |
US20060002571A1 (en) | 2004-06-30 | 2006-01-05 | International Business Machines Corporation | Self-adjusted car stereo system |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7624021B2 (en) | 2004-07-02 | 2009-11-24 | Apple Inc. | Universal container for audio data |
KR100689443B1 (ko) | 2004-08-21 | 2007-03-08 | 삼성전자주식회사 | 방송 데이터를 저장하기 위한 디지털 방송 시스템 및송수신 방법 |
CA2581810C (en) | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US20060106472A1 (en) | 2004-11-16 | 2006-05-18 | Romesburg Eric D | Method and apparatus for normalizing sound recording loudness |
JP2006174079A (ja) * | 2004-12-15 | 2006-06-29 | Sony Corp | オーディオ信号処理方法及び装置 |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
BRPI0607028A2 (pt) | 2005-04-07 | 2009-07-28 | Matsushita Electric Ind Co Ltd | meio de gravação, dispositivo de reprodução, método de gravação, e método de reprodução |
TW200638335A (en) | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
WO2007055461A1 (en) | 2005-08-30 | 2007-05-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
WO2007097549A1 (en) | 2006-02-23 | 2007-08-30 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
UA93243C2 (ru) | 2006-04-27 | 2011-01-25 | ДОЛБИ ЛЕБОРЕТЕРИЗ ЛАЙСЕНСИНГ КОРПОРЕЙШи | Регулирование усиления звука c использованием основанного ha конкретной громкости выявления аккустических событий |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
US20080080722A1 (en) * | 2006-09-29 | 2008-04-03 | Carroll Tim J | Loudness controller with remote and local control |
RU2406166C2 (ru) | 2007-02-14 | 2010-12-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов |
US7742746B2 (en) | 2007-04-30 | 2010-06-22 | Qualcomm Incorporated | Automatic volume and dynamic range adjustment for mobile audio devices |
WO2008136608A1 (en) | 2007-05-02 | 2008-11-13 | Pixtree Technologis, Inc. | Method of processing media data and receiver, broadcasting system |
ATE486407T1 (de) * | 2007-07-13 | 2010-11-15 | Dolby Lab Licensing Corp | Zeitvariierender tonsignalpegel unter verwendung von zeitvariierender geschätzter wahrscheinlichkeitsdichte des pegels |
JP2010537233A (ja) * | 2007-08-16 | 2010-12-02 | ディーティーエス・インコーポレイテッド | 圧縮デジタルテレビの音声処理 |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
WO2010005823A1 (en) | 2008-07-11 | 2010-01-14 | Spinvox Inc. | Providing a plurality of audio files with consistent loudness levels but different audio characteristics |
AU2009267529B2 (en) * | 2008-07-11 | 2011-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
EP2146522A1 (en) * | 2008-07-17 | 2010-01-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio output signals using object based metadata |
CN102160358B (zh) | 2008-09-19 | 2015-03-11 | 杜比实验室特许公司 | 小蜂窝无线网络中的客户设备的上游信号处理 |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
WO2010053728A1 (en) * | 2008-10-29 | 2010-05-14 | Dolby Laboratories Licensing Corporation | Signal clipping protection using pre-existing audio gain metadata |
US7755526B2 (en) | 2008-10-31 | 2010-07-13 | At&T Intellectual Property I, L.P. | System and method to modify a metadata parameter |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
US8626516B2 (en) | 2009-02-09 | 2014-01-07 | Broadcom Corporation | Method and system for dynamic range control in an audio processing system |
US8165321B2 (en) * | 2009-03-10 | 2012-04-24 | Apple Inc. | Intelligent clip mixing |
US8422699B2 (en) | 2009-04-17 | 2013-04-16 | Linear Acoustic, Inc. | Loudness consistency at program boundaries |
JP2010258776A (ja) * | 2009-04-24 | 2010-11-11 | Canon Inc | 音声信号処理装置 |
WO2010138309A1 (en) | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Audio signal dynamic equalization processing control |
US8567157B2 (en) | 2009-10-30 | 2013-10-29 | Munchkin, Inc. | System for disposing waste packages such as diapers |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
TWI525987B (zh) * | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
EP2381574B1 (en) | 2010-04-22 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an input audio signal |
US9998081B2 (en) | 2010-05-12 | 2018-06-12 | Nokia Technologies Oy | Method and apparatus for processing an audio signal based on an estimated loudness |
US8948406B2 (en) | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
TWI665659B (zh) | 2010-12-03 | 2019-07-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
ES2363151B1 (es) | 2011-02-11 | 2012-04-17 | Adecq Digital, S.L | Procedimiento de reproducción dinámica de contenidos en emisiones en entornos push. |
JP5719966B2 (ja) * | 2011-04-08 | 2015-05-20 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 2つのエンコードされたビットストリームからのオーディオストリームの混合において使用するためのメタデータの自動設定 |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US20120287999A1 (en) | 2011-05-11 | 2012-11-15 | Microsoft Corporation | Syntax element prediction in error correction |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
KR101594480B1 (ko) | 2011-12-15 | 2016-02-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 클립핑 아티팩트를 피하기 위한 장치, 방법 및 컴퓨터 프로그램 |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
WO2014114781A1 (en) | 2013-01-28 | 2014-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
EP3061090B1 (en) | 2013-10-22 | 2019-04-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
SG11201605015XA (en) | 2013-12-27 | 2016-08-30 | Sony Corp | Decoding device, method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
AU2015238519B2 (en) | 2014-03-25 | 2017-11-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
RU2653858C1 (ru) | 2014-05-28 | 2018-05-15 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Процессор данных и транспорт данных пользовательского управления на устройства декодирования и воспроизведения аудио |
WO2015182491A1 (ja) | 2014-05-30 | 2015-12-03 | ソニー株式会社 | 情報処理装置および情報処理方法 |
CA2953242C (en) | 2014-06-30 | 2023-10-10 | Sony Corporation | Information processing apparatus and information processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
CA2987702C (en) | 2015-05-29 | 2022-06-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Device and method for volume control |
CA2988645C (en) | 2015-06-17 | 2021-11-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Loudness control for user interactivity in audio coding systems |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2014
- 2014-01-15 BR BR122020007932-0A patent/BR122020007932B1/pt active IP Right Grant
- 2014-01-15 US US14/761,888 patent/US9841941B2/en active Active
- 2014-01-15 BR BR122020007931-2A patent/BR122020007931B1/pt active IP Right Grant
- 2014-01-15 IN IN1766MUN2015 patent/IN2015MN01766A/en unknown
- 2014-01-15 CN CN201480005314.9A patent/CN104937844B/zh active Active
- 2014-01-15 BR BR112015017064-1A patent/BR112015017064B1/pt active IP Right Grant
- 2014-01-15 KR KR1020157019693A patent/KR102016901B1/ko active IP Right Grant
- 2014-01-15 KR KR1020247012473A patent/KR20240055146A/ko active Application Filing
- 2014-01-15 ES ES14703670.1T patent/ES2624419T3/es active Active
- 2014-01-15 RU RU2015135361A patent/RU2631139C2/ru active
- 2014-01-15 KR KR1020167036002A patent/KR102071860B1/ko active IP Right Grant
- 2014-01-15 KR KR1020227040993A patent/KR102660144B1/ko active IP Right Grant
- 2014-01-15 KR KR1020217037771A patent/KR102473260B1/ko active IP Right Grant
- 2014-01-15 KR KR1020167036004A patent/KR102056589B1/ko active IP Right Grant
- 2014-01-15 RU RU2017131515A patent/RU2665873C1/ru active
- 2014-01-15 KR KR1020207002186A patent/KR102194120B1/ko active IP Right Grant
- 2014-01-15 WO PCT/US2014/011681 patent/WO2014113471A1/en active Application Filing
- 2014-01-15 KR KR1020207036219A patent/KR102331129B1/ko active IP Right Grant
- 2014-01-15 CN CN201810859613.9A patent/CN109003617B/zh active Active
- 2014-01-15 CN CN201810859612.4A patent/CN109036443B/zh active Active
- 2014-01-15 JP JP2015553800A patent/JP6129348B2/ja active Active
- 2014-01-15 EP EP16203669.3A patent/EP3193447A1/en active Pending
- 2014-01-15 EP EP14703670.1A patent/EP2946469B1/en active Active
-
2016
- 2016-01-29 HK HK16101081.0A patent/HK1213374A1/zh unknown
-
2017
- 2017-04-11 JP JP2017078015A patent/JP6450415B2/ja active Active
- 2017-12-07 US US15/835,241 patent/US10671339B2/en active Active
-
2018
- 2018-12-07 JP JP2018229824A patent/JP6680858B2/ja active Active
-
2020
- 2020-03-19 JP JP2020048672A patent/JP6851523B2/ja active Active
- 2020-06-01 US US16/889,658 patent/US11080010B2/en active Active
-
2021
- 2021-03-09 JP JP2021037328A patent/JP7133673B2/ja active Active
- 2021-07-27 US US17/386,423 patent/US11782672B2/en active Active
-
2022
- 2022-08-29 JP JP2022136006A patent/JP7375138B2/ja active Active
-
2023
- 2023-10-09 US US18/483,082 patent/US20240103801A1/en active Pending
- 2023-10-25 JP JP2023182909A patent/JP2023175019A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6851523B2 (ja) | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 | |
JP2021101259A (ja) | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ | |
RU2777880C2 (ru) | Оптимизация громкости и динамического диапазона через различные устройства воспроизведения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6851523 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |