JP2019174852A - プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ - Google Patents
プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ Download PDFInfo
- Publication number
- JP2019174852A JP2019174852A JP2019134478A JP2019134478A JP2019174852A JP 2019174852 A JP2019174852 A JP 2019174852A JP 2019134478 A JP2019134478 A JP 2019134478A JP 2019134478 A JP2019134478 A JP 2019134478A JP 2019174852 A JP2019174852 A JP 2019174852A
- Authority
- JP
- Japan
- Prior art keywords
- metadata
- audio
- bitstream
- program
- loudness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims abstract description 201
- 238000000034 method Methods 0.000 claims abstract description 69
- 230000006835 compression Effects 0.000 claims description 35
- 238000007906 compression Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 description 37
- 238000007781 pre-processing Methods 0.000 description 30
- 230000001419 dependent effect Effects 0.000 description 23
- 238000012937 correction Methods 0.000 description 21
- 230000003044 adaptive effect Effects 0.000 description 20
- 238000005259 measurement Methods 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 238000010200 validation analysis Methods 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 11
- 239000000284 extract Substances 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012805 post-processing Methods 0.000 description 7
- 230000006978 adaptation Effects 0.000 description 6
- 238000002156 mixing Methods 0.000 description 6
- 238000009877 rendering Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Time-Division Multiplex Systems (AREA)
- Information Transfer Systems (AREA)
- Application Of Or Painting With Fluid Materials (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Description
本願は2013年6月19日に出願された米国仮特許出願第61/836,865号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
本発明は、オーディオ信号処理に、より詳細には、ビットストリームによって示されるオーディオ・コンテンツに関するサブストリーム構造および/またはプログラム情報を示すメタデータをもつオーディオ・データ・ビットストリームのエンコードおよびデコードに関する。本発明のいくつかの実施形態は、ドルビー・デジタル(AC-3)、ドルビー・デジタル・プラス(向上AC-3またはE-AC-3)またはドルビーEとして知られるフォーマットの一つでのオーディオ・データを生成または復号する。
請求項を含む本開示を通じて、信号またはデータ「に対して」動作を実行する(たとえば信号またはデータをフィルタリングする、スケーリングする、変換するまたは利得を適用する)という表現は、信号またはデータに対して直接的に、または信号またはデータの処理されたバージョンに対して(たとえば、予備的なフィルタリングまたは前処理を該動作の実行に先立って受けている前記信号のバージョンに対して)該動作を実行することを表わすために広義で使用される。
オーディオ・データの典型的なストリームは、オーディオ・コンテンツ(たとえばオーディオ・コンテンツの一つまたは複数のチャネル)と、オーディオ・コンテンツの少なくとも一つの特性を示すメタデータとの両方を含む。たとえば、AC-3ビットストリームでは、聴取環境に送達されるプログラムの音を変える際に使うために特に意図されているいくつかのオーディオ・メタデータ・パラメータがある。そうしたメタデータ・パラメータの一つがDIALNORMパラメータである。これは、オーディオ・プログラムにおけるダイアログの平均レベルを示すために意図されており、オーディオ再生信号レベルを決定するために使われる。
独立サブストリーム(メイン・プログラムの少なくとも一つのチャネルを示す)を含むエンコードされたビットストリームの例において、ビットストリームは、メイン・プログラムの一つまたは複数の追加的なスピーカー・チャネルを示す従属サブストリーム(前記独立ビットストリームに関連付けられている)をも含む。そのような追加的なスピーカー・チャネルは、前記独立サブストリームによって示されるメイン・プログラム・チャネル(単数または複数)に対して追加的である。たとえば、独立サブストリームが、7.1チャネル・メイン・プログラムの標準的なフォーマットの左、右、中央、左サラウンド、右サラウンドのフルレンジ・スピーカー・チャネルを示す場合、従属サブストリームは、メイン・プログラムの二つの他のフルレンジ・スピーカー・チャネルを示してもよい。
オーディオ・サンプルのストリームおよび入力されたエンコードされたビットストリームから抽出されたSIMおよび/またはPIM(および典型的には他のメタデータも)の少なくとも一つの対応するストリーム;または
オーディオ・サンプルのストリームおよび入力されたエンコードされたビットストリームから抽出されたSSMおよび/またはPIM(および典型的には他のメタデータ、たとえばLPSMも)から決定された制御ビットの対応するストリーム;または
メタデータやメタデータから決定された制御ビットの対応するストリームなしの、オーディオ・サンプルのストリーム。この最後の場合、デコーダは、抽出されたメタデータやそれから決定される制御ビットを出力しなくても、入力されたエンコードされたビットストリームからメタデータを抽出し、抽出されたメタデータに対する少なくとも一つの動作(たとえば有効確認)を実行してもよい。
1.AC-3データおよびLPSMがエンコードされたのち、フレーム・データ・バイト(連結されたフレーム・データ#1およびフレーム・データ#2)およびLPSMデータ・バイトが、ハッシュ関数HMACのための入力として使われる。補助データ・フィールド内に存在していてもよい他のデータは、このダイジェストを計算するためには考慮に入れられない。そのような他のデータは、AC-3データにもLSPSMデータにも属さないバイトであってもよい。LPSMに含まれる保護ビットは、HMACダイジェストを計算するためには考慮されなくてもよい。
2.ダイジェストが計算されたのち、該ダイジェストは保護ビットのためにリザーブされているフィールドにおいてビットストリームに書き込まれる。
3.完全なAC-3フレームの生成の最後の段階は、CRC検査の計算である。これは、フレームのいちばん最後に書かれ、LPSMビットを含む、このフレームに属するすべてのデータが考慮に入れられる。
(たとえば、LPSMがデコーダ101から出力されたオーディオ・データが特定の型のラウドネス処理を受けていないことを示し、有効確認器102からの制御ビットがLPSMが有効であることを示すとき)ラウドネス処理段103の適応的に処理された出力;または
(たとえば、LPSMがデコーダ101から出力されたオーディオ・データが段103によって実行されるはずの特定の型のラウドネス処理をすでに受けていることを示し、有効確認器102からの制御ビットがLPSMが有効であることを示すとき)デコーダ101から出力された前記オーディオ・データ。
ペイロード・ヘッダ。これは典型的には少なくとも一つの識別情報値(たとえば、SSMフォーマット・バージョンを示す2ビット値および任意的には、長さ、期間(period)、カウントおよびサブストリーム関連付け値)を含む;
ヘッダ後に、
ビットストリームによって示されるプログラムの独立サブストリームの数を示す独立サブストリーム・メタデータ;および
プログラムの各独立サブストリームが少なくとも一つの関連付けられた従属サブストリームをもつかどうか(すなわち、前記各独立サブストリームに少なくとも一つの従属サブストリームが関連付けられているかどうか)およびもしそうであればプログラムの各独立サブストリームに関連付けられた従属サブストリームの数を示す従属サブストリーム・メタデータ。
ペイロード・ヘッダ。これは典型的には少なくとも一つの識別情報値(たとえば、PIMフォーマット・バージョンを示す値および任意的には、長さ、期間(period)、カウントおよびサブストリーム関連付け値)を含む;および
ヘッダ後に、次のフォーマットでのPIM:
オーディオ・プログラムの各無音チャネルおよび各非無音チャネル(すなわち、プログラムのどのチャネルがオーディオ情報を含むかおよび(もしあれば)どのチャネルが無音のみを含むか(典型的には当該フレームの継続時間にわたって))を示すアクティブ・チャネル・メタデータ。エンコードされたビットストリームがAC-3またはE-AC-3ビットストリームである実施形態では、プログラムのどのチャネルがオーディオ情報を含み、どのチャネルが無音を含むかを決定するために、ビットストリームのフレーム中のアクティブ・チャネル・メタデータは、ビットストリームの追加的なメタデータ(たとえば、当該フレームのオーディオ符号化モード(「acmod」)フィールドおよびもし存在すれば当該フレームもしくは関連付けられた従属サブストリーム・フレーム(単数または複数)内のchanmapフィールド)との関連で使用されてもよい。AC-3またはE-AC-3フレームの「acmod」フィールドは、当該フレームのオーディオ・コンテンツによって示されるオーディオ・プログラムのフルレンジ・チャネルの数(たとえば、プログラムが1.0チャネル・モノフォニック・プログラム、2.0チャネル・ステレオ・プログラムまたはL、R、C、Ls、Rsフルレンジ・チャネルを含むプログラムのいずれであるか)を示すか、あるいは当該フレームが二つの独立な1.0チャネル・モノフォニック・プログラムを示すことを示す。E-AC-3ビットストリームの「chanmap」フィールドは、ビットストリームによって示される従属サブストリームについてのチャネル・マップを示す。アクティブ・チャネル・メタデータは、たとえばデコーダの出力において無音を含むチャネルにオーディオを加えるために、デコーダの下流で(後処理器内での)上方混合〔増数混合〕を実装するために有用でありうる;。
サラウンド減衰が適用されたかどうか(たとえば、オーディオ・プログラムのサラウンド・チャネルがエンコードに先立って3dB減衰されたかどうか)、
90度位相シフトが適用されたかどうか(たとえばエンコードに先立ってオーディオ・プログラムのサラウンド・チャネルLsおよびRsチャネルに)、
エンコードに先立ってオーディオ・プログラムのLFEチャネルに低域通過フィルタが適用されたかどうか、
プログラムのLFEチャネルのレベルが制作中にモニタリングされたかどうかおよびもしそうであればプログラムのフルレンジ・オーディオ・チャネルのレベルに対するLFEチャネルのモニタリングされたレベル、。
ヘッダ(典型的にはLPSMペイロードの始まりを同定する同期語を含み、それに続いて少なくとも一つの識別情報値、たとえば下記の表2に示されるLPSMフォーマット・バージョン、長さ、期間(period)、カウントおよびサブストリーム関連付け値がくる);
ヘッダ後に、
対応するオーディオ・データがダイアログを示すかダイアログを示さないか(たとえば、対応するオーディオ・データのどのチャネルがダイアログを示すか)を示す少なくとも一つのダイアログ指示値(たとえば、表2のパラメータ「ダイアログ・チャネル」);
対応するオーディオ・データがラウドネス規制の示されるセットに準拠しているかどうかを示す少なくとも一つのラウドネス規制準拠値(たとえば、表2のパラメータ「ラウドネス規制型」);
対応するオーディオ・データに対して実行されたラウドネス処理の少なくとも一つの型を示す少なくとも一つのラウドネス処理値(たとえば、表2のパラメータ「ダイアログ・ゲーテッド・ラウドネス補正フラグ」、「ラウドネス補正型」の一つまたは複数);および
対応するオーディオ・データに特徴的な少なくとも一つのラウドネス(たとえばピークまたは平均ラウドネス)を示す少なくとも一つのラウドネス値(たとえば、パラメータ「ITU相対ゲーテッド・ラウドネス」、「ITU発話ゲーテッド・ラウドネス」、「ITU(EBU3341)短時間3sラウドネス」および「真のピーク」の一つまたは複数)。
ペイロード・ヘッダ。典型的には少なくとも一つの識別情報値(たとえば、SSMまたはPIMフォーマット・バージョン、長さ、期間(period)、カウントおよびサブストリーム関連付け値)を含む;
ペイロード・ヘッダ後に、当該SSMまたはPIM(または他の型のメタデータ)。
メタデータ・セグメント・ヘッダ(典型的にはメタデータ・セグメントの開始を同定する同期語と、それに続く識別情報値、たとえば下記の表1に示されるバージョン、長さ、期間(period)、拡張要素カウントおよびサブストリーム関連付け値を含む);および
メタデータ・セグメント・ヘッダ後に、メタデータ・セグメントのメタデータまたは対応するオーディオ・データの少なくとも一方の解読、認証(authentication)または有効確認(validation)のうちの少なくとも一つのために有用な少なくとも一つの保護値(たとえば、表1のHMACダイジェストおよびオーディオ・フィンガープリント値);および
やはりメタデータ・セグメント・ヘッダ後に後続の各メタデータ・ペイロード内のメタデータの型を同定し、それぞれのそのようなペイロードの構成の少なくとも一つの側面(たとえばサイズ)を示すメタデータ・ペイロード識別情報(「ID」)およびペイロード構成値。
高レベル構造(たとえばメタデータ・セグメント・ヘッダ)。これは、余剰ビット(または補助データまたはaddbsi)フィールドがメタデータを含むかどうかを示すフラグと、どの型(単数または複数)のメタデータが存在しているかを示す少なくとも一つのID値と、典型的にはまた(メタデータが存在する場合)(たとえば各型の)何ビットのメタデータが存在するかを示す値とを含む。存在できるメタデータの一つの型はPIMであり、存在できるメタデータのもう一つの型はSSMであり、存在できるメタデータの他の型はLPSMおよび/またはプログラム境界メタデータおよび/またはメディア・リサーチ(research)・メタデータである;
中間レベル構造。これは、メタデータのそれぞれの同定される型に関連するデータを含む(たとえば、メタデータのそれぞれの同定される型についてのメタデータ・ペイロード・ヘッダ、保護値およびペイロードIDおよびペイロード構成値);および
低レベル構造。これは、それぞれの同定される型のメタデータについてのメタデータ・ペイロード(たとえば、PIMが存在すると同定されている場合のPIM値および/または他の型のメタデータが存在すると同定されている場合の該他の型のメタデータ値(たとえばSSMまたはLPSM)のシーケンス)。
(たとえば、LPSMがデコーダ202から出力されたオーディオ・データが特定の型のラウドネス処理を受けていることを示し、有効確認器203からの制御ビットがLPSMが有効であることを示すとき)デコーダ202から出力されたデコードされたオーディオ・データが該特定の型のラウドネス処理を受けていることを示す制御ビット;または
(たとえば、LPSMがデコーダ202から出力されたオーディオ・データが特定の型のラウドネス処理を受けていないことを示す、またはLPSMがデコーダ202から出力されたオーディオ・データが特定の型のラウドネス処理を受けていることを示すが、有効確認器203からの制御ビットがLPSMが有効でないことを示すとき)デコーダ202から出力されたデコードされたオーディオ・データが該特定の型のラウドネス処理を受けるべきであることを示す制御ビット。
ペイロード・ヘッダ。これは典型的には少なくとも一つの識別情報値(たとえば、SSMフォーマット・バージョンを示す2ビット値および任意的には、長さ、期間(period)、カウントおよびサブストリーム関連付け値)を含む;
ヘッダ後に、
ビットストリームによって示されるプログラムの独立サブストリームの数を示す独立サブストリーム・メタデータ;および
プログラムの各独立サブストリームがそれに関連付けられた少なくとも一つの従属サブストリームをもつかどうかおよびもしそうであればプログラムの各独立サブストリームに関連付けられた従属サブストリームの数を示す従属サブストリーム・メタデータ。
ペイロード・ヘッダ。これは典型的には少なくとも一つの識別情報値(たとえば、PIMフォーマット・バージョンを示す値および任意的には、長さ、期間(period)、カウントおよびサブストリーム関連付け値)を含む;および
ヘッダ後に、次のフォーマットでのPIM:
オーディオ・プログラムの各無音チャネルおよび各非無音チャネル(すなわち、プログラムのどのチャネルがオーディオ情報を含むかおよび(もしあれば)どのチャネルが無音のみを含むか(典型的には当該フレームの継続時間にわたって))を示すアクティブ・チャネル・メタデータ。エンコードされたビットストリームがAC-3またはE-AC-3ビットストリームである実施形態では、プログラムのどのチャネルがオーディオ情報を含み、どのチャネルが無音を含むかを決定するために、ビットストリームのフレーム中のアクティブ・チャネル・メタデータは、ビットストリームの追加的なメタデータ(たとえば、当該フレームのオーディオ符号化モード(「acmod」)フィールドおよびもし存在すれば当該フレームもしくは関連付けられた従属サブストリーム・フレーム(単数または複数)内のchanmapフィールド)との関連で使用されてもよい;。
サラウンド減衰が適用されたかどうか(たとえば、オーディオ・プログラムのサラウンド・チャネルがエンコードに先立って3dB減衰されたかどうか)、
90度位相シフトが適用されたかどうか(たとえばエンコードに先立ってオーディオ・プログラムのサラウンド・チャネルLsおよびRsチャネルに)、
エンコードに先立ってオーディオ・プログラムのLFEチャネルに低域通過フィルタが適用されたかどうか、
プログラムのLFEチャネルのレベルが制作中にモニタリングされたかどうかおよびもしそうであればプログラムのフルレンジ・オーディオ・チャネルのレベルに対するLFEチャネルのモニタリングされたレベル、。
ヘッダ(典型的にはLPSMペイロードの始まりを同定する同期語を含み、それに続いて少なくとも一つの識別情報値、たとえば下記の表2に示されるLPSMフォーマット・バージョン、長さ、期間(period)、カウントおよびサブストリーム関連付け値がくる);
ヘッダ後に、
対応するオーディオ・データがダイアログを示すかダイアログを示さないか(たとえば、対応するオーディオ・データのどのチャネルがダイアログを示すか)を示す少なくとも一つのダイアログ指示値(たとえば、表2のパラメータ「ダイアログ・チャネル」);
対応するオーディオ・データがラウドネス規制の示されるセットに準拠しているかどうかを示す少なくとも一つのラウドネス規制準拠値(たとえば、表2のパラメータ「ラウドネス規制型」);
対応するオーディオ・データに対して実行されたラウドネス処理の少なくとも一つの型を示す少なくとも一つのラウドネス処理値(たとえば、表2のパラメータ「ダイアログ・ゲーテッド・ラウドネス補正フラグ」、「ラウドネス補正型」の一つまたは複数);および
対応するオーディオ・データに特徴的な少なくとも一つのラウドネス(たとえばピークまたは平均ラウドネス)を示す少なくとも一つのラウドネス値(たとえば、パラメータ「ITU相対ゲーテッド・ラウドネス」、「ITU発話ゲーテッド・ラウドネス」、「ITU(EBU3341)短時間3sラウドネス」および「真のピーク」の一つまたは複数)。
メタデータ・セグメント・ヘッダ(典型的にはメタデータ・セグメントの開始を同定する同期語と、それに続く少なくとも一つの識別情報値、たとえばバージョン、長さ、期間(period)、拡張要素カウントおよびサブストリーム関連付け値を含む);および
メタデータ・セグメント・ヘッダ後に、メタデータ・セグメントのメタデータまたは対応するオーディオ・データの少なくとも一方の解読、認証(authentication)または有効確認(validation)のうちの少なくとも一つのために有用な少なくとも一つの保護値(たとえば、表1のHMACダイジェストおよびオーディオ・フィンガープリント値);および
やはりメタデータ・セグメント・ヘッダ後に後続の各メタデータ・ペイロードの型およびその構成の少なくとも一つの側面(たとえばサイズ)を同定するメタデータ・ペイロード識別情報(「ID」)およびペイロード構成値。
ペイロードID(メタデータの型、たとえばSSM、PIMまたはLPSMを同定する)。これは(たとえば表1において指定される値を含んでいてもよい)メタデータ・セグメント・ヘッダに続く;
ペイロード構成値(典型的にはペイロードの大きさを示す)。これはペイロードIDに続く;
任意的にはまた、追加的なペイロード構成値(たとえば、フレームの先頭から当該ペイロードに関する最初のオーディオ・サンプルまでのオーディオ・サンプル数を示すオフセット値ならびにたとえばペイロードが破棄されうる条件を示す、ペイロード優先度値)。
ペイロードのメタデータがPIM。これは、
オーディオ・プログラムのどのチャネルがオーディオ情報を含むかおよび(もしあれば)どのチャネルが無音のみを含むか(典型的には当該フレームの継続時間にわたって)を示すアクティブ・チャネル・メタデータと;プログラムが(エンコード前にまたはエンコード中に)下方混合〔減数混合〕されたものであるかどうかおよびもしそうであれば適用された下方混合の型を示す下方混合処理状態メタデータと、プログラムがエンコード前にまたはエンコード中に(たとえばより少数のチャネルから)上方混合されたものであるかどうかおよびもしそうであれば適用された上方混合の型を示す上方混合処理状態メタデータと、当該フレームのオーディオ・コンテンツに対して(エンコードされたビットストリームを生成するためにオーディオ・コンテンツをエンコードする前に)前処理が実行されたかどうかおよびもしそうであれば実行された前処理の型を示す前処理状態メタデータ;
ペイロードのメタデータはLPSMデータで、次の表(表2)に示されるフォーマットをもつ。
loudness_correction_type_flag〔ラウドネス補正型フラグ〕:ここで、「1」は対応するオーディオ・データのラウドネスが当該エンコーダの上流で補正されたことを示し、「0」は該ラウドネスが当該エンコーダに組み込まれているラウドネス補正器(たとえば、図2のエンコーダ100のラウドネス処理器103)によって補正されたことを示す;
speech_channel〔発話チャネル〕:どの源チャネル(単数または複数)が(それまでの0.5秒の間に)発話を含むかを示す。発話が検出されない場合、その旨が示される;
speech_loudness〔発話ラウドネス〕:発話を含む各対応するオーディオ・チャネルの(それまでの0.5秒の間の)統合された発話ラウドネスを示す;
ITU_loudness〔ITUラウドネス〕:各対応するオーディオ・チャネルの統合されたITU BS.1770-3ラウドネスを示す;
利得:(可逆性を実証するため)デコーダにおいて反転するためのラウドネス複合利得(単数または複数)。
(LPSM値をビットストリーム中に挿入する)E-AC-3エンコーダが「アクティブ」であり、「信頼」フラグなしのAC-3フレームを受領している間は、当該エンコーダに組み込まれたラウドネス・コントローラ(たとえば図2のエンコーダ100のラウドネス処理器103)はアクティブであるべきである。LPSMブロック生成は継続し、loudness_correction_type_flagは「0」に設定される。ラウドネス・コントローラ・アクティブ化シーケンスは、「信頼」フラグが消失するデコードされたAC-3フレームの先頭に同期されるべきである。ラウドネス・コントローラ・アクティブ化シーケンスは次のように実装されるべきである。leveler_amount〔平準化器量〕コントロールが、1オーディオ・ブロック期間(すなわち、5.3msec)にわたって値0から値9にインクリメントされ、leveler_back_end_meter〔平準化器バック・エンド・メーター〕コントロールが「アクティブ」モードにされる(この動作は、シームレスな遷移を与え、back_end_meter統合リセットを含むべきである)。
〔態様1〕
バッファ・メモリと該バッファ・メモリに結合された少なくとも一つの処理サブシステムとを含むオーディオ処理ユニットであって、
前記バッファ・メモリは、エンコードされたオーディオ・ビットストリームの少なくとも一つのフレームを記憶し、前記フレームは、前記フレームの少なくとも一つのスキップ・フィールドの少なくとも一つのメタデータ・セグメントにおいてプログラム情報メタデータまたはサブストリーム構造メタデータを、前記フレームの少なくとも一つの他のセグメントにおいてオーディオ・データを含み、
前記処理サブシステムは、前記ビットストリームの生成、前記ビットストリームのデコードまたは前記ビットストリームのメタデータを使った前記ビットストリームのオーディオ・データの適応的な処理または前記ビットストリームのメタデータを使った前記ビットストリームのオーディオ・データもしくはメタデータの少なくとも一方の認証もしくは検証の少なくとも一方、のうちの少なくとも一つを実行するよう結合され、構成されており、
前記メタデータ・セグメントは少なくとも一つのメタデータ・ペイロードを含み、前記メタデータ・ペイロードは:
ヘッダと;
前記ヘッダ後に、前記プログラム情報メタデータの少なくとも一部または前記サブストリーム構造メタデータの少なくとも一部を含む、
オーディオ処理ユニット。
〔態様2〕
前記エンコードされたオーディオ・ビットストリームが少なくとも一つのオーディオ・プログラムを示し、前記メタデータ・セグメントはプログラム情報メタデータ・ペイロードを含み、前記プログラム情報メタデータ・ペイロードは:
プログラム情報メタデータ・ヘッダと;
前記プログラム情報メタデータ・ヘッダ後に、前記プログラムのオーディオ・コンテンツの少なくとも一つの属性または特性を示すプログラム情報メタデータとを含み、
前記プログラム情報メタデータは、前記プログラムの各非無音チャネルおよび各無音チャネルを示すアクティブ・チャネル・メタデータを含む、
態様1記載のオーディオ処理ユニット。
〔態様3〕
前記プログラム情報メタデータは:
前記プログラムが下方混合されたものであるかどうかおよびもしそうであれば前記プログラムに適用された下方混合の型を示す下方混合処理状態メタデータ;
前記プログラムが上方混合されたものであるかどうかおよびもしそうであれば前記プログラムに適用された上方混合の型を示す上方混合処理状態メタデータ;
前記フレームのオーディオ・コンテンツに対して前処理が実行されたかどうかおよびもしそうであれば前記オーディオ・コンテンツに対して実行された前処理の型を示す前処理状態メタデータ;または
前記プログラムにスペクトル拡張処理またはチャネル結合が適用されたかどうかおよびもしそうであれば前記スペクトル拡張またはチャネル結合が適用された周波数範囲を示すスペクトル拡張処理またはチャネル結合メタデータ、
のうちの少なくとも一つをも含む、態様2記載のオーディオ処理ユニット。
〔態様4〕
前記エンコードされたオーディオ・ビットストリームは、オーディオ・コンテンツの少なくとも一つの独立サブストリームをもつ少なくとも一つのオーディオ・プログラムを示し、前記メタデータ・セグメントはサブストリーム構造メタデータ・ペイロードを含み、前記サブストリーム構造メタデータ・ペイロードは:
サブストリーム構造メタデータ・ペイロード・ヘッダと;
前記サブストリーム構造メタデータ・ペイロード・ヘッダの後に、前記プログラムの独立サブストリームの数を示す独立サブストリーム・メタデータおよび前記プログラムの各独立サブストリームが少なくとも一つの関連付けられた従属サブストリームをもつかどうかを示す従属サブストリーム・メタデータとを含む、
態様1記載のオーディオ処理ユニット。
〔態様5〕
前記メタデータ・セグメントが:
メタデータ・セグメント・ヘッダと;
前記メタデータ・セグメント・ヘッダの後に、前記プログラム情報メタデータまたは前記サブストリーム構造メタデータまたは前記プログラム情報メタデータもしくは前記サブストリーム構造メタデータに対応するオーディオ・データのうちの少なくとも一つの解読、認証または有効確認のうちの少なくとも一つのために有用な少なくとも一つのために有用な保護値と;
前記メタデータ・セグメント・ヘッダ後に、メタデータ・ペイロード識別情報およびペイロード構成値とを含み、前記メタデータ・ペイロードは前記メタデータ・ペイロード識別情報およびペイロード構成値に後続する、
態様1記載のオーディオ処理ユニット。
〔態様6〕
前記メタデータ・セグメントが、前記メタデータ・セグメントの始まりを同定する同期語と、該同期語に続いて少なくとも一つの識別情報値とを含み、前記メタデータ・ペイロードのヘッダが少なくとも一つの識別情報値を含む、態様5記載のオーディオ処理ユニット。
〔態様7〕
前記エンコードされたオーディオ・ビットストリームがAC-3ビットストリームまたはE-AC-3ビットストリームである、態様1記載のオーディオ処理ユニット。
〔態様8〕
前記バッファ・メモリが前記フレームを非一時的な仕方で記憶する、態様1記載のオーディオ処理ユニット。
〔態様9〕
前記オーディオ処理ユニットがエンコーダである、態様1記載のオーディオ処理ユニット。
〔態様10〕
前記処理サブシステムが:
入力オーディオ・ビットストリームを受領して、該入力オーディオ・ビットストリームから入力メタデータおよび入力オーディオ・データを抽出するよう構成されているデコード・サブシステムと;
前記入力メタデータを使って前記入力オーディオ・データに対して適応処理を実行し、それにより処理されたオーディオ・データを生成するよう結合され、構成されている適応処理サブシステムと;
前記エンコードされたオーディオ・ビットストリーム中に前記プログラム情報メタデータまたは前記サブストリーム構造メタデータを含めることによることを含め、前記処理されたオーディオ・データに応答して前記エンコードされたオーディオ・ビットストリームを生成し、前記エンコードされたオーディオ・ビットストリームを前記バッファ・メモリに呈するよう結合され、構成されているエンコード・サブシステムとを含む、
態様9記載のオーディオ処理ユニット。
〔態様11〕
前記オーディオ処理ユニットがデコーダである、態様1記載のオーディオ処理ユニット。
〔態様12〕
前記処理サブシステムが、前記バッファ・メモリに結合され、前記エンコードされたオーディオ・ビットストリームから前記プログラム情報メタデータまたは前記サブストリーム構造メタデータを抽出するよう構成されているデコード・サブシステムである、態様11記載のオーディオ処理ユニット。
〔態様13〕
前記バッファ・メモリに結合され、前記エンコードされたオーディオ・ビットストリームから前記プログラム情報メタデータまたは前記サブストリーム構造メタデータを抽出し、前記エンコードされたオーディオ・ビットストリームから前記オーディオ・データを抽出するよう構成されているサブシステムと;
前記サブシステムに結合され、前記エンコードされたオーディオ・ビットストリームから抽出された前記プログラム情報メタデータまたは前記サブストリーム構造メタデータの少なくとも一つを使って前記オーディオ・データに対して適応処理を実行するよう構成されている後処理器とを含む、
態様1記載のオーディオ処理ユニット。
〔態様14〕
前記オーディオ処理ユニットがデジタル信号プロセッサである、態様1記載のオーディオ処理ユニット。
〔態様15〕
当該オーディオ処理ユニットが、前記エンコードされたオーディオ・ビットストリームから前記プログラム情報メタデータまたは前記サブストリーム構造メタデータおよび前記オーディオ・データを抽出し、前記エンコードされたオーディオ・ビットストリームから抽出された前記プログラム情報メタデータまたは前記サブストリーム構造メタデータの少なくとも一つを使って前記オーディオ・データに対して適応処理を実行するよう構成されている前処理器である、態様1記載のオーディオ処理ユニット。
〔態様16〕
エンコードされたビットストリームをデコードする方法であって:
エンコードされたオーディオ・ビットストリームを受領する段階と;
前記エンコードされたオーディオ・ビットストリームからメタデータおよびオーディオ・データを抽出する段階であって、前記メタデータはプログラム情報メタデータおよびサブストリーム構造メタデータであるまたはプログラム情報メタデータおよびサブストリーム構造メタデータを含む、段階とを含み、
前記エンコードされたオーディオ・ビットストリームはフレームのシーケンスを含み、少なくとも一つのオーディオ・プログラムを示し、前記プログラム情報メタデータおよび前記サブストリーム構造メタデータは前記プログラムを示し、各フレームは、少なくとも一つのオーディオ・データ・セグメントを含み、前記オーディオ・データ・セグメントのそれぞれは前記オーディオ・データの少なくとも一部を含み、前記フレームの少なくとも部分集合の各フレームはメタデータ・セグメントを含み、前記メタデータ・セグメントのそれぞれは前記プログラム情報メタデータの少なくとも一部および前記サブストリーム構造メタデータの少なくとも一部を含む、
方法。
〔態様17〕
前記メタデータ・セグメントはプログラム情報メタデータ・ペイロードを含み、前記プログラム情報メタデータ・ペイロードは:
プログラム情報メタデータ・ヘッダと;
前記プログラム情報メタデータ・ヘッダ後に、前記プログラムのオーディオ・コンテンツの少なくとも一つの属性または特性を示すプログラム情報メタデータとを含み、
前記プログラム情報メタデータは、前記プログラムの各非無音チャネルおよび各無音チャネルを示すアクティブ・チャネル・メタデータを含む、
態様16記載の方法。
〔態様18〕
前記プログラム情報メタデータは:
前記プログラムが下方混合されたものであるかどうかおよびもしそうであれば前記プログラムに適用された下方混合の型を示す下方混合処理状態メタデータ;
前記プログラムが上方混合されたものであるかどうかおよびもしそうであれば前記プログラムに適用された上方混合の型を示す上方混合処理状態メタデータ;または
前記フレームのオーディオ・コンテンツに対して前処理が実行されたかどうかおよびもしそうであれば前記オーディオ・コンテンツに対して実行された前処理の型を示す前処理状態メタデータ
のうちの少なくとも一つをも含む、態様17記載の方法。
〔態様19〕
前記エンコードされたオーディオ・ビットストリームは、オーディオ・コンテンツの少なくとも一つの独立サブストリームをもつ少なくとも一つのオーディオ・プログラムを示し、前記メタデータ・セグメントはサブストリーム構造メタデータ・ペイロードを含み、前記サブストリーム構造メタデータ・ペイロードは:
サブストリーム構造メタデータ・ペイロード・ヘッダと;
前記サブストリーム構造メタデータ・ペイロード・ヘッダの後に、前記プログラムの独立サブストリームの数を示す独立サブストリーム・メタデータおよび前記プログラムの各独立サブストリームが少なくとも一つの関連付けられた従属サブストリームをもつかどうかを示す従属サブストリーム・メタデータとを含む、
態様16記載の方法。
〔態様20〕
前記メタデータ・セグメントが:
メタデータ・セグメント・ヘッダと;
前記メタデータ・セグメント・ヘッダの後に、前記プログラム情報メタデータまたは前記サブストリーム構造メタデータまたは前記プログラム情報メタデータおよび前記サブストリーム構造メタデータに対応するオーディオ・データのうちの少なくとも一つの解読、認証または有効確認のうちの少なくとも一つのために有用な少なくとも一つの保護値と;
前記メタデータ・セグメント・ヘッダ後に、前記プログラム情報メタデータの前記少なくとも一部および前記サブストリーム構造メタデータの前記少なくとも一部を含むメタデータ・ペイロードとを含む、
態様16記載の方法。
〔態様21〕
前記エンコードされたオーディオ・ビットストリームがAC-3ビットストリームまたはE-AC-3ビットストリームである、態様16記載の方法。
〔態様22〕
前記エンコードされたオーディオ・ビットストリームから抽出された前記プログラム情報メタデータまたは前記サブストリーム構造メタデータの少なくとも一方を使って前記オーディオ・データに対して適応処理を実行する段階をも含む、
態様16記載の方法。
Claims (2)
- 非一時的媒体であるバッファ・メモリを有するオーディオ処理ユニットであって、
前記バッファ・メモリは、エンコードされたオーディオ・ビットストリームの少なくとも一つのフレームを記憶するよう構成されており、前記エンコードされたオーディオ・ビットストリームはオーディオ・データおよびメタデータ・コンテナを含み、前記メタデータ・コンテナはダイナミックレンジ圧縮(DRC)メタデータを含む一つまたは複数のメタデータ・ペイロードを含み、前記DRCメタデータはダイナミックレンジ圧縮制御値を含み、前記ダイナミックレンジ圧縮制御値を生成するためにエンコーダによって想定された圧縮プロファイルを示すものであり、一つの前記圧縮プロファイルがフィルム・スタンダード圧縮プロファイルであり;
当該オーディオ処理ユニットはさらに、
前記バッファ・メモリに結合され、前記エンコードされたオーディオ・ビットストリームをパースするよう構成されたパーサと;
前記パーサに結合され、前記オーディオ・データの少なくとも一部に対してまたは前記オーディオ・データの前記少なくとも一部をデコードすることによって生成されたデコードされたオーディオ・データに対して、前記DRCメタデータを使ってダイナミックレンジ圧縮を実行するよう構成されているサブシステムとを有する、
オーディオ処理ユニット。 - オーディオ・デコード方法であって、
一つまたは複数のフレームに分割されているエンコードされたオーディオ・ビットストリームを受領する段階と;
前記エンコードされたオーディオ・ビットストリームからオーディオ・データおよびメタデータのコンテナを抽出する段階であって、前記メタデータのコンテナはダイナミックレンジ圧縮(DRC)メタデータを含む一つまたは複数のメタデータ・ペイロードを含み、前記DRCメタデータはダイナミックレンジ圧縮制御値を含み、前記ダイナミックレンジ圧縮制御値を生成するためにエンコーダによって想定された圧縮プロファイルを示すものであり、一つの前記圧縮プロファイルがフィルム・スタンダード圧縮プロファイルである、段階と;
前記オーディオ・データの少なくとも一部に対してまたは前記オーディオ・データの前記少なくとも一部をデコードすることによって生成されたデコードされたオーディオ・データに対して、前記DRCメタデータを使ってダイナミックレンジ圧縮を実行する段階とを含む、
方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021065161A JP7090196B2 (ja) | 2013-06-19 | 2021-04-07 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2022095116A JP7427715B2 (ja) | 2013-06-19 | 2022-06-13 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2024008433A JP2024028580A (ja) | 2013-06-19 | 2024-01-24 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361836865P | 2013-06-19 | 2013-06-19 | |
US61/836,865 | 2013-06-19 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016232450A Division JP6561031B2 (ja) | 2013-06-19 | 2016-11-30 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021065161A Division JP7090196B2 (ja) | 2013-06-19 | 2021-04-07 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019174852A true JP2019174852A (ja) | 2019-10-10 |
JP6866427B2 JP6866427B2 (ja) | 2021-04-28 |
Family
ID=49112574
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013004320U Expired - Lifetime JP3186472U (ja) | 2013-06-19 | 2013-07-26 | 番組情報メタデータを用いたオーディオデコーダ |
JP2015557247A Active JP6046275B2 (ja) | 2013-06-19 | 2014-06-12 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2016188196A Active JP6571062B2 (ja) | 2013-06-19 | 2016-09-27 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2016232450A Active JP6561031B2 (ja) | 2013-06-19 | 2016-11-30 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2019134478A Active JP6866427B2 (ja) | 2013-06-19 | 2019-07-22 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2021065161A Active JP7090196B2 (ja) | 2013-06-19 | 2021-04-07 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2022095116A Active JP7427715B2 (ja) | 2013-06-19 | 2022-06-13 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2024008433A Pending JP2024028580A (ja) | 2013-06-19 | 2024-01-24 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013004320U Expired - Lifetime JP3186472U (ja) | 2013-06-19 | 2013-07-26 | 番組情報メタデータを用いたオーディオデコーダ |
JP2015557247A Active JP6046275B2 (ja) | 2013-06-19 | 2014-06-12 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2016188196A Active JP6571062B2 (ja) | 2013-06-19 | 2016-09-27 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2016232450A Active JP6561031B2 (ja) | 2013-06-19 | 2016-11-30 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021065161A Active JP7090196B2 (ja) | 2013-06-19 | 2021-04-07 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2022095116A Active JP7427715B2 (ja) | 2013-06-19 | 2022-06-13 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
JP2024008433A Pending JP2024028580A (ja) | 2013-06-19 | 2024-01-24 | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
Country Status (24)
Country | Link |
---|---|
US (7) | US10037763B2 (ja) |
EP (3) | EP3680900A1 (ja) |
JP (8) | JP3186472U (ja) |
KR (7) | KR200478147Y1 (ja) |
CN (10) | CN110491396A (ja) |
AU (1) | AU2014281794B9 (ja) |
BR (6) | BR122017011368B1 (ja) |
CA (1) | CA2898891C (ja) |
CL (1) | CL2015002234A1 (ja) |
DE (1) | DE202013006242U1 (ja) |
ES (2) | ES2777474T3 (ja) |
FR (1) | FR3007564B3 (ja) |
HK (3) | HK1204135A1 (ja) |
IL (1) | IL239687A (ja) |
IN (1) | IN2015MN01765A (ja) |
MX (5) | MX367355B (ja) |
MY (2) | MY171737A (ja) |
PL (1) | PL2954515T3 (ja) |
RU (4) | RU2619536C1 (ja) |
SG (3) | SG11201505426XA (ja) |
TR (1) | TR201808580T4 (ja) |
TW (11) | TWM487509U (ja) |
UA (1) | UA111927C2 (ja) |
WO (1) | WO2014204783A1 (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
JP6476192B2 (ja) | 2013-09-12 | 2019-02-27 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多様な再生環境のためのダイナミックレンジ制御 |
US9621963B2 (en) | 2014-01-28 | 2017-04-11 | Dolby Laboratories Licensing Corporation | Enabling delivery and synchronization of auxiliary content associated with multimedia data using essence-and-version identifier |
MY186155A (en) * | 2014-03-25 | 2021-06-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US10313720B2 (en) * | 2014-07-18 | 2019-06-04 | Sony Corporation | Insertion of metadata in an audio stream |
RU2701126C2 (ru) * | 2014-09-12 | 2019-09-24 | Сони Корпорейшн | Устройство передачи, способ передачи, устройство приема и способ приема |
MX2016005809A (es) * | 2014-09-12 | 2016-08-01 | Sony Corp | Dispositivo de transmision, metodo de transmision, dispositivo de recepcion y metodo de recepcion. |
WO2016050740A1 (en) | 2014-10-01 | 2016-04-07 | Dolby International Ab | Efficient drc profile transmission |
JP6812517B2 (ja) * | 2014-10-03 | 2021-01-13 | ドルビー・インターナショナル・アーベー | パーソナル化されたオーディオへのスマート・アクセス |
WO2016050900A1 (en) * | 2014-10-03 | 2016-04-07 | Dolby International Ab | Smart access to personalized audio |
ES2916254T3 (es) * | 2014-10-10 | 2022-06-29 | Dolby Laboratories Licensing Corp | Sonoridad de programa basada en la presentación, independiente de la transmisión |
US10523731B2 (en) | 2014-10-20 | 2019-12-31 | Lg Electronics Inc. | Apparatus for transmitting broadcast signal, apparatus for receiving broadcast signal, method for transmitting broadcast signal and method for receiving broadcast signal |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US10271094B2 (en) | 2015-02-13 | 2019-04-23 | Samsung Electronics Co., Ltd. | Method and device for transmitting/receiving media data |
KR102070434B1 (ko) * | 2015-02-14 | 2020-01-28 | 삼성전자주식회사 | 시스템 데이터를 포함하는 오디오 비트스트림을 디코딩하는 방법 및 장치 |
TW202242853A (zh) * | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
US10304467B2 (en) | 2015-04-24 | 2019-05-28 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
EP4156180A1 (en) * | 2015-06-17 | 2023-03-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Loudness control for user interactivity in audio coding systems |
TWI607655B (zh) * | 2015-06-19 | 2017-12-01 | Sony Corp | Coding apparatus and method, decoding apparatus and method, and program |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
EP3332310B1 (en) | 2015-08-05 | 2019-05-29 | Dolby Laboratories Licensing Corporation | Low bit rate parametric encoding and transport of haptic-tactile signals |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
CN105468711A (zh) * | 2015-11-19 | 2016-04-06 | 中央电视台 | 一种音频处理方法及装置 |
US10573324B2 (en) | 2016-02-24 | 2020-02-25 | Dolby International Ab | Method and system for bit reservoir control in case of varying metadata |
CN105828272A (zh) * | 2016-04-28 | 2016-08-03 | 乐视控股(北京)有限公司 | 音频信号处理方法和装置 |
US10015612B2 (en) * | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
PL3568853T3 (pl) | 2017-01-10 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio, enkoder audio, sposób dostarczania dekodowanego sygnału audio, sposób dostarczania enkodowanego sygnału audio, strumień audio, moduł dostarczania strumienia audio i program komputerowy używający identyfikator strumienia |
US10878879B2 (en) * | 2017-06-21 | 2020-12-29 | Mediatek Inc. | Refresh control method for memory system to perform refresh action on all memory banks of the memory system within refresh window |
EP3756355A1 (en) | 2018-02-22 | 2020-12-30 | Dolby International AB | Method and apparatus for processing of auxiliary media streams embedded in a mpeg-h 3d audio stream |
CN108616313A (zh) * | 2018-04-09 | 2018-10-02 | 电子科技大学 | 一种基于超声波的旁路信息安全隐蔽传送方法 |
US10937434B2 (en) * | 2018-05-17 | 2021-03-02 | Mediatek Inc. | Audio output monitoring for failure detection of warning sound playback |
SG11202012940XA (en) * | 2018-06-26 | 2021-01-28 | Huawei Tech Co Ltd | High-level syntax designs for point cloud coding |
CN112384976A (zh) * | 2018-07-12 | 2021-02-19 | 杜比国际公司 | 动态eq |
CN109284080B (zh) * | 2018-09-04 | 2021-01-05 | Oppo广东移动通信有限公司 | 音效调整方法、装置、电子设备以及存储介质 |
EP3895164B1 (en) | 2018-12-13 | 2022-09-07 | Dolby Laboratories Licensing Corporation | Method of decoding audio content, decoder for decoding audio content, and corresponding computer program |
WO2020164753A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method selecting an error concealment mode, and encoder and encoding method |
GB2582910A (en) * | 2019-04-02 | 2020-10-14 | Nokia Technologies Oy | Audio codec extension |
EP4014506B1 (en) * | 2019-08-15 | 2023-01-11 | Dolby International AB | Methods and devices for generation and processing of modified audio bitstreams |
EP4022606A1 (en) * | 2019-08-30 | 2022-07-06 | Dolby Laboratories Licensing Corporation | Channel identification of multi-channel audio signals |
US11533560B2 (en) * | 2019-11-15 | 2022-12-20 | Boomcloud 360 Inc. | Dynamic rendering device metadata-informed audio enhancement system |
US11380344B2 (en) | 2019-12-23 | 2022-07-05 | Motorola Solutions, Inc. | Device and method for controlling a speaker according to priority data |
CN112634907B (zh) * | 2020-12-24 | 2024-05-17 | 百果园技术(新加坡)有限公司 | 用于语音识别的音频数据处理方法及装置 |
CN113990355A (zh) * | 2021-09-18 | 2022-01-28 | 赛因芯微(北京)电子科技有限公司 | 音频节目元数据和产生方法、电子设备及存储介质 |
CN114051194A (zh) * | 2021-10-15 | 2022-02-15 | 赛因芯微(北京)电子科技有限公司 | 一种音频轨道元数据和生成方法、电子设备及存储介质 |
US20230117444A1 (en) * | 2021-10-19 | 2023-04-20 | Microsoft Technology Licensing, Llc | Ultra-low latency streaming of real-time media |
CN114363791A (zh) * | 2021-11-26 | 2022-04-15 | 赛因芯微(北京)电子科技有限公司 | 串行音频元数据生成方法、装置、设备及存储介质 |
WO2023205025A2 (en) * | 2022-04-18 | 2023-10-26 | Dolby Laboratories Licensing Corporation | Multisource methods and systems for coded media |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013519918A (ja) * | 2010-02-11 | 2013-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
Family Cites Families (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
JPH0746140Y2 (ja) | 1991-05-15 | 1995-10-25 | 岐阜プラスチック工業株式会社 | かん水栽培方法において使用する水位調整タンク |
JPH0746140A (ja) * | 1993-07-30 | 1995-02-14 | Toshiba Corp | 符号化装置及び復号化装置 |
US6611607B1 (en) * | 1993-11-18 | 2003-08-26 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
JP3186472B2 (ja) | 1994-10-04 | 2001-07-11 | キヤノン株式会社 | ファクシミリ装置およびその記録紙選択方法 |
US7224819B2 (en) * | 1995-05-08 | 2007-05-29 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
JPH11234068A (ja) | 1998-02-16 | 1999-08-27 | Mitsubishi Electric Corp | ディジタル音声放送受信機 |
JPH11330980A (ja) * | 1998-05-13 | 1999-11-30 | Matsushita Electric Ind Co Ltd | 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体 |
US6530021B1 (en) * | 1998-07-20 | 2003-03-04 | Koninklijke Philips Electronics N.V. | Method and system for preventing unauthorized playback of broadcasted digital data streams |
JP3580777B2 (ja) * | 1998-12-28 | 2004-10-27 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
US6909743B1 (en) | 1999-04-14 | 2005-06-21 | Sarnoff Corporation | Method for generating and processing transition streams |
US8341662B1 (en) * | 1999-09-30 | 2012-12-25 | International Business Machine Corporation | User-controlled selective overlay in a streaming media |
AU2001229402A1 (en) * | 2000-01-13 | 2001-07-24 | Digimarc Corporation | Authenticating metadata and embedding metadata in watermarks of media signals |
US7450734B2 (en) * | 2000-01-13 | 2008-11-11 | Digimarc Corporation | Digital asset management, targeted searching and desktop searching using digital watermarks |
US7266501B2 (en) * | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US8091025B2 (en) * | 2000-03-24 | 2012-01-03 | Digimarc Corporation | Systems and methods for processing content objects |
US7392287B2 (en) * | 2001-03-27 | 2008-06-24 | Hemisphere Ii Investment Lp | Method and apparatus for sharing information using a handheld device |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US6807528B1 (en) * | 2001-05-08 | 2004-10-19 | Dolby Laboratories Licensing Corporation | Adding data to a compressed data frame |
AUPR960601A0 (en) * | 2001-12-18 | 2002-01-24 | Canon Kabushiki Kaisha | Image protection |
US7535913B2 (en) * | 2002-03-06 | 2009-05-19 | Nvidia Corporation | Gigabit ethernet adapter supporting the iSCSI and IPSEC protocols |
JP3666463B2 (ja) * | 2002-03-13 | 2005-06-29 | 日本電気株式会社 | 光導波路デバイスおよび光導波路デバイスの製造方法 |
EP1491033A1 (en) * | 2002-03-27 | 2004-12-29 | Koninklijke Philips Electronics N.V. | Watermarking a digital object with a digital signature |
JP4355156B2 (ja) | 2002-04-16 | 2009-10-28 | パナソニック株式会社 | 画像復号化方法及び画像復号化装置 |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
CA2562137C (en) | 2004-04-07 | 2012-11-27 | Nielsen Media Research, Inc. | Data insertion apparatus and methods for use with compressed audio/video data |
GB0407978D0 (en) * | 2004-04-08 | 2004-05-12 | Holset Engineering Co | Variable geometry turbine |
US8131134B2 (en) * | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7624021B2 (en) | 2004-07-02 | 2009-11-24 | Apple Inc. | Universal container for audio data |
WO2006047600A1 (en) * | 2004-10-26 | 2006-05-04 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8199933B2 (en) * | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US9639554B2 (en) * | 2004-12-17 | 2017-05-02 | Microsoft Technology Licensing, Llc | Extensible file system |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
EP1873773B1 (en) | 2005-04-07 | 2011-11-30 | Panasonic Corporation | Recording medium, reproducing device, recording method and reproducing method |
CN101156208B (zh) * | 2005-04-07 | 2010-05-19 | 松下电器产业株式会社 | 记录媒体、再现装置、记录方法、再现方法 |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
KR20070025905A (ko) * | 2005-08-30 | 2007-03-08 | 엘지전자 주식회사 | 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법 |
EP1932239A4 (en) * | 2005-09-14 | 2009-02-18 | Lg Electronics Inc | METHOD AND APPARATUS FOR ENCODING / DECODING |
WO2007067168A1 (en) | 2005-12-05 | 2007-06-14 | Thomson Licensing | Watermarking encoded content |
US8929870B2 (en) * | 2006-02-27 | 2015-01-06 | Qualcomm Incorporated | Methods, apparatus, and system for venue-cast |
US8244051B2 (en) * | 2006-03-15 | 2012-08-14 | Microsoft Corporation | Efficient encoding of alternative graphic sets |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
US8948206B2 (en) * | 2006-08-31 | 2015-02-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Inclusion of quality of service indication in header compression channel |
AU2007312597B2 (en) * | 2006-10-16 | 2011-04-14 | Dolby International Ab | Apparatus and method for multi -channel parameter transformation |
AU2008215232B2 (en) | 2007-02-14 | 2010-02-25 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
EP2118885B1 (en) * | 2007-02-26 | 2012-07-11 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
EP3712888B1 (en) * | 2007-03-30 | 2024-05-08 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi object audio signal with multi channel |
US20100208829A1 (en) * | 2007-04-04 | 2010-08-19 | Jang Euee-Seon | Bitstream decoding device and method having decoding solution |
JP4750759B2 (ja) * | 2007-06-25 | 2011-08-17 | パナソニック株式会社 | 映像音声再生装置 |
US7961878B2 (en) * | 2007-10-15 | 2011-06-14 | Adobe Systems Incorporated | Imparting cryptographic information in network communications |
EP2083585B1 (en) * | 2008-01-23 | 2010-09-15 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
US9143329B2 (en) * | 2008-01-30 | 2015-09-22 | Adobe Systems Incorporated | Content integrity and incremental security |
EP2250821A1 (en) * | 2008-03-03 | 2010-11-17 | Nokia Corporation | Apparatus for capturing and rendering a plurality of audio channels |
US20090253457A1 (en) * | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
KR100933003B1 (ko) * | 2008-06-20 | 2009-12-21 | 드리머 | Bd-j 기반 채널 서비스 제공 방법 및 이를 실현시키기위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체 |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
WO2010013943A2 (en) * | 2008-07-29 | 2010-02-04 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
JP2010081397A (ja) * | 2008-09-26 | 2010-04-08 | Ntt Docomo Inc | データ受信端末、データ配信サーバ、データ配信システム、およびデータ配信方法 |
JP2010082508A (ja) | 2008-09-29 | 2010-04-15 | Sanyo Electric Co Ltd | 振動モータおよびそれを用いた携帯端末装置 |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
CN102203854B (zh) * | 2008-10-29 | 2013-01-02 | 杜比国际公司 | 使用预先存在的音频增益元数据的信号削波保护 |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
KR20100089772A (ko) * | 2009-02-03 | 2010-08-12 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
EP2441259B1 (en) * | 2009-06-08 | 2017-09-27 | NDS Limited | Secure association of metadata with content |
EP2309497A3 (en) * | 2009-07-07 | 2011-04-20 | Telefonaktiebolaget LM Ericsson (publ) | Digital audio signal processing system |
TWI405108B (zh) | 2009-10-09 | 2013-08-11 | Egalax Empia Technology Inc | 分析位置的方法與裝置 |
MX2012005781A (es) * | 2009-11-20 | 2012-11-06 | Fraunhofer Ges Forschung | Aparato para proporcionar una representacion de señal de mezcla ascendente con base en la representacion de señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio multicanal, metodos, programas informaticos y flujo de bits que representan una señal de audio multicanal usando un parametro de combinacion lineal. |
UA100353C2 (uk) | 2009-12-07 | 2012-12-10 | Долбі Лабораторіс Лайсензін Корпорейшн | Декодування цифрових потоків кодованого багатоканального аудіосигналу з використанням адаптивного гібридного перетворення |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
TWI525987B (zh) * | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
WO2011141772A1 (en) * | 2010-05-12 | 2011-11-17 | Nokia Corporation | Method and apparatus for processing an audio signal based on an estimated loudness |
US8948406B2 (en) * | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium |
JP5650227B2 (ja) * | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
CN103250206B (zh) | 2010-10-07 | 2015-07-15 | 弗朗霍夫应用科学研究促进协会 | 用于比特流域中的编码音频帧的强度估计的装置及方法 |
TWI759223B (zh) * | 2010-12-03 | 2022-03-21 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
CN102610229B (zh) * | 2011-01-21 | 2013-11-13 | 安凯(广州)微电子技术有限公司 | 一种音频动态范围压缩方法、装置及设备 |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
TW202339510A (zh) | 2011-07-01 | 2023-10-01 | 美商杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
EP2727369B1 (en) | 2011-07-01 | 2016-10-05 | Dolby Laboratories Licensing Corporation | Synchronization and switchover methods and systems for an adaptive audio system |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
KR102172279B1 (ko) * | 2011-11-14 | 2020-10-30 | 한국전자통신연구원 | 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법 |
EP2783366B1 (en) | 2011-11-22 | 2015-09-16 | Dolby Laboratories Licensing Corporation | Method and system for generating an audio metadata quality score |
KR101594480B1 (ko) | 2011-12-15 | 2016-02-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 클립핑 아티팩트를 피하기 위한 장치, 방법 및 컴퓨터 프로그램 |
EP2814028B1 (en) * | 2012-02-10 | 2016-08-17 | Panasonic Intellectual Property Corporation of America | Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech |
US9633667B2 (en) * | 2012-04-05 | 2017-04-25 | Nokia Technologies Oy | Adaptive audio signal filtering |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
US8793506B2 (en) * | 2012-08-31 | 2014-07-29 | Intel Corporation | Mechanism for facilitating encryption-free integrity protection of storage data at computing systems |
US20140074783A1 (en) * | 2012-09-09 | 2014-03-13 | Apple Inc. | Synchronizing metadata across devices |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
KR101637897B1 (ko) | 2013-01-21 | 2016-07-08 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 프로그램 라우드니스 및 경계 메타데이터를 가진 오디오 인코더 및 디코더 |
RU2639663C2 (ru) | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
US9372531B2 (en) * | 2013-03-12 | 2016-06-21 | Gracenote, Inc. | Detecting an event within interactive media including spatialized multi-channel audio content |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
EP3048609A4 (en) | 2013-09-19 | 2017-05-03 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
CN105814630B (zh) | 2013-10-22 | 2020-04-28 | 弗劳恩霍夫应用研究促进协会 | 用于音频设备的组合动态范围压缩和引导截断防止的构思 |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
RU2667627C1 (ru) | 2013-12-27 | 2018-09-21 | Сони Корпорейшн | Устройство и способ декодирования и программа |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
MY186155A (en) | 2014-03-25 | 2021-06-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
ES2956362T3 (es) | 2014-05-28 | 2023-12-20 | Fraunhofer Ges Forschung | Procesador de datos y transporte de datos de control del usuario a decodificadores de audio y renderizadores |
CA2947549C (en) | 2014-05-30 | 2023-10-03 | Sony Corporation | Information processing apparatus and information processing method |
CN106471574B (zh) | 2014-06-30 | 2021-10-12 | 索尼公司 | 信息处理装置和信息处理方法 |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
JP7141946B2 (ja) | 2015-05-29 | 2022-09-26 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音量制御のための装置および方法 |
EP4156180A1 (en) | 2015-06-17 | 2023-03-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Loudness control for user interactivity in audio coding systems |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2013
- 2013-06-26 TW TW102211969U patent/TWM487509U/zh not_active IP Right Cessation
- 2013-07-10 FR FR1356768A patent/FR3007564B3/fr not_active Expired - Lifetime
- 2013-07-10 DE DE202013006242U patent/DE202013006242U1/de not_active Expired - Lifetime
- 2013-07-26 JP JP2013004320U patent/JP3186472U/ja not_active Expired - Lifetime
- 2013-07-31 CN CN201910832003.4A patent/CN110491396A/zh active Pending
- 2013-07-31 CN CN201910831662.6A patent/CN110491395B/zh active Active
- 2013-07-31 CN CN201910832004.9A patent/CN110473559A/zh active Pending
- 2013-07-31 CN CN201310329128.8A patent/CN104240709B/zh active Active
- 2013-07-31 CN CN201910831663.0A patent/CN110459228B/zh active Active
- 2013-07-31 CN CN201320464270.9U patent/CN203415228U/zh not_active Expired - Lifetime
- 2013-07-31 CN CN201910831687.6A patent/CN110600043A/zh active Pending
- 2013-08-19 KR KR2020130006888U patent/KR200478147Y1/ko active IP Right Grant
-
2014
- 2014-05-29 TW TW103118801A patent/TWI553632B/zh active
- 2014-05-29 TW TW105119765A patent/TWI605449B/zh active
- 2014-05-29 TW TW105119766A patent/TWI588817B/zh active
- 2014-05-29 TW TW107136571A patent/TWI708242B/zh active
- 2014-05-29 TW TW111102327A patent/TWI790902B/zh active
- 2014-05-29 TW TW110102543A patent/TWI756033B/zh active
- 2014-05-29 TW TW106135135A patent/TWI647695B/zh active
- 2014-05-29 TW TW109121184A patent/TWI719915B/zh active
- 2014-05-29 TW TW112101558A patent/TWI831573B/zh active
- 2014-05-29 TW TW106111574A patent/TWI613645B/zh active
- 2014-06-12 AU AU2014281794A patent/AU2014281794B9/en active Active
- 2014-06-12 KR KR1020217027339A patent/KR102358742B1/ko active IP Right Grant
- 2014-06-12 CA CA2898891A patent/CA2898891C/en active Active
- 2014-06-12 KR KR1020157021887A patent/KR101673131B1/ko active IP Right Grant
- 2014-06-12 SG SG11201505426XA patent/SG11201505426XA/en unknown
- 2014-06-12 TR TR2018/08580T patent/TR201808580T4/tr unknown
- 2014-06-12 CN CN201480008799.7A patent/CN104995677B/zh active Active
- 2014-06-12 EP EP20156303.8A patent/EP3680900A1/en active Pending
- 2014-06-12 WO PCT/US2014/042168 patent/WO2014204783A1/en active Application Filing
- 2014-06-12 PL PL14813862T patent/PL2954515T3/pl unknown
- 2014-06-12 KR KR1020167019530A patent/KR102041098B1/ko active IP Right Grant
- 2014-06-12 JP JP2015557247A patent/JP6046275B2/ja active Active
- 2014-06-12 IN IN1765MUN2015 patent/IN2015MN01765A/en unknown
- 2014-06-12 EP EP14813862.1A patent/EP2954515B1/en active Active
- 2014-06-12 BR BR122017011368-2A patent/BR122017011368B1/pt active IP Right Grant
- 2014-06-12 BR BR112015019435-4A patent/BR112015019435B1/pt active IP Right Grant
- 2014-06-12 ES ES18156452T patent/ES2777474T3/es active Active
- 2014-06-12 MX MX2016013745A patent/MX367355B/es unknown
- 2014-06-12 KR KR1020247012621A patent/KR20240055880A/ko active Application Filing
- 2014-06-12 CN CN201610652166.0A patent/CN106297811B/zh active Active
- 2014-06-12 SG SG10201604617VA patent/SG10201604617VA/en unknown
- 2014-06-12 BR BR122016001090-2A patent/BR122016001090B1/pt active IP Right Grant
- 2014-06-12 KR KR1020197032122A patent/KR102297597B1/ko active IP Right Grant
- 2014-06-12 RU RU2016119396A patent/RU2619536C1/ru active
- 2014-06-12 SG SG10201604619RA patent/SG10201604619RA/en unknown
- 2014-06-12 MX MX2021012890A patent/MX2021012890A/es unknown
- 2014-06-12 US US14/770,375 patent/US10037763B2/en active Active
- 2014-06-12 MX MX2015010477A patent/MX342981B/es active IP Right Grant
- 2014-06-12 CN CN201610645174.2A patent/CN106297810B/zh active Active
- 2014-06-12 BR BR122020017897-3A patent/BR122020017897B1/pt active IP Right Grant
- 2014-06-12 EP EP18156452.7A patent/EP3373295B1/en active Active
- 2014-06-12 ES ES14813862.1T patent/ES2674924T3/es active Active
- 2014-06-12 RU RU2016119397A patent/RU2624099C1/ru active
- 2014-06-12 RU RU2015133936/08A patent/RU2589370C1/ru active
- 2014-06-12 BR BR122017012321-1A patent/BR122017012321B1/pt active IP Right Grant
- 2014-06-12 BR BR122020017896-5A patent/BR122020017896B1/pt active IP Right Grant
- 2014-06-12 KR KR1020227003239A patent/KR102659763B1/ko active IP Right Grant
- 2014-06-12 MY MYPI2015702460A patent/MY171737A/en unknown
- 2014-06-12 MY MYPI2018002360A patent/MY192322A/en unknown
- 2014-12-06 UA UAA201508059A patent/UA111927C2/uk unknown
-
2015
- 2015-05-13 HK HK15104519.7A patent/HK1204135A1/xx unknown
- 2015-06-29 IL IL239687A patent/IL239687A/en active IP Right Grant
- 2015-08-11 CL CL2015002234A patent/CL2015002234A1/es unknown
-
2016
- 2016-03-11 HK HK16102827.7A patent/HK1214883A1/zh unknown
- 2016-05-11 HK HK16105352.3A patent/HK1217377A1/zh unknown
- 2016-06-20 US US15/187,310 patent/US10147436B2/en active Active
- 2016-06-22 US US15/189,710 patent/US9959878B2/en active Active
- 2016-09-27 JP JP2016188196A patent/JP6571062B2/ja active Active
- 2016-10-19 MX MX2022015201A patent/MX2022015201A/es unknown
- 2016-10-19 MX MX2019009765A patent/MX2019009765A/es unknown
- 2016-11-30 JP JP2016232450A patent/JP6561031B2/ja active Active
-
2017
- 2017-06-22 RU RU2017122050A patent/RU2696465C2/ru active
- 2017-09-01 US US15/694,568 patent/US20180012610A1/en not_active Abandoned
-
2019
- 2019-07-22 JP JP2019134478A patent/JP6866427B2/ja active Active
-
2020
- 2020-03-16 US US16/820,160 patent/US11404071B2/en active Active
-
2021
- 2021-04-07 JP JP2021065161A patent/JP7090196B2/ja active Active
-
2022
- 2022-06-13 JP JP2022095116A patent/JP7427715B2/ja active Active
- 2022-08-01 US US17/878,410 patent/US11823693B2/en active Active
-
2023
- 2023-11-16 US US18/511,495 patent/US20240153515A1/en active Pending
-
2024
- 2024-01-24 JP JP2024008433A patent/JP2024028580A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013519918A (ja) * | 2010-02-11 | 2013-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 携帯機器内でオーディオ信号のラウドネスを非破壊的に正規化するシステムおよび方法 |
Non-Patent Citations (1)
Title |
---|
""Dolby Metadata Guide"", [ONLINE], JPN6020029875, 1 November 2005 (2005-11-01), pages 1 - 10, ISSN: 0004324769 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7090196B2 (ja) | プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200818 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210407 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6866427 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |