JP6007196B2 - オーディオ符号化におけるフレーム要素長さの伝送 - Google Patents
オーディオ符号化におけるフレーム要素長さの伝送 Download PDFInfo
- Publication number
- JP6007196B2 JP6007196B2 JP2013558472A JP2013558472A JP6007196B2 JP 6007196 B2 JP6007196 B2 JP 6007196B2 JP 2013558472 A JP2013558472 A JP 2013558472A JP 2013558472 A JP2013558472 A JP 2013558472A JP 6007196 B2 JP6007196 B2 JP 6007196B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- sequence
- configuration
- frame elements
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title description 25
- 230000005236 sound signal Effects 0.000 claims description 74
- 238000000034 method Methods 0.000 claims description 49
- 238000013467 fragmentation Methods 0.000 claims description 9
- 238000006062 fragmentation reaction Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 description 27
- 230000007246 mechanism Effects 0.000 description 24
- 238000005070 sampling Methods 0.000 description 23
- 230000003595 spectral effect Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 11
- 230000011664 signaling Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000003068 static effect Effects 0.000 description 8
- 230000005284 excitation Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 229910000497 Amalgam Inorganic materials 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereophonic System (AREA)
- Communication Control (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Time-Division Multiplex Systems (AREA)
Description
・現在のフレームにおけるコア符号化のタイプによって、
‐量子化されかつ雑音なしで符号化されるスペクトルであって、
‐スケールファクタ情報
‐算術的に符号化されたスペクトルラインにより表現され
・または、以下のいずれかにより表現される励起信号を伴う線形予測(LP)パラメータのいずれかである。すなわち、それらは
‐量子化されかつ算術的に符号化されるスペクトルライン(変換符号化励起、TCX)もしくは
‐ACELP符号化時間領域励起
・スペクトルノイズフィリング情報(随意)
・M/S決定情報(随意)
・時間雑音整形(TNS)情報(随意)
・フィルタバンク制御情報
・時間アンワープ(TW)制御情報(随意)
・エンハンストスペクトル帯域幅複製(eSBR)制御情報(随意)
・MPEGサラウンド(MPEGS)制御情報
・ノイズレスで符号化されたスペクトルのためのスケールファクタ情報
・スケールファクタの復号化整数表現。
・ノイズレスに復号化されたスペクトル
・スペクトルの量子化された値
逆量子化部ツールは、スペクトルのための量子化された値を得、かつ整数値を非スケーリングの再構成スペクトルへ変換する。この量子化部は、コンパンディング量子化部であり、そのコンパンディングファクタは、選択されるコア符号化モードに依存する。
・スペクトルのための量子化された値
・非スケーリングの逆量子化されたスペクトル
・非スケーリング、逆量子化スペクトル
・ノイズフィリングパラメータ
・スケールファクタの復号化された整数表現
・前回ゼロに量子化されたスペクトルラインの非スケーリング、逆量子化スペクトル値
・スケールファクタの修正された整数表現
・スケールファクタの復号化された整数表現
・非スケーリングの、逆量子化されたスペクトル
・スケーリングされ、逆量子化されたスペクトル
・(逆量子化された)スペクトル
・フィルタバンク制御情報
フィルタバンクツールからの出力(単数または複数)は、以下のとおりである。
・時間領域再構成オーディオ信号(単数または複数)
・逆量子化したスペクトル
・フィルタバンク制御情報
・時間ワープ制御情報
・線形時間領域再構成オーディオ信号(単数または複数)
・量子化されたエンベロープデータ
・Misc.制御データ
・周波数領域コアデコーダまたはACELP/TCXコアデコーダからの時間領域信号
・時間領域信号、または
・MPEGサラウンドツール等における信号のQMF領域表現が使用される。
・ダウンミックスされた時間領域信号、または
・eSBRツールからのダウンミックスされた信号のQMF領域表現
・多チャネル時間領域信号
・元の、修正されていない入力信号
・追加の実装依存パラメータ
・コアコーディック(非LPフィルタ化周波数領域符号化、LPフィルタ化周波数領域またはLPフィルタ化時間領域符号化)の選択を制御する制御信号
・適合およびイノベーションコードブックインデクス
・適合およびイノベーションコード利得値
・他の制御データ
・逆量子化されかつ補間されたLPCフィルタ係数
・時間領域再構成オーディオ信号
・(逆量子化された)MDCTスペクトル
・逆量子化されかつ補間されたLPCフィルタ係数
・時間領域再構成オーディオ信号
その上、スキップすべきフレーム要素をスキップできるようにするため、ビットストリーム12は、潜在的にスキップすべきフレーム要素に関する上記の長さ情報を伝達する必要がある。今度はこの伝送のせいで圧縮効率が下がる。
さらに、長さ情報の伝送をより効果的に行うことができることが好ましい。
本件の実施例によれば、ビットストリーム構文は、以下のような知見を利用してさらに設計される。すなわち、高すぎるビットストリームおよび復号化オーバヘッドと、フレーム要素位置決めの柔軟性とのより良い妥協が、ビットストリームのフレームのシーケンスの各々が、N個のフレーム要素のシーケンスを含み、かつビットストリームが要素数Nを表示するフィールドおよびタイプ表示構文部を含むコンフィギュレーションブロックを含み、タイプ表示構文部が、N個の要素位置のシーケンスの各要素位置について、複数の要素タイプのうちから要素タイプを表示し、フレームのN個のフレーム要素のシーケンスにおいて、各フレーム要素が、ビットストリームにおいてそれぞれのフレームのN個のフレーム要素のシーケンス内でそれぞれのフレーム要素が位置するそれぞれの要素位置について、タイプ表示部が表示する要素タイプである構成により得られるとする知見に基づく。このように、各フレームが、同じ順序でビットストリーム内に位置するタイプ表示構文部により表示されるフレーム要素タイプのN個のフレーム要素の同じシーケンスを含む点で、フレームは等しく構成される。この順序は、N個の要素位置のシーケンスの各要素位置について、複数の要素タイプのうちから要素タイプを表示するタイプ表示構文部を使用することによりフレームのシーケンスについて共通に調節可能である。
以下に詳説するとおり、フレーム20のシーケンスにより伝達されるサブストリームは、デコーダによるオーディオコンテントの再構成を可能にする情報を伝達する。サブストリームのいくつかは必要不可欠であるのに対して、随意であってデコーダのいくつかによってはスキップしても構わないものもある。たとえば、サブストリームのいくつかは、他のサブストリームに関するサイド情報を表し得るが、不可欠ではないものもある。これについては、以下に詳細に述べる。しかしながら、デコーダがフレーム要素のいくつか、より厳密には、フレーム要素のシーケンスの少なくとも一つのフレーム要素、すなわちサブストリームのいくつかをスキップできるようにするために、エンコーダ24は、コンフィギュレーションブロック28をビットストリーム12に書き込むよう構成されるが、これは、デフォルトペイロード長さに関するデフォルトペイロード長さ情報を含む。また、この少なくとも一つのサブストリームの各フレーム要素22について、エンコーダは、長さ情報をビットストリーム12に書き込むが、これは、この少なくとも一つのサブストリームのフレーム要素22の少なくともサブセットについて、デフォルトペイロード長さフラグを含み、デフォルトペイロード長さフラグが設定されていなければ、ペイロード長さ値が後に続く。そのデフォルト拡張ペイロード長さフラグが設定されているフレーム要素22のシーケンスの少なくとも一つのうちのいずれかのフレーム要素は、デフォルトペイロード長さを有し、かつ、そのデフォルト拡張ペイロード長さフラグ64が設定されていないフレーム要素22のシーケンスのこの少なくとも一つのいずれかのフレーム要素は、ペイロード長さ値に対応するペイロード長さを有する。これにより、スキップ可能なサブストリームの各フレーム要素のペイロード長さの明示的な伝送が回避され得る。むしろ、このようなフレーム要素により伝達されるペイロードタイプに依存して、フレーム要素ごとに何度も繰り返しペイロード長さを明示的に伝送するよりも、デフォルトペイロード長さを参照することにより、伝送有効性が多大に向上するようなペイロード長さの統計にできる。
このように、ビットストリームについてやや一般的に説明したが、以下では、より具体的な実施例についてより詳細に説明する。上記のとおり、これらの実施例においては、連続するフレーム20内のサブストリームの間で一定だが、調整可能な順序は、随意の特徴を表すにすぎず、これらの実施例において変更可能である。
こうして再構成されたオーディオ信号は、アレンジャ42に転送され、アレンジャ42がこれらを配列して、再構成したもの38を構成する。アレンジャ42は、さらにユーザ入力48により制御されてもよく、このユーザ入力は、利用可能なラウドスピーカコンフィギュレーションまたは再構成38の可能な最大数のチャネルを示す。ユーザ入力48に依存して、アレンジャ42は、拡張フレーム要素がビットストリーム12内に存在していても、たとえば拡張モジュール44dおよび44eのいずれかのような復号化モジュール44a〜44eのいずれかを不能化し得る。
以下に説明する実施例では、この機構は、拡張要素タイプのサブストリームのみに限定されるが、このような機構または構文部が1を超える数の要素タイプに適用できることは当然である。
デコーダ、エンコーダおよびビットストリームそれぞれの可能な詳細についてさらに説明する前に、エンコーダによる拡張要素タイプでないサブストリームのフレーム要素の間に拡張要素タイプのサブストリームのフレーム要素を分散させる能力により、デコーダ36のバッファオーバヘッドは、サブストリーム間の順序および各フレーム20内のサブストリームのフレーム要素間の順序をそれぞれ適切に選ぶエンコーダ24により減じられ得ることを承知されたい。たとえば、チャネル対デコーダ44cに入るサブストリームは、フレーム20内の第1の要素位置に配置され、一方、デコーダ44eの多チャネルサブストリームが、各フレームの最後に配置される。この場合、デコーダ36は、各フレーム20の第1のフレーム要素の到来と、最後のフレーム要素との間の時間にまたがる期間、多チャネルデコーダ44eのダウンミックス信号を表す中間オーディオ信号をバッファする必要があると考えられる。それで初めて多チャネルデコーダ44eがその処理を開始することができる。この延期は、たとえばフレーム20の第2の要素位置で多チャネルデコーダ44e専用のサブストリームを配列するエンコーダ24により回避され得る。一方、ディストリビュータ40は、サブストリームのいずれかについてそのメンバーシップに関して各フレーム要素を調べる必要はない。むしろ、ディストリビュータ40は、コンフィギュレーションブロックおよびそこに含まれるタイプ表示構文部から単純に現在のフレーム20の現在のフレーム要素22のN個のサブストリームのいずれかに対するメンバーシップを推定することができる。
(1)コンフィギュレーションブロック28を読み出すステップ。
UsacConfig()(図4a)
UsacConfig()は、含まれるオーディオコンテントおよび完全なデコーダセットアップのために必要なものすべてについての情報を含むよう拡張されていた。オーディオについてのトップレベルの情報(サンプリングレート、チャネルコンフィギュレーション、出力フレーム長)は、より高い(アプリケーション)レイヤからのアクセスを容易にするために始まりに集められる。
これらの要素は、含まれるビットストリーム要素およびそれらのラウドスピーカへのマッピングについての情報を付与する。channelConfigurationIndexにより、実際に関連あると考えられた予め定義されるモノ、ステレオまたは多チャネルコンフィギュレーションの範囲から1つを信号伝達する容易で便利な方法が可能になる。
この要素は、デコーダコンフィギュレーションの中心にあり、したがって、デコーダがビットストリームを解釈するために必要なすべての追加情報を含む。
将来の拡張について対処するため、コンフィギュレーションは、USACのいまだ存在しないコンフィギュレーション拡張のために、コンフィギュレーションを拡張する強力な機構を特徴とする。
この要素コンフィギュレーションは、1つの単一チャネルを復号化するデコーダを構成するために必要な情報すべてを含む。これは、本質的にはコアコーダ関連情報であり、SBRが使用される場合には、SBR関連情報である。
上記と同様、この要素コンフィギュレーションは、1つのチャネル対を復号化するデコーダを構成するために必要な情報すべてを含む。上記のコアconfigおよびSBRコンフィギュレーションに加えて、これは適用されるステレオ符号化の正確な種類(MPS212、残差の有無等)のようなステレオ専用のコンフィギュレーションを含む。なお、この要素は、USACにおいて入手可能な全種類のステレオ符号化オプションをカバーする。
LFE要素コンフィギュレーションは、LFE要素が静的コンフィギュレーションを有するのでコンフィギュレーションデータを含まない。
この要素コンフィギュレーションは、コーデックに対するいずれかの種類の既存のまたは将来の拡張を構成するために使用され得る。各拡張要素のタイプは、それ自体の専用ID値を有する。デコーダには未知のコンフィギュレーション拡張を都合よくスキップすることができるように、長さフィールドが含まれる。デフォルトペイロード長さの随意の規定により、実際のビットストリームに存在する拡張ペイロードの符号化効率をさらに向上する。
この要素は、コアコーダセットアップにインパクトを有するコンフィギュレーションデータを含む。現在、これらは、時間ワープツールおよびノイズフィリングツールのためのスィッチである。
sbr_header()を頻繁に再送信することにより生成されるビットオーバヘッドを減らすため、典型的には一定に維持されるsbr_header()の要素のためのデフォルト値を、コンフィギュレーション要素SbrDfltHeader()において保持する。さらに、静的SBRコンフィギュレーション要素もSbrConfig()において保持する。これらの静的ビットには、高調波トランスポジションまたはインタTES等のエンハンストSBRの特定の特徴を可能かまたは不能化するフラグを含む。
これは、典型的には一定に維持されるsbr_header()の要素を保持する。振幅分解能、クロスオーババンド、スペクトル予備平坦化等に影響を及ぼす要素は、ここで、実行中にこれらを効率的に変更し得るSbrInfo()において保持される。
上記SBRコンフィギュレーションと同様に、MPEGサラウンド2−1−2ツールのための全セットアップパラメータが、このコンフィギュレーションにおいてアセンブルされる。このコンテクストにおいて関連がないかまたは冗長なSpatialSpecificConfig()からの要素はすべて除去される。
UsacFrame()(図4n)
これは、USACビットストリームペイロードの最も外側のラッパでかつUSACアクセス単位を表す。それは、config部で信号伝達される、含まれるチャネル要素および拡張要素すべてにわたるループを含む。これは、含み得るものという意味でビットストリームフォーマットをより柔軟にし、かつ、何らかの将来の拡張に対しても将来的に使用可能である。
この要素は、モノストリームを復号化するための全データを含む。コンテントは、コアコーダに関連する部分とeSBRに関連する部分に分かれる。後者は、より密接にコアに接続され、デコーダが必要とするデータの順序をよりよく反映する。
この要素は、ステレオ対を符号化するためのすべての可能な方法についてのデータをカバーする。特に、旧式のM/S系符号化からMPEGサラウンド2−1−2の補助による完全なパラメータステレオ符号化まで、統合されたステレオ符号化のフレーバのすべてをカバーする。stereoConfigIndexは、どのフレーバが実際に使用されるかを示す。適切なeSBRデータおよびMPEGサラウンド2−1−2データをこの要素において送る。
以前のlfe_channel_element()は、一貫したネーミングスキームに従うためにのみ再ネーミングされる。
この拡張要素は、小さいペイロードを有する(またはしばしば全くペイロードがない場合も)拡張についてさえ、最大限の柔軟性が得られしかも同時に最大限効率的になり得るよう慎重に設計された。不可知のデコーダがスキップするよう拡張のペイロード長が信号伝達される。ユーザが定義する拡張については、拡張のタイプの予備範囲により信号伝達することができる。拡張は要素の順序で自由に配置することができる。拡張要素の範囲は、フィルバイトを書き込むための機構を含めてすでに考慮されている。
この新しい要素は、コアコーダに影響を与える情報のすべてを要約し、かつまたそれによりfd_channel_stream()’sおよびlpd_channel_stream()’sも含む。
構文の読出し性を緩和するために、ステレオ関連情報のすべてがこの要素に捕捉された。これは、ステレオ符号化モードにおける多数のビットの依存性を扱うものである。
CRC機能性およびスケーリング可能なオーディオ符号化の古い記述要素は、かつてsbr_extension_data()要素だったものから除去された。SBRinfoおよびヘッダデータの頻繁な再送信が原因で生じるオーバヘッドを減らすために、これらの存在は、明示的に信号伝達され得る。
実行中に頻繁に修正されるSBRコンフィギュレーションデータ。これは、振幅分解能、クロスオーババンド、スペクトルの予備平坦化等の以前は完全なsbr_header()の送信を必要とした事項を制御する要素を含む([N11660]の6.3「効率」を参照)。
実行中にsbr_header()の値を変更するSBRの能力を維持するために、ここでは、SbrDfltHeader()において送られるもの以外の値を使用する必要がある場合には、UsacSbrData()内部にSbrHeaderを保持することができる。最も一般的な場合のために、オーバヘッドをできるだけ低く保つため、bs_header_extra機構は維持された。
ここでも、USACコンテクストでは適用不可能なため、SBRスケーリング可能符号化の残余が取り除かれている。チャネルの数によって、sbr_data()は、1つのsbr_single_channel_element()または1つのsbr_channel_pair_element()を含む。
この表は、オーディオコーディックのサンプリング周波数を信号伝達するためにMPEG−4において使用される表のスーパーセットである。この表は、現在USAC動作モードにおいて使用されるサンプリングレートをカバーするためにもさらに拡張されている。いくつかのサンプリング周波数の倍数も加えられている。
この表は、channelConfigurationを信号伝達するためにMPEG−4において使用される表のスーパーセットである。これをさらに拡張して、一般的に使用されかつ将来に見込まれるラウドスピーカのセットアップの信号伝達が可能にされている。この表内へのインデクスを5ビットで信号伝達して、将来の拡張を図る。
4つ要素タイプのみが存在する。4つの基本的ビットストリーム要素:UsacSingleChannelElement()、UsacChannelPairElement()、UsacLfeElement()およびUsacExtElement()の各々について1つである。これらの要素は、必要とされる柔軟性をすべて維持しながら、必要なトップレベルの構造を提供する。
UsacExtElement()の内部で、この要素は、過剰な拡張の信号伝達を可能にする。将来も使い続けられるよう、考えられるすべての拡張を可能にするのに十分な広さのビットフィールドが選択されている。現在既知の拡張のうち、いくつかが考慮の対象として提案されている。フィル要素、MPEGサラウンドおよびSAOCである。
ある時点で、コンフィギュレーションを拡張することが必要であれば、新しいコンフィギュレーションごとにタイプを割り当てることが可能なUsacConfigExtension()により対処することができる。現在、信号伝達可能な唯一のタイプは、コンフィギュレーションのためのフィル機構である。
この表は、デコーダの複数のコンフィギュレーション特性を信号伝達する。特に、これらは、出力フレーム長、SBR比および結果として得られるコアコーダフレーム長(ccfl)である。同時に、SBRにおいて使用されるQMF解析および合成帯域数も示す。
この表は、UsacChannelPairElement()の内部構造を決定する。モノまたはステレオコアの使用、MPS212の使用、ステレオSBRが適用されるかどうかおよび残差符号化がMPS212において適用されるかどうかを示す。
UsacConfig()
この要素は、含まれるオーディオコンテントおよび完全なデコーダセットアップに必要なすべてについての情報を含む。
この要素は、含まれるビットストリーム要素およびそれらのラウドスピーカへのマッピングについての情報を付与する。
この要素は、デコーダがビットストリームを解釈するために必要な他のすべての情報を含む。特に、SBR再サンプリング比がここで信号伝達され、かつビットストリームの構造が、ここでは、ビットストリームにおける要素の数およびそれらの順序を明示的に述べることにより規定される。
USACの将来のコンフィギュレーション拡張のためコンフィギュレーションを拡張するコンフィギュレーション拡張機構。
1つの単一チャネルを復号化するようデコーダを構成するために必要なすべての情報を含む。これは、本質的にコアコーダに関連する情報であり、かつ、SBRが使用される場合には、SBR関連情報である。
上記と同様、この要素コンフィギュレーションは、1つのチャネル対を復号化するようデコーダを構成するために必要なすべての情報を含む。上記のコアconfigおよびsbrコンフィギュレーションに加えて、これは、適用されるステレオ符号化の正確な種類(MPS212、残差等の有無)等のステレオに特定的なコンフィギュレーションを含む。この要素は、USACにおいて現在使用可能なステレオ符号化オプションのすべての種類をカバーする。
LFE要素コンフィギュレーションは、LFE要素が静的コンフィギュレーションを有するので、コンフィギュレーションデータを含まない。
この要素コンフィギュレーションは、いずれかの種類の既存または将来の拡張をコーデックに対して構成するために使用することができる。各拡張要素タイプは、その独自の専用タイプ値を有する。デコーダに未知のコンフィギュレーション拡張をスキップできるように、長さフィールドが含まれる。
コアコーダセットアップに対してインパクトのあるコンフィギュレーションデータを含む。
典型的には一定に維持されるeSBRのコンフィギュレーション要素のためのデフォルト値を含む。さらに、静的SBRコンフィギュレーション要素をSbrConfig()内に保持する。これらの静的ビットは、高調波トランスポジションまたはインタTES等のエンハンストSBRの特定の特徴を可能化または不能化するためのフラグを含む。
この要素は、SbrHeader()の要素について異なる値を希望しない場合に参照することができるこられの要素のデフォルトバージョンを保持する。
MPEGサラウンド2−1−2ツールのためのすべてのセットアップパラメータは、このコンフィギュレーションにおいてアセンブルされる。
この要素は、可変数のビットを使用して整数値を送信する一般的な方法を実現する。追加ビットの連続送信により表現可能な値の範囲を拡大することができる2レベルエスケープ機構を特徴とする。
このインデクスは、復号化後のオーディオ信号のサンプリング周波数を決定する。usacSamplingFrequencyIndexの値および関連のサンプリング周波数を表Cに示す。
usacSamplingFrequencyIndex=0である場合、符号のついていない整数値として符号化されるデコーダの出力サンプリング周波数。
このインデクスは、チャネルコンフィギュレーションを決定する。channelConfigurationIndex>0の場合、インデクスは、表Yに従って、チャネルの数、チャネル要素および関連のラウドスピーカマッピングを明白に規定する。ラウドスピーカの位置の名称、使用される略称および利用可能なラウドスピーカの一般的な位置を図3a、図3b、図4aおよび図4bから推定することができる。
このインデクスは、表XXに従う所与のチャネルに関連するラウドスピーカの位置を記述する。図Yは、リスナの3D環境におけるラウドスピーカの位置を示す。ラウドスピーカの位置をより容易に理解するため、表XXは、関心のある読者への情報としてここに挙げるIEC100/1706/CDVによるラウドスピーカ位置も含む。
コンフィギュレーションに対する拡張の存在を示す。
channelConfigrationIndexの値が、予め規定されたチャネルコンフィギュレーションのどれも使用されないことを示す場合には、この要素が、特定のラウドスピーカ位置が関連付けられるオーディオチャネルの数を決定する。
このフィールドは、UsacDecoderConfig()におけるループオーバ要素のタイプにおいてフォローする要素の数を含む。
ビットストリームにおける位置elemIdxの要素のUSACチャネル要素タイプを規定する。4つの要素タイプが存在し、この4つの基本ビットストリーム要素、UsacSingleChannelElement()、UsacChannelPairElement(), UsacLfeElement()、およびUsacExtElement()の各々について1つ存在する。これらの要素は、必要なトップレベルの構造を付与する一方で、必要とされる柔軟性のすべてを維持する。usacElementTypeの意味を表Aに定義する。
この要素は、UsacChannelPairElement()の内部構造を決定する。表ZZによれば、これは、モノまたはステレオコアの使用、MPS212の使用、ステレオSBR適用の有無およびMPS212における残差符号化適用の有無を示す。この要素はまたヘルパー要素であるbsStereoSBRおよびbsResidualCodingの値も規定する。
このフラグは、このストリーム内で時間ワープしたMDCTの使用を信号伝達する。
このフラグは、FDコアデコーダにおけるスペクトルホールのノイズフィリングの使用を信号伝達する。
このフラグは、SBRのための高調波パッチングの使用を信号伝達する。
このフラグは、SBRにおけるインタTESツールの使用を信号伝達する。
これは、フラグsbrUseDfltHeaderが、SbrHeader()要素のデフォルト値が想定されることを示す場合に付与されるビットストリーム要素bs_stat_freqのデフォルト値である。
これは、フラグsbrUseDfltHeaderが、SbrHeader()要素のデフォルト値が想定されることを示す場合に付与されるビットストリーム要素bs_stоp_freqのデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_header_extra1のデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_header_extra2のデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_freq_scaleのデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_alter_scaleのデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_noise_bandsのデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_limiter_bandsのデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_limiter_gainsのデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_interpol_freqのデフォルト値である。
これは、SbrHeader()要素のデフォルト値が想定されることをフラグsbrUseDfltHeaderが示す場合に付与されるビットストリーム要素bs_smoothing_modeのデフォルト値である。
この要素は、ビットストリーム拡張タイプの信号伝達を可能にする。usacExtElementTypeの意味を、表Bにおいて定義する。
バイト(オクテット)で拡張コンフィギュレーションの長さを信号伝達する。
このフラグはusacExtElementDefaultLengthがUsacExtElementConfig()で運ばれるかどうかを信号伝達する。
拡張要素のデフォルト長をバイトで信号伝達する。所与のアクセス単位における拡張要素がこの値からそれている場合にのみ、ビットストリームにおいて追加の長さを伝送する必要がある。この要素が明示的に伝送されない場合(usacExtElementDefaultLengthPresent==0)、usacExtElementDefaultLengthの値がゼロに設定される。
このフラグは、この拡張要素のペイロードが分割されて連続するUSACフレームにおいていくつかのセグメントとして送られ得るかどうかを示す。
コンフィギュレーションへの拡張が、UsacConfig()に存在する場合には、この値は、信号伝達されるコンフィギュレーション拡張の数を示す。
コンフィギュレーション拡張へのインデクス。
この要素は、コンフィギュレーション拡張タイプを信号伝達することを可能にする。usacExtElementTypeの意味は、表Dにおいて定義される。
バイト(オクテット)でコンフィギュレーション拡張の長さを信号伝達する。
このフラグは、逆mid/side回転をMps212処理の前にコア信号に適用すべきであることを信号伝達する。
このフラグは、MPEGサラウンド復号化と組み合わせたステレオSBRの使用を信号伝達する。
残差符号化を下の表に従って適用するかどうかを示す。bsResidualCodingの値は、stereoConfigIndex(Xを参照)により定義される。
コアサンプリングレートとeSBR処理後のサンプリングレートとの比率を示す。同時に、下の表によるSBRにおいて使用されるQMF解析および合成帯域の数を示す。
UsacDecoderConfig()およびUsacFrame()に存在する要素へのインデクス。
UsacConfig()は、出力サンプリング周波数およびチャネルコンフィギュレーションについての情報を含む。この情報は、MPEG-4AudioSpecificConfig()等におけるこの要素の外部に信号伝達される情報と同じになる。
サンプリングレートが表1の右欄に列挙するレートの1つではない場合、サンプリング周波数に依拠する表(コード表、スケールファクタ帯域表等)を推定して、ビットストリームペイロードを構文解析する必要がある。所与のサンプリング周波数は1つのサンプリング周波数表とだけ関連付けられており、かつ、可能なサンプリング周波数の範囲においては最大の柔軟性が望まれるので、以下の表を使用して、暗示されるサンプリング周波数を希望のサンプリング周波数に依拠する表と関連付ける。
チャネルコンフィギュレーション表は、最も一般的なラウドスピーカ位置をカバーする。他のフレキシビリティチャネルについては、様々なアプリケーションにおける現代のラウドスピーカセットアップに見られる全部で32のラウドスピーカ一位置の選択肢へマッピングすることができる(図3a、図3bを参照)。
UsacDecoderConfig()は、ビットストリームを解釈するのにデコーダが必要とする他の情報のすべてを含む。まず、sbrRatioIndexの値がコアコーダフレーム長(ccfl)と出力フレーム長との比を決定する。sbrRatioIndexの後は、現在のビットストリームにおいて全チャネル要素にわたるループが続く。各繰り返しについて、要素のタイプがusacElementType[]において信号伝達され、直後に対応のコンフィギュレーション構造が続く。UsacDecoderConfig()において様々な要素が存在する順序は、UsacFrame()における対応のペイロードの順序と同じになる。
UsacSingleChannelElementConfig()は、1つの単一チャネルを復号化するためのデコーダを構成するために必要な全情報を含む。SBRコンフィギュレーションデータは、SBRが実際に採用された場合にのみ送信される。
UsacChannelPairElementConfig()は、コアコーダ関連のコンフィギュレーションデータおよびSBRの使用に依拠するSBRコンフィギュレーションデータを含む。ステレオ符号化アルゴリズムの正確なタイプについては、stereoConfigIndexにより示される。USACにおいては、チャネル対が様々な態様で符号化できる。それらは、
時間ワープしたMDCTおよびノイズフィリングの使用はLFEチャネルについては許容されていないので、これらのツールについて通常のコアコーダフラグを送信する必要はない。その代り、これらはゼロに設定される。
UsacCoreConfig()は、グローバルビットストリームレベルでの時間ワープしたMDCTおよびスペクトルノイズフィリングの使用を可能化または不能化するフラグのみを含む。tw_mdctがゼロに設定されると、時間ワープは適用されない。nоiseFillingがゼロに設定されると、スペクトルノイズフィリングは適用されない。
SbrConfig()ビットストリーム要素は、正確なeSBRセットアップパラメータを信号伝達する目的を果たす。一方、SbrConfig()は、eSBRツールの一般的な採用を信号伝達する。他方、SbrConfig()は、SbrHeader()のデフォルトバージョンであるSbrDfltHeader()を含む。異なるSbrHeader()がビットストリームにおいて送信されなければ、このデフォルトヘッダの値が想定されることになる。このメカニズムの背景には、1つのビットストリームにおいては、典型的には1セットのSbrHeader()値しか付与されないことがある。SbrDfltHeader()の送信で、ビットストリームにおける1つのビットのみを使用することにより非常に効率的にこのデフォルト値のセットを参照することが可能になる。ビットストリーム自体における新たなSbrHeaderをインバンドで送信できるようにすることで、依然として、実行中にSbrHeaderの値を変更する可能性は保持される。
SbrDfltHeader()は、基本SbrHeader()テンプレートと呼んでもよいもので、主に使用されるeSBRコンフィギュレーションのための値を含む必要がある。ビットストリームにおいて、このコンフィギュレーションは、sbrUseDfltHeaderフラグを設定することにより参照することができる。SbrDfltHeader()の構造は、SbrHeader()のものと同様である。SbrDfltHeader()およびSbrHeader()の値を区別できるように、SbrDfltHeader()におけるビットフィールドは、「bs_」の代わりに「dflt」を接頭辞にする。SbrDfltHeader()の使用が表示されると、SbrHeader()ビットフィールドは、対応のSbrDfltHeader()の値を想定する。すなわち、以下のとおりである。
bs_stop_freq=dflt_stop_freq;etc.
(bs_xxx_yyy=dflt_xxx_yyyのように、SbrHeader()におけるすべての要素について続く)。
Mps212Config()は、MPEGサラウンドのSpatialSpecificConfig()に類似し、かつ、多くの部分において、それから推定されていた。しかしながら、USACコンテクストにおけるモノからステレオへのアップミキシングについて関連のある情報のみを含むと言う範囲まで狭められる。結果として、MPS212は、1つのOTTボックスのみを構成する。
UsacExtElementConfig()は、USACのための拡張要素のコンフィギュレーションデータ用の一般的なコンテナである。各USAC拡張は、独自のタイプ識別子であるusacExtElementTypeを有し、これは表Xにおいて定義される。各UsacExtElementConfig()ごとに、含まれる拡張コンフィギュレーションの長さを可変usacExtElementConfigLengthにおいて送信し、含まれる拡張コンフィギュレーションの長さによって、デコーダが、そのusacExtElementTypeが未知である拡張要素を安全にスキップできる。
UsacConfigExtension()は、UsacConfig()の拡張のための一般的なコンテナである。デコーダ初期化またはセットアップ時に交換される情報を補正または拡張する便利な方法を提供する。config拡張の存在はusacConfigExtensionPresentにより示される。config拡張が存在する場合(usacConfigExtensionPresent==1)、ビットフィールドnumConfigExtensionsにおいて、これらの拡張の正確な数が続く。各コンフィギュレーション拡張は、表Xで定義される独自のタイプ識別子usacConfigExtTypeを有する。各UsacConfigExtensionについて、含まれるコンフィギュレーション拡張の長さは、可変のusacConfigExtLengthにおいて送信され、かつ、コンフィギュレーションビットストリーム構文解析部が、そのusacConfigExtTypeが不明であるコンフィギュレーション拡張を安全にスキップできるようにする。
用語および定義
このデータのブロックは、1つのUSACフレームの期間についてのオーディオデータ、関連情報および他のデータを含む。UsacDecoderConfig()において信号伝達されるように、UsacFrame()は、numElement要素を含む。これらの要素は1また2チャネルについてのオーディオデータ、低周波数エンハンスメントのためのオーディオデータまたは拡張ペイロードを含み得る。
略称はSCE。単一のオーディチャネルのための符号化データを含むビットストリームの構文要素。single_channel_element()は、基本的に、FDまたはLPDコアコーダのためのデータを含むUsacCoreCoderData()からなる。SBRが活性の場合には、UsacSingleChannelElementもSBRデータを含む。
略称はCPE。チャネル対についてのデータを含むビットストリームペイロードの構文要素。チャネル対は、2つのディスクリートなチャネルを送信するかまたは1つのディスクリートなチャネルおよび関連のMps212ペイロードのいずれかにより達成され得る。これは、stereoConfigIndexにより信号伝達される。UsacChannelPairElementはSBRが活性の場合にはSBRデータをさらに含む。
略称はLFE。低サンプリング周波数エンハンスメントチャネルを含む構文要素。LFEは常にfd_channel_stream()要素を使用して符号化される。
拡張ペイロードを含む構文要素。拡張要素の長さがコンフィギュレーション(USACExtElementConfig())においてデフォルト長さとして信号伝達されるかまたはUsacExtEelement()自体において信号伝達される。存在すれば、拡張ペイロードは、コンフィギュレーションにおいて信号伝達されるようなタイプusacExtElementTypeである。
下の表に従って、現在のUsacFrame()が以前のフレームからの情報の知識なしに完全に復号化できるかどうかを表示する。
拡張要素の長さが、UsacExtElementConfig()に規定されたusacExtElementDefaultLengthに対応するかどうかを示す。
バイトで表す拡張要素の長さを含む。この値は、現在のアクセス単位における拡張要素の長さがデフォルト値であるusacExtElementDefaultLengthから偏移する場合、ビットストリームにおいて明示的に送信する必要があるのみである。
現在のusacExtElementSegmentDataがデータブロックを開始するかどうかを示す。
現在のusacExtElementSegmentDataがデータブロックを終了するかどうかを示す。
usacExtElementStart==1のUsacExtElement()から始まり、usacExtElementStop==1のUsacExtElement()まで(これを含んで)連続するUSACフレームのUsacExtElement()からの全usacExtElementSegmentDataの連結が1つのデータブロックを構成する。完全なデータブロックが1つのUsacExtElement()に含まれる場合には、usacExtElementStartおよびusacExtElementStopの両方が1に設定される。データブロックは、下の表によるusacExtElementTypeに依存するバイト単位でそろえられた拡張ペイロードとして解釈される。
情報を保持しないビットを有するビットストリームをパディングするために使用され得るビットのオクテット。fill_byteに使用される正確なビットパターンは、「10100101」である必要がある。
nrCoreCoderChannels
チャネル対要素のコンテクストにおいては、この変数は、ステレオ符号化のための基礎を構成するコアコーダチャネルの数を示す。stereoConfigIndexの値によって、この値は1または2になる。
チャネル対要素のコンテクストにおいては、この変数はSBR処理が適用されるチャネルの数を示す。stereoConfigIndexの値によって、この値は1または2になる。
用語および定義
このデータブロックは、コアコーダオーディオデータを含む。ペイロード要素は、FDまたはLPDモード用のいずれかの1つまたは2つのコアコーダチャネルのためのデータを含む。特定のモードは、要素の開始にチャネルごとに信号伝達される。
すべてのステレオ関連の情報は、この要素において捕捉される。ステレオ符号化モードにおけるビットフィールドの多数の依存性を扱う。
cоmmоnCoreMode
CPEにおいて、このフラグは、両方の符号化コアコーダチャネルが同じモードを使用するかどうか示す。
このデータブロックは、Mps212ステレオモジュールのためのペイロードを含む。このデータの存在は、stereоConfigIndexに依存する。
CPEのチャネル0およびチャネル1が同じウィンドウパラメータを使用するかどうかを示す。
CPEのチャネル0およびチャネル1が時間ワープしたMDCTについて同じパラメータを使用するかどうかを示す。
1つのUsacFrame()は、USACビットストリームの1つのアクセス単位を構成する。各UsacFrameが、表Xから決定されるoutputFrameLengthに従って、768、1024、2048または4096の出力サンプルに復号化する。
UsacSingleChannelElement()の単純な構造は、1に設定されたnrCoreCoderChannelsを有するUsacCoreCoderData()の1つのインスタンスから構成される。この要素のsbrRatioIndexにより、UsacSbrData()要素はこれも1に設定されたnrSbrChannelで続く。
ビットストリームにおけるUsacExtElement()構造を、USACデコーダにより復号化またはスキップすることができる。各拡張は、UsacExtElement()’sの関連のUsacExtElementConfig()において伝達されるusacExtElementTypeにより識別される。各usacExtElementTypeについては、特定のデコーダが存在し得る。
UsacChannelPairElementConfig()において送信されるstereoConfigIndexは、所与のCPEにおいて適用されるステレオ符号化の正確なタイプを決定する。ステレオ符号化のこのタイプに依存して、1または2のコアコーダチャネルが実際にビットストリームにおいて送信され、かつ、可変nrCoreCoderChannelsをこれに応じて設定する必要がある。構文要素UsacCoreCoderData()は、1または2のコアコーダチャネルのためのデータを付与する。
デコーダにおける規定の構造を維持するため、UsacLfeElement()を標準fd_channel_stream(0,0,0,0,x)要素として規定し、すなわち、周波数領域コーダを使用してUsacCoreCoderData()と等しくする。こうして、UsacCoreCoderData()要素を復号化するための標準的過程を利用して復号化を行うことができる。
・LFEの最も低い24のスペクトル係数のみが非ゼロになり得る。
・非時間雑音整形が使用される、すなわちtns_data_presentがゼロに設定される。
・時間ワープが不活性である。
・ノイズフィリィングが適用されない。
UsacCoreCoderData()は、1または2のコアコーダチャネルを復号化するためのすべての情報を含む。
・チャネルごとのcore_mode[]を取得。
・2つのコア符号化チャネルの場合(nrChannels==2)、StereoCoreToolInfo()を構文解析し、全ステレオ関連パラメータを決定。
・信号伝達されたcore_modeに基づき、チャネルごとにlpd_channel_stream()またはfd_channel_stream()を送信。
StereoCoreToolInfo()により、パラメータを効率的に符号化でき、その値は、両方のチャネルがFDモード(core_mode[0,1]=0)で符号化される場合には、CPEのコアコーダチャネルを横断して共有され得る。ビットストリームにおける適切なフラグが1にセットされると、特に以下のデータ要素が共有される。
このデータブロックは、1つまたは2つのチャネルについてのSBR帯域幅拡張のためのペイロードを含む。このデータの存在は、sbrRatioIndexに依存する。
この要素は、変更されてもデコーダリセットを必要としないSBR制御パラメータを含む。
この要素は、SBRコンフィギュレーションパラメータを有するSBRヘッダデータを含み、これらパラメータは典型的にはビットストリームの持続時間にわたって変化しない。
USACにおいては、SBRペイロードは、UsacSbrData()において送信され、これは、各単一チャネル要素またはチャネル対要素の不可欠な部分である。UsacSbrData()は、UsacCoreCoderData()の直後に続く。LFEチャネルについては、SBRペイロードは存在しない。
Mps212Dataフレームにおける時間スロットの数。
装置に関連して、いくつかの特徴について説明したが、これらの特徴が、ブロックまたは装置が方法ステップまたは方法ステップの特徴に相当する対応の方法の記述にも相当することは明らかである。同様に、方法ステップに関連して説明した特徴は、対応のブロックもしくはアイテムまたは対応の装置の記述にも相当する。
Claims (19)
- コンフィギュレーションブロック(28)およびそれぞれがオーディオコンテント(10)の連続する期間を表すフレーム(20)のシーケンスを含み、
フレーム(20)のシーケンスがフレーム要素(22)のN個のシーケンスから構成され、各フレーム(20)がそれぞれフレーム要素(22)のN個のシーケンスからの1つのフレーム要素(22)を含み、かつ、フレーム要素(22)の各シーケンスについて、フレーム要素(22)が相互に等しい要素タイプになるように、各フレーム要素(22)が複数の要素タイプのうちのそれぞれの1つであり、
デコーダが、ビットストリーム(12)を構文解析し、かつ、フレーム要素のシーケンスのサブセットに基づいてオーディオコンテントを再構成し、フレーム要素のシーケンスのサブセットに属さないフレーム要素(22)の少なくとも一つに対しては、
フレーム要素(22)のシーケンスの少なくとも1つについて、デフォルトペイロード長さに関するデフォルトペイロード長さ情報(60)をコンフィギュレーションブロック(28)から読み出し、かつ
フレーム要素(22)のシーケンスの少なくとも1つの各フレーム要素(22)について、ビットストリーム(12)から長さ情報を読み出すよう構成され、長さ情報(58)の読み出しが、フレーム要素(22)のシーケンスの少なくとも1つのフレーム要素(22)の少なくともサブセットについて、デフォルトペイロード長さフラグ(64)を読み出すことを含み、デフォルトペイロード長さフラグ(64)が設定されていなければ、ペイロード長さ値(66)を読み出すことが後に続き、
ビットストリーム(12)を構文解析する上で、そのデフォルトペイロード長さフラグ(64)が設定されている、フレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素を、デフォルトペイロード長さをスキップインターバル長さとして使用してスキップし、そのデフォルトペイロード長さフラグ(64)が設定されていないフレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素をペイロード長さ値(66)に対応するペイロード長さをスキップインターバル長さとして使用してスキップする、デコーダ。 - デコーダが、コンフィギュレーションブロック(28)を読み出す上で、要素数Nを表示するフィールド(50)と、N個の要素位置のシーケンスの各要素位置について、複数の要素タイプのうちから要素タイプを表示するタイプ表示構文部(52)とを読み出すよう構成され、
デコーダが、
ビットストリーム(12)におけるそれぞれのフレーム(20)のN個のフレーム要素(22)のシーケンス内でそれぞれのフレーム要素が位置するそれぞれの要素位置について、タイプ表示構文部により表示される要素タイプに従って各フレーム要素(22)を復号化することにより各フレーム(20)を復号化するよう構成される、請求項1に記載のデコーダ。 - デコーダが、タイプ表示構文部(52)からN個の構文要素(54)のシーケンスを読み出すよう構成され、各要素が、それぞれの構文要素がN個の構文要素のシーケンス内で位置するそれぞれの要素位置について要素タイプを表示する、請求項2に記載のデコーダ。
- デコーダが、コンフィギュレーションブロック(28)からフレーム要素の各シーケンスについてコンフィギュレーション要素(56)を読み出すよう構成され、各コンフィギュレーション要素が、フレーム要素のそれぞれのシーケンスについてコンフィギュレーション情報を含み、
デコーダが、フレーム要素のシーケンスのサブセットに基づきオーディオコンテントを再構成する上で、それぞれのコンフィギュレーション要素のコンフィギュレーション情報を使用してフレーム要素のシーケンスのサブセットの各フレーム要素(22)を復号化するように構成される、請求項1から3のいずれかに記載のデコーダ。 - タイプ表示構文部(52)が、N個の構文要素(54)のシーケンスを含み、各構文要素(54)が、それぞれの構文要素(54)がタイプ表示構文部(52)内で位置するそれぞれの要素位置について要素タイプを表示し、デコーダが、ビットストリーム(12)からコンフィギュレーション要素(56)および構文要素(54)を交互に読み出すよう構成される、請求項4に記載のデコーダ。
- デコーダが、フレーム要素の少なくとも1つのシーケンスのいずれかのフレーム要素の長さ情報(58)を読み出す上で、ビットストリーム(12)から拡張ペイロードプレゼントフラグ(70)を読み出し、拡張ペイロードプレゼントフラグ(70)が設定されているかどうかをチェックし、拡張ペイロードプレゼントフラグ(70)が設定されていない場合には、それぞれのフレーム要素(22b)を読み出すことを止め、現在のフレーム(20)の他のフレーム要素(22)、または後続のフレーム(20)のフレーム要素の読み出しにとりかかり、かつ拡張ペイロードプレゼントフラグ(70)が設定されている場合には、デフォルトペイロード長さフラグ(64)の読み出しを続け、デフォルトペイロード長さフラグ(64)が設定されていない場合には、ビットストリーム(12)からペイロード長さ値(66)が後に続き、スキップすることにとりかかる、請求項1から5のいずれかに記載のデコーダ。
- デコーダが、デフォルトペイロード長さ情報(60)を読み出す上で、
ビットストリーム(12)からデフォルトペイロード長さプレゼントフラグを読み出し、
デフォルトペイロード長さプレゼントフラグが設定されているかどうかチェックし、
デフォルトペイロード長さプレゼントフラグが設定されていない場合は、デフォルト拡張ペイロード長さをゼロに設定し、かつ
デフォルトペイロード長さプレゼントフラグが設定されている場合には、ビットストリームからデフォルト拡張ペイロード長さを明示的に読み出すように構成される、請求項1から6のいずれかに記載のデコーダ。 - デコーダが、コンフィギュレーションブロック(28)を読み出す上で、フレーム要素の少なくとも1つのシーケンスのフレーム要素の各シーケンスについて、
ビットストリーム(12)から拡張要素タイプについてのコンフィギュレーション情報を含むコンフィギュレーション要素(56)を読み出すように構成され、
コンフィギュレーション情報が、複数のペイロードデータタイプのうちからペイロードデータタイプを表示する拡張要素タイプフィールド(72)を含む、請求項1から7のいずれかに記載のデコーダ。 - 複数のペイロードデータタイプが、多チャネルサイド情報タイプおよび多オブジェクト符号化サイド情報タイプを含み、
デコーダが、コンフィギュレーションブロック(28)を読み出す上で、フレーム要素の少なくとも1つのシーケンスの各々について、
拡張要素タイプフィールド(72)が、多チャネルサイド情報タイプを表示する場合、 ビットストリーム(12)からコンフィギュレーション情報の一部として多チャネルサイド情報コンフィギュレーションデータ(74)を読み出し、かつ拡張要素タイプフィールド(72)が多オブジェクトサイド情報タイプを表示する場合には、ビットストリームからのコンフィギュレーショ情報の一部として多オブジェクトサイド情報コンフィギュレーションデータ(74)を読み出すよう構成され、
デコーダが、各フレームを復号化する上で、
それについてコンフィギュレーション要素(56)の拡張要素タイプが多チャネルサイド情報タイプを表示するフレーム要素の少なくとも1つのシーケンスのいずれかのフレーム要素を、多チャネルサイド情報コンフィギュレーションデータ(74)を使用して多チャネルデコーダ(44e)を構成し、かつこうして構成された多チャネルデコーダ(44e)に、多チャネルサイド情報として、フレーム要素のそれぞれのシーケンスのフレーム要素(22b)のペイロードデータ(68)をフィードすることにより復号化し、かつ
それについてコンフィギュレーション要素(56)の拡張要素タイプが多オブジェクトサイド情報タイプを表示するフレーム要素の少なくとも1つのシーケンスのいずれかのフレーム要素を、多オブジェクトサイド情報コンフィギュレーションデータ(74)を使用して多オブジェクトデコーダ(44d)を構成しかつこうして構成した多オブジェクトデコーダ(44d)にフレーム要素のそれぞれのシーケンスのフレーム要素(22)のペイロードデータ(68)をフィードすることにより復号化するよう構成される、請求項8に記載のデコーダ。 - デコーダが、フレーム要素の少なくとも1つのシーケンスのいずれかについて、
フレーム要素のそれぞれのシーケンスについてのコンフィギュレーション要素のコンフィギュレーション情報の一部として、ビットストリーム(12)からコンフィギュレーションデータ長さフィード(76)を読み出し、
フレーム要素のそれぞれのシーケンスについて、コンフィギュレーション要素のコンフィギュレーション情報の拡張要素タイプフィールド(72)により表示されるペイロードデータタイプが、複数のペイロードデータタイプのサブセットであるペイロードタイプの予め定められたセットに属するかどうかをチェックし、
フレーム要素のそれぞれのシーケンスについてのコンフィギュレーション要素のコンフィギュレーション情報の拡張要素タイプフィールド(72)により表示されるペイロードデータタイプが、ペイロードデータタイプの予め定められたセットに属する場合、
ビットストリーム(12)からフレーム要素のそれぞれのシーケンスについてのコンフィギュレーション要素のコンフィギュレーション情報の一部としてペイロードデータ依存のコンフィギュレーションデータ(74)を読み出し、かつ
ペイロードデータ依存のコンフィギュレーションデータ(74)を使用して、フレーム(20)におけるフレーム要素のそれぞれのシーケンスのフレーム要素を復号化し、かつ
フレーム要素のそれぞれのシーケンスについてのコンフィギュレーション要素のコンフィギュレーション情報の拡張要素タイプフィールド(72)により表示されるペイロードデータタイプが、ペイロードデータタイプの予め定められたセットに属していない場合、
コンフィギュレーションデータ長さを使用してペイロードデータ依存のコンフィギュレーションデータ(74)をスキップし、かつ
内部の長さ情報(58)を使用してフレーム(20)内のフレーム要素のそれぞれのシーケンスのフレーム要素をスキップするよう構成される、請求項8または9に記載のデコーダ。 - デコーダが、フレーム要素の少なくとも1つのシーケンスの各々について、コンフィギュレーションブロック(28)を読み出す上で、
ビットストリーム(12)からの拡張要素タイプのコンフィギュレーション情報を含むコンフィギュレーション要素(56)を読み出すよう構成され、コンフィギュレーション情報が、フラグメンテーション使用フラグ(78)を含み、
デコーダが、それについてコンフィギュレーション要素のフラグメンテーション使用フラグ(78)が設定されているフレーム要素のいずれかのシーケンスのフレーム要素(22)を読み出す上で、
ビットストリームからフラグメント情報を読み出し、かつ
連続するフレームのこれらのフレーム要素のペイロードデータを結合させるようフラグメント情報を使用するよう構成される、請求項1から10のいずれかに記載のデコーダ。 - 単一チャネル要素タイプであるフレーム要素のシーケンスのサブセットの1つのフレーム要素(22)からオーディオ信号を再構成するように、デコーダが構成される、請求項1から11のいずれかに記載のデコーダ。
- チャネル対要素タイプであるフレーム要素のシーケンスのサブセットの1つのフレーム要素(22)からオーディオ信号を再構成するように、デコーダが構成される、請求項1から12のいずれかに記載のデコーダ。
- デコーダが、長さ情報(80)、拡張要素タイプフィールド(72)およびコンフィギュレーションデータ長フィールド(76)を読み出すために同じ可変長コードを使用するよう構成される、請求項1から13のいずれかに記載のデコーダ。
- オーディオコンテントをビットストリームに符号化するためのエンコーダであって、エンコーダが、
オーディオコンテント(10)の連続する期間(18)を、それぞれがオーディオコンテント(10)の連続する期間(18)を表すフレーム(20)のシーケンスに符号化し、それにより、フレーム(20)のシーケンスがフレーム要素(22)のN個のシーケンスから構成され、各フレーム(20)がそれぞれフレーム要素(22)のN個のシーケンスからの1つのフレーム要素(22)を含むように、かつフレーム要素(22)の各シーケンスについて、フレーム要素(22)が相互に等しい要素タイプになるよう、各フレーム要素(22)が複数の要素タイプのうちのそれぞれの1つであり、かつ
フレーム要素(22)のシーケンスの少なくとも1つについて、デフォルトペイロード長さに関するデフォルトペイロード長さ情報(60)を含むコンフィギュレーションブロック(28)をビットストリーム(12)に符号化し、
フレーム要素(22)のシーケンスの少なくとも1つのフレーム要素(22)の少なくともサブセットについて、デフォルトペイロード長さフラグ(64)を含み、デフォルトペイロード長さフラグ(64)が設定されていない場合は、ペイロード長さ値(66)が後に続くように、かつ
そのデフォルトペイロード長さフラグ(64)が設定されているフレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素が、デフォルトペイロード長さを有するように、そのデフォルトペイロード長さフラグ(64)が設定されていないフレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素がペイロード長さ値(66)に対応するペイロード長さを有するように、フレーム要素(22)のシーケンスの少なくとも1つの各フレーム要素(22)をビットストリーム(12)に符号化するよう構成される、エンコーダ。 - コンフィギュレーションブロック(28)と、それぞれがオーディオコンテントの連続する期間を表すフレーム(20)のシーケンスとを含むビットストリームを復号化する方法であって、
フレーム(20)のシーケンスが、フレーム要素(22)のN個のシーケンスからなる構成であり、各フレーム(20)が、それぞれフレーム要素(22)のN個のシーケンスからの1つのフレーム要素(22)を含むように、かつフレーム要素(22)の各シーケンスについて、フレーム要素(22)が相互に等しい要素タイプになるように、各フレーム要素(22)が、複数の要素タイプのうちのそれぞれの1つであり、当該方法がコンピ ュータまたはハードウェア装置によって実行され、
方法が、ビットストリーム(12)を構文解析し、かつ、フレーム要素のシーケンスのサブセットに基づき、かつ、フレーム要素のシーケンスのサブセットに属していないフレーム要素(22)のシーケンスの少なくとも1つのフレームに関してオーディオコンテントを再構成するステップと、
フレーム要素(22)のシーケンスの少なくとも1つについて、デフォルトペイロード長さに関するデフォルトペイロード長さ情報(60)をコンフィギュレーションブロック(28)から読み出すステップと、
フレーム要素(22)のシーケンスの少なくとも1つの各フレーム要素(22)について、ビットストリーム(12)から長さ情報を読み出すステップとを含み、長さ情報を読み出すステップが、フレーム要素(22)のシーケンスの少なくとも1つのフレーム要素(22)の少なくともサブセットについて、デフォルトペイロード長さフラグ(64)を読み出すステップを含み、デフォルトペイロード長さフラグ(64)が設定されていない場合には、ペイロード長さ値(66)を読み出すステップが後に続き、
さらに、ビットストリーム(12)を構文解析する上で、そのデフォルトペイロード長さフラグ(64)が設定されているフレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素を、デフォルトペイロード長さをスキップインターバル長さとして使用して、スキップし、かつそのデフォルトペイロード長さフラグ(64)が設定されていないフレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素を、ペイロード長さ値(66)に対応するペイロード長さをスキップインターバル長さとして使用して、スキップするステップを含む、方法。 - オーディオコンテントをビットストリームに符号化するための方法であって、
当該方法がコンピュータまたはハードウェア装置によって実行され、
方法が、オーディオコンテント(10)の連続する期間(18)をそれぞれがオーディオコンテント(10)の連続する期間(18)を表すフレーム(20)のシーケンスに符号化するステップを含み、それによりフレーム(20)のシーケンスが、フレーム要素(22)のN個のシーケンスの構成となり、各フレーム(20)が、それぞれフレーム要素(22)のN個のシーケンスからの1つのフレーム要素(22)を含むように、かつフレーム要素(22)の各シーケンスについて、フレーム要素(22)が、相互に等しい要素タイプになるように、各フレーム要素(22)が複数の要素タイプのうちのそれぞれの1つのタイプであり、
さらに、フレーム要素(22)のシーケンスの少なくとも1つについて、デフォルトペイロード長さに関するデフォルトペイロード長さ情報(60)を含むコンフィギュレーションブロック(28)をビットストリーム(12)に符号化するステップと、
フレーム要素(22)のシーケンスの少なくとも1つのフレーム要素(22)の少なくともサブセットについて、デフォルトペイロード長さフラグ(64)を含む長さ情報(58)を含み、デフォルトペイロード長さフラグ(64)が設定されていない場合は、ペイロード長さ値(66)が後に続き、かつそのデフォルトペイロード長さフラグ(64)が設定されているフレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素がデフォルトペイロード長さを有し、かつそのデフォルトペイロード長さフラグ(64)が設定されていないフレーム要素(22)のシーケンスの少なくとも1つのいずれかのフレーム要素が、ペイロード長さ値(66)に対応するペイロード長さを有するように、フレーム要素(22)のシーケンスの少なくとも1つの各フレーム要素(22)をビットストリーム(12)に符号化するステップとを含む、方法。 - コンピュータで実行した際に、請求項16に記載の方法を実行するためのコンピュータプログラム。
- コンピュータで実行した際に、請求項17に記載の方法を実行するためのコンピュータ プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161454121P | 2011-03-18 | 2011-03-18 | |
US61/454,121 | 2011-03-18 | ||
PCT/EP2012/054823 WO2012126893A1 (en) | 2011-03-18 | 2012-03-19 | Frame element length transmission in audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014510310A JP2014510310A (ja) | 2014-04-24 |
JP6007196B2 true JP6007196B2 (ja) | 2016-10-12 |
Family
ID=45992196
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013558472A Active JP6007196B2 (ja) | 2011-03-18 | 2012-03-19 | オーディオ符号化におけるフレーム要素長さの伝送 |
JP2013558468A Active JP5805796B2 (ja) | 2011-03-18 | 2012-03-19 | 柔軟なコンフィギュレーション機能性を有するオーディオエンコーダおよびデコーダ |
JP2013558471A Active JP5820487B2 (ja) | 2011-03-18 | 2012-03-19 | オーディオコンテントを表すビットストリームのフレームにおけるフレーム要素位置決め |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013558468A Active JP5805796B2 (ja) | 2011-03-18 | 2012-03-19 | 柔軟なコンフィギュレーション機能性を有するオーディオエンコーダおよびデコーダ |
JP2013558471A Active JP5820487B2 (ja) | 2011-03-18 | 2012-03-19 | オーディオコンテントを表すビットストリームのフレームにおけるフレーム要素位置決め |
Country Status (16)
Country | Link |
---|---|
US (5) | US9524722B2 (ja) |
EP (3) | EP2686849A1 (ja) |
JP (3) | JP6007196B2 (ja) |
KR (7) | KR101748760B1 (ja) |
CN (5) | CN107342091B (ja) |
AR (3) | AR088777A1 (ja) |
AU (5) | AU2012230440C1 (ja) |
BR (2) | BR112013023949A2 (ja) |
CA (3) | CA2830439C (ja) |
HK (1) | HK1245491A1 (ja) |
MX (3) | MX2013010535A (ja) |
MY (2) | MY167957A (ja) |
RU (2) | RU2589399C2 (ja) |
SG (2) | SG193525A1 (ja) |
TW (3) | TWI480860B (ja) |
WO (3) | WO2012126891A1 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4372742A2 (en) * | 2010-07-08 | 2024-05-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coder using forward aliasing cancellation |
JP6100164B2 (ja) * | 2010-10-06 | 2017-03-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 |
CN103918029B (zh) * | 2011-11-11 | 2016-01-20 | 杜比国际公司 | 使用过采样谱带复制的上采样 |
CN108806706B (zh) * | 2013-01-15 | 2022-11-15 | 韩国电子通信研究院 | 处理信道信号的编码/解码装置及方法 |
WO2014112793A1 (ko) * | 2013-01-15 | 2014-07-24 | 한국전자통신연구원 | 채널 신호를 처리하는 부호화/복호화 장치 및 방법 |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
IN2015MN01952A (ja) | 2013-02-14 | 2015-08-28 | Dolby Lab Licensing Corp | |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
JP6250071B2 (ja) | 2013-02-21 | 2017-12-20 | ドルビー・インターナショナル・アーベー | パラメトリック・マルチチャネル・エンコードのための方法 |
CN108806704B (zh) | 2013-04-19 | 2023-06-06 | 韩国电子通信研究院 | 多信道音频信号处理装置及方法 |
CN103336747B (zh) * | 2013-07-05 | 2015-09-09 | 哈尔滨工业大学 | VxWorks操作系统下CPCI总线数字量输入与开关量输出可配置驱动器及驱动方法 |
EP2830058A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
TWI671734B (zh) | 2013-09-12 | 2019-09-11 | 瑞典商杜比國際公司 | 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統 |
KR102329309B1 (ko) | 2013-09-12 | 2021-11-19 | 돌비 인터네셔널 에이비 | Qmf 기반 처리 데이터의 시간 정렬 |
EP2928216A1 (en) | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
US9847804B2 (en) * | 2014-04-30 | 2017-12-19 | Skyworks Solutions, Inc. | Bypass path loss reduction |
EP3258467B1 (en) * | 2015-02-10 | 2019-09-18 | Sony Corporation | Transmission and reception of audio streams |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
WO2016142380A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Fragment-aligned audio coding |
TWI758146B (zh) * | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI732403B (zh) * | 2015-03-13 | 2021-07-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
KR20240050483A (ko) * | 2015-06-17 | 2024-04-18 | 삼성전자주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
KR102627374B1 (ko) * | 2015-06-17 | 2024-01-19 | 삼성전자주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
WO2016204579A1 (ko) * | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
CN107787584B (zh) * | 2015-06-17 | 2020-07-24 | 三星电子株式会社 | 处理低复杂度格式转换的内部声道的方法和装置 |
US10008214B2 (en) * | 2015-09-11 | 2018-06-26 | Electronics And Telecommunications Research Institute | USAC audio signal encoding/decoding apparatus and method for digital radio services |
CA3127805C (en) * | 2016-11-08 | 2023-12-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain |
CN116631416A (zh) | 2017-01-10 | 2023-08-22 | 弗劳恩霍夫应用研究促进协会 | 音频解码器、提供解码的音频信号的方法、和计算机程序 |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
AU2018308668A1 (en) * | 2017-07-28 | 2020-02-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
US11032580B2 (en) | 2017-12-18 | 2021-06-08 | Dish Network L.L.C. | Systems and methods for facilitating a personalized viewing experience |
BR112020012654A2 (pt) * | 2017-12-19 | 2020-12-01 | Dolby International Ab | métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf |
TWI812658B (zh) | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
TWI834582B (zh) * | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
US10365885B1 (en) | 2018-02-21 | 2019-07-30 | Sling Media Pvt. Ltd. | Systems and methods for composition of audio content from multi-object audio |
CN110505425B (zh) * | 2018-05-18 | 2021-12-24 | 杭州海康威视数字技术股份有限公司 | 一种解码方法、解码装置、电子设备和可读存储介质 |
CA3091150A1 (en) * | 2018-07-02 | 2020-01-09 | Dolby Laboratories Licensing Corporation | Methods and devices for encoding and/or decoding immersive audio signals |
US11081116B2 (en) * | 2018-07-03 | 2021-08-03 | Qualcomm Incorporated | Embedding enhanced audio transports in backward compatible audio bitstreams |
CN109448741B (zh) * | 2018-11-22 | 2021-05-11 | 广州广晟数码技术有限公司 | 一种3d音频编码、解码方法及装置 |
EP3761654A1 (en) * | 2019-07-04 | 2021-01-06 | THEO Technologies | Media streaming |
KR102594160B1 (ko) * | 2019-11-29 | 2023-10-26 | 한국전자통신연구원 | 필터뱅크를 이용한 오디오 신호 부호화/복호화 장치 및 방법 |
TWI772099B (zh) * | 2020-09-23 | 2022-07-21 | 瑞鼎科技股份有限公司 | 應用於有機發光二極體顯示器之亮度補償方法 |
CN112422987B (zh) * | 2020-10-26 | 2022-02-22 | 眸芯科技(上海)有限公司 | 适用于avc的熵解码硬件并行计算方法及应用 |
US11659330B2 (en) * | 2021-04-13 | 2023-05-23 | Spatialx Inc. | Adaptive structured rendering of audio channels |
Family Cites Families (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09146596A (ja) * | 1995-11-21 | 1997-06-06 | Japan Radio Co Ltd | 音声信号合成方法 |
US6256487B1 (en) | 1998-09-01 | 2001-07-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Multiple mode transmitter using multiple speech/channel coding modes wherein the coding mode is conveyed to the receiver with the transmitted signal |
US7266501B2 (en) * | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
FI120125B (fi) * | 2000-08-21 | 2009-06-30 | Nokia Corp | Kuvankoodaus |
KR20040036948A (ko) * | 2001-09-18 | 2004-05-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 비디오 부호화 및 복호 방법과, 대응하는 신호 |
US7054807B2 (en) * | 2002-11-08 | 2006-05-30 | Motorola, Inc. | Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters |
EP1427252A1 (en) * | 2002-12-02 | 2004-06-09 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for processing audio signals from a bitstream |
WO2004059643A1 (en) | 2002-12-28 | 2004-07-15 | Samsung Electronics Co., Ltd. | Method and apparatus for mixing audio stream and information storage medium |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7684521B2 (en) * | 2004-02-04 | 2010-03-23 | Broadcom Corporation | Apparatus and method for hybrid decoding |
US7516064B2 (en) | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
US8131134B2 (en) * | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
CA2566368A1 (en) * | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
DE102005014477A1 (de) * | 2005-03-30 | 2006-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung |
KR101271069B1 (ko) | 2005-03-30 | 2013-06-04 | 돌비 인터네셔널 에이비 | 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법 |
JP4988716B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
EP1905002B1 (en) | 2005-05-26 | 2013-05-22 | LG Electronics Inc. | Method and apparatus for decoding audio signal |
JP2008542816A (ja) * | 2005-05-26 | 2008-11-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の符号化及び復号化方法 |
US8050915B2 (en) * | 2005-07-11 | 2011-11-01 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding |
RU2380767C2 (ru) | 2005-09-14 | 2010-01-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для декодирования аудиосигнала |
EP2555187B1 (en) * | 2005-10-12 | 2016-12-07 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding audio data and extension data |
BRPI0706488A2 (pt) | 2006-02-23 | 2011-03-29 | Lg Electronics Inc | método e aparelho para processar sinal de áudio |
KR100917843B1 (ko) | 2006-09-29 | 2009-09-18 | 한국전자통신연구원 | 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법 |
WO2008046530A2 (en) | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
CN101197703B (zh) | 2006-12-08 | 2011-05-04 | 华为技术有限公司 | 对Zigbee网络进行管理的方法及系统及设备 |
DE102007007830A1 (de) * | 2007-02-16 | 2008-08-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms |
DE102007018484B4 (de) * | 2007-03-20 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen |
JP5686594B2 (ja) * | 2007-04-12 | 2015-03-18 | トムソン ライセンシングThomson Licensing | スケーラブル・ビデオ符号化のためのビデオ・ユーザビリティ情報(vui)用の方法及び装置 |
US7778839B2 (en) * | 2007-04-27 | 2010-08-17 | Sony Ericsson Mobile Communications Ab | Method and apparatus for processing encoded audio data |
KR20090004778A (ko) * | 2007-07-05 | 2009-01-12 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP2242047B1 (en) * | 2008-01-09 | 2017-03-15 | LG Electronics Inc. | Method and apparatus for identifying frame type |
KR101461685B1 (ko) | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
EP2301019B1 (en) * | 2008-07-11 | 2017-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and audio decoder |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
MX2011000370A (es) * | 2008-07-11 | 2011-03-15 | Fraunhofer Ges Forschung | Un aparato y un metodo para decodificar una señal de audio codificada. |
MX2011000382A (es) | 2008-07-11 | 2011-02-25 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion. |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
WO2010036059A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
EP2169665B1 (en) * | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
KR20100035121A (ko) * | 2008-09-25 | 2010-04-02 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
WO2010053287A2 (en) * | 2008-11-04 | 2010-05-14 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101751925B (zh) * | 2008-12-10 | 2011-12-21 | 华为技术有限公司 | 一种语音解码方法及装置 |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
CA2750795C (en) | 2009-01-28 | 2015-05-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
KR20100089772A (ko) * | 2009-02-03 | 2010-08-12 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
KR20100090962A (ko) * | 2009-02-09 | 2010-08-18 | 주식회사 코아로직 | 멀티채널 오디오 디코더, 그 디코더를 포함한 송수신 장치 및 멀티채널 오디오 디코딩 방법 |
US8780999B2 (en) * | 2009-06-12 | 2014-07-15 | Qualcomm Incorporated | Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems |
US8411746B2 (en) * | 2009-06-12 | 2013-04-02 | Qualcomm Incorporated | Multiview video coding over MPEG-2 systems |
EP2446539B1 (en) | 2009-06-23 | 2018-04-11 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
WO2011010876A2 (ko) * | 2009-07-24 | 2011-01-27 | 한국전자통신연구원 | Mdct 프레임과 이종의 프레임 연결을 위한 윈도우 처리 방법 및 장치, 이를 이용한 부호화/복호화 장치 및 방법 |
-
2012
- 2012-03-19 KR KR1020137027430A patent/KR101748760B1/ko active IP Right Grant
- 2012-03-19 MX MX2013010535A patent/MX2013010535A/es unknown
- 2012-03-19 RU RU2013146530/08A patent/RU2589399C2/ru active
- 2012-03-19 CN CN201710422449.0A patent/CN107342091B/zh active Active
- 2012-03-19 MX MX2013010537A patent/MX2013010537A/es unknown
- 2012-03-19 AU AU2012230440A patent/AU2012230440C1/en active Active
- 2012-03-19 WO PCT/EP2012/054821 patent/WO2012126891A1/en active Application Filing
- 2012-03-19 TW TW101109346A patent/TWI480860B/zh active
- 2012-03-19 WO PCT/EP2012/054749 patent/WO2012126866A1/en active Application Filing
- 2012-03-19 SG SG2013070206A patent/SG193525A1/en unknown
- 2012-03-19 KR KR1020167011886A patent/KR101742136B1/ko active IP Right Grant
- 2012-03-19 BR BR112013023949-2A patent/BR112013023949A2/pt not_active Application Discontinuation
- 2012-03-19 CA CA2830439A patent/CA2830439C/en active Active
- 2012-03-19 TW TW101109344A patent/TWI488178B/zh active
- 2012-03-19 KR KR1020137027429A patent/KR101712470B1/ko active IP Right Grant
- 2012-03-19 CA CA2830631A patent/CA2830631C/en active Active
- 2012-03-19 TW TW101109343A patent/TWI571863B/zh active
- 2012-03-19 MY MYPI2013701690A patent/MY167957A/en unknown
- 2012-03-19 AU AU2012230442A patent/AU2012230442B2/en active Active
- 2012-03-19 EP EP12715632.1A patent/EP2686849A1/en not_active Ceased
- 2012-03-19 SG SG2013077045A patent/SG194199A1/en unknown
- 2012-03-19 KR KR1020137027431A patent/KR101767175B1/ko active IP Right Grant
- 2012-03-19 MY MYPI2013701687A patent/MY163427A/en unknown
- 2012-03-19 CN CN201280023577.3A patent/CN103562994B/zh active Active
- 2012-03-19 JP JP2013558472A patent/JP6007196B2/ja active Active
- 2012-03-19 CA CA2830633A patent/CA2830633C/en active Active
- 2012-03-19 AR ARP120100900A patent/AR088777A1/es active IP Right Grant
- 2012-03-19 EP EP12715631.3A patent/EP2686848A1/en not_active Ceased
- 2012-03-19 MX MX2013010536A patent/MX2013010536A/es active IP Right Grant
- 2012-03-19 CN CN201280023527.5A patent/CN103703511B/zh active Active
- 2012-03-19 KR KR1020167012032A patent/KR101854300B1/ko active IP Right Grant
- 2012-03-19 BR BR112013023945A patent/BR112013023945A2/pt active Search and Examination
- 2012-03-19 CN CN201280023547.2A patent/CN103620679B/zh active Active
- 2012-03-19 RU RU2013146528/08A patent/RU2571388C2/ru active
- 2012-03-19 WO PCT/EP2012/054823 patent/WO2012126893A1/en active Application Filing
- 2012-03-19 AR ARP120100898A patent/AR085445A1/es active IP Right Grant
- 2012-03-19 EP EP12715627.1A patent/EP2686847A1/en not_active Ceased
- 2012-03-19 JP JP2013558468A patent/JP5805796B2/ja active Active
- 2012-03-19 KR KR1020167011885A patent/KR101742135B1/ko active IP Right Grant
- 2012-03-19 KR KR1020167011887A patent/KR101748756B1/ko active IP Right Grant
- 2012-03-19 CN CN201710619659.9A patent/CN107516532B/zh active Active
- 2012-03-19 JP JP2013558471A patent/JP5820487B2/ja active Active
- 2012-03-19 AR ARP120100899A patent/AR085446A1/es active IP Right Grant
-
2013
- 2013-09-17 US US14/029,073 patent/US9524722B2/en active Active
- 2013-09-17 US US14/029,054 patent/US9773503B2/en active Active
- 2013-09-17 US US14/029,058 patent/US9779737B2/en active Active
-
2016
- 2016-05-25 AU AU2016203419A patent/AU2016203419B2/en active Active
- 2016-05-25 AU AU2016203417A patent/AU2016203417B2/en active Active
- 2016-05-25 AU AU2016203416A patent/AU2016203416B2/en active Active
-
2017
- 2017-06-05 US US15/613,484 patent/US9972331B2/en active Active
-
2018
- 2018-04-09 HK HK18104576.4A patent/HK1245491A1/zh unknown
- 2018-04-11 US US15/950,295 patent/US10290306B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6007196B2 (ja) | オーディオ符号化におけるフレーム要素長さの伝送 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140930 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20141222 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20141225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150908 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20151106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160912 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6007196 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |