JP6922017B2 - オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 - Google Patents
オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 Download PDFInfo
- Publication number
- JP6922017B2 JP6922017B2 JP2020035668A JP2020035668A JP6922017B2 JP 6922017 B2 JP6922017 B2 JP 6922017B2 JP 2020035668 A JP2020035668 A JP 2020035668A JP 2020035668 A JP2020035668 A JP 2020035668A JP 6922017 B2 JP6922017 B2 JP 6922017B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- bitstream
- spectral band
- band replication
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 118
- 230000003595 spectral effect Effects 0.000 claims description 144
- 230000010076 replication Effects 0.000 claims description 124
- 238000000034 method Methods 0.000 claims description 45
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 238000012805 post-processing Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 7
- 238000007493 shaping process Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000017105 transposition Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereophonic System (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本願は2015年3月13日に出願された欧州特許出願第15159067.6号および16年3月16日に出願された米国仮出願第62/133,800号の優先権を主張するものである。各文献の内容は参照によってその全体において組み込まれる。
技術分野
本発明は、オーディオ信号処理に関する。いくつかの実施形態はオーディオ・ビットストリーム(たとえばMPEG-4 AACフォーマットをもつビットストリーム)のエンコードおよびデコードに関する。他の実施形態は、そのようなビットストリームの、eSBR処理を実行するよう構成されておらずそのようなメタデータを無視するレガシー・デコーダによるデコードに関し、あるいはそのようなメタデータを含まないオーディオ・ビットストリームのデコードに関し、それは該ビットストリームに応答してeSBR制御データを生成することによることを含む。
MPEG-4 AAC規格は、エンコードされたMPEG-4 AACビットストリームが、該ビットストリームのオーディオ・コンテンツをデコードするためにデコーダによって適用されるべき(もし適用されるべきものがあるとして)SBR処理のそれぞれの型を示すおよび/またはそのようなSBR処理を制御するおよび/または該ビットストリームのオーディオ・コンテンツをデコードするために用いられるべき少なくとも一つのSBRツールの少なくとも一つの特性またはパラメータを示すメタデータを含むことを考えている。ここで、MPEG-4 AAC規格で記述または言及されているこの型のメタデータを表わすために「SBRメタデータ」という表現を使う。
・高調波転換;
・QMFパッチング追加的前処理(前置平坦化(pre-flattening));および
・サブバンド・サンプル間時間包絡整形(Temporal Envelope Shaping)または「インターTES」。
たとえば、ビットストリームに含まれるeSBRメタデータは、(MPEG USAC規格および本開示において記述される)パラメータ:harmonicSBR[ch]、sbrPatchingMode[ch]、sbrOversamplingFlag[ch]、sbrPitchInBins[ch]、sbrPitchInBins[ch]、bs_interTes、bs_temp_shape[ch][env]、bs_inter_temp_shape_mode[ch][env]およびbs_sbr_preprocessingの値を示してもよい。
・(eSBRメタデータを含めることに起因する)ビットレート・ペナルティーは、eSBR処理を実行するために必要とされる差分の制御データだけが伝送される(SBR制御データのサイマルキャストではない)ので、全ビットレートの非常に小さな割合であること;
・SBRに関係した制御情報のチューニングは典型的には転換の詳細には依存しないこと;および
・(eSBR処理の間に用いられる)インターTESツールは、転換された信号のシングルエンドの後処理を実行すること。
エンコードされたオーディオ・ビットストリームの少なくとも一つのブロック(たとえばMPEG-4 AACビットストリームの少なくとも一つのブロック)を記憶するよう構成されたメモリ(たとえば図3または図4のバッファ201)と;
前記メモリに結合され、前記ビットストリームの前記ブロックの少なくとも一部を多重分離するよう構成されているビットストリーム・ペイロード・フォーマット解除器(たとえば、図3の要素205または図4の要素215)と;
前記ビットストリームの前記ブロックのオーディオ・コンテンツの少なくとも一つの部分をデコードするよう結合され、構成されたデコード・サブシステム(たとえば図3の要素202および203または図4の要素202および213)とを有し、前記ブロックは、
充填要素を含み、該充填要素の先頭を示す識別子(たとえば、MPEG-4 AAC規格の表4.85の値0x6をもつid_syn_ele識別子)と、該識別子後の充填データとを含み、前記充填データは:
前記ブロックのオーディオ・コンテンツに対して(たとえば前記ブロックに含まれるスペクトル帯域複製データおよびeSBRメタデータを使って)向上スペクトル帯域複製(eSBR)処理が実行されるべきかどうかを同定する少なくとも一つのフラグを含む、
オーディオ処理ユニットである。
●高調波転換(16kbps、14400/28800Hz)
○DFTベース:3.68WMOPS(weighted million operations per second[加重百万演算毎秒]);
○WMFベース:0.98WMOPS;
●QMFパッチング前処理(前置平坦化):0.1WMOPS;
●サブバンド・サンプル間時間的包絡整形(インターTES):高々0.16WMOPS
過渡成分については、DFTベースの転換が典型的にはQMFベースの転換よりよい性能を発揮することがわかっている。
1.上記の一ビットのメタデータ・パラメータharmonicSBR;bs_interTES;およびbs_sbr_preprocessing;
2.デコードされるべきエンコードされたビットストリームのオーディオ・コンテンツの各チャネル(「ch」)について、上記のパラメータ:sbrPatchingMode[ch];sbrOversamplingFlag[ch];sbrPitchInBinsFlag[ch];およびsbrPitchInBins[ch]のそれぞれ;および
3.デコードされるべきエンコードされたビットストリームのオーディオ・コンテンツの各チャネル(「ch」)の各SBR包絡(「env」)について、上記のパラメータ:bs_temp_shape[ch][env];およびbs_inter_temp_shape_mode[ch][env]のそれぞれ。
〔態様1〕
エンコードされたオーディオ・ビットストリームの少なくとも一つのブロックを記憶するよう構成されたバッファと;
前記バッファに結合され、前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックの少なくとも一部を多重分離するよう構成されたビットストリーム・ペイロード・フォーマット解除器と;
前記ビットストリーム・ペイロード・フォーマット解除器に結合され、前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックの少なくとも一部をデコードするよう構成されたデコード・サブシステムとを有するオーディオ処理ユニットであって、前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックは:
充填要素を含み、該充填要素は、該充填要素の先頭を示す識別子と、該識別子の後の充填データとをもち、前記充填データは:
前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックのオーディオ・コンテンツに対して基本形のスペクトル帯域複製または向上された形のスペクトル帯域複製のどちらが実行されるべきかどうかを同定する少なくとも一つのフラグを含む、
オーディオ処理ユニット。
〔態様2〕
前記基本形のスペクトル帯域複製はスペクトル・パッチングを含み、前記向上された形のスペクトル帯域複製は高調波転換を含み、前記充填データはさらに向上スペクトル帯域複製メタデータを含み、前記向上スペクトル帯域複製メタデータは、スペクトル・パッチングおよび高調波転換両方のために使われる一つまたは複数のパラメータを含まない、態様1記載のオーディオ処理ユニット。
〔態様3〕
スペクトル・パッチングおよび高調波転換両方のために使われる前記一つまたは複数のパラメータが、充填要素の拡張ペイロードに含まれる、態様2記載のオーディオ処理ユニット。
〔態様4〕
スペクトル・パッチングおよび高調波転換両方のために使われる前記一つまたは複数のパラメータが、マスター周波数帯域テーブルを定義する一つまたは複数のパラメータを含む、態様2または3記載のオーディオ処理ユニット。
〔態様5〕
スペクトル・パッチングおよび高調波転換両方のために使われる前記一つまたは複数のパラメータが、包絡スケール因子またはノイズ・フロア・スケール因子を含む、態様2または3記載のオーディオ処理ユニット。
〔態様6〕
当該オーディオ処理ユニットがオーディオ・デコーダであり、前記識別子が、0x6の値をもつ、三ビットの、最上位ビットが最初に伝送される符号なし整数である、態様1ないし5のうちいずれか一項記載のオーディオ処理ユニット。
〔態様7〕
前記充填データが拡張ペイロードを含み、前記拡張ペイロードがスペクトル帯域複製拡張データを含み、前記拡張ペイロードは、「1101」または「1110」の値をもつ、四ビットの、最上位ビットが最初に伝送される符号なし整数を用いて同定され、任意的には、
前記スペクトル帯域複製拡張データは:
任意的なスペクトル帯域複製ヘッダ、
前記ヘッダの後のスペクトル帯域複製データおよび
前記スペクトル帯域複製データの後のスペクトル帯域複製拡張要素を含み、前記第一のフラグは、前記スペクトル帯域複製拡張要素に含まれる、
態様1ないし6のうちいずれか一項記載のオーディオ処理ユニット。
〔態様8〕
前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックは、第一の充填要素および第二の充填要素を含み、前記第一の充填要素にはスペクトル帯域複製データが含まれ、前記第二の充填要素には前記第一のフラグが含まれるが、スペクトル帯域複製データは含まれない、態様1ないし7のうちいずれか一項記載のオーディオ処理ユニット。
〔態様9〕
前記向上された形のスペクトル帯域複製処理は高調波転換を含み、前記基本形のスペクトル帯域複製処理はスペクトル・パッチングを含み、前記第一のフラグの一つの値は、前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックのオーディオ・コンテンツに対して前記向上された形のスペクトル帯域複製処理が実行されるべきであることを示し、前記第一のフラグの別の値は、前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックのオーディオ・コンテンツに対してスペクトル・パッチングが実行されるべきであるが前記高調波転換は実行されるべきではないことを示す、態様1ないし8のうちいずれか一項記載のオーディオ処理ユニット。
〔態様10〕
前記スペクトル帯域複製拡張要素が、前記第一のフラグ以外の向上スペクトル帯域複製メタデータを含み、前記向上スペクトル帯域複製メタデータが前置平坦化を実行するかどうかを示すパラメータを含む、態様7記載のオーディオ処理ユニット。
〔態様11〕
前記スペクトル帯域複製拡張要素が、前記第一のフラグ以外の向上スペクトル帯域複製メタデータを含み、前記向上スペクトル帯域複製メタデータがサブバンド・サンプル間時間的包絡整形を実行するかどうかを示すパラメータを含む、態様7記載のオーディオ処理ユニット。
〔態様12〕
前記第一のフラグを使って向上スペクトル帯域複製処理を実行するよう構成された向上スペクトル帯域複製処理サブシステムをさらに有する、態様1ないし11のうちいずれか一項記載のオーディオ処理ユニット。
〔態様13〕
前記少なくとも一つのフラグが前記向上された形のスペクトル帯域複製処理を示す場合、第二のフラグが、信号適応的な周波数領域オーバーサンプリングが有効にされるか無効にされるかを同定する、態様1ないし12のうちいずれか一項記載のオーディオ処理ユニット。
〔態様14〕
エンコードされたオーディオ・ビットストリームをデコードする方法であって:
エンコードされたオーディオ・ビットストリームの少なくとも一つのブロックを受領する段階と;
前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックの少なくとも一部を多重分離する段階と;
前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックの少なくとも一部をデコードする段階とを含み、
前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックは:
充填要素を含み、該充填要素は、該充填要素の先頭を示す識別子と、該識別子の後の充填データとをもち、前記充填データは:
前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックのオーディオ・コンテンツに対して基本形のスペクトル帯域複製または向上された形のスペクトル帯域複製処理のどちらが実行されるべきかを同定する少なくとも一つのフラグを含む、
方法。
〔態様15〕
前記識別子が、0x6の値をもつ、三ビットの、最上位ビットが最初に伝送される符号なし整数である、態様14記載の方法。
〔態様16〕
前記基本形のスペクトル帯域複製はスペクトル・パッチングを含み、前記向上された形のスペクトル帯域複製は高調波転換を含み、前記充填データはさらに向上スペクトル帯域複製メタデータを含み、前記向上スペクトル帯域複製メタデータは、スペクトル・パッチングおよび高調波転換両方のために使われる一つまたは複数のパラメータを含まない、態様14または15記載の方法。
〔態様17〕
前記充填データが拡張ペイロードを含み、前記拡張ペイロードがスペクトル帯域複製拡張データを含み、前記拡張ペイロードは、「1101」または「1110」の値をもつ、四ビットの、最上位ビットが最初に伝送される符号なし整数を用いて同定され、任意的には、
前記スペクトル帯域複製拡張データは:
任意的なスペクトル帯域複製ヘッダ、
前記ヘッダの後のスペクトル帯域複製データおよび
前記スペクトル帯域複製データの後のスペクトル帯域複製拡張要素を含み、前記第一のフラグは、前記スペクトル帯域複製拡張要素に含まれる、
態様14ないし16のうちいずれか一項記載の方法。
〔態様18〕
前記向上された形のスペクトル帯域複製処理が高調波転換であり、前記基本形のスペクトル帯域複製はスペクトル・パッチングであり、前記第一のフラグのある値は前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックのオーディオ・コンテンツに対して前記向上された形のスペクトル帯域複製処理が実行されるべきであることを示し、前記第一のフラグの別の値は前記エンコードされたオーディオ・ビットストリームの前記少なくとも一つのブロックのオーディオ・コンテンツに対してスペクトル・パッチングが実行されるべきであるが前記高調波転換は実行されるべきではないことを示す、態様14ないし17のうちいずれか一項記載の方法。
〔態様19〕
前記スペクトル帯域複製拡張要素が、前記第一のフラグ以外の向上スペクトル帯域複製メタデータを含み、前記向上スペクトル帯域複製メタデータが前置平坦化を実行するかどうかを示すパラメータを含む、または、
前記スペクトル帯域複製拡張要素が、前記第一のフラグ以外の向上スペクトル帯域複製メタデータを含み、前記向上スペクトル帯域複製メタデータがサブバンド・サンプル間時間的包絡整形を実行するかどうかを示すパラメータを含む、
態様17または18記載の方法。
〔態様20〕
前記第一のフラグおよび前記第二のフラグを使って向上スペクトル帯域複製処理を実行する段階をさらに含み、前記向上スペクトル帯域複製は高調波転換を含む、態様14ないし19のうちいずれか一項記載の方法。
〔態様21〕
前記エンコードされたオーディオ・ビットストリームがMPEG-4 AACビットストリームである、態様14ないし20のうちいずれか一項記載の方法または態様1ないし8のうちいずれか一項記載のオーディオ処理ユニット。
Claims (8)
- エンコードされたオーディオ・ビットストリームをデコードするためのオーディオ処理ユニットであって、当該オーディオ処理ユニットは:
前記エンコードされたオーディオ・ビットストリームを多重分離するよう構成されたビットストリーム・ペイロード・フォーマット解除器と;
前記ビットストリーム・ペイロード・フォーマット解除器に結合され、前記エンコードされたオーディオ・ビットストリームをデコードするよう構成されたデコード・サブシステムとを有しており、前記エンコードされたオーディオ・ビットストリームは:
充填要素を含み、該充填要素は、該充填要素の先頭を示す識別子と、該識別子の後の充填データとをもち、前記充填データは:
前記エンコードされたオーディオ・ビットストリームのオーディオ・コンテンツに対して基本形のスペクトル帯域複製または向上された形のスペクトル帯域複製のどちらが実行されるべきかを同定する少なくとも一つのフラグを含み、
前記基本形のスペクトル帯域複製はスペクトル・パッチングを含み、前記向上された形のスペクトル帯域複製は高調波転換を含み、前記フラグの一つの値は、前記オーディオ・コンテンツに対して前記向上された形のスペクトル帯域複製が実行されるべきであることを示し、前記フラグの別の値は、前記オーディオ・コンテンツに対して前記基本形のスペクトル帯域複製が実行されるべきであるが前記高調波転換は実行されるべきではないことを示し、
前記少なくとも一つのフラグが、3に等しい値をもつbs_extension_idパラメータをもって識別される拡張ペイロードに含まれる、
オーディオ処理ユニット。 - 前記充填データはさらに向上スペクトル帯域複製メタデータを含む、請求項1記載のオーディオ処理ユニット。
- 前記向上スペクトル帯域複製メタデータが、前記拡張ペイロードに含まれる、請求項2記載のオーディオ処理ユニット。
- 前記向上スペクトル帯域複製メタデータが、マスター周波数帯域テーブルを定義する一つまたは複数のパラメータを含む、請求項2または3記載のオーディオ処理ユニット。
- 前記向上スペクトル帯域複製メタデータが、包絡スケール因子またはノイズ・フロア・スケール因子を含む、請求項2または3記載のオーディオ処理ユニット。
- エンコードされたオーディオ・ビットストリームをデコードする方法であって:
前記エンコードされたオーディオ・ビットストリームを多重分離する段階と;
前記エンコードされたオーディオ・ビットストリームをデコードする段階とを含み、
前記エンコードされたオーディオ・ビットストリームは:
充填要素を含み、該充填要素は、該充填要素の先頭を示す識別子と、該識別子の後の充填データとをもち、前記充填データは:
前記エンコードされたオーディオ・ビットストリームのオーディオ・コンテンツに対して基本形のスペクトル帯域複製または向上された形のスペクトル帯域複製のどちらが実行されるべきかを同定する少なくとも一つのフラグを含み、
前記基本形のスペクトル帯域複製はスペクトル・パッチングを含み、前記向上された形のスペクトル帯域複製は高調波転換を含み、前記フラグの一つの値は、前記オーディオ・コンテンツに対して前記向上された形のスペクトル帯域複製が実行されるべきであることを示し、前記フラグの別の値は、前記オーディオ・コンテンツに対して前記基本形のスペクトル帯域複製が実行されるべきであるが前記高調波転換は実行されるべきではないことを示し、
前記少なくとも一つのフラグが、3に等しい値をもつbs_extension_idパラメータをもって識別される拡張ペイロードに含まれる、
方法。 - 前記識別子が、最上位ビットが最初に伝送される、0x6の値をもつ三ビットの符号なし整数である、請求項6記載の方法。
- 前記充填データが、向上スペクトル帯域複製メタデータをさらに含む、請求項6または7記載の方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021123219A JP7210658B2 (ja) | 2015-03-13 | 2021-07-28 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
JP2023002650A JP7503666B2 (ja) | 2015-03-13 | 2023-01-11 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15159067 | 2015-03-13 | ||
EP15159067.6 | 2015-03-13 | ||
US201562133800P | 2015-03-16 | 2015-03-16 | |
US62/133,800 | 2015-03-16 | ||
JP2018146621A JP6671429B2 (ja) | 2015-03-13 | 2018-08-03 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018146621A Division JP6671429B2 (ja) | 2015-03-13 | 2018-08-03 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021123219A Division JP7210658B2 (ja) | 2015-03-13 | 2021-07-28 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020079963A JP2020079963A (ja) | 2020-05-28 |
JP6922017B2 true JP6922017B2 (ja) | 2021-08-18 |
Family
ID=66624667
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020035668A Active JP6922017B2 (ja) | 2015-03-13 | 2020-03-03 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
JP2021123219A Active JP7210658B2 (ja) | 2015-03-13 | 2021-07-28 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021123219A Active JP7210658B2 (ja) | 2015-03-13 | 2021-07-28 | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Country Status (10)
Country | Link |
---|---|
JP (2) | JP6922017B2 (ja) |
DK (2) | DK3268956T3 (ja) |
ES (2) | ES2867477T3 (ja) |
HK (6) | HK1259548A1 (ja) |
HU (2) | HUE053954T2 (ja) |
IL (3) | IL256786B (ja) |
SG (1) | SG10202005260VA (ja) |
TW (2) | TWI732403B (ja) |
UA (1) | UA119808C2 (ja) |
ZA (6) | ZA201705971B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7503666B2 (ja) | 2015-03-13 | 2024-06-20 | ドルビー・インターナショナル・アーベー | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
CN100395817C (zh) * | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
ES2796552T3 (es) * | 2008-07-11 | 2020-11-27 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio |
CN102667923B (zh) * | 2009-10-20 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法 |
ES2935637T3 (es) * | 2010-03-09 | 2023-03-08 | Fraunhofer Ges Forschung | Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada |
US9093120B2 (en) * | 2011-02-10 | 2015-07-28 | Yahoo! Inc. | Audio fingerprint extraction by scaling in time and resampling |
AR085445A1 (es) * | 2011-03-18 | 2013-10-02 | Fraunhofer Ges Forschung | Codificador y decodificador que tiene funcionalidad de configuracion flexible |
EP2950308B1 (en) * | 2013-01-22 | 2020-02-19 | Panasonic Corporation | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method |
JP6445460B2 (ja) * | 2013-01-28 | 2018-12-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 |
TWI530941B (zh) * | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
-
2016
- 2016-02-22 TW TW108147912A patent/TWI732403B/zh active
- 2016-02-22 TW TW108124351A patent/TWI693595B/zh active
- 2016-03-10 ES ES19190806T patent/ES2867477T3/es active Active
- 2016-03-10 UA UAA201709027A patent/UA119808C2/uk unknown
- 2016-03-10 DK DK16765449.0T patent/DK3268956T3/da active
- 2016-03-10 SG SG10202005260VA patent/SG10202005260VA/en unknown
- 2016-03-10 HU HUE19190806A patent/HUE053954T2/hu unknown
- 2016-03-10 ES ES16709426T patent/ES2770029T3/es active Active
- 2016-03-10 HU HUE16709426A patent/HUE047987T2/hu unknown
- 2016-03-10 DK DK16709426.7T patent/DK3268961T3/da active
-
2017
- 2017-09-01 ZA ZA2017/05971A patent/ZA201705971B/en unknown
- 2017-09-01 ZA ZA2017/05978A patent/ZA201705978B/en unknown
- 2017-12-28 HK HK19101315.5A patent/HK1259548A1/zh unknown
- 2017-12-28 HK HK19101666.0A patent/HK1259302A1/zh unknown
- 2017-12-28 HK HK19100951.6A patent/HK1259131A1/zh unknown
- 2017-12-28 HK HK19101775.8A patent/HK1259406A1/zh unknown
- 2017-12-28 HK HK19101777.6A patent/HK1259408A1/zh unknown
- 2017-12-28 HK HK19100948.2A patent/HK1259544A1/zh unknown
-
2018
- 2018-01-08 IL IL256786A patent/IL256786B/en active IP Right Grant
- 2018-03-23 ZA ZA2018/01941A patent/ZA201801941B/en unknown
- 2018-08-31 ZA ZA201805869A patent/ZA201805869B/en unknown
-
2019
- 2019-03-19 ZA ZA2019/01691A patent/ZA201901691B/en unknown
- 2019-08-21 ZA ZA2019/05506A patent/ZA201905506B/en unknown
-
2020
- 2020-03-03 JP JP2020035668A patent/JP6922017B2/ja active Active
- 2020-12-09 IL IL279327A patent/IL279327B/en unknown
-
2021
- 2021-07-28 JP JP2021123219A patent/JP7210658B2/ja active Active
- 2021-08-16 IL IL285643A patent/IL285643B2/en unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7503666B2 (ja) | 2015-03-13 | 2024-06-20 | ドルビー・インターナショナル・アーベー | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Also Published As
Publication number | Publication date |
---|---|
TW201941186A (zh) | 2019-10-16 |
UA119808C2 (uk) | 2019-08-12 |
ES2867477T3 (es) | 2021-10-20 |
ZA201705978B (en) | 2019-02-27 |
JP2020079963A (ja) | 2020-05-28 |
HK1259548A1 (zh) | 2019-11-29 |
HUE053954T2 (hu) | 2021-08-30 |
ZA201801941B (en) | 2019-07-31 |
ZA201905506B (en) | 2021-03-31 |
HUE047987T2 (hu) | 2020-05-28 |
HK1259408A1 (zh) | 2019-11-29 |
JP7210658B2 (ja) | 2023-01-23 |
DK3268956T3 (da) | 2021-10-18 |
SG10202005260VA (en) | 2020-07-29 |
ES2770029T3 (es) | 2020-06-30 |
ZA201901691B (en) | 2020-07-29 |
IL285643A (en) | 2021-09-30 |
IL256786A (en) | 2018-03-29 |
HK1259302A1 (zh) | 2019-11-29 |
IL256786B (en) | 2021-01-31 |
IL279327A (en) | 2021-01-31 |
TWI732403B (zh) | 2021-07-01 |
HK1259131A1 (zh) | 2019-11-29 |
TWI693595B (zh) | 2020-05-11 |
JP2021167981A (ja) | 2021-10-21 |
IL285643B (en) | 2022-10-01 |
IL285643B2 (en) | 2023-02-01 |
HK1259406A1 (zh) | 2019-11-29 |
IL279327B (en) | 2021-09-30 |
HK1259544A1 (zh) | 2019-11-29 |
ZA201705971B (en) | 2019-01-30 |
ZA201805869B (en) | 2019-11-27 |
TW202042215A (zh) | 2020-11-16 |
DK3268961T3 (da) | 2020-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7038747B2 (ja) | 少なくとも一つの充填要素内の向上スペクトル帯域複製メタデータを用いたオーディオ・ビットストリームのデコード | |
JP6922017B2 (ja) | オーディオ処理ユニットおよびエンコードされたオーディオ・ビットストリームをデコードする方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200303 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210629 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210728 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6922017 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |