JP2018511826A - 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ - Google Patents
符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ Download PDFInfo
- Publication number
- JP2018511826A JP2018511826A JP2017548011A JP2017548011A JP2018511826A JP 2018511826 A JP2018511826 A JP 2018511826A JP 2017548011 A JP2017548011 A JP 2017548011A JP 2017548011 A JP2017548011 A JP 2017548011A JP 2018511826 A JP2018511826 A JP 2018511826A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- group
- kernel
- transform
- kernels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 70
- 238000006243 chemical reaction Methods 0.000 claims abstract description 83
- 230000003595 spectral effect Effects 0.000 claims abstract description 67
- 230000003044 adaptive effect Effects 0.000 claims abstract description 51
- 230000009466 transformation Effects 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims description 67
- 238000012545 processing Methods 0.000 claims description 42
- 238000001228 spectrum Methods 0.000 claims description 42
- 230000008569 process Effects 0.000 claims description 16
- 238000013139 quantization Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 30
- 230000006870 function Effects 0.000 description 20
- 230000002441 reversible effect Effects 0.000 description 20
- 230000010363 phase shift Effects 0.000 description 18
- 239000002131 composite material Substances 0.000 description 16
- 238000000844 transformation Methods 0.000 description 14
- 238000005457 optimization Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000007704 transition Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
窓掛け処理の後、時間出力xi,n はオーバーラップ・アンド・アッド(OLA)プロセスによって前の時間出力xi-1,n と組み合わされる。Cは、0より大きいか又は1以下の定数パラメータであってもよく、例えば、2/Nとなる。
例えば、
・各高調波が複数のMDCTビンによって表されるように、MDCTを介してサンプリン グされた特定の基本周波数を有する高調波信号である。これは、スペクトル領域におい て準最適エネルギー圧縮、すなわち低い符号化利得を導く。
・従来のM/Sステレオベースのジョイントチャネルコーディングでは利用できない、チ ャネルのMDCTビン間で約90度の位相シフトを持つステレオ信号を生成する。チャ ネル間位相差(IPD)の符号化を含むより高度なステレオ符号化は、例えば、HE− AACのパラメトリックステレオまたはMPEGサラウンドを使用しているが、このよ うなツールは別のフィルタバンクドメインで動作し、複雑さが増している。
・MDCT−IVは、その左側で奇数対称性を示し、その右側で偶数対称性を示す。合成された信号は、この変換の信号の逆畳み込みの間、その左側で反転される。
・MDST−IVは、その左側で偶数対称性を示し、その右側で偶数対象性を示す。合成された信号は、この変換の信号の逆畳み込みの間、その右側で反転される。
・MDCT−IIは、その左側で偶数対称性を示し、その右側で奇数対称性を示す。合成された信号は、この変換の信号の逆折畳みの間のいずれの側でも反転されない。
・MDST−IIは、その左側で奇数対称を示し、その右側で偶数対称性を示す。合成された信号は、この変換の信号の逆畳み込みの間、両側で反転される。
IMDCT(MDCT(a,b,c,d))=(a−bR,b−aR,c+dR,d+cR)/2
となる。
IMDCT(MDCT(A,B))=(A−AR,B+BR)/2
で書くことができる。
WR・(WRB+(WRB)R)=WR・(WRB+WBR)=WR 2B+WWRBR
W・(WB−WRBR)=W2B−WWRBR
したがって、
・(逆の)MDCT−IVの後には、逆MDCT−IVまたは逆MDST−IIを続ける。
・(逆の)MDST−IVの後には、逆MDST−IVまたは逆MDCT−IIを続ける。
・(逆の)MDCT−IIの後には、逆MDCT−IVまたは逆MDST−IIを続ける。
・(逆の)MDST−IIの後には、逆MDST−IVまたは逆MDCT−IIを続ける。
次いで、サイド信号は、ミッド/サイドエンコーディングに関して図12Cに示すように、例えば和差分処理を行うコンバイナ1162に入力される。具体的には、ブロック1162は、左チャネルの周波数領域表現および右チャネルの周波数領域表現を得るために、(逆の)ミッド/サイド復号を実行する。次に、周波数領域表現は、対応する周波数/時間変換器52および53によって時間領域表現に変換される。
方法1500は、スペクトル値の連続するブロックを時間値の重なり合う連続ブロックに変換するステップ1505と、復号されたオーディオ値を得るために時間値の連続するブロックを重ね合わせて加算するステップ1510と、制御情報を受信し且つ制御情報に応じて、カーネルの両側に異なる対称性を有する1つ以上の変換カーネルを含む変換カーネルの第1のグループと、カーネルの両側に同じ対称性を有する1つ以上の変換カーネルを含む変換カーネルの第2のグループとの間で、切り替えるステップ1515と、を含む。
[1] H. S. Malvar, Signal Processing with Lapped Transforms, Norwood: Artech House, 1992.
[2] J. P. Princen and A. B. Bradley, "Analysis/Synthesis Filter Bank Design Based on Time
Domain Aliasing Cancellation," IEEE Trans. Acoustics, Speech, and Signal Proc., 1986.
[3] J. P. Princen, A. W. Johnson, and A. B. Bradley, "Subband/transform coding using filter
bank design based on time domain aliasing cancellation," in IEEE ICASSP, vol. 12, 1987.
[4] H. S. Malvar, "Lapped Transforms for Efficient Transform/Subband Coding," IEEE Trans. Acoustics, Speech, and Signal Proc., 1990.
[5] http://en.wikipedia.org/wiki/Modified_discrete_cosine_transform
Claims (24)
- 符号化されたオーディオ信号(4)を復号するためのデコーダ(2)であって、
前記デコーダは、
スペクトル値(4’、4’’)の連続するブロックを時間値(10)の連続するブロックに変換する適応型スペクトル−時間変換器(6)、および
復号化されたオーディオ値(14)を得るために、時間値(10)の連続するブロックを重ね合わせて加算するためのオーバーラップ加算プロセッサ(8)を含み、
前記適応型スペクトル−時間変換器(6)は、制御情報(12)を受信し、前記制御情報に応じて、カーネルの両側に異なる対称性を有する1つ以上の変換カーネルを含む変換カーネルの第1のグループと、変換カーネルの両側に同じ対称性を有する1つ以上の変換カーネルを含む変換カーネルの第2のグループとの間で、切り替えるように構成される、デコーダ。 - 前記変換カーネルの第1のグループは、前記カーネルの左側に奇数対称性を有し、右側に偶数対称性を有する、またはその逆の1つ以上の変換カーネルを有する、あるいは前記変換カーネルの第2のグループは、前記カーネルの両側に偶数対称性または奇数対称性を有する1つ以上の変換カーネルを有する、請求項1に記載のデコーダ(2)。
- 前記変換カーネルの第1のグループは、逆MDCT−IV変換カーネルまたは逆MDST−IV変換カーネルを含む、あるいは前記変換カーネルの第2のグループは、逆MDCT−II変換カーネルまたは逆MDST−II変換カーネルを含む、請求項1または請求項2に記載のデコーダ(2)。
- 前記第1のグループおよび前記第2のグループの前記変換カーネルは、以下の式に基づいていて、
前記第1のグループの前記少なくとも1つの変換カーネルは、
cs( )=cos( )および k0 =0.5
または
cs( )=sin( )および k0 =0.5
のパラメータに基づいており、
または
前記第2のグループの少なくとも1つの変換カーネルは、
cs( )=cos( )および k0 =0
または
cs( )=sin( )および k0 =1
のパラメータに基づいており、
ここで、xi,n は時間領域出力であり、Cは定数パラメータであり、Nは時間窓長であり、specはブロックについてM個の値を有するスペクトル値であり、MはN/2に等しく、iは時間ブロックインデックスであり、kはスペクトル値を示すスペクトルインデックスであり、nはブロックiにおける時間値を示す時間インデックスであり、n0 は整数またはゼロである定数パラメータである、請求項1〜請求項3のいずれか1項に記載のデコーダ(2)。 - 前記制御情報(12)は、現在のフレームについての現在の対称性を示す現在のビットを含み、
前記適応型スペクトル−時間変換器(6)は、前記現在のビットが前のフレームで使用されたのと同じ対称性を示すとき、前記第1のグループから前記第2のグループに切り替わらないように構成され、
前記適応型スペクトル−時間変換器は、前記現在のビットが前記前のフレームで使用されたものとは異なる対称性を示すとき、前記第1のグループから前記第2のグループに切り替えるように構成される、請求項1〜請求項4のいずれか1項に記載のデコーダ(2)。 - 前記適応型スペクトル−時間変換器(6)は、現在のフレームの現在の対称性を示す現在のビットが前記前のフレームで使用されたものと同じ対称性を示すとき、前記第2のグループを前記第1のグループに切り替えるように構成され、
前記適応型スペクトル−時間変換器(6)は、前記現在のビットが前記前のフレームで使用されていたものとは異なる対称性を有する前記現在のフレームの現在の対称性を示すとき、前記第2のグループから前記第1のグループに切り替わらないように構成される、請求項1〜請求項5のいずれか1項に記載のデコーダ(2)。 - 前記適応型スペクトル−時間変換器(6)は、前のフレームについての制御情報(12)を符号化されたオーディオ信号(4)から、および前記前のフレームに続く現在のフレームについての制御情報を前記現在のフレームの制御データセクション内の前記符号化されたオーディオ信号から読み出すように構成される、あるいは
前記適応型スペクトル−時間変換器(6)は、前記現在のフレームの前記制御データセクションから前記制御情報(12)を読み出し、前記前のフレームの制御データセクションから、または前記前のフレームに適用されたデコーダ設定から、前記前のフレームについての前記制御情報(12)を取り出すように構成されている、請求項1〜請求項6のいずれか1項に記載のデコーダ(2)。 - 第1のマルチチャネルおよび第2のマルチチャネルについてのスペクトル値の処理されたブロックを得るために、前記第1および前記第2のマルチチャネルを表すスペクトル値のブロックを受信し、ジョイントマルチチャネル処理技術に従って前記受信したブロックを処理するためのマルチチャネルプロセッサ(40)をさらに含み、前記適応型スペクトル−時間プロセッサ(6)は、前記第1のマルチチャネルのための制御情報を使用して前記第1のマルチチャネルのための前記処理されたブロックを、および前記第2のマルチチャネルのための制御情報を使用して前記第2のマルチチャネルのための前記処理されたブロックを処理するように構成される、請求項1〜請求項8のいずれか1項に記載のデコーダ(2)。
- 前記マルチチャネルプロセッサは、前記第1および前記第2のマルチチャネルを表す前記スペクトル値のブロックに関連する複素予測制御情報を使用して複素予測を適用するように構成される、請求項9に記載のデコーダ(2)。
- 前記マルチチャネルプロセッサは、前記ジョイントマルチチャネル処理技術に従って前記受信したブロックを処理するように構成され、前記受信されたブロックは、前記第1のマルチチャネルの表現の符号化された残差信号と前記第2のマルチチャネルの表現とを含み、前記マルチチャネルプロセッサは、前記残差信号およびさらなる符号化された信号を使用して、前記第1のマルチチャネル信号および前記第2のマルチチャネル信号を計算するように構成される、請求項9または請求項10のいずれか1項に記載のデコーダ。
- オーディオ信号(24)を符号化するためのエンコーダ(22)であって、
前記エンコーダは、
時間値(30)の重複ブロックをスペクトル値(4’、4’’)の連続するブロックに変換するための適応型時間−スペクトル変換器、および
変換カーネルの第1のグループの変換カーネルと、変換カーネルの第2のグループの変換カーネルとを切り替えるように、前記時間−スペクトル変換器を制御するコントローラ(28)を含み、
前記適応型時間−スペクトル変換器は、制御情報(12)を受信して、前記制御情報に応じて、カーネルの両側に異なる対称性を有する1つ以上の変換カーネルを含む変換カーネルの第1のグループと、変換カーネルの両側に同じ対称性を有する1つ以上の変換カーネルを含む変換カーネルの第2のグループとの間で、切り替えるように構成される、エンコーダ。 - 現在のフレームについて、前記現在のフレームを生成するために使用される前記変換カーネルの対称性を示す制御情報(12)を有する符号化されたオーディオ信号(4)を生成するための出力インタフェース(32)をさらに含む、請求項12に記載のエンコーダ(22)。
- 前記出力インターフェース(32)は、前記現在のフレームが独立したフレームである場合、前記現在のフレームの制御データセクションに、前記現在のフレームのおよび前記前のフレームの対称情報を含み、あるいは
前記現在のフレームが従属フレームである場合、前記現在のフレームの前記制御データセクションに、前記現在のフレームのための対称情報のみを含み、前記前のフレームの対称情報を含まないように構成される、請求項12または請求項13に記載のエンコーダ(22)。 - 前記変換カーネルの第1のグループは、左側に奇数対称性を有し、且つ、右側に偶数対称性を有する、あるいはその逆の1つ以上の変換カーネルを有し、あるいは前記変換カーネルの第2のグループは、両側に偶数対称性または奇数対称性を有する1つ以上の変換カーネルを有する、請求項12〜請求項14のいずれか1項に記載のエンコーダ(22)。
- 前記変換カーネルの第1のグループは、MDCT−IV変換カーネルまたはMDST−IV変換カーネルを含み、あるいは、前記第2のグループの変換カーネルは、MDCT−II変換カーネルまたはMDST−II変換カーネルを含む、請求項12〜請求項15のいずれか1項に記載のエンコーダ。
- 前記コントローラ(28)は、MDCT−IVの後にMDCT−IVまたはMDST−IIが続くように構成されている、あるいは、MDST−IVの後にはMDST−IVまたはMDCT−IIが続くように、あるいは、MDCT−IIの後にMDCT−IVまたはMDST−IIが続くように、あるいは、前記MDST−IIの後にMDST−IVまたはMDCT−IIが続くように構成されている、請求項12〜請求項16のいずれか1項に記載のエンコーダ(22)。
- 前記コントローラ(28)は、前記第1のチャネルのフレームと、対応する前記第2のチャネルのフレームとについて、前記変換カーネルを決定するために、第1のチャネルおよび第2のチャネルを有する前記時間値(30)の重複ブロックを分析するように構成される、請求項12〜請求項17のいずれか1項に記載のエンコーダ(22)。
- 前記時間−スペクトル変換器(26)は、マルチチャネル信号の第1のチャネルおよび第2のチャネルを処理するように構成され、前記エンコーダ(22)は、処理されたスペクトル値のブロックを得るために、ジョイントマルチチャネル処理技術を用いて、前記第1のチャネルおよび前記第2のチャネルのスペクトル値の前記連続するブロックを処理するためのマルチチャネルプロセッサ(40)と、符号化されたチャネルを得るために、前記処理されたスペクトル値のブロックを処理するための符号化プロセッサ(46)とをさらに含む、請求項12〜請求項18のいずれか1項に記載のエンコーダ(22)。
- 前記第1の処理されたスペクトル値のブロックは、前記ジョイントマルチチャネル処理技術の第1の符号化表現を表し、前記第2の処理されたスペクトル値のブロックは、前記ジョイントマルチチャネル処理技術の第2の符号化表現を表し、前記符号化プロセッサ(46)は、量子化およびエントロピー符号化を使用して前記第1の処理済みブロックを処理して、第1の符号化された表現を形成するように構成され、前記符号化プロセッサ(46)は量子化およびエントロピー符号化を使用して前記第2の処理済みブロックを処理して、第2の符号化された表現を形成するように構成され、前記符号化プロセッサは、前記第1の符号化された表現および前記第2の符号化された表現を使用して、前記符号化されたオーディオ信号のビットストリームを形成するように構成される、
請求項12〜19のいずれか1項のいずれかに記載のエンコーダ(22)。 - 符号化されたオーディオ信号を復号する方法(1500)であって、
スペクトル値の連続ブロックを時間値の連続ブロックに変換するステップと、
復号されたオーディオ値を得るために時間値の連続するブロックを重ね合わせて加算するステップと、
制御情報を受信して、前記制御情報に応じて、カーネルの両側に異なる対称性を有する1つ以上の変換カーネルを含む変換カーネルの第1のグループと、変換カーネルの両側に同じ対称性を有する1つ以上の変換カーネルを含む変換カーネルの第2のグループとの間で切り替えるステップを含む、方法。 - オーディオ信号を符号化する方法(1600)であって、
時間値のオーバーラップするブロックをスペクトル値の連続するブロックに変換するステップと、
変換カーネルの第1のグループの変換カーネルと変換カーネルの第2のグループの変換カーネルとを切り替えるために、前記時間−スペクトル変換を制御するステップと、
制御情報を受信して、前記制御情報に応じて、カーネルの両側に異なる対称性を有する1つ以上の変換カーネルを含む変換カーネルの第1のグループと、変換カーネルの両側に同じ対称性を有する1つ以上の変換カーネルを含む変換カーネルの第2のグループとの間で、切り替えるステップを含む、方法 - コンピュータまたはプロセッサ上で動作する時に、請求項21または請求項22に記載の方法を実行するためのコンピュータプログラム。
- マルチチャネル処理とは、ジョイントステレオ処理または2つ以上のチャネルのジョイント処理を意味し、マルチチャネル信号は、2つのチャネルまたは2つ以上のチャネルを有する、請求項1〜請求項23のいずれかに記載の装置、方法またはコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158236 | 2015-03-09 | ||
EP15158236.8 | 2015-03-09 | ||
EP15172542.1 | 2015-06-17 | ||
EP15172542.1A EP3067889A1 (en) | 2015-03-09 | 2015-06-17 | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
PCT/EP2016/054902 WO2016142376A1 (en) | 2015-03-09 | 2016-03-08 | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020114013A Division JP7126328B2 (ja) | 2015-03-09 | 2020-07-01 | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018511826A true JP2018511826A (ja) | 2018-04-26 |
JP6728209B2 JP6728209B2 (ja) | 2020-07-22 |
Family
ID=52692422
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548011A Active JP6728209B2 (ja) | 2015-03-09 | 2016-03-08 | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ |
JP2020114013A Active JP7126328B2 (ja) | 2015-03-09 | 2020-07-01 | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ |
JP2022128735A Pending JP2022174061A (ja) | 2015-03-09 | 2022-08-12 | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020114013A Active JP7126328B2 (ja) | 2015-03-09 | 2020-07-01 | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ |
JP2022128735A Pending JP2022174061A (ja) | 2015-03-09 | 2022-08-12 | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ |
Country Status (15)
Country | Link |
---|---|
US (5) | US10236008B2 (ja) |
EP (3) | EP3067889A1 (ja) |
JP (3) | JP6728209B2 (ja) |
KR (1) | KR102101266B1 (ja) |
CN (2) | CN112786061B (ja) |
AR (1) | AR103859A1 (ja) |
AU (1) | AU2016231239B2 (ja) |
CA (1) | CA2978821C (ja) |
ES (1) | ES2950286T3 (ja) |
MX (1) | MX2017011185A (ja) |
PL (1) | PL3268962T3 (ja) |
RU (1) | RU2691231C2 (ja) |
SG (1) | SG11201707347PA (ja) |
TW (1) | TWI590233B (ja) |
WO (1) | WO2016142376A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022521811A (ja) * | 2019-03-14 | 2022-04-12 | ブームクラウド 360 インコーポレイテッド | 優先度を持つ空間認識マルチバンド圧縮システム |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2834083T3 (es) * | 2016-11-08 | 2021-06-16 | Fraunhofer Ges Forschung | Aparato y método para la mezcla descendente o mezcla ascendente de una señal multicanal usando compensación de fase |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP3588495A1 (en) | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
KR20200000649A (ko) * | 2018-06-25 | 2020-01-03 | 네이버 주식회사 | 오디오 병렬 트랜스코딩을 위한 방법 및 시스템 |
CN115132214A (zh) | 2018-06-29 | 2022-09-30 | 华为技术有限公司 | 立体声信号的编码、解码方法、编码装置和解码装置 |
SG11202012936VA (en) * | 2018-07-04 | 2021-01-28 | Fraunhofer Ges Forschung | Multisignal audio coding using signal whitening as preprocessing |
TWI681384B (zh) * | 2018-08-01 | 2020-01-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊等化器 |
CN110830884B (zh) * | 2018-08-08 | 2021-06-25 | 瑞昱半导体股份有限公司 | 音频处理方法与音频均衡器 |
US11432069B2 (en) * | 2019-10-10 | 2022-08-30 | Boomcloud 360, Inc. | Spectrally orthogonal audio component processing |
CN110855673B (zh) * | 2019-11-15 | 2021-08-24 | 成都威爱新经济技术研究院有限公司 | 一种复杂多媒体数据传输及处理方法 |
KR20220018271A (ko) * | 2020-08-06 | 2022-02-15 | 라인플러스 주식회사 | 딥러닝을 이용한 시간 및 주파수 분석 기반의 노이즈 제거 방법 및 장치 |
WO2022177481A1 (en) * | 2021-02-18 | 2022-08-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and decoding complex data |
CN113314130B (zh) * | 2021-05-07 | 2022-05-13 | 武汉大学 | 一种基于频谱搬移的音频对象编解码方法 |
CN116032901A (zh) * | 2022-12-30 | 2023-04-28 | 北京天兵科技有限公司 | 多路音频数据信号采编方法、装置、系统、介质和设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05506345A (ja) * | 1990-04-12 | 1993-09-16 | ドルビー・ラボラトリーズ・ランセンシング・コーポレーション | 高品質オーディオ用符号器・復号器 |
JP2013528822A (ja) * | 2010-04-09 | 2013-07-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2680924B1 (fr) | 1991-09-03 | 1997-06-06 | France Telecom | Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant. |
JP2642546B2 (ja) * | 1991-10-15 | 1997-08-20 | 沖電気工業株式会社 | 視覚特性の算出方法 |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US6199039B1 (en) * | 1998-08-03 | 2001-03-06 | National Science Council | Synthesis subband filter in MPEG-II audio decoding |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6496795B1 (en) | 1999-05-05 | 2002-12-17 | Microsoft Corporation | Modulated complex lapped transform for integrated signal enhancement and coding |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US7006699B2 (en) | 2002-03-27 | 2006-02-28 | Microsoft Corporation | System and method for progressively transforming and coding digital data |
US20030187528A1 (en) | 2002-04-02 | 2003-10-02 | Ke-Chiang Chu | Efficient implementation of audio special effects |
DE10234130B3 (de) | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
CA2469674C (en) | 2002-09-19 | 2012-04-24 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
BR122018007834B1 (pt) * | 2003-10-30 | 2019-03-19 | Koninklijke Philips Electronics N.V. | Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador |
US6980933B2 (en) | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
US20050265445A1 (en) | 2004-06-01 | 2005-12-01 | Jun Xin | Transcoding videos based on different transformation kernels |
CN101025919B (zh) * | 2006-02-22 | 2011-04-20 | 上海奇码数字信息有限公司 | 音频解码中的合成子带滤波方法和合成子带滤波器 |
DE102006047197B3 (de) | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
RU2451998C2 (ru) * | 2007-09-19 | 2012-05-27 | Квэлкомм Инкорпорейтед | Эффективный способ проектирования набора фильтров для mdct/imdct в приложениях для кодирования речи и аудиосигналов |
WO2009100021A2 (en) * | 2008-02-01 | 2009-08-13 | Lehigh University | Bilinear algorithms and vlsi implementations of forward and inverse mdct with applications to mp3 audio |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
RU2515704C2 (ru) | 2008-07-11 | 2014-05-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала |
CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
JP5597968B2 (ja) | 2009-07-01 | 2014-10-01 | ソニー株式会社 | 画像処理装置および方法、プログラム、並びに記録媒体 |
KR101437896B1 (ko) * | 2010-04-09 | 2014-09-16 | 돌비 인터네셔널 에이비 | Mdct-기반의 복소수 예측 스테레오 코딩 |
AU2011240239B2 (en) * | 2010-04-13 | 2014-06-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
WO2012039920A1 (en) * | 2010-09-22 | 2012-03-29 | Dolby Laboratories Licensing Corporation | Efficient implementation of phase shift filtering for decorrelation and other applications in an audio coding system |
EP2673776B1 (en) | 2012-01-20 | 2015-06-17 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
GB2509055B (en) | 2012-12-11 | 2016-03-23 | Gurulogic Microsystems Oy | Encoder and method |
JP6089878B2 (ja) * | 2013-03-28 | 2017-03-08 | 富士通株式会社 | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 |
-
2015
- 2015-06-17 EP EP15172542.1A patent/EP3067889A1/en not_active Withdrawn
-
2016
- 2016-02-24 TW TW105105525A patent/TWI590233B/zh active
- 2016-03-04 AR ARP160100580A patent/AR103859A1/es active IP Right Grant
- 2016-03-08 CA CA2978821A patent/CA2978821C/en active Active
- 2016-03-08 MX MX2017011185A patent/MX2017011185A/es active IP Right Grant
- 2016-03-08 RU RU2017134619A patent/RU2691231C2/ru active
- 2016-03-08 AU AU2016231239A patent/AU2016231239B2/en active Active
- 2016-03-08 EP EP16709345.9A patent/EP3268962B1/en active Active
- 2016-03-08 WO PCT/EP2016/054902 patent/WO2016142376A1/en active Application Filing
- 2016-03-08 CN CN202110100367.0A patent/CN112786061B/zh active Active
- 2016-03-08 SG SG11201707347PA patent/SG11201707347PA/en unknown
- 2016-03-08 EP EP23178648.4A patent/EP4235656A3/en active Pending
- 2016-03-08 ES ES16709345T patent/ES2950286T3/es active Active
- 2016-03-08 KR KR1020177028552A patent/KR102101266B1/ko active IP Right Grant
- 2016-03-08 PL PL16709345.9T patent/PL3268962T3/pl unknown
- 2016-03-08 JP JP2017548011A patent/JP6728209B2/ja active Active
- 2016-03-08 CN CN201680026851.0A patent/CN107592938B/zh active Active
-
2017
- 2017-09-06 US US15/696,934 patent/US10236008B2/en active Active
-
2019
- 2019-02-08 US US16/271,380 patent/US10706864B2/en active Active
-
2020
- 2020-06-11 US US16/899,406 patent/US11335354B2/en active Active
- 2020-07-01 JP JP2020114013A patent/JP7126328B2/ja active Active
-
2022
- 2022-04-15 US US17/722,027 patent/US11854559B2/en active Active
- 2022-08-12 JP JP2022128735A patent/JP2022174061A/ja active Pending
-
2023
- 2023-11-16 US US18/511,741 patent/US20240096336A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05506345A (ja) * | 1990-04-12 | 1993-09-16 | ドルビー・ラボラトリーズ・ランセンシング・コーポレーション | 高品質オーディオ用符号器・復号器 |
JP2013528822A (ja) * | 2010-04-09 | 2013-07-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022521811A (ja) * | 2019-03-14 | 2022-04-12 | ブームクラウド 360 インコーポレイテッド | 優先度を持つ空間認識マルチバンド圧縮システム |
JP7354275B2 (ja) | 2019-03-14 | 2023-10-02 | ブームクラウド 360 インコーポレイテッド | 優先度を持つ空間認識マルチバンド圧縮システム |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7126328B2 (ja) | 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ | |
AU2011238010B2 (en) | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction | |
AU2011240239B2 (en) | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction | |
JP6654236B2 (ja) | オーディオ変換コーディングにおけるオーバーラップ率の信号適応スイッチングのための符号化器、復号器および方法 | |
BR112017019179B1 (pt) | Decodificador para decodificar um sinal de áudio codificado e codificador para codificar um sinal de áudio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190507 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6728209 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |