JP2016530788A - 符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するためのオーディオデコーダ、オーディオエンコーダ、方法、帯域幅拡張を用いた少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法およびコンピュータプログラム - Google Patents
符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するためのオーディオデコーダ、オーディオエンコーダ、方法、帯域幅拡張を用いた少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2016530788A JP2016530788A JP2016528408A JP2016528408A JP2016530788A JP 2016530788 A JP2016530788 A JP 2016530788A JP 2016528408 A JP2016528408 A JP 2016528408A JP 2016528408 A JP2016528408 A JP 2016528408A JP 2016530788 A JP2016530788 A JP 2016530788A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- signal
- channel
- channel signal
- downmix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 81
- 238000004590 computer program Methods 0.000 title claims description 16
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 239000002131 composite material Substances 0.000 description 44
- 238000010586 diagram Methods 0.000 description 35
- 230000006870 function Effects 0.000 description 23
- 238000000926 separation method Methods 0.000 description 19
- 230000005236 sound signal Effects 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 15
- 239000000203 mixture Substances 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000003595 spectral effect Effects 0.000 description 11
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 230000008447 perception Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 229920006235 chlorinated polyethylene elastomer Polymers 0.000 description 3
- 238000000136 cloud-point extraction Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
図1は、全体において100で表されるオーディオエンコーダの概略ブロック図を示す。オーディオエンコーダ100は、少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するよう構成される。オーディオエンコーダ100は、第1のオーディオチャネル信号110と、第2のオーディオチャネル信号112と、第3のオーディオチャネル信号114と、第4のオーディオチャネル信号116とを受信するよう構成される。また、オーディオエンコーダ100は、残留信号のジョイント符号化表現130と共に、第1のダウンミックス信号120および第2のダウンミックス信号122の符号化表現を提供するよう構成される。オーディオエンコーダ100は、残留信号支援マルチチャネルエンコーダ140を含む。残留信号支援マルチチャネルエンコーダ140は、残留信号支援マルチチャネル符号化を用いて第1のオーディオチャネル信号110と第2のオーディオチャネル信号112とをジョイント符号化して、第1のダウンミックス信号120と第1の残留信号142とを得るよう構成される。オーディオ信号エンコーダ100は、また、残留信号支援マルチチャネルエンコーダ150を含む。残留信号支援マルチチャネルエンコーダ150は、残留信号支援マルチチャネル符号化を用いて少なくとも第3のオーディオチャネル信号114と第4のオーディオチャネル信号116とをジョイント符号化して、第2のダウンミックス信号122と第2の残留信号152とを得るよう構成される。オーディオデコーダ100は、また、マルチチャネルエンコーダ160を含む。マルチチャネルエンコーダ160は、マルチチャネル符号化を用いて第1の残留信号142と第2の残留信号152とをジョイント符号化して、残留信号142,152のジョイント符号化表現130を得るよう構成される。
図2は、全体において200で表されるオーディオデコーダの概略ブロック図を示す。
図3は、本発明の他の実施形態によるオーディオデコーダの概略ブロック図を示す。図3のオーディオデコーダは、全体において300で表される。オーディオデコーダ300は、図2によるオーディオデコーダ200と類似するため、上述の説明が適用される。しかし、以下に述べるように、オーディオデコーダ300は、オーディオデコーダ200と比べて、付加的特徴および機能が補われている。
図4は、本発明の他の実施形態によるオーディオエンコーダの概略ブロック図を示す。図4によるオーディオエンコーダは、全体において400で表される。オーディオエンコーダ400は、4つのオーディオチャネル信号、すなわち、第1のオーディオチャネル信号410と、第2のオーディオチャネル信号412と、第3のオーディオチャネル信号414と、第4のオーディオチャネル信号416とを受信するよう構成される。また、オーディオエンコーダ400は、オーディオチャネル信号410,412,414および416に基づいて符号化表現を提供するよう構成され、前記符号化表現は、共通帯域幅拡張パラメータの第1の組422と共通帯域幅拡張パラメータの第2の組424との符号化表現と共に、2つのダウンミックス信号のジョイント符号化表現420を含む。オーディオエンコーダ400は、第1の帯域幅拡張パラメータエクストラクタ430を含む。第1の帯域幅拡張パラメータエクストラクタ430は、第1のオーディオチャネル信号410と第3のオーディオチャネル信号414とに基づいて、共通帯域幅拡張パラメータの第1の組422を得るよう構成される。オーディオエンコーダ400は、また、第2の帯域幅拡張パラメータエクストラクタ440を含む。第2の帯域幅拡張パラメータエクストラクタ440は、第2のオーディオチャネル信号412と第4のオーディオチャネル信号416とに基づいて、共通帯域幅拡張パラメータの第2の組424を得るよう構成される。
図5は、本発明の他の実施形態によるオーディオデコーダの概略ブロック図を示す。図5のオーディオデコーダは、全体において500で表される。
図6は、本発明の他の実施形態によるオーディオデコーダの概略ブロック図を示す。図6によるオーディオデコーダは、全体において600で表される。図6によるオーディオデコーダ600は、図5によるオーディオデコーダ500と類似しており、上述の説明が当てはまる。しかし、オーディオデコーダ600にはいくつかの特徴および機能が補われている。これらの特徴および機能は、個々にまたは組み合わせて、改良のためにオーディオデコーダ500に導入することも可能である。
図7は、少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法700のフローチャートを示す。
図8は、符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するための方法800のフローチャートを示す。
図9は、少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法900のフローチャートを示す。
図10は、符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するための方法1000のフローチャートを示す。
以下に、本発明による付加的実施形態および基本的な考察を記載する。
以下に、本発明による概念が適用され得るオーディオ符号化/復号環境について記載する。
プリレンダラ/ミキサ1510は、符号化前に、チャネルプラスオブジェクト入力シーンをチャネルシーンに変換するために任意に用いることができる。これは、機能的に、例えば、下記のオブジェクトレンダラ/ミキサと同一であってもよい。オブジェクトのプリレンダリングは、例えば、同時にアクティブなオブジェクト信号の数から基本的に独立した、エンコーダ入力での決定論的信号エントロピーを保証してもよい。オブジェクトのプリレンダリングにおいて、オブジェクトメタデータ送信は不要である。離散オブジェクト信号は、エンコーダが用いるよう構成されているチャネルレイアウトにレンダリングされる。各チャネルのためのオブジェクトの重みは、関連オブジェクトメタデータ(OAM)1552から得られる。
ラウドスピーカチャネル信号、離散オブジェクト信号、オブジェクトダウンミックス信号、およびプリレンダリング済信号のためのコアコーデック1530,1620は、MPEG−D USAC技術に基づく。これは、入力のチャネルおよびオブジェクト割り当てに関する幾何学的および意味論的情報に基づいてチャネルおよびオブジェクトマッピング情報を生成することにより、多数の信号の符号化を扱う。このマッピング情報は、どのように入力チャネルおよびオブジェクトがUSACチャネル要素(CPE、SCE、LFE)にマッピングされるかを記述し、対応する情報がデコーダに送信される。SAOCデータまたはオブジェクトメタデータ等の付加的ペイロードは、全て、拡張要素を通過し、エンコーダレート制御において考慮されている。
1.プリレンダリング済オブジェクト:オブジェクト信号は、符号化前に、プリレンダリングされ、22.2チャネル信号へ混合される。後続符号化系統は、22.2チャネル信号を見る。
2.離散オブジェクト波形:オブジェクトは、モノラル波形としてエンコーダに供給される。エンコーダは、単一チャネル要素SCEを用いてチャネル信号に加えてオブジェクトを転送する。復号オブジェクトは、受信機側で、レンダリングされ、かつ、混合される。圧縮オブジェクトメタデータ情報は、受信機/レンダラへ並行に送信される。
3.パラメトリックオブジェクト波形:オブジェクト特性および互いの関係は、SAOCパラメータによって記述される。オブジェクト信号のダウンミックスは、USACで符号化される。パラメトリック情報は、並行に送信される。ダウンミックスチャネル数は、オブジェクト数および全体データレートに依存して選択される。圧縮オブジェクトメタデータ情報は、SAOCレンダラへ送信される。
オブジェクト信号のためのSAOCエンコーダ1540およびSAOCデコーダ1660は、MPEG SAOC技術に基づく。当該システムは、少数の送信チャネルおよび付加的パラメトリックデータ(オブジェクトレベル差OLD、オブジェクト間相互関係IOC、ダウンミックスゲインDMG)に基づいて多数のオーディオオブジェクトを再現、修正、およびレンダリングすることができる。付加的パラメトリックデータは、全てのオブジェクトを個々に送信するために必要なデータレートよりも大幅に低いデータレートを示すため、符号化が非常に効率的になる。SAOCエンコーダは、入力として、オブジェクト/チャネル信号をモノラル波形として取り、パラメトリック情報(3Dオーディオビットストリーム1532,1610内にパックされる)およびSAOC伝送チャネル(単一チャネル要素を用いて符号化され、かつ、送信される)を出力する。
各オブジェクトのために、3D空間におけるオブジェクトの幾何学的位置および量を特定する関連メタデータが、時間および空間におけるオブジェクト特性の量子化によって効率的に符号化される。圧縮オブジェクトメタデータcOAM1554,1632は、サイド情報として受信機に送信される。
オブジェクトレンダラは、所与の再生フォーマットに従って、圧縮オブジェクトメタデータを利用してオブジェクト波形を生成する。各オブジェクトは、そのメタデータによって、ある出力チャネルにレンダリングされる。このブロックの出力は、部分結果の合計から生じる。離散/パラメトリックオブジェクトと共に両チャネルベースコンテンツが復号された場合、チャネルベース波形およびレンダリング済オブジェクト波形は、結果として得られる波形を出力する前に(または、これらをバイノーラルレンダラまたはラウドスピーカレンダラモジュール等のポストプロセッサモジュールへ供給する前に)、混合される。
バイノーラルレンダラモジュール1680は、マルチチャネルオーディオ素材のバイノーラルダウンミックスを生成し、それによって、各入力チャネルがバーチャル音源によって表されるようにする。当該処理は、QMFドメインにおいて、フレーム単位で行われる。バイノーラル化は、測定バイノーラル室内インパルス応答に基づく。
ラウドスピーカレンダラ1690は、送信チャネル構成と所望の送信フォーマットとの間を変換する。よって、以下では「フォーマットコンバータ」と呼ばれる。フォーマットコンバータは、より少数の出力チャネルへの変換を行う、すなわち、ダウンミックスを生成する。当該システムは、入力および出力フォーマットの所与の組み合わせのための最適化ダウンミックスマトリクスを自動的に生成して、これらのマトリクスをダウンミックス処理において適用する。フォーマットコンバータは、標準のラウドスピーカ構成だけでなく、非標準的ラウドスピーカ配置を伴うランダム構成も可能にする。
以下に、付加的な実施形態について記載する。
cplx_out_dmx_L[]:複合予測ステレオ復号後の第1のCPEの第1のチャネル
cplx_out_dmx_R[]:複合予測ステレオ復号後の第1のCPEの第2のチャネル
cplx_out_res_L[]:複合予測ステレオ復号後の第2のCPE(qceIndex=1の場合、0)
cplx_out_res_R[]:複合予測ステレオ復号後の第2のCPEの第2のチャネル(qceIndex=1の場合、0)
mps_out_L_1[]:第1のMPSボックスの第1の出力チャネル
mps_out_L_2[]:第1のMPSボックスの第2の出力チャネル
mps_out_R_1[]:第2のMPSボックスの第1の出力チャネル
mps_out_R_2[]:第2のMPSボックスの第2の出力チャネル
sbr_out_L_1[]:第1のステレオSBRボックスの第1の出力チャネル
sbr_out_R_1[]:第1のステレオSBRボックスの第2の出力チャネル
sbr_out_L_2[]:第2のステレオSBRボックスの第1の出力チャネル
sbr_out_R_2[]:第2のステレオSBRボックスの第2の出力チャネル
いくつかの態様を装置のコンテキストで記載したが、これらの態様は、対応する方法の記載も表し、ブロックや装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップのコンテキストで記載された態様は、対応する装置の対応するブロック、または要素、または特徴の記載も表す。方法ステップの一部または全部は、マイクロプロセッサ、プログラマブルコンピュータ、または電子回路等のハードウェア装置によって(を用いて)実行されてもよい。いくつかの実施形態において、1つ以上の最も重要な方法ステップは、そのような装置によって実行されてもよい。
以下に、結論を述べる。
Claims (40)
- 符号化表現(510;610,682;1310,1312)に基づいて少なくとも4つの帯域幅拡張チャネル信号(520,522,524,526)を提供するためのオーディオデコーダ(500;600;1300;1600;2000)であって、
オーディオデコーダは、マルチチャネル復号(530;630;1340)を用いて、第1のダウンミックス信号と第2のダウンミックス信号とのジョイント符号化表現(510;610;1310)に基づいて、第1のダウンミックス信号(532;632;1342)と第2のダウンミックス信号(534;634;1344)とを提供するよう構成され、
オーディオデコーダは、マルチチャネル復号(540;640;1370を用いて、第1のダウンミックス信号に基づいて、少なくとも第1のオーディオチャネル信号(542;642;1372)と第2のオーディオチャネル信号(544;644;1374)とを提供するよう構成され、
オーディオデコーダは、マルチチャネル復号(550;650;1380)を用いて、第2のダウンミックス信号に基づいて、少なくとも第3のオーディオチャネル信号(556;656;1382)と第4のオーディオチャネル信号(558;658;1384)とを提供するよう構成され、
オーディオデコーダは、前記第1のオーディオチャネル信号と前記第3のオーディオチャネル信号とに基づいて、マルチチャネル帯域幅拡張(560;660;1390)を行って第1の帯域幅拡張チャネル信号(520;620;1320)と第3の帯域幅拡張チャネル信号(524;624;1324)とを得るよう構成され、
オーディオデコーダは、前記第2のオーディオチャネル信号と前記第4のオーディオチャネル信号とに基づいて、マルチチャネル帯域幅拡張(570;670;1394)を行って第2の帯域幅拡張チャネル信号(522;622;1322)と第4の帯域幅拡張チャネル信号(526;626;1326)とを得るよう構成される、オーディオデコーダ。 - 前記第1のダウンミックス信号および前記第2のダウンミックス信号は、オーディオシーンの異なる水平位置または方位位置と関連付けられる、請求項1に記載のオーディオデコーダ。
- 前記第1のダウンミックス信号は、オーディオシーンの左側と関連付けられ、前記第2のダウンミックス信号は、前記オーディオシーンの右側と関連付けられる、請求項1または2に記載のオーディオデコーダ。
- 前記第1のオーディオチャネル信号および前記第2のオーディオチャネル信号は、オーディオシーンの垂直近傍位置と関連付けられ、
前記第3のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの垂直近傍位置と関連付けられる、請求項1〜3のいずれか1項に記載のオーディオデコーダ。 - 前記第1のオーディオチャネル信号および前記第3のオーディオチャネル信号は、オーディオシーンの第1の共通水平面または第1の共通高度ではあるが前記オーディオシーンの異なる水平位置または方位位置と関連付けられ、
前記第2のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの第2の共通水平面または第2の共通高度ではあるが前記オーディオシーンの異なる水平位置または方位位置と関連付けられ、
前記第1の共通水平面または第1の共通高度は、前記第2の共通水平面または第2の共通高度と異なる、請求項1〜4のいずれか1項に記載のオーディオデコーダ。 - 前記第1のオーディオチャネル信号および前記第2のオーディオチャネル信号は、前記オーディオシーンの第1の共通垂直面または第1の共通方位位置ではあるが前記オーディオシーンの異なる垂直位置または高度と関連付けられ、
前記第3のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの第2の共通垂直面または第2の共通方位位置ではあるが前記オーディオシーンの異なる垂直位置または高度と関連付けられ、
前記第1の共通垂直面または第1の方位位置は、前記第2の共通垂直面または第2の方位位置と異なる、請求項5に記載のオーディオデコーダ。 - 前記第1のオーディオチャネル信号および前記第2のオーディオチャネル信号は、オーディオシーンの左側と関連付けられ、
前記第3のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの右側と関連付けられる、請求項1〜6のいずれか1項に記載のオーディオデコーダ。 - 前記第1のオーディオチャネル信号および前記第3のオーディオチャネル信号は、オーディオシーンの下部と関連付けられ、
前記第2のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの上部と関連付けられる、請求項1〜7のいずれか1項に記載のオーディオデコーダ。 - オーディオデコーダは、マルチチャネル復号を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とのジョイント符号化表現に基づいて前記第1のダウンミックス信号と前記第2のダウンミックス信号とを提供する際、水平分割を行うよう構成される、請求項1〜8のいずれか1項に記載のオーディオデコーダ。
- オーディオデコーダは、マルチチャネル復号を用いて、前記第1のダウンミックス信号に基づいて少なくとも前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とを提供する際、垂直分割を行うよう構成され、
オーディオデコーダは、マルチチャネル復号を用いて、前記第2のダウンミックス信号に基づいて少なくとも前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とを提供する際、垂直分割を行うよう構成される、請求項1〜9のいずれか1項に記載のオーディオデコーダ。 - オーディオデコーダは、前記第1のオーディオチャネル信号と前記第3のオーディオチャネル信号とに基づいて、ステレオ帯域幅拡張を行い、前記第1の帯域幅拡張チャネル信号と前記第3の帯域幅拡張チャネル信号とを得るよう構成され、
前記第1のオーディオチャネル信号と前記第3のオーディオチャネル信号とは、第1の左右チャネル対を表し、
オーディオデコーダは、前記第2のオーディオチャネル信号と前記第4のオーディオチャネル信号とに基づいて、ステレオ帯域幅拡張を行い、前記第2の帯域幅拡張チャネル信号と前記第4の帯域幅拡張チャネル信号とを得るよう構成され、
前記第2のオーディオチャネル信号と前記第4のオーディオチャネル信号とは、第2の左右チャネル対を表す、請求項1〜10のいずれか1項に記載のオーディオデコーダ。 - オーディオデコーダは、予測ベースマルチチャネル復号を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とのジョイント符号化表現に基づいて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とを提供するよう構成される、請求項1〜11のいずれか1項に記載のオーディオデコーダ。
- オーディオデコーダは、残留信号支援マルチチャネル復号を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とのジョイント符号化表現に基づいて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とを提供するよう構成される、請求項1〜12のいずれか1項に記載のオーディオデコーダ。
- オーディオデコーダは、パラメータベースマルチチャネル復号を用いて、前記第1のダウンミックス信号に基づいて、少なくとも前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とを提供するよう構成され、
オーディオデコーダは、パラメータベースマルチチャネル復号を用いて、前記第2のダウンミックス信号に基づいて、少なくとも前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とを提供するよう構成される、請求項1〜13のいずれか1項に記載のオーディオデコーダ。 - 前記パラメータベースマルチチャネル復号は、それぞれのダウンミックス信号に基づいて2つ以上のオーディオチャネル信号を提供するために、2つのチャネル間の所望の相関関係および/または2つのチャネル間のレベル差を記述する1つ以上のパラメータを評価するよう構成される、請求項14に記載のオーディオデコーダ。
- オーディオデコーダは、残留信号支援マルチチャネル復号を用いて、前記第1のダウンミックス信号に基づいて、少なくとも前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とを提供するよう構成され、
オーディオデコーダは、残留信号支援マルチチャネル復号を用いて、前記第2のダウンミックス信号に基づいて、少なくとも前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とを提供するよう構成される、請求項1〜15のいずれか1項に記載のオーディオデコーダ。 - オーディオデコーダは、マルチチャネル復号を用いて、第1の残留信号と第2の残留信号とのジョイント符号化表現に基づいて、少なくとも前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とを提供するのに用いられる前記第1の残留信号と、少なくとも前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とを提供するのに用いられる前記第2の残留信号とを提供するよう構成される、請求項1〜16のいずれか1項に記載のオーディオデコーダ。
- 前記第1の残留信号および前記第2の残留信号は、オーディオシーンの異なる水平位置または方位位置と関連付けられる、請求項17に記載のオーディオデコーダ。
- 前記第1の残留信号は、オーディオシーンの左側と関連付けられ、前記第2の残留信号は、前記オーディオシーンの右側と関連付けられる、請求項17または18に記載のオーディオデコーダ。
- 少なくとも4つのオーディオチャネル信号(410,412;1512,1514;2212,2222,2214,2224)に基づいて符号化表現(420;1532;2272,2282)を提供するためのオーディオエンコーダ(400;1500;2200)であって、
オーディオエンコーダは、第1のオーディオチャネル信号(410;2212)と第3のオーディオチャネル信号(414,2214)とに基づいて、共通帯域幅拡張パラメータの第1の組(2215)を得るよう構成され、
オーディオエンコーダは、第2のオーディオチャネル信号(412;2222)と第4のオーディオチャネル信号(416;2224)とに基づいて、共通帯域幅拡張パラメータの第2の組(2225)を得るよう構成され、
オーディオエンコーダは、マルチチャネル符号化(450;2230)を用いて、少なくとも前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とをジョイント符号化して第1のダウンミックス信号(452;2234)を得るよう構成され、
オーディオエンコーダは、マルチチャネル符号化(460;2240)を用いて、少なくとも前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とをジョイント符号化して第2のダウンミックス信号(462;2244)を得るよう構成され、
オーディオエンコーダは、マルチチャネル符号化(470;2250)を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とをジョイント符号化して前記ダウンミックス信号の符号化表現を得るよう構成される、オーディオエンコーダ。 - 前記第1のダウンミックス信号および前記第2のダウンミックス信号は、オーディオシーンの異なる水平位置または方位位置と関連付けられる、請求項20に記載のオーディオエンコーダ。
- 前記第1のダウンミックス信号は、オーディオシーンの左側と関連付けられ、前記第2のダウンミックス信号は、前記オーディオシーンの右側と関連付けられる、請求項20または21に記載のオーディオエンコーダ。
- 前記第1のオーディオチャネル信号および前記第2のオーディオチャネル信号は、オーディオシーンの垂直近傍位置と関連付けられ、
前記第3のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの垂直近傍位置と関連付けられる、請求項20〜22のいずれか1項に記載のオーディオエンコーダ。 - 前記第1のオーディオチャネル信号および前記第3のオーディオチャネル信号は、オーディオシーンの第1の共通水平面または第の1高度ではあるが前記オーディオシーンの異なる水平位置または方位位置と関連付けられ、
前記第2のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの第2の共通水平面または第2の高度ではあるが前記オーディオシーンの異なる水平位置または方位位置と関連付けられ、
前記第1の共通水平面または第1の高度は、前記第2の共通水平面または第2の高度と異なる、請求項20〜23のいずれか1項に記載のオーディオエンコーダ。 - 前記第1のオーディオチャネル信号および前記第2のオーディオチャネル信号は、前記オーディオシーンの第1の共通垂直面または第1の方位位置ではあるが前記オーディオシーンの異なる垂直位置または高度と関連付けられ、
前記第3のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの第2の共通垂直面または第2の方位位置ではあるが前記オーディオシーンの異なる垂直位置または高度と関連付けられ、
前記第1の共通垂直面または第1の方位位置は、前記第2の共通垂直面または第2の方位位置と異なる、請求項24に記載のオーディオエンコーダ。 - 前記第1のオーディオチャネル信号および前記第2のオーディオチャネル信号は、オーディオシーンの左側と関連付けられ、
前記第3のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの右側と関連付けられる、請求項20〜25のいずれか1項に記載のオーディオエンコーダ。 - 前記第1のオーディオチャネル信号および前記第3のオーディオチャネル信号は、オーディオシーンの下部と関連付けられ、
前記第2のオーディオチャネル信号および前記第4のオーディオチャネル信号は、前記オーディオシーンの上部と関連付けられる、請求項20〜26のいずれか1項に記載のオーディオエンコーダ。 - オーディオエンコーダは、マルチチャネル符号化を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とに基づいて前記ダウンミックス信号の符号化表現を提供する際、水平結合を行うよう構成される、請求項20〜27のいずれか1項に記載のオーディオエンコーダ。
- オーディオエンコーダは、マルチチャネル符号化を用いて前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とに基づいて前記第1のダウンミックス信号を提供する際、垂直結合を行うよう構成され、
オーディオエンコーダは、マルチチャネル符号化を用いて前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とに基づいて前記第2のダウンミックス信号を提供する際、垂直結合を行うよう構成される、請求項20〜28のいずれか1項に記載のオーディオエンコーダ。 - オーディオエンコーダは、予測ベースマルチチャネル符号化を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とに基づいて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とのジョイント符号化表現を提供するよう構成される、請求項20〜29のいずれか1項に記載のオーディオエンコーダ。
- オーディオエンコーダは、残留信号支援マルチチャネル符号化を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とに基づいて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とのジョイント符号化表現を提供するよう構成される、請求項20〜30のいずれか1項に記載のオーディオエンコーダ。
- オーディオエンコーダは、パラメータベースマルチチャネル符号化を用いて、前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とに基づいて、前記第1のダウンミックス信号を提供するよう構成され、
オーディオエンコーダは、パラメータベースマルチチャネル符号化を用いて、前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とに基づいて、前記第2のダウンミックス信号を提供するよう構成される、請求項20〜31のいずれか1項に記載のオーディオエンコーダ。 - 前記パラメータベースマルチチャネル符号化は、2つのチャネル間の所望の相関関係および/または2つのチャネル間のレベル差を記述する1つ以上のパラメータを提供するよう構成される、請求項32に記載のオーディオエンコーダ。
- オーディオエンコーダは、残留信号支援マルチチャネル符号化を用いて、前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とに基づいて、前記第1のダウンミックス信号を提供するよう構成され、
オーディオエンコーダは、残留信号支援マルチチャネル符号化を用いて、前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とに基づいて、前記第2のダウンミックス信号を提供するよう構成される、請求項20〜33のいずれか1項に記載のオーディオエンコーダ。 - オーディオエンコーダは、マルチチャネル符号化を用いて、少なくとも前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とをジョイント符号化する際に得られる第1の残留信号と、少なくとも前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とをジョイント符号化する際に得られる第2の残留信号とのジョイント符号化表現を提供するよう構成される、請求項20〜34のいずれか1項に記載のオーディオエンコーダ。
- 前記第1の残留信号および前記第2の残留信号は、オーディオシーンの異なる水平位置または方位位置と関連付けられる、請求項35に記載のオーディオエンコーダ。
- 前記第1の残留信号は、オーディオシーンの左側と関連付けられ、
前記第2の残留信号は、前記オーディオシーンの右側と関連付けられる、請求項35または36に記載のオーディオエンコーダ。 - 符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するための方法(1000)であって、
マルチチャネル復号を用いて、第1のダウンミックス信号と第2のダウンミックス信号とのジョイント符号化表現に基づいて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とを提供するステップ(1010)と、
マルチチャネル復号を用いて、前記第1のダウンミックス信号に基づいて、少なくとも第1のオーディオチャネル信号と第2のオーディオチャネル信号とを提供するステップ(1020)と、
マルチチャネル復号を用いて、前記第2のダウンミックス信号に基づいて、少なくとも第3のオーディオチャネル信号と第4のオーディオチャネル信号とを提供するステップ(1030)と、
前記第1のオーディオチャネル信号と前記第3のオーディオチャネル信号とに基づいて、マルチチャネル帯域幅拡張を行い(1040)、第1の帯域幅拡張チャネル信号と第3の帯域幅拡張チャネル信号とを得るステップと、
前記第2のオーディオチャネル信号と前記第4のオーディオチャネル信号とに基づいて、マルチチャネル帯域幅拡張を行い(1050)、第2の帯域幅拡張チャネル信号と第4の帯域幅拡張チャネル信号とを得るステップとを備える、方法。 - 少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法(900)であって、
第1のオーディオチャネル信号と第3のオーディオチャネル信号とに基づいて、共通帯域幅拡張パラメータの第1の組を取得するステップ(920)と、
第2のオーディオチャネル信号と第4のオーディオチャネル信号とに基づいて、共通帯域幅拡張パラメータの第2の組を取得するステップ(930)と、
マルチチャネル符号化を用いて、少なくとも前記第1のオーディオチャネル信号と前記第2のオーディオチャネル信号とをジョイント符号化(930)して第1のダウンミックス信号を得るステップと、
マルチチャネル符号化を用いて、少なくとも前記第3のオーディオチャネル信号と前記第4のオーディオチャネル信号とをジョイント符号化(940)して第2のダウンミックス信号を得るステップと、
マルチチャネル符号化を用いて、前記第1のダウンミックス信号と前記第2のダウンミックス信号とをジョイント符号化(950)して前記ダウンミックス信号の符号化表現を得るステップとを備える、方法。 - コンピュータプログラムがコンピュータ上で動作する際に請求項38または39に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13177376.4 | 2013-07-22 | ||
EP13177376 | 2013-07-22 | ||
EP13189306.7A EP2830052A1 (en) | 2013-07-22 | 2013-10-18 | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
EP13189306.7 | 2013-10-18 | ||
PCT/EP2014/065021 WO2015010934A1 (en) | 2013-07-22 | 2014-07-14 | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016530788A true JP2016530788A (ja) | 2016-09-29 |
JP6117997B2 JP6117997B2 (ja) | 2017-04-19 |
Family
ID=48874137
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016528404A Active JP6346278B2 (ja) | 2013-07-22 | 2014-07-11 | ジョイント符号化残留信号を用いたオーディオエンコーダ、オーディオデコーダ、方法、およびコンピュータプログラム |
JP2016528408A Active JP6117997B2 (ja) | 2013-07-22 | 2014-07-14 | 符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するためのオーディオデコーダ、オーディオエンコーダ、方法、帯域幅拡張を用いた少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法およびコンピュータプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016528404A Active JP6346278B2 (ja) | 2013-07-22 | 2014-07-11 | ジョイント符号化残留信号を用いたオーディオエンコーダ、オーディオデコーダ、方法、およびコンピュータプログラム |
Country Status (19)
Country | Link |
---|---|
US (8) | US9953656B2 (ja) |
EP (4) | EP2830052A1 (ja) |
JP (2) | JP6346278B2 (ja) |
KR (2) | KR101823278B1 (ja) |
CN (5) | CN111105805A (ja) |
AR (2) | AR097012A1 (ja) |
AU (2) | AU2014295360B2 (ja) |
BR (2) | BR112016001141B1 (ja) |
CA (2) | CA2917770C (ja) |
ES (2) | ES2650544T3 (ja) |
MX (2) | MX357667B (ja) |
MY (1) | MY181944A (ja) |
PL (2) | PL3022735T3 (ja) |
PT (2) | PT3022735T (ja) |
RU (2) | RU2677580C2 (ja) |
SG (1) | SG11201600468SA (ja) |
TW (2) | TWI550598B (ja) |
WO (2) | WO2015010926A1 (ja) |
ZA (2) | ZA201601078B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021507314A (ja) * | 2018-01-18 | 2021-02-22 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 音場表現信号を符号化する方法及びデバイス |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
EP2830053A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP3262638B1 (en) | 2015-02-27 | 2023-11-08 | NewAuro BV | Encoding and decoding digital data sets |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP3285257A4 (en) | 2015-06-17 | 2018-03-07 | Samsung Electronics Co., Ltd. | Method and device for processing internal channels for low complexity format conversion |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10217468B2 (en) * | 2017-01-19 | 2019-02-26 | Qualcomm Incorporated | Coding of multiple audio signals |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
RU2750505C1 (ru) * | 2017-10-12 | 2021-06-29 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Оптимизация доставки звука для приложений виртуальной реальности |
KR20240033290A (ko) | 2018-04-11 | 2024-03-12 | 돌비 인터네셔널 에이비 | 오디오 렌더링을 위한 사전 렌더링된 신호를 위한 방법, 장치 및 시스템 |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
CN114708874A (zh) | 2018-05-31 | 2022-07-05 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
CN115132214A (zh) * | 2018-06-29 | 2022-09-30 | 华为技术有限公司 | 立体声信号的编码、解码方法、编码装置和解码装置 |
JP7504091B2 (ja) | 2018-11-02 | 2024-06-21 | ドルビー・インターナショナル・アーベー | オーディオ・エンコーダおよびオーディオ・デコーダ |
US10985951B2 (en) | 2019-03-15 | 2021-04-20 | The Research Foundation for the State University | Integrating Volterra series model and deep neural networks to equalize nonlinear power amplifiers |
CN112020724A (zh) * | 2019-04-01 | 2020-12-01 | 谷歌有限责任公司 | 学习可压缩的特征 |
US20200402522A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
CN110534120B (zh) * | 2019-08-31 | 2021-10-01 | 深圳市友恺通信技术有限公司 | 一种移动网络环境下的环绕声误码修复方法 |
KR20230060502A (ko) * | 2020-09-03 | 2023-05-04 | 소니그룹주식회사 | 신호 처리 장치 및 방법, 학습 장치 및 방법, 그리고 프로그램 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005535266A (ja) * | 2002-08-07 | 2005-11-17 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオチャンネルの空間的変換 |
WO2007111568A2 (en) * | 2006-03-28 | 2007-10-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for a decoder for multi-channel surround sound |
JP2009508433A (ja) * | 2005-09-14 | 2009-02-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
JP2011501230A (ja) * | 2007-10-22 | 2011-01-06 | 韓國電子通信研究院 | マルチオブジェクトオーディオ符号化および復号化方法とその装置 |
JP2011509429A (ja) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | 信号処理方法及び装置 |
JP2011066868A (ja) * | 2009-08-18 | 2011-03-31 | Victor Co Of Japan Ltd | オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置 |
Family Cites Families (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3528260B2 (ja) * | 1993-10-26 | 2004-05-17 | ソニー株式会社 | 符号化装置及び方法、並びに復号化装置及び方法 |
US5488665A (en) | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
US5970152A (en) | 1996-04-30 | 1999-10-19 | Srs Labs, Inc. | Audio enhancement system for use in a surround sound environment |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
KR101106026B1 (ko) * | 2003-10-30 | 2012-01-17 | 돌비 인터네셔널 에이비 | 오디오 신호 인코딩 또는 디코딩 |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
EP1761916A1 (en) * | 2004-06-22 | 2007-03-14 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
US7630396B2 (en) | 2004-08-26 | 2009-12-08 | Panasonic Corporation | Multichannel signal coding equipment and multichannel signal decoding equipment |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US7573912B2 (en) | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
WO2006103586A1 (en) * | 2005-03-30 | 2006-10-05 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
US7751572B2 (en) | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
JP4850827B2 (ja) * | 2005-04-28 | 2012-01-11 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
WO2007083952A1 (en) * | 2006-01-19 | 2007-07-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
JP2007207328A (ja) | 2006-01-31 | 2007-08-16 | Toshiba Corp | 情報記憶媒体、プログラム、情報再生方法、情報再生装置、データ転送方法、及びデータ処理方法 |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
DE102006047197B3 (de) * | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
ES2399562T3 (es) * | 2006-10-13 | 2013-04-02 | Auro Technologies | Método y codificador para combinar conjuntos de datos digitales, método para descodificar y descodificador para tales conjuntos de datos digitales combinados y soporte de grabación para almacenar tales conjuntos de datos digitales combinados |
CN101071570B (zh) * | 2007-06-21 | 2011-02-16 | 北京中星微电子有限公司 | 耦合声道的编、解码处理方法、音频编码装置及解码装置 |
WO2009038512A1 (en) | 2007-09-19 | 2009-03-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Joint enhancement of multi-channel audio |
EP2082396A1 (en) * | 2007-10-17 | 2009-07-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
US8504377B2 (en) | 2007-11-21 | 2013-08-06 | Lg Electronics Inc. | Method and an apparatus for processing a signal using length-adjusted window |
EP2229677B1 (en) * | 2007-12-18 | 2015-09-16 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
US20090164223A1 (en) | 2007-12-19 | 2009-06-25 | Dts, Inc. | Lossless multi-channel audio codec |
RU2452042C1 (ru) * | 2008-03-04 | 2012-05-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки аудиосигнала |
BR122020009727B1 (pt) | 2008-05-23 | 2021-04-06 | Koninklijke Philips N.V. | Método |
EP2144229A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
CA2820199C (en) | 2008-07-31 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Signal generation for binaural signals |
JP5608660B2 (ja) * | 2008-10-10 | 2014-10-15 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
WO2010064877A2 (en) * | 2008-12-05 | 2010-06-10 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
US8332229B2 (en) * | 2008-12-30 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte. Ltd. | Low complexity MPEG encoding for surround sound recordings |
EP2214162A1 (en) | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
EP2214161A1 (en) | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for upmixing a downmix audio signal |
CN105225667B (zh) * | 2009-03-17 | 2019-04-05 | 杜比国际公司 | 编码器系统、解码器系统、编码方法和解码方法 |
PL2394268T3 (pl) | 2009-04-08 | 2014-06-30 | Fraunhofer Ges Forschung | Urządzenie, sposób i program komputerowy do realizacji upmixu sygnału audio downmixu z użyciem wygładzania wartości faz |
CN101582262B (zh) * | 2009-06-16 | 2011-12-28 | 武汉大学 | 一种空间音频参数帧间预测编解码方法 |
EP2446435B1 (en) | 2009-06-24 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages |
CN101989425B (zh) * | 2009-07-30 | 2012-05-23 | 华为终端有限公司 | 多描述音频编解码的方法、装置及系统 |
KR101569702B1 (ko) * | 2009-08-17 | 2015-11-17 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
KR101613975B1 (ko) * | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
BR112012007138B1 (pt) | 2009-09-29 | 2021-11-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos |
CN101695150B (zh) * | 2009-10-12 | 2011-11-30 | 清华大学 | 多声道音频编码方法、编码器、解码方法和解码器 |
KR101710113B1 (ko) | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
KR101370870B1 (ko) * | 2009-12-16 | 2014-03-07 | 돌비 인터네셔널 에이비 | Sbr 비트스트림 파라미터 다운믹스 |
RU2559899C2 (ru) * | 2010-04-09 | 2015-08-20 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
BR112012026324B1 (pt) | 2010-04-13 | 2021-08-17 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V | Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável |
EP2609591B1 (en) | 2010-08-25 | 2016-06-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for generating a decorrelated signal using transmitted phase information |
KR101697550B1 (ko) * | 2010-09-16 | 2017-02-02 | 삼성전자주식회사 | 멀티채널 오디오 대역폭 확장 장치 및 방법 |
GB2485979A (en) * | 2010-11-26 | 2012-06-06 | Univ Surrey | Spatial audio coding |
ES2525839T3 (es) | 2010-12-03 | 2014-12-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Adquisición de sonido mediante la extracción de información geométrica de estimativos de dirección de llegada |
EP2477188A1 (en) | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
CN102610231B (zh) * | 2011-01-24 | 2013-10-09 | 华为技术有限公司 | 一种带宽扩展方法及装置 |
AR085895A1 (es) | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
US9117440B2 (en) * | 2011-05-19 | 2015-08-25 | Dolby International Ab | Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
JP6113282B2 (ja) * | 2012-08-10 | 2017-04-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | パラメトリックオーディオオブジェクトコーディングのための残差コンセプトを採用するエンコーダ、デコーダ、システム、および方法 |
PL2951820T3 (pl) | 2013-01-29 | 2017-06-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób wyboru jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania |
KR20140123015A (ko) * | 2013-04-10 | 2014-10-21 | 한국전자통신연구원 | 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법 |
WO2014168439A1 (ko) * | 2013-04-10 | 2014-10-16 | 한국전자통신연구원 | 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법 |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830332A3 (en) | 2013-07-22 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2830052A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
EP2830047A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
EP2928216A1 (en) | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
-
2013
- 2013-10-18 EP EP13189306.7A patent/EP2830052A1/en not_active Withdrawn
- 2013-10-18 EP EP13189305.9A patent/EP2830051A3/en not_active Withdrawn
-
2014
- 2014-07-11 AU AU2014295360A patent/AU2014295360B2/en active Active
- 2014-07-11 ES ES14739141.1T patent/ES2650544T3/es active Active
- 2014-07-11 PT PT147391411T patent/PT3022735T/pt unknown
- 2014-07-11 CN CN201911231996.6A patent/CN111105805A/zh active Pending
- 2014-07-11 MX MX2016000939A patent/MX357667B/es active IP Right Grant
- 2014-07-11 PL PL14739141T patent/PL3022735T3/pl unknown
- 2014-07-11 CA CA2917770A patent/CA2917770C/en active Active
- 2014-07-11 EP EP14739141.1A patent/EP3022735B1/en active Active
- 2014-07-11 JP JP2016528404A patent/JP6346278B2/ja active Active
- 2014-07-11 WO PCT/EP2014/064915 patent/WO2015010926A1/en active Application Filing
- 2014-07-11 SG SG11201600468SA patent/SG11201600468SA/en unknown
- 2014-07-11 KR KR1020167004625A patent/KR101823278B1/ko active IP Right Grant
- 2014-07-11 RU RU2016105702A patent/RU2677580C2/ru active
- 2014-07-11 CN CN201480041694.1A patent/CN105593931B/zh active Active
- 2014-07-11 BR BR112016001141-4A patent/BR112016001141B1/pt active IP Right Grant
- 2014-07-11 CN CN201911231963.1A patent/CN111128206A/zh active Pending
- 2014-07-14 KR KR1020167004626A patent/KR101823279B1/ko active IP Right Grant
- 2014-07-14 MY MYPI2016000096A patent/MY181944A/en unknown
- 2014-07-14 ES ES14738535.5T patent/ES2649194T3/es active Active
- 2014-07-14 AU AU2014295282A patent/AU2014295282B2/en active Active
- 2014-07-14 EP EP14738535.5A patent/EP3022734B1/en active Active
- 2014-07-14 RU RU2016105703A patent/RU2666230C2/ru active
- 2014-07-14 CN CN201480041693.7A patent/CN105580073B/zh active Active
- 2014-07-14 PT PT147385355T patent/PT3022734T/pt unknown
- 2014-07-14 BR BR112016001137-6A patent/BR112016001137B1/pt active IP Right Grant
- 2014-07-14 PL PL14738535T patent/PL3022734T3/pl unknown
- 2014-07-14 WO PCT/EP2014/065021 patent/WO2015010934A1/en active Application Filing
- 2014-07-14 MX MX2016000858A patent/MX357826B/es active IP Right Grant
- 2014-07-14 CA CA2918237A patent/CA2918237C/en active Active
- 2014-07-14 JP JP2016528408A patent/JP6117997B2/ja active Active
- 2014-07-14 CN CN201911131913.6A patent/CN111128205A/zh active Pending
- 2014-07-21 TW TW103124923A patent/TWI550598B/zh active
- 2014-07-21 TW TW103124925A patent/TWI544479B/zh active
- 2014-07-22 AR ARP140102716A patent/AR097012A1/es active IP Right Grant
- 2014-07-22 AR ARP140102715A patent/AR097011A1/es active IP Right Grant
-
2016
- 2016-01-22 US US15/004,661 patent/US9953656B2/en active Active
- 2016-01-22 US US15/004,617 patent/US10147431B2/en active Active
- 2016-02-17 ZA ZA2016/01078A patent/ZA201601078B/en unknown
- 2016-02-17 ZA ZA2016/01080A patent/ZA201601080B/en unknown
- 2016-05-27 US US15/167,072 patent/US9940938B2/en active Active
-
2018
- 2018-04-09 US US15/948,342 patent/US10741188B2/en active Active
- 2018-12-04 US US16/209,008 patent/US10770080B2/en active Active
-
2020
- 2020-08-11 US US16/990,566 patent/US11657826B2/en active Active
- 2020-09-03 US US17/011,584 patent/US11488610B2/en active Active
-
2023
- 2023-05-22 US US18/200,190 patent/US20240029744A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005535266A (ja) * | 2002-08-07 | 2005-11-17 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオチャンネルの空間的変換 |
JP2009508433A (ja) * | 2005-09-14 | 2009-02-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2007111568A2 (en) * | 2006-03-28 | 2007-10-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for a decoder for multi-channel surround sound |
JP2011501230A (ja) * | 2007-10-22 | 2011-01-06 | 韓國電子通信研究院 | マルチオブジェクトオーディオ符号化および復号化方法とその装置 |
JP2011509429A (ja) * | 2008-01-01 | 2011-03-24 | エルジー エレクトロニクス インコーポレイティド | 信号処理方法及び装置 |
JP2011066868A (ja) * | 2009-08-18 | 2011-03-31 | Victor Co Of Japan Ltd | オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021507314A (ja) * | 2018-01-18 | 2021-02-22 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 音場表現信号を符号化する方法及びデバイス |
US11322164B2 (en) | 2018-01-18 | 2022-05-03 | Dolby Laboratories Licensing Corporation | Methods and devices for coding soundfield representation signals |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6117997B2 (ja) | 符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するためのオーディオデコーダ、オーディオエンコーダ、方法、帯域幅拡張を用いた少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法およびコンピュータプログラム | |
RU2406166C2 (ru) | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170223 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6117997 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |