JP2010540985A - マルチチャネル・オーディオのジョイント強化 - Google Patents
マルチチャネル・オーディオのジョイント強化 Download PDFInfo
- Publication number
- JP2010540985A JP2010540985A JP2010525778A JP2010525778A JP2010540985A JP 2010540985 A JP2010540985 A JP 2010540985A JP 2010525778 A JP2010525778 A JP 2010525778A JP 2010525778 A JP2010525778 A JP 2010525778A JP 2010540985 A JP2010540985 A JP 2010540985A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- encoding
- residual
- encoder
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002787 reinforcement Effects 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 173
- 230000008569 process Effects 0.000 claims abstract description 105
- 239000002131 composite material Substances 0.000 claims abstract description 44
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 10
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 10
- 230000005540 biological transmission Effects 0.000 claims description 16
- 238000004091 panning Methods 0.000 claims description 14
- 230000005236 sound signal Effects 0.000 claims description 14
- 238000013139 quantization Methods 0.000 claims description 13
- 230000002596 correlated effect Effects 0.000 claims description 12
- 230000000875 corresponding effect Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 8
- 238000002347 injection Methods 0.000 claims description 7
- 239000007924 injection Substances 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 16
- 239000010410 layer Substances 0.000 description 16
- 239000000243 solution Substances 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 1
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- VJYFKVYYMZPMAB-UHFFFAOYSA-N ethoprophos Chemical compound CCCSP(=O)(OCC)SCCC VJYFKVYYMZPMAB-UHFFFAOYSA-N 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000007562 laser obscuration time method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
・エンドポイントでの適応。すなわち、より低い送信レートが選択されなければならない場合に、送信側に通知が行われ、送信側がスケーリング又はコーデックの変更を行う。
・中間ゲートウェイでの適応。ネットワークの一部が輻輳した場合に、又は異なるサービス能力を有する場合に、図1に示すような専用ネットワーク・エンティティが、サービスのトランスコーディングを行う。スケーラブル・コーデックを使えば、これはメディア・フレームを破棄したり、一部を切り取ったりするのと同じくらい単純でありうるだろう。
・ネットワーク内部での適応。ルータ又は無線インタフェースが輻輳した場合に、まさにその問題の場所でパケットを破棄するか又は一部を切り取ることによって適応が行われる。これは、無線リンクの深刻なトラヒック・バースト又はチャネル品質の変化の処理のような一時的な問題についての望ましい解決策である。
非会話型、ストリーミング/ダウンロード
一般に、現行のオーディオ研究の傾向は、低レートでの圧縮効率を改良する(32kbps未満のビットレートにおいて十分良好なステレオ品質を提供する)ことである。最近の低レート・オーディオの改良としては、MPEGにおけるパラメトリック・ステレオ(PS)ツール開発の完成と、3GPPにおけるCELPと変換コーデックである拡張AMR−WB(AMR−WB+とも知られる)との混合的な標準化とが挙げられる。また、空間的オーディオ符号化(サラウンド/5.1コンテンツ)の周辺でMPEG標準化の活動が進行中であり、最初の見本モデル(RM0)がすでに選択されている。
概要
一般的な音声圧縮において、最新の標準化活動は、8.55kbpsの最大レートでの動作をもサポートする3GPP2/VMR−WBコーデックの拡張である。ITU−Tでは、以前、マルチレートG.722.1オーディオ/ビデオ会議コーデックが、24、32及び48kbpsで動作する超広帯域(14kHzオーディオ帯域幅、32kHzサンプリング)の能力を提供する2つの新規モードと共に更新された。帯域幅を48kHzのフルバンド符号化へと拡張するさらなるモードが、現在、標準化の最中である。
ビット量/レイヤ数を増加させることでSNRを高めることのできるスケーラブルな会話型コーデックが複数存在する。例えば、MPEG4−CELP(非特許文献2)、G.727(エンベデッドADPCM)は、SNRがスケーラブルであり、追加レイヤの各々が、再構築された信号の再現性を高める。最近ではKovesi他が、所定のコア・レートから精細スケーラビリティを実現し、音声/オーディオ会議サーバ又はオープンループ・ネットワークの輻輳制御に適用可能なトランスポート帯域幅の精細最適化を可能にする柔軟なSNR及び帯域幅スケーラブルなコーデック(非特許文献3)を提案した。
ビット量を増加させることで帯域幅を増加させることができるコーデックも存在する。その例としては、G722(サブバンドADPCM)、3GPP WB音声コーデック競合に対するTI候補(非特許文献4)、そして、アカデミックなAMR−BWS(非特許文献5)コーデックなどがある。これらのコーデックについて、特定の帯域幅レイヤを追加すると、〜4kHzから〜7kHzまでの合成信号のオーディオ帯域幅を増加させる。帯域幅スケーラブル・コーダのもう1つの例は、非特許文献6の中で小石田によって記載されたG.729に基づく16kbps帯域幅スケーラブル・オーディオ・コーダである。また、SNRがスケーラブルであることに加えて、MPEG4−CELPは、8および16kHzでサンプルされた入力信号についてのSNRスケーラブル符号化システムを規定する(非特許文献3)。
会話型コーデックのチャネル・ロバスト性を改良することに関して、既存の標準及びコーデックについて様々な方法で行われてきた。以下に例をあげる。
・EVRC(1995)、部分的冗長符号化パラメータである差分遅延パラメータを送信して、チャネル削除の後で適応コードブック状態を再構築することを可能にし、従ってエラーリカバリを向上させる。EVRCの詳細な概要は、非特許文献7に見られる。
・AMR−NB(非特許文献8)において、GSMネットワークのために特定された音声サービスが、最大ソースレート適応原理で動作する。所与の総ビットレートについてのチャネル符号化とソース符号化との間のトレードオフが、GSMシステムによって連続的に監視されて調整され、そして、エンコーダ・ソースレートが、実現し得る最高の品質を提供するように構成される。ソースレートは、4.75kbpsから12.2kbpsまで変動してもよい。そして、チャネル総レートは、22.8kbpsか11.4kbpsかのいずれか一方である。
・最大ソースレートに加えて、上記の中点で述べた適応能力。AMR RTPペイロード・フォーマット(非特許文献9)によって、過去のフレーム全部の再送信が可能になり、ランダム・フレーム・エラーに対するロバスト性を大いに高める。非特許文献10には、全体的および部分的冗長性概念を適応的に用いるマルチモード適応AMRシステムについて記載されている。さらに、RTPペイロードによって、パケットのインタリービングが可能になり、従って、非会話アプリケーションのロバスト性が強化される。
・AMR−WBと組み合わせた複数記述符号化について非特許文献11に記載されており、加えて、低エラー条件についてはAMR−WBが用いられる適応コーデック・モード選択方式が提案されており、深刻なエラー条件の間は、ここに記載されたチャネル・ロバストMD−AMR(WB)コーダが用いられる。
・冗長データ送信技術に対するチャネル・ロバスト性技術の変形として、状態の依存関係を低減させるためにエンコーダ分析を調整する技術があり、これはAMR4.75符号化モードで行われる。AMR−WBについての同様のエンコーダ側分析技術の用途については、非特許文献12の中でLefebvre他によって記載された。
・非特許文献13では、Chen他が、総レートを適応させるためにマルチレート・オーディオ能力を用いるマルチメディア・アプリケーションと、低速の(1秒の)フィードバック・チャネルからの情報に基づく実際に用いられる圧縮方式とについて記述している。加えて、Chen他は、非常に深刻なエラー条件について音声合成を提供することができるように、冗長パラメータとしてテキストを用いる非常に低レートの基本レイヤを用いてオーディオ・アプリケーションを拡張する。
基本的に、オーディオ・スケーラビリティは、以下によって達成することができる。
・信号の量子化、すなわち、SNRのようなスケーラビリティを変えること。
・信号の帯域幅を拡張又は縮小すること。
・オーディオ・チャネルを落とすこと(例えば、1チャネルで構成されるモノラル、2チャネルで構成されるステレオ、5チャンネルで構成されるサラウンド)−(空間的スケーラビリティ)
現時点で利用可能な精細なスケーラブル・オーディオ・コーデックは、AAC−BSAC(アドバンスド・オーディオ符号化−ビット・スライス算術符号化)である。これは、オーディオと音声との両方の符号化に用いることができ、また、少量ずつの増分によるビットレートのスケーラビリティも可能にする。
オーディオ符号化システムについて所与のビットレートにおいて最良の知覚品質を達成するには、人間の聴覚系の性質を考慮しなければならない。その目的は、注意深く聞かれるだろう音の部分にリソースを集中させつつ、聴覚が鈍感なところではリソースを節約することである。人間の聴覚系の性質は、各種の聴覚検査で文書化されており、知覚モデルの導出にあたっては、それらの結果が用いられた。
マルチチャネル(すなわち、少なくとも二つの入力チャネル)符号化・復号を用いるオーディオ送信システムの一般的な例を図2に示す。システム全体は基本的に送信側にマルチチャネル・オーディオ・エンコーダ100と送信モジュール10とを備え、受信側に受信モジュール20とマルチチャネル・オーディオ・デコーダ200とを備える。
ここで、インデックスmは、周波数帯のサンプルをインデックス付けする。本発明の精神から逸脱することなく、適応型の時変重み係数αb及びβbと共に、もっと複雑なダウンミキシング方式が用いられてもよい。
を局所合成器104−Aにおいて生成する。次いで、ステレオ・エンコーダが、局所復号されたモノラル信号を用いてステレオ信号を生成する。
を入力として使用しつつ、左チャネル
及び
右チャネル
の相関を推定して予測値を提供することによって、ステレオ信号の相関成分を処理する。プロセスにおいて、チャネル予測器105−Aは、量子化されたビットストリーム(Q1)を生成する。元の入力信号L及びRから予測値
及び
を差し引くことによって、各チャネルのステレオ予測誤差εL及びεRが算出される。予測値は、局所復号されたモノラル信号
に基づくことから、予測残差はステレオ予測誤差とモノラル・コーデックからの符号化誤差との両方を含むだろう。本明細書では複合残差エンコーダ106−Aと呼ばれる次のステージにおいて、複合誤差信号がさらに分析されて量子化され(Q2)、それによってエンコーダは、ステレオ予測誤差とモノラル符号化誤差との相関を利用できるだけでなく、二つのエンティティ間のリソースを共有できるようになる。
は、デコーダで利用可能であるだろうから、予測の目的は、この信号から左右のチャネルのペアを再構築することである。
エンコーダでの元の入力信号から予測値を差し引くと、誤差信号のペア
が形成されるだろう。
を用いることによって時間領域でこの解を求めることができる。
周波数領域における同様の算出は、次式のように書くことができる。
ここで、HL(b,k)とHR(b,k)とは、周波数帯bの係数kについてのフィルタ
と
との周波数応答であり、
と
と
とは、時間信号
と
と
との変換後の相手方である。
ここでkは帯域bにおけるMDCT係数のインデックスを表し、mは時間領域のフレーム・インデックスを表す。
ここで、E[・]は、平均化演算子を表すとともに、任意の時間周波数変数の一例として、所定の時間周波数領域全体の平均化として定義される。例えば次式のようである。
また、平均化は、周波数帯bを越えて拡張されてもよい。
によって表現するために、いわゆるチャネル間予測(ICP)がサイド予測器105−Bにおいて採用されるが、これは以下の式のようにN個のフィルタ係数ht(i)を有する時変FIRフィルタH(z)を通じてモノラル信号m(n)をフィルタリングすることによって得られてもよい。
ここで、Lはフレームサイズであり、NはICPフィルタの長さ/次数/次元である。簡単に言えば、ICPフィルタの性能は、従ってMSEの大きさは、最終のステレオ分離を判定する主要な要因である。サイド信号は左右のチャネル間の差を記述するので、十分に広いステレオ・イメージを保証するためには、忠実なサイド信号の再構築が欠かせない。
本発明の例示的な実施形態において、チャネル間相関又は他の信号依存性を抽出することを目指して、複合誤差信号に関して分析が行われる。分析結果は好適には、複合誤差のチャネルの無相関化/直交化を行う変換を導出するために用いられる。
次いで、帯域bについての予測誤差は、(フレーム・インデックスmと帯域係数kとを省略すると)以下のように書ける。
である。これは、とりわけ、拡散音場成分、すなわち、モノラル信号とはまったく相関関係のない成分を有する。第2の成分は、モノラル符号化誤差に関するものであり、そして、モノラル信号についての符号化雑音に比例する。
モノラル符号化誤差は、パンニング因子を用いて相異なるチャネルに分散されることに留意されたい。
ここで、
は、KLT変換(角度θb(m)を平面内で回転)であり、
は、
となる二つの無相関成分である。
が、例えばスカラ量子化器又は格子量子化器を用いることによって、量子化されて符号化される。最も低い成分が無視される一方で、すなわち、そのエネルギー以外の第2の成分
のゼロビット量子化が、この成分を人工的にシミュレートするために、デコーダにおいて必要であろう。言い換えると、ここで、量子化のための第1の誤差成分と第2の誤差成分のエネルギーの指標とを選択するために、エンコーダが構成される。
の成分が復号され、一方で、適切なエネルギーで雑音注入を用いることによって
の成分がシミュレートされ、受信されたレベルにレベルを調整する利得算出モジュールを用いることによってエネルギーが設定される。また、利得は、直接に量子化されることもできるし、利得量子化の任意の先行技術を用いてもよい。雑音注入は、(量子化された形式でデコーダにおいて利用可能な)
によって無相関化されており、かつ、
と同じエネルギーを有しているという制約を用いて雑音成分を生成する。二つの残差のエネルギー分散を維持するために、無相関化の制約が重要である。事実、雑音置換と
との間のいかなる量の相関も、相関のミスマッチにつながるであろうし、二つの復号されたチャネル上の知覚バランスを阻害して、ステレオ幅に影響を及ぼすであろう。
複合又は連結誤差空間の作成によって、さらなる適応と最適化とが可能になる。
・バイノーラル・マスキング・レベル差(BMLD、非特許文献14)に依存する周波数重み付けを導入することによって。この周波数重み付けはさらに、人間の聴覚系のマスキング特性を利用するために、一方のKLT成分を他方に対して強調してもよい。
本発明の例示的な実施形態において、好適にはデコーダへ送信されるパラメータは、二つの回転角、すなわちパンニング角ψbとKLT角θbとである。典型的には各サブバンドについて一組の角度が用いられ、パンニング角ψbのベクトルとKLT角θbのベクトルとが生成される。例えば、これらのベクトルの要素が共通のスカラ量子化器を用いて個別に量子化される。次いで、予測方式が量子化器のインデックスに適用されうる。この方式は好適には、評価されて選択された閉ループである二つのモードを有する。
1.時間予測。各帯域についての予測器は、前のフレームからのインデックスである。
2.周波数予測。各インデックスが中央値インデックスに対して量子化される。
デルタ・インデックスは量子化器の境界を用いることによって、図8に説明されるように、ラップ・アラウンド・ステップが考慮されてもよい。
AAC 先進的音響符号化(Advanced Audio Coding)
AAC−BSAC 先進的音響符号化−ビット・スライス算術符号化(Advanced Audio Coding-Bit-Sliced Audio Coding)
ADPCM 適応差分パルス符号変調(Adaptive Differential Pulse Code Modulation)
AMR 適応マルチレート(Adaptive Multi Rate)
AMR−NB 狭帯域適応マルチレート(AMR NarrowBand)
AMR−WB 広帯域適応マルチレート(AMR WideBand)
AMR−BWS AMR帯域幅スケーラブル(AMR-BandWidth Scalable)
AOT オーディオ・オブジェクト・タイプ(Audio Object Type)
BCC バイノーラル・キュー符号化(Binaural Cue Coding)
BMLD バイノーラル・マスキング・レベル差分(Binaural Masking Level Difference)
CELP 符号励振線形予測(Code Excited Linear Prediction)
EV エンベデッド可変ビットレート(Embedded VBR(Variable Bit Rate))
EVRC 拡張可変レートコーダ(Enhanced Variable Rate Coder)
FIR 有限インパルス応答(Finite Impulse Response)
GSM 移動体通信のための全世界システム(Groupe Special Mobile;Global System for Mobile communications)
ICP チャネル間予測(Inter Channel Prediction)
KLT カルーネン・レーベ変換(Karhunen-Loeve Transform)
LSB 最下位ビット(Least significant Bit)
MD−AMR マルチディスクリプションAMR(Multi Description AMR)
MDCT 修正離散コサイン変換(Modified Discrete Cosine Transform)
MPEG ムービング・ピクチャ・エキスパート・グループ(Moving Picture Experts Group)
MPEG−SLS MPEGスケーラブル・ロスレス(MPEG-Scalable to Lossless)
MSB 最上位ビット(Most Significant Bit)
MSE 平均2乗誤差(Mean Squared Error)
MMSE 最小平均2乗誤差(Minimum MSE)
PCA 主成分分析(Principal Components Analysis)
PS パラメトリック・ステレオ(Parametric Stereo)
RTP リアルタイムプロトコル(Real-Time Protocol)
SNR 信号対雑音比(Signal-to-Noise Ratio)
VMR 可変マルチレート(Variable Multi Rate)
VoIP IP音声(Voice over Internet Protocol)
xDSL xディジタル加入者線(x Digital Subscriber Line)
Claims (30)
- マルチチャネル・オーディオ信号のオーディオ入力チャネル集合の信号表現について動作し、第1の符号化プロセスと第2の符号化プロセスとを含む少なくとも二つの信号符号化プロセスを伴う符号化手順全体に基づくマルチチャネル・オーディオ符号化方法であって、
前記第1の符号化プロセスの符号化誤差の表現を含む局所復号された信号を生成するために、前記第1の符号化プロセスに関連して局所合成を実行する工程と、
少なくとも前記局所復号された信号を前記第2の符号化プロセスの入力として適用する工程と、
前記符号化手順のうち前記第2の符号化プロセスを含む少なくとも一つから、少なくとも二つの残差符号化誤差信号を生成する工程と、
前記残差誤差信号間の相関に基づいて、さらなる符号化プロセスにおいて前記残差誤差信号の複合残差符号化を実行する工程と
を有することを特徴とするマルチチャネル・オーディオ符号化方法。 - 前記複合残差符号化を実行する工程は、
対応する無相関誤差成分を生成する変換によって前記相関残差誤差信号を無相関化する工程と、
前記無相関誤差成分の少なくとも一つを量子化する工程と、
前記変換の表現を量子化する工程と
を含むことを特徴とする請求項1に記載のマルチチャネル・オーディオ符号化方法。 - 前記無相関誤差成分の少なくとも一つを量子化する工程は、前記誤差成分のエネルギー・レベルに基づいて前記無相関誤差成分にビット割り当てを実行する工程を含むことを特徴とする請求項2に記載のマルチチャネル・オーディオ符号化方法。
- 前記変換はカルーネン・レーベ変換(KLT)であることを特徴とする請求項2に記載のマルチチャネル・オーディオ符号化方法。
- 前記変換の前記表現はKLT回転角の表現を含み、前記第2の符号化プロセスはパンニング角に加えられる予測パラメータを生成し、前記パンニング角と前記KLT回転角とは量子化されていることを特徴とする請求項4に記載のマルチチャネル・オーディオ符号化方法。
- 前記パンニング角と前記KLT回転角とは差分量子化によって一緒に量子化されていることを特徴とする請求項5に記載のマルチチャネル・オーディオ符号化方法。
- 前記少なくとも二つの残差符号化誤差信号は前記第2の符号化プロセスから生成されるを有することを特徴とする請求項1に記載のマルチチャネル・オーディオ符号化方法。
- 前記入力チャネル集合の第1の信号表現は前記第1の符号化プロセスにおいて符号化され、
前記入力チャネルの少なくとも一部のうち、少なくとも一つの付加的な信号表現は、前記局所復号された信号を前記第2の符号化プロセスへの入力として用いつつ、前記第2の信号符号化プロセスにおいて符号化され、
前記残差誤差信号は、前記残差信号間の相関に基づいて複合誤差分析を含む複合誤差符号化プロセスにおいて処理される
ことを特徴とする請求項1に記載のマルチチャネル・オーディオ符号化方法。 - 前記第1の符号化プロセスはモノラル符号化プロセスのようなメイン符号化プロセスであり、前記第2の符号化プロセスはステレオ符号化プロセスのような補助的な符号化プロセスであることを特徴とする請求項1に記載のマルチチャネル・オーディオ符号化方法。
- マルチチャネル・オーディオ信号のオーディオ入力チャネル集合の信号表現について動作し、第1のエンコーダと第2のエンコーダとを含む少なくとも二つのエンコーダを備えるマルチチャネル・オーディオ符号化装置であって、
前記第1のエンコーダの符号化誤差の表現を含む局所復号された信号を生成するために、前記第1のエンコーダに関連する局所合成のための手段と、
少なくとも前記局所復号された信号を前記第2のエンコーダへの入力として適用する手段と、
前記第1のエンコーダと前記第2のエンコーダとのうち前記第2のエンコーダを含む少なくとも一方から、少なくとも二つの残差符号化誤差信号を生成する手段と、
前記残差誤差信号間の相関に基づいて、前記残差誤差信号の複合残差符号化のための複合残差エンコーダと
を備えることを特徴とするマルチチャネル・オーディオ符号化装置。 - 前記複合残差エンコーダは、
対応する無相関誤差成分を生成する変換を用いて前記相関残差誤差信号を無相関化する手段と、
前記無相関誤差成分の少なくとも一つを量子化する手段と、
前記変換の表現を量子化する手段と
を含むことを特徴とする請求項10に記載のマルチチャネル・オーディオ符号化装置。 - 前記無相関誤差成分の少なくとも一つを量子化する手段は、前記誤差成分のエネルギー・レベルに基づいて前記無相関誤差成分にビット割り当てを実行するように構成されていることを特徴とする請求項11に記載のマルチチャネル・オーディオ符号化装置。
- 前記変換はカルーネン・レーベ変換(KLT)であることを特徴とする請求項11に記載のマルチチャネル・オーディオ符号化装置。
- 前記変換の前記表現はKLT回転角の表現を含み、前記第2のエンコーダはパンニング角に加えられる予測パラメータを生成するように構成されており、前記符号化装置は、前記パンニング角と前記KLT回転角とを量子化するように構成されていることを特徴とする請求項13に記載のマルチチャネル・オーディオ符号化装置。
- 前記パンニング角と前記KLT回転角とを差分量子化によって一緒に量子化するように構成されていることを特徴とする請求項14に記載のマルチチャネル・オーディオ符号化装置。
- 前記少なくとも二つの残差符号化誤差信号は前記第2のエンコーダから生成されることを特徴とする請求項10に記載のマルチチャネル・オーディオ符号化装置。
- 前記第1のエンコーダは、前記入力チャネル集合の第1の信号表現を符号化するように構成されており、
前記第2のエンコーダは、前記局所復号された信号を前記第2のエンコーダへの入力として用いつつ、前記入力チャネルの少なくとも一部のうち、少なくとも一つの付加的な信号表現を符号化するように構成されており、
前記複合残差エンコーダは、前記残差信号間の相関に基づいて複合誤差分析を含む前記残差誤差信号の処理を行うように構成されている
ことを特徴とする請求項10に記載のマルチチャネル・オーディオ符号化装置。 - 前記第1のエンコーダはモノラル・エンコーダのようなメイン・エンコーダであり、前記第2のエンコーダはステレオ・エンコーダのような補助的なエンコーダであることを特徴とする請求項10に記載のマルチチャネル・オーディオ符号化装置。
- 前記複合残差エンコーダは、ステレオ予測誤差とモノラル符号化誤差との間の相関に基づいて動作するように構成されていることを特徴とする請求項18に記載のマルチチャネル・オーディオ符号化装置。
- マルチチャネル・オーディオ信号の再構築のための入来ビットストリームについて動作し、第1の復号プロセスと第2の復号プロセスとを含む少なくとも二つの信号復号プロセスを伴う復号手順全体に基づくマルチチャネル・オーディオ復号方法であって、
相関残差誤差信号を生成するために、無相関残差誤差信号情報を表す入来残差ビットストリームに基づいて、さらなる復号プロセスにおいて複合残差復号を実行する工程と、
マルチチャネル・オーディオ信号を生成するために、前記第1の復号プロセスと前記第2の復号プロセスとのうち前記第2の復号プロセスを含む少なくとも一方からの復号されたチャネル表現に前記相関残差誤差信号を加える工程と
を有することを特徴とするマルチチャネル・オーディオ復号方法。 - 前記第1の復号プロセスは、入来メイン・ビットストリームに基づいて復号されたダウンミックス信号を生成するメイン・デコーダの復号プロセスであり、前記第2の復号プロセスは、前記復号されたダウンミックス信号と入来予測ビットストリームとに基づいて予測チャネル集合を再構築するパラメトリック・マルチチャネル・デコーダの復号プロセスであることを特徴とする請求項20に記載のマルチチャネル・オーディオ復号方法。
- 前記さらなる復号プロセスにおいて複合残差復号を実行する工程は、前記入来残差ビットストリームに基づいて残差逆量子化を実行する工程と、前記相関残差誤差信号を生成するために入来変換ビットストリームに基づいて直交信号置換及び逆変換を実行する工程とを含むことを特徴とする請求項20又は21に記載のマルチチャネル・オーディオ復号方法。
- 前記逆変換は逆カルーネン・レーベ変換(KLT)であることを特徴とする請求項22に記載のマルチチャネル・オーディオ復号方法。
- 前記入来残差ビットストリームは量子化された第1の無相関成分と第2の無相関成分のエネルギーの指標とを含み、前記変換ビットストリームは前記KLT変換の表現を含み、量子化された前記第1の無相関成分は復号されており、前記第2の無相関成分は前記示されたエネルギーで雑音注入を行うことによってシミュレートされ、前記逆KLT変換は前記第1の復号された無相関成分とシミュレートされた前記第2の無相関成分と前記KLT変換表現とに基づいて前記相関残差誤差信号を生成することを特徴とする請求項23に記載のマルチチャネル・オーディオ復号方法。
- マルチチャネル・オーディオ信号の再構築のための入来ビットストリームについて動作し、第1のデコーダと第2のデコーダとを含む少なくとも二つのデコーダを備えるマルチチャネル・オーディオ復号装置であって、
相関残差誤差信号を生成するために、無相関残差誤差信号情報を表す入来残差ビットストリームに基づいて、複合残差復号を実行するように構成された複合残差デコーダと、
マルチチャネル・オーディオ信号を生成するために、前記第1のデコーダと前記第2のデコーダとのうち前記第2のデコーダを含む少なくとも一方からの復号されたチャネル表現に前記相関残差誤差信号を加えるように構成された加算モジュールと
を備えることを特徴とするマルチチャネル・オーディオ復号装置。 - 前記第1のデコーダは、入来メイン・ビットストリームに基づいて復号されたダウンミックス信号を生成するメイン・デコーダであり、前記第2のデコーダは、前記復号されたダウンミックス信号と入来予測ビットストリームとに基づいて予測チャネル集合を再構築するパラメトリック・マルチチャネル・デコーダであることを特徴とする請求項25に記載のマルチチャネル・オーディオ復号装置。
- 前記複合残差デコーダは、
前記入来残差ビットストリームに基づいた残差逆量子化のための手段と、
前記相関残差誤差信号を生成するための入来変換ビットストリームに基づいた直交信号置換及び逆変換のための手段と
を含むことを特徴とする請求項25又は26に記載のマルチチャネル・オーディオ復号装置。 - 前記逆変換は逆カルーネン・レーベ変換(KLT)であることを特徴とする請求項27に記載のマルチチャネル・オーディオ復号装置。
- 前記入来残差ビットストリームは量子化された第1の無相関成分と第2の無相関成分のエネルギーの指標とを含み、前記変換ビットストリームは前記KLT変換の表現を含み、前記複合残差デコーダは量子化された前記第1の無相関成分を復号するとともに、前記第2の無相関成分を前記示されたエネルギーで雑音注入を行うことによってシミュレートするように構成されており、前記逆KLT変換は前記第1の復号された無相関成分とシミュレートされた前記第2の無相関成分と前記KLT変換表現とに基づいて前記相関残差誤差信号を生成することを特徴とする請求項28に記載のマルチチャネル・オーディオ復号装置。
- 請求項10乃至19のいずれか1項に記載のオーディオ符号化装置と請求項25乃至29のいずれか1項に記載のオーディオ復号装置とを備えるオーディオ送信システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96017507P | 2007-09-19 | 2007-09-19 | |
US60/960,175 | 2007-09-19 | ||
PCT/SE2008/000272 WO2009038512A1 (en) | 2007-09-19 | 2008-04-17 | Joint enhancement of multi-channel audio |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010540985A true JP2010540985A (ja) | 2010-12-24 |
JP2010540985A5 JP2010540985A5 (ja) | 2011-05-12 |
JP5363488B2 JP5363488B2 (ja) | 2013-12-11 |
Family
ID=40468142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010525778A Expired - Fee Related JP5363488B2 (ja) | 2007-09-19 | 2008-04-17 | マルチチャネル・オーディオのジョイント強化 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8218775B2 (ja) |
EP (1) | EP2201566B1 (ja) |
JP (1) | JP5363488B2 (ja) |
KR (1) | KR101450940B1 (ja) |
CN (1) | CN101802907B (ja) |
PL (1) | PL2201566T3 (ja) |
WO (1) | WO2009038512A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141412A (ja) * | 2010-12-28 | 2012-07-26 | Fujitsu Ltd | 符号器、符号化方法および符号化プログラム |
JP2016529544A (ja) * | 2013-07-22 | 2016-09-23 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | ジョイント符号化残留信号を用いたオーディオエンコーダ、オーディオデコーダ、方法、およびコンピュータプログラム |
JP2022516374A (ja) * | 2019-01-11 | 2022-02-25 | ブームクラウド 360 インコーポレイテッド | サウンドステージを保全するオーディオチャネルの加算 |
JP2022523414A (ja) * | 2019-03-05 | 2022-04-22 | オランジュ | 回転の補間と量子化による空間化オーディオコーディング |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8452587B2 (en) * | 2008-05-30 | 2013-05-28 | Panasonic Corporation | Encoder, decoder, and the methods therefor |
EP2293292B1 (en) * | 2008-06-19 | 2013-06-05 | Panasonic Corporation | Quantizing apparatus, quantizing method and encoding apparatus |
US8644526B2 (en) | 2008-06-27 | 2014-02-04 | Panasonic Corporation | Audio signal decoding device and balance adjustment method for audio signal decoding device |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
WO2010042024A1 (en) | 2008-10-10 | 2010-04-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Energy conservative multi-channel audio coding |
WO2010091555A1 (zh) * | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种立体声编码方法和装置 |
EP2224425B1 (en) * | 2009-02-26 | 2012-02-08 | Honda Research Institute Europe GmbH | An audio signal processing system and autonomous robot having such system |
US20100223061A1 (en) * | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
BRPI1009467B1 (pt) * | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
GB2470059A (en) | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
WO2010140306A1 (ja) * | 2009-06-01 | 2010-12-09 | 三菱電機株式会社 | 信号処理装置 |
US20120072207A1 (en) * | 2009-06-02 | 2012-03-22 | Panasonic Corporation | Down-mixing device, encoder, and method therefor |
KR101613975B1 (ko) * | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
KR101641684B1 (ko) * | 2009-08-18 | 2016-07-21 | 삼성전자주식회사 | 디지털 멀티미디어 방송의 전송 장치 및 방법, 수신 장치 및 방법 |
EP2492911B1 (en) * | 2009-10-21 | 2017-08-16 | Panasonic Intellectual Property Management Co., Ltd. | Audio encoding apparatus, decoding apparatus, method, circuit and program |
US8942989B2 (en) * | 2009-12-28 | 2015-01-27 | Panasonic Intellectual Property Corporation Of America | Speech coding of principal-component channels for deleting redundant inter-channel parameters |
JP5299327B2 (ja) * | 2010-03-17 | 2013-09-25 | ソニー株式会社 | 音声処理装置、音声処理方法、およびプログラム |
MX2012011532A (es) | 2010-04-09 | 2012-11-16 | Dolby Int Ab | Codificacion a estereo para prediccion de complejos basados en mdct. |
EP2572499B1 (en) * | 2010-05-18 | 2018-07-11 | Telefonaktiebolaget LM Ericsson (publ) | Encoder adaption in teleconferencing system |
CN102280107B (zh) * | 2010-06-10 | 2013-01-23 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
JP5581449B2 (ja) * | 2010-08-24 | 2014-08-27 | ドルビー・インターナショナル・アーベー | Fmステレオ無線受信機の断続的モノラル受信の隠蔽 |
WO2012065081A1 (en) * | 2010-11-12 | 2012-05-18 | Polycom, Inc. | Scalable audio in a multi-point environment |
EP2661746B1 (en) * | 2011-01-05 | 2018-08-01 | Nokia Technologies Oy | Multi-channel encoding and/or decoding |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
CN105976824B (zh) * | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
US20150025894A1 (en) * | 2013-07-16 | 2015-01-22 | Electronics And Telecommunications Research Institute | Method for encoding and decoding of multi channel audio signal, encoder and decoder |
TWI634547B (zh) | 2013-09-12 | 2018-09-01 | 瑞典商杜比國際公司 | 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品 |
US9088447B1 (en) * | 2014-03-21 | 2015-07-21 | Mitsubishi Electric Research Laboratories, Inc. | Non-coherent transmission and equalization in doubly-selective MIMO channels |
KR101641645B1 (ko) * | 2014-06-11 | 2016-07-22 | 전자부품연구원 | 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템 |
EP3067885A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
US10499229B2 (en) * | 2016-01-24 | 2019-12-03 | Qualcomm Incorporated | Enhanced fallback to in-band mode for emergency calling |
EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
FR3048808A1 (fr) * | 2016-03-10 | 2017-09-15 | Orange | Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal |
US10057681B2 (en) | 2016-08-01 | 2018-08-21 | Bose Corporation | Entertainment audio processing |
US10217468B2 (en) * | 2017-01-19 | 2019-02-26 | Qualcomm Incorporated | Coding of multiple audio signals |
US10362332B2 (en) * | 2017-03-14 | 2019-07-23 | Google Llc | Multi-level compound prediction |
US11176954B2 (en) * | 2017-04-10 | 2021-11-16 | Nokia Technologies Oy | Encoding and decoding of multichannel or stereo audio signals |
CN107483194A (zh) * | 2017-08-29 | 2017-12-15 | 中国民航大学 | 基于非零脉冲位置和幅度信息的g.729语音信息隐藏算法 |
CN114420139A (zh) * | 2018-05-31 | 2022-04-29 | 华为技术有限公司 | 一种下混信号的计算方法及装置 |
CN118192925A (zh) | 2018-08-21 | 2024-06-14 | 杜比国际公司 | 即时播放帧(ipf)的生成、传输及处理的方法、设备及系统 |
KR102501233B1 (ko) * | 2018-10-22 | 2023-02-20 | 삼성에스디에스 주식회사 | 화상 회의 서비스 방법 및 이를 수행하기 위한 장치 |
JP7092050B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 多地点制御方法、装置及びプログラム |
CN110718211B (zh) * | 2019-09-26 | 2021-12-21 | 东南大学 | 一种基于混合压缩卷积神经网络的关键词识别系统 |
JPWO2022009505A1 (ja) * | 2020-07-07 | 2022-01-13 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6629078B1 (en) * | 1997-09-26 | 2003-09-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method of coding a mono signal and stereo information |
JP2005522721A (ja) * | 2002-04-10 | 2005-07-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ステレオ信号の符号化 |
WO2006070751A1 (ja) * | 2004-12-27 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
WO2006089570A1 (en) * | 2005-02-22 | 2006-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
NL9100173A (nl) | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
US6125348A (en) * | 1998-03-12 | 2000-09-26 | Liquid Audio Inc. | Lossless data compression with low complexity |
US7231054B1 (en) * | 1999-09-24 | 2007-06-12 | Creative Technology Ltd | Method and apparatus for three-dimensional audio display |
SE519985C2 (sv) | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
EP1500084B1 (en) * | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
EP1595247B1 (en) | 2003-02-11 | 2006-09-13 | Koninklijke Philips Electronics N.V. | Audio coding |
EP1851866B1 (en) | 2005-02-23 | 2011-08-17 | Telefonaktiebolaget LM Ericsson (publ) | Adaptive bit allocation for multi-channel audio encoding |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
WO2006109113A2 (en) | 2005-04-12 | 2006-10-19 | Acol Technologies Sa | Primary optic for a light emitting diode |
-
2008
- 2008-04-17 CN CN2008801083540A patent/CN101802907B/zh not_active Expired - Fee Related
- 2008-04-17 PL PL08753930T patent/PL2201566T3/pl unknown
- 2008-04-17 KR KR1020107006915A patent/KR101450940B1/ko active IP Right Grant
- 2008-04-17 WO PCT/SE2008/000272 patent/WO2009038512A1/en active Application Filing
- 2008-04-17 EP EP08753930.0A patent/EP2201566B1/en not_active Not-in-force
- 2008-04-17 JP JP2010525778A patent/JP5363488B2/ja not_active Expired - Fee Related
- 2008-04-17 US US12/677,383 patent/US8218775B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6629078B1 (en) * | 1997-09-26 | 2003-09-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method of coding a mono signal and stereo information |
JP2005522721A (ja) * | 2002-04-10 | 2005-07-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ステレオ信号の符号化 |
WO2006070751A1 (ja) * | 2004-12-27 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
WO2006089570A1 (en) * | 2005-02-22 | 2006-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
Non-Patent Citations (1)
Title |
---|
VAN DER WAAL, R. G. ET. AL.: ""Subband coding of stereophonic digital audio signals"", ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1991. ICASSP-91., 1991 INTERNATIONAL CONFERENCE ON, vol. 5, JPN6012052413, April 1991 (1991-04-01), pages 3601 - 3604, XP008146163, ISSN: 0002349313 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141412A (ja) * | 2010-12-28 | 2012-07-26 | Fujitsu Ltd | 符号器、符号化方法および符号化プログラム |
JP2016529544A (ja) * | 2013-07-22 | 2016-09-23 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | ジョイント符号化残留信号を用いたオーディオエンコーダ、オーディオデコーダ、方法、およびコンピュータプログラム |
US9940938B2 (en) | 2013-07-22 | 2018-04-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
US9953656B2 (en) | 2013-07-22 | 2018-04-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
US10147431B2 (en) | 2013-07-22 | 2018-12-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
US10741188B2 (en) | 2013-07-22 | 2020-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
US11657826B2 (en) | 2013-07-22 | 2023-05-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
JP2022516374A (ja) * | 2019-01-11 | 2022-02-25 | ブームクラウド 360 インコーポレイテッド | サウンドステージを保全するオーディオチャネルの加算 |
JP7038921B2 (ja) | 2019-01-11 | 2022-03-18 | ブームクラウド 360 インコーポレイテッド | サウンドステージを保全するオーディオチャネルの加算 |
JP2022523414A (ja) * | 2019-03-05 | 2022-04-22 | オランジュ | 回転の補間と量子化による空間化オーディオコーディング |
JP7419388B2 (ja) | 2019-03-05 | 2024-01-22 | オランジュ | 回転の補間と量子化による空間化オーディオコーディング |
Also Published As
Publication number | Publication date |
---|---|
CN101802907B (zh) | 2013-11-13 |
CN101802907A (zh) | 2010-08-11 |
PL2201566T3 (pl) | 2016-04-29 |
EP2201566B1 (en) | 2015-11-11 |
EP2201566A1 (en) | 2010-06-30 |
KR20100063099A (ko) | 2010-06-10 |
WO2009038512A1 (en) | 2009-03-26 |
US8218775B2 (en) | 2012-07-10 |
EP2201566A4 (en) | 2011-09-28 |
JP5363488B2 (ja) | 2013-12-11 |
KR101450940B1 (ko) | 2014-10-15 |
US20100322429A1 (en) | 2010-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5363488B2 (ja) | マルチチャネル・オーディオのジョイント強化 | |
JP5608660B2 (ja) | エネルギ保存型マルチチャネルオーディオ符号化 | |
CA2997331C (en) | Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel | |
JP5536674B2 (ja) | 入力データストリームのミキシング及びそこからの出力データストリームの生成 | |
JP5171256B2 (ja) | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 | |
JP5215994B2 (ja) | 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置 | |
JP5413839B2 (ja) | 符号化装置および復号装置 | |
JP5706445B2 (ja) | 符号化装置、復号装置およびそれらの方法 | |
JPWO2005106848A1 (ja) | スケーラブル復号化装置および拡張レイヤ消失隠蔽方法 | |
WO2008000901A1 (en) | Scalable audio coding | |
Gayer et al. | A guideline to audio codec delay | |
KR101462293B1 (ko) | 고정된 배경 잡음의 평활화를 위한 방법 및 장치 | |
US8930197B2 (en) | Apparatus and method for encoding and reproduction of speech and audio signals | |
JPWO2008132826A1 (ja) | ステレオ音声符号化装置およびステレオ音声符号化方法 | |
JPWO2008090970A1 (ja) | ステレオ符号化装置、ステレオ復号装置、およびこれらの方法 | |
Li et al. | Efficient stereo bitrate allocation for fully scalable audio codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110317 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110317 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121005 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121205 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130405 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130716 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130812 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5363488 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |