JP2008517337A - 予測ベースの多チャンネル再構築の性能を改善するための方法 - Google Patents

予測ベースの多チャンネル再構築の性能を改善するための方法 Download PDF

Info

Publication number
JP2008517337A
JP2008517337A JP2007537235A JP2007537235A JP2008517337A JP 2008517337 A JP2008517337 A JP 2008517337A JP 2007537235 A JP2007537235 A JP 2007537235A JP 2007537235 A JP2007537235 A JP 2007537235A JP 2008517337 A JP2008517337 A JP 2008517337A
Authority
JP
Japan
Prior art keywords
energy
channel
upmixing
signal
upmix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007537235A
Other languages
English (en)
Other versions
JP4527781B2 (ja
Inventor
ヴィレモース ラーシュ
クヨルリング クリストファー
プルナーゲン エイコ
ローデン ヨーナス
ブレバールト ジェローン
ホート ジェラルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Koninklijke Philips NV
Dolby International AB
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Dolby International AB, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008517337A publication Critical patent/JP2008517337A/ja
Application granted granted Critical
Publication of JP4527781B2 publication Critical patent/JP4527781B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Fats And Perfumes (AREA)
  • Amplifiers (AREA)
  • Transmitters (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Electroluminescent Light Sources (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Manufacturing Of Micro-Capsules (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

少なくとも1個のベースチャンネルに基づくオーディオ信号の多チャンネル再構築のために、予測的アップミックスによるエネルギ損失を補償するためにエネルギ尺度が用いられる。エネルギ尺度はエンコーダまたはデコーダにおいて適用可能である。さらに、エネルギ損失を伴うアップミックス手順によって生成された出力チャンネルに、無相関化された信号が付加される。無相関化された信号のエネルギは、予測的アップミックスによって導入されたエネルギ誤差より小さいかこれと等しい。したがって、高周波数再構築技術で符号化されたアップミキシング信号等の、予測ベースのアップミックス方法で生じる問題を解決でき、アップミックス信号間の正しい相関が得られるか、またはアップミックスを任意のダウンミックスに適合させることができる。
【選択図】図11

Description

本発明は利用可能なステレオ信号と付加的な制御データに基づいたオーディオ信号の多チャンネル再構築に関するものである。
オーディオ符号化の最近の発展により、ステレオ(またはモノラル)信号と対応する制御データとに基づいてオーディオ信号の多チャンネル表現を再生成する能力が利用可能となった。これらの方法はドルビープロロジック(Dolby Prologic)等の過去のマトリックスベースの解決策とは実質的に異なっている。なぜなら送信されたモノラルまたはステレオチャンネルに基づいてサラウンドチャンネルの、アップミックスとも称される、再生成を制御するために、付加的な制御データが送信されるからである。
すなわち、パラメータによる多チャンネルのオーディオデコーダは、N>MであるM個の送信されたチャンネルと、付加的な制御データとに基づいてN個のチャンネルを再構築する。付加的なN−M個のチャンネルを送信するのに比べて、付加的な制御データのデータ速度はかなり遅いので、符号化を非常に効率化すると同時にMチャンネルの装置とNチャンネルの装置との互換性を確保する。
これらのパラメータによるサラウンド符号化方法は通常、IID(Inter channel Intensity Difference:チャンネル間強度差)およびICC(Inter Channel Coherence:チャンネル間コヒーレンス)に基づいたサラウンド信号のパラメータ化を含む。これらのパラメータはアップミックス処理におけるチャンネル対間の出力比と相関とを示す。先行技術で用いられているさらなるパラメータは、アップミックス手順の間の中間または出力チャンネルを予測するのに用いられる予測パラメータを含む。
先行技術で説明された予測ベースの方法の最も魅力的な用途のひとつは、2個の送信チャネルから5.1チャネルを再生成するシステムのためのものである。この構成では、デコーダ側でステレオ送信が利用可能であるが、これはオリジナルの5.1多チャンネル信号のダウンミックスである。ここで特に興味深いのは、ステレオ信号からセンターチャンネルを可能な限り正確に抽出できる点であり、なぜなら通常センターチャンネルは左右のダウンミックスチャンネルの両者にダウンミックスされるからである。これは、センターチャンネルを構築するのに用いられる2個の送信チャネルの各々の量を記述した2個の予測係数を推定することによって行なわれる。これらのパラメータは、上述のIIDおよびICCパラメータと同様に異なる周波数領域について推定される。
しかしながら、予測パラメータは2個の信号の出力比を示すものではなく、最小二乗誤差の意味で波形整合に基づくものであるため、この方法は予測パラメータの計算後のステレオ波形に何らかの変形があると本質的にその影響を受けやすくなる。
近年のオーディオ符号化におけるさらなる発展により、低いビットレートでのオーディオコーデックの非常に有用なツールとして、高周波再構築法がもたらされた。その一例はSBR(Spectral Band Replication:スペクトル帯域複製)であり[WO98/57436]、これはMPEG−4高効率AAC等のMPEG標準化コーデックにおいて用いられている。これらの方法に共通するのは、基礎となるコアコーデックによって符号化された狭帯域信号と少量の付加的なガイド情報とから、デコーダ側で高周波数を再生成することである。1個または2個のチャネルに基づいて多チャンネル信号をパラメータによって再構築する場合と同様に、欠落した信号成分(SBRの場合、高周波数)を再生成するのに必要とされる制御データの量は、波形によるコーデックで完全な信号を符号化するのに必要とされるデータ量に比べかなり小さい。
しかしながらここで承知しておくべきことは、再生成された高帯域信号は知覚的にはオリジナルの高帯域信号と等しいものの、実際の波形はかなり異なるということである。さらに、低いビットレートでステレオ信号を符号化する波形コーダでは通常ステレオ前処理が用いられ、これはステレオ信号のミッド/サイド表現のサイド信号に制限が加えられることを意味する。
MPEG−4高効率AACを用いたステレオコーデック信号、または高周波再構築技術を利用した何らかの他のコーデックに基づく多チャンネルの表現が望まれる場合には、ダウンミックスされたステレオ信号を符号化する際に用いられるコーデックのこれらのおよび他の局面を考慮しなければならない。
さらに多チャンネルオーディオ信号として利用可能な録音に関して通常は専用のステレオミックスが利用可能であり、これは多チャンネル信号を自動的にダウンミックスしたものではない。これは一般に「芸術的ダウンミックス」と称される。このダウンミックスは多チャンネル信号の線形組合せとして表現することはできない。
本発明の目的はより良い品質の再構築された多チャンネル出力をもたらす、改良された多チャンネルダウンミックス/エンコーダまたはアップミックス/デコーダの概念を提供することである。
この目的は請求項1に記載の多チャンネルシンセサイザ、請求項30に記載の多チャンネル入力信号を処理するためのエンコーダ、請求項42に記載の少なくとも3個の出力チャンネルを生成する方法、請求項43に記載のエンコード方法、請求項44に記載のエンコードされた多チャンネル信号、請求項45に記載のデータキャリアによって達成される。
発明の概要
本発明は予測ベースのアップミックス方法が用いられる場合のダウンミックスされた多チャンネル信号の波形の変形の問題に関する。これは、ダウンミックスされた信号が、波形をかなり変形させるステレオ前処理、高周波再構築および他の符号化スキームによって符号化される場合を含む。さらに本発明は芸術的ダウンミックスの、すなわち多チャンネル信号から自動的に得られるものではないダウンミックス信号のために予測的アップミックス技術を用いた場合に生じる問題に対処するものである。
本発明は以下の特徴を含む。
−ダウンミックスされた波形に代えて変形された波形に基づいて予測パラメータを推定すること;
−予測ベースの方法を、それが有利である周波数域でのみ用いること;
−予測ベースのアップミックス手順において導入されたチャンネル間の不正確な相関とエネルギ損失とを訂正すること。
好ましい実施例の説明
以下で説明する実施例は単に本発明の原理を例示するものである。当業者にとっては構成の修正や変形およびここでの説明の詳細は明らかであることが理解される。したがってその範囲は添付の特許請求の範囲によってのみ限定されるものであって、以下の実施例の説明によって示される具体的な詳細によって限定されるものではない。
以下のパラメータの計算、応用、アップミックス、ダウンミックスまた他のいかなる行為も、周波数帯域選択ベースにより、すなわちフィルタバンクのサブバンドについて行なわれ得ることを強調しておく。
本発明の利点の概略を述べるために、先行技術によって公知の予測的アップミックスのより詳細な説明をまず最初に行なう。図1に概略を示すように、2つのダウンミックスチャネルに基づく3チャンネルのアップミックスを仮定する。ここで101は左オリジナルチャンネル、102はセンターオリジナルチャンネル、103は右オリジナルチャンネル、104はエンコーダ側ダウンミックスおよびパラメータ抽出モジュール、105および106は予測パラメータ、107は左ダウンミックスチャンネル、108は右ダウンミックスチャンネル、109は予測アップミックスモジュール、110、111および112はそれぞれ再構築された左、センターおよび右チャンネルを表わす。
ここで以下の定義を仮定する。Xは3×L行列であって、3個の信号セグメントl(k)、r(k)、c(k)、k=0…、L−1を行として含む。
同様に、2個のダウンミックスされた信号l(k)、r(k)がXの行を形成するものとする。ダウンミックス処理は以下の式で説明される。
Figure 2008517337
ここでダウンミックス行列は以下のように定義される。
Figure 2008517337
ダウンミックス行列の好ましい選択例は以下のものである。
Figure 2008517337
すなわち、左ダウンミックス信号l(k)はl(k)およびαc(k)のみを含み、r(k)はr(k)およびαc(k)のみを含むことを意味する。このダウンミックス行列が好ましいのはセンターチャンネルの同じ量を左と右のダウンミックスに割当てるからであり、さらにオリジナルの右チャンネルを左のダウンミックスに何ら割当てず、また逆も同様だからである。
アップミックスは以下のように定義される。
Figure 2008517337
ここでCは3×2アップミックス行列である。
先行技術から公知の予測的アップミックスは最小二乗の意味においてCについて優決定系を解くという思想に依拠している。
Figure 2008517337
これは以下の正規方程式を導く。
Figure 2008517337
式(6)の左からDで乗算することによりDCX0X0 *= X0X0 *が得られ、X0X0 *=DXX*D*となる通則的な場合にはこれが正則であることから、これは
Figure 2008517337
を暗示する。ここでIはn個の単位行列を示す。この関係により、パラメータ空間
Cは次元2に減じられる。
上述のことから、アップミックス行列C(数式8)は、ダウンミックス行列Dが公知であってC行列の2個の要素、例えばc11およびc22が送信されていれば、デコーダ側で完全に定義することができる。
Figure 2008517337
残差(予測誤差)信号は以下で与えられる。
Figure 2008517337
左からDを乗算することにより、(7)から以下が得られる。
Figure 2008517337
以下のような1×L行ベクトル信号xが存在することになる。
Figure 2008517337
ここでvはDのカーネル(ゼロ空間)を張る3×1単位ベクトルである。例えばダウンミックス(3)の場合、以下を用いることができる。
Figure 2008517337
一般に、(数式13)かつ(数式14)である場合、これは単にある重み付け因子までは残差信号が3個のチャンネルすべてについて共通であることを意味する。
Figure 2008517337
Figure 2008517337
Figure 2008517337
直交射影原理により残差xr(k)は3個の予測された信号(数式16)、(数式17)、(数式18)の全てに直交する。
Figure 2008517337
Figure 2008517337
Figure 2008517337
[本発明の好ましい実施例によって解決される問題および得られる改良点]
上で概要を述べた先行技術に従った予測に基づくアップミックスを用いる際に、明らかに以下のような問題が生じる:
・この方法は最小二乗誤差の意味で波形整合に依拠しており、ダウンミックスされた信号の波形が維持されないシステムでは効果がない。
・この方法は再構築されたチャンネル間に正しい相関構造を提供しない(以下で概略を述べる)。
・この方法は再構築されたチャンネルに正しい量のエネルギを再構築しない。
[エネルギ補償]
上述の通り、予測ベースの多チャンネル再構築に伴う問題の一つは、予測誤差が3個の再構築されたチャンネルのエネルギ損失に対応することである。以下ではこのエネルギ損失の理論と好ましい実施例によって教示される解決策との概略を述べる。第一に、理論的な分析を行い、その後、以下で概略を述べる理論に従った本発明の好ましい実施例を説明する。
E、(数式19)(以下hat{E}と記載する)およびErをXのオリジナル信号、(数式20)(以下hat{X}と記載する)の予測された信号およびXrの予測誤差信号のそれぞれのエネルギの和であるとする。
Figure 2008517337
Figure 2008517337
直交性により、以下が成り立つ。
Figure 2008517337
予測利得の総和はP=E/Erとして定義することができるが、以下においては、パラメータ
Figure 2008517337

を考えることがより便利であろう。
したがって、ρ2∈[0,1]が予測的アップミックスの相対的エネルギの総和を測定する。
このρにより、z=l、r、cについて(数式23)となるように、補償利得(数式24)を適用することによって、各チャンネルを再調整することが可能となる。
Figure 2008517337
Figure 2008517337
具体的には、目標エネルギは式(12)から、以下で与えられる。
Figure 2008517337
したがって、解くべき式は
Figure 2008517337

となる。
したがって、vが単位ベクトルであるので、
Figure 2008517337
となり、ρの定義(14)と式(13)とにより、以下が得られる。
Figure 2008517337
これらすべてにより、利得は次のようになる。
Figure 2008517337
この方法では、ρを送信することに加えて、デコードされたチャンネルのエネルギ分布をデコーダで計算しなければならないことは明らかである。さらに、正確に再構築されるのはエネルギだけであって、非対角の相関構造は無視される。
総エネルギが確実に保存されるような利得の値を引出すことは可能であるが、個別のチャンネルのエネルギが正しいか否かは保証されない。総エネルギが確実に保存されるすべてのチャンネルに対する共通の利得g=gは、定義式(数式30)によって得られる。
Figure 2008517337
すなわち
Figure 2008517337
線形性により、この利得はエンコーダにおいてダウンミックスされた信号に適用することができ、したがって付加的なパラメータを送信する必要はない。
図2は出力チャンネルの正確なエネルギを維持しながら3個のチャンネルを再生成する本発明の好ましい実施例を概略的に示す。ダウンミックスされた信号lおよびrは予測パラメータcおよびcとともにアップミックスモジュール201に入力される。アップミックスモジュールはダウンミックス行列Dに関する知識と受信した予測パラメータとに基づいて、アップミックス行列Cを再生成する。201からの3個の出力チャンネルは調整パラメータρとともに202に入力される。3個のチャンネルは送信されたパラメータρの関数として利得調整され、エネルギ訂正されたチャンネルが出力される。
図3に調整モジュール202のより詳細な実施例を示す。3個のアップミックスされたチャンネルは調整モジュール304とモジュール301、302および303にそれぞれ入力される。エネルギ推定モジュール301−303は3個のアップミックスされた信号のエネルギを推定し、測定されたエネルギを調整モジュール304に入力する。エンコーダから受信された制御信号ρ(予測利得を表す)もまた304に入力される。調整モジュールは上で概略を述べた式(19)を実現するものである。
本発明の別の実現例では、エネルギ訂正はエンコーダ側で行うことができる。図4はエンコーダの実現例を例示する図であって、ダウンミックスされた信号l107およびr108は403によって計算された利得値にしたがって401および402で利得調整される。利得値は上述の式(20)にしたがって導出される。上で概略を述べたとおり、本発明のこの実施例は、予測的アップミックスから3個の再生成されたチャンネルのエネルギを計算する必要がないため、有利である。しかしながら、これは単に3個の再生成されたチャンネルのエネルギの総和を確実に正しくするというだけである。個々のチャンネルのエネルギが確実に正しいというわけではない。
図4において、ダウンミキサの下に式(3)に対応するダウンミックス行列の好ましい例が記されている。しかしながら、ダウンミキサは式(2)で概略を示したいずれかの一般的なダウンミックス行列のいずれを適用することもできる。
後で概略を述べるように、入力として3個のチャンネルがあり、出力として2個のチャンネルがあるダウンミキサのこのような例では、少なくとも2個の付加的なアップミックスパラメータc、cが必要である。ダウンミックス行列Dが可変であるか、またはデコーダに完全に知られていない場合には、用いられたダウンミックスの付加的な情報を、パラメータ105および106に加えて、エンコーダ側からデコーダ側に送信しなければならない。
[相関構造]
先行技術で説明されたアップミックス手順に伴う問題の一つは、これが再生成されたチャンネル間の正しい相関を再構築しない、ということである。したがって、上で概略を述べたとおり、センターチャンネルは左ダウンミックスチャンネルと右ダウンミックスチャンネルの線形組合せとして予測され、左右のチャンネルは、左右のダウンミックスチャンネルから予測されたセンターチャンネルを減じることによって再構築される。予測誤差があれば、予測された左右のチャンネルにオリジナルなセンターチャンネルの残り部分が生じることは明らかである。これは、再構築されたチャンネルにおいて3個のチャンネル間の相関がオリジナルの3個のチャンネルのそれと同じでないことを暗示する。
好ましい実施例では、予測された3個のチャンネルを、測定された予測誤差にしたがって無相関化された信号と組合せるべきであることが教示される。
正しい相関構造を達成するための基本的な理論を以下で簡単に説明する。残差の特別な構造を用いて、デコーダにおいて残差を無相関化された信号xで置換することによって、完全な3×3相関構造XX*を再構築することができる。
最初に、正規方程式(6)がXX0 *=0を導くので、
Figure 2008517337
となり、X=hat{X}+Xrであるから、
Figure 2008517337
が得られ、ここで、最後の等式に(10)および(17)が適用される。
を、hat{X}・xr *=0となるようにすべてのデコードされた信号(数式34)、(数式35)、(数式36)から無相関化された信号であるとする。
Figure 2008517337
Figure 2008517337
Figure 2008517337
強化された信号
Figure 2008517337
はしたがって、相関行列
Figure 2008517337
を有することとなる。元の相関行列(22)を完全に再生するためには
Figure 2008517337
であれば十分である。もしxがダウンミックスされた信号、例えば(1/2)・(l0+r0) を無相関化することによって、さらに利得γによって得られるのであれば、以下が成立するはずである。
Figure 2008517337
この利得はエンコーダで計算可能である。しかしながら、式(14)からのより良く定義されたパラメータρ2∈[0,1]を用いるとすれば、hat{E}および‖(1/2)・(l0+r0)‖2の推定はデコーダ側で行わなければならない。これに照らして、より魅力的な選択肢は、3個の無相関化要素を用いてxを生成することである。すなわち
Figure 2008517337
というのも、この場合、‖χd22・hat{E}となり、したがって式(25)は以下を選択することによって満足されるからである。
Figure 2008517337
図5はチャンネル間の正確な相関構造を維持しながら、2個のダウンミックスチャンネルから3個のチャンネルの予測的アップミックスを行うための、本発明の一実施例を例示する図である。図5において、モジュール109、110、111および112は図1と同様であり、したがってここではさらなる詳細は説明しない。109から出力された3個のアップミックスされた信号は無相関化モジュール501、502および503に入力される。これらは相互に無相関化された信号を生成する。無相関化された信号は和を取られてミキシングモジュール504、505および506に入力され、ここで109からの出力と混合される。予測的にアップミックスされた信号と、これらの無相関化されたものとを混合することが本発明の本質的な特徴である。図6にミキシングモジュール504、505および506の一実施例を示す。本発明のこの実施例では、無相関化された信号のレベルは制御信号γに基づいて601で調整される。その後無相関化された信号は602において予測的にアップミックスされた信号に加えられる。
第三の好ましい実施例では、無相関化部501、502、503をアップミックスされたチャンネルに用いる。無相関化された信号はまた、無相関化部501’によって生成することもでき、これは入力信号として、ダウンミックスされた信号、またはすべてのダウンミックスされた信号を受信する。さらに、ダウンミックスチャンネルが2つ以上ある場合には、図5で示すように、無相関化信号は左ベースチャンネルlと右ベースチャンネルrとのための別個の無相関化部を用い、これら別個の無相関化部の出力を組合せることによって生成することができる。この方策は実質的には図5に示した方策と同じであるが、アップミックスの前のベースチャンネルが用いられる点で図5に示したものと異なる。
さらに、図5に関連して概略を述べるように、ミキシングモジュール504、505および506は、エネルギ尺度ρのみに依存するため3個のチャンネル全てに対し等しい因子γを受信するのみでなく、式(10)および(11)に関連して概略を述べるように決定される、チャンネルごとに特有の因子νl、νc、およびνrも、また受信する。しかしながらこのパラメータは、デコーダがエンコーダで用いられたダウンミックスを知っている場合には、エンコーダからデコーダへ送信しなくても良い。代わりに、式(10)および(11)に示された行列vにおけるこれらのパラメータがミキシングモジュール504、505および506に予めプログラムされることが好ましく、こうすることによって、これらのチャンネルごとに特有の重み付け因子を送信する必要がなくなる(しかし当然のことながら、要求があれば送信することができる)。
図6では、重み付け装置601がγとチャンネルごとに特有のダウンミックス依存パラメータνzとの積を用いて無相関化された信号のエネルギを調整することが示されており、ここでzはl、rまたはcを表す。ここで、式(26a)により、xのエネルギが予測的にアップミックスされた左、右およびセンターチャンネルのエネルギの和と確実に等しくされることが注目される。したがって装置601は単純にスケーリング因子GIを用いるスケーラとして実現することができる。しかしながら、無相関化信号が別に生成される場合には、ミキシングモジュール504、505、506は、加算器602で加算された信号のエネルギが残差信号のエネルギ、すなわち非エネルギ保存の予測的アップミックスによって失われたエネルギ、と等しくなるように、加算装置602によって加算された無相関化信号の絶対的なエネルギ調整を行わなければならない。
チャンネルごとに特有のダウンミックス依存パラメータνzに関しては、図6に関連して上で概略を述べた内容が図7の実施例についても同様に当てはまる。
さらに、ここで注目すべきことは、図6および図7の実施例は予測的アップミックスで失われたエネルギの少なくとも一部が無相関化信号を用いて付加されるという認識に基づいていることである。正しい信号エネルギと、ドライ信号成分(非相関)信号と「ウェット」信号成分(無相関化)の正しい部分を得るためには、ミキシングモジュール504への「ドライ」信号入力が前もってスケールされていないことを確実にする必要がある。例えば、ベースチャンネルがデ−エンコーダ側で前もって訂正されている場合(図4に示す)、この図4の事前の訂正はこのチャンネルをミキサボックス504、505または506に入力する前に(相対的)エネルギ尺度ρによってチャンネルを乗算することによって補償しなければならない。さらに、このようなエネルギの訂正がデコーダ側で行われている場合には、図5に示すように、ダウンミックスチャンネルをアップミキサ109に入れる前に、同様の手順を行わなければならない。
残差エネルギの一部のみを無相関化された信号でカバーする場合には、ρ依存因子によってミキシングボックス504、505、506に入力される信号を前もってスケーリングすることによって事前の訂正を部分的にのみ除去すればよいが、これは、因子ρそのものよりも1に近い。当然のことながら、この部分的に補償する事前スケーリング因子は図7において605に入力されるエンコーダによって生成された信号кに依存する。このように部分的に前もってスケーリングを行わなければならない場合、Gで適用される重み付け因子は不要である。これに代えて、入力604から加算器602への分岐は図6と同じになる。
[無相関化の程度の制御]
本発明の好ましい実施例は、予測されたアップミックスされた信号に加えられる無相関化の量は、正しい出力エネルギを依然として維持しながら、エンコーダから制御できることを教示している。これは、センターチャンネルにドライな音声があり、左右のチャンネルに背景音がある典型的な「インタビュー」の例では、センターチャンネルの予測誤差を無相関化された信号で置換することが望ましくないからである。
本発明の好ましい実施例に従えば、図5で概略を述べたものに代わるミキシング手順を用いることができる。以下では、本発明にしたがって、総エネルギ保存の問題と真の相関再生の問題とをどのように分離することができ、また無相関化の量をパラメータкによってどのように制御できるか、が示される。
総エネルギ保存利得補償(20)がダウンミックスされた信号に対して行われ、そのため最初にデコードされた信号hat{X}/ρが得られると仮定する。ここから、同じ総エネルギ‖d‖2=hat{E}/ρ2を備えた無相関化された信号dが、例えば上のセクションと同様に3個の無相関化部を用いることによって生成される。したがって、アップミックスの総和は以下のように定義される。
Figure 2008517337
ここで、κ∈[ρ,1]は送信されたパラメータである。κ=1を選択することは、無相関化された信号の付加なしの総エネルギ保存に対応し、κ=ρは完全な3×3相関構造の再生に対応する。ここで以下が成り立つ。
Figure 2008517337
したがって、全てのκ∈[ρ,1]について、総エネルギが保存され、これは、(30)において行列のトレース(対角要素の値の和)を計算することによって理解されるとおりである。しかしながら正しい個々のエネルギが得られるのはк=ρについてのみである。
図7は上で概略を述べた理論に従った図5のミキシングモジュール504、505および506の実施例を例示する図である。ミキシングモジュールのこの別の例においては、制御パラメータγは702および701に入力される。702について用いられる利得因子は上の式(29)に従ったкに対応し、701に用いられる利得因子は上の式(29)に従った(1-κ21/2に対応する。
本発明の上述の実施例は、このシステムにおいてエンコーダ側に検出メカニズムを用いることを可能にし、これは予測ベースのアップミックスにおいて付加すべき無相関化の量を推定する。図7に示された実現例は示された量の無相関化信号を付加し、エネルギ訂正を適用するので、3個のチャンネルの総エネルギは正しくなり、一方で、予測誤差の任意の量を無相関化信号によって置換することができる。
これは、3個の背景音信号があるような例、例えば背景音が多いクラシック音楽の曲等で、エンコーダが「ドライ」なセンターチャンネルの欠如を検出し、デコーダに予測誤差全体を無相関化された信号と置換えさせて、先行技術の予測ベースの方法のみでは不可能であったような方法で、3個のチャンネルからの音の背景音を再生成できることを意味する。さらに、ドライなセンターチャンネルがある信号、例えばセンターチャンネルに音声があり、左右のチャンネルに背景音があるような場合、エンコーダは予測誤差を無相関化された信号で置換することは音響心理学的に正しくないと検出し、これに代えてデコーダに3個の再構築されたチャンネルのレベルを調整させて、3個のチャンネルのエネルギが正しくなるようにさせる。明らかに、上の極端な例は本発明の2つの生じうる結果を表すものである。これは上の例で概略を述べたような極端な例だけをカバーすることを意図したものではない。
[変形された波形に対する予測係数の適合化]
上で概略を述べたとおり、予測パラメータは所与のオリジナルの3個のチャンネルxとダウンミックス行列Dについて平均二乗誤差を最小化することによって推定される。しかしながら多くの状況において、ダウンミックスされた信号がオリジナルの多チャンネル信号を示す行列Xによって乗算されたダウンミックス行列Dとして記述されうることに依拠することができない。この明らかな例は、いわゆる「芸術的ダウンミックス」が用いられる場合であって、2つのチャンネルのダウンミックスは多チャンネル信号の線形組合せとして示すことができない。別の例は、符号化効率を改善するために、ダウンミックスされた信号がステレオ前処理または他のツールを利用して知覚的オーディオコーデックによって符号化されている場合である。先行技術でよく知られているように、多くの知覚的オーディオコーデックはミッド/サイドステレオ符号化に依拠しており、ここではビットレートに制約のある条件下ではサイド信号が減衰され、エンコード用に用いられる信号よりもステレオイメージが狭い出力が生じる。
図8は本発明の好ましい実施例を表し、ここでは多チャンネル信号から離れたエンコーダ側でのパラメータ抽出が変形されたダウンミックス信号にもアクセスを有する。ここでは変形されたダウンミックスが801によって生成される。もしC行列の2個のパラメータのみが送信される場合、アップミックスを行い、全てのアップミックスされたチャンネルについて最小二乗誤差を得るためには、デコーダ側のD行列の知識が必要とされる。しかしながら、この実施例では、エンコーダ側のダウンミックスされた信号lおよびrを、デコーダ側で仮定されるのと必ずしも同じでないダウンミックス行列Dを用いて得られたダウンミックスされた信号l’およびr’によって置換できることを教示している。エンコーダ側でパラメータ推定のために別のダウンミックスを用いることは、デコーダ側で正しいセンターチャンネルの再生のみを確実にする。エンコーダからデコーダへ付加的な情報を送信することにより、3個のチャンネルのより正確なアップミックスが得られる。極端な場合ではC行列の6個の要素全てを送信することができる。しかしながらこの実施例では、C行列のサブセットが802で用いられるダウンミックス行列Dの情報を伴う場合には、これを送信可能であることを教示している。
先に述べたとおり、知覚的なオーディオコーデックは低いビットレートでのステレオ符号化のためにミッド/サイド符号化を用いる。さらにビットレートに制約のある状況下では、サイド信号のエネルギを減じるために、ステレオ前処理が通常用いられる。これは耳に聞こえる量子化歪と帯域制限に比べて、ステレオ信号の幅でステレオ信号を減少させるほうが好ましい符号化上の加工であるという、音響心理学的な考えに基づいて行われるものである。
したがって、ステレオ前処理が用いられる場合、ダウンミックス式(3)は以下のように表される。
Figure 2008517337
ここで、γはサイド信号の減衰である。先に概略を述べたとおり、3個のチャンネルを正確に再構築できるようにするためには、デコーダ側でD行列が知られている必要がある。したがって、この実施例は減衰因子がデコーダ側に送られるべきことを教示している。
図9は本発明の別の実施例を示し、ここで104から出力されるダウンミックス信号lおよびrは、ダウンミックス信号のミッド/サイド表現のサイド信号(l-r)を因子γによって制限する、ステレオ前処理装置901に入力される。このパラメータはデコーダに送信される。
[HFRコーデック信号のパラメータ化]
もし予測ベースのアップミックスがSBR[WO98/57436]等の高周波数再構築法とともに用いられる場合、エンコーダ側で推定された予測パラメータはデコーダ側で再生成された高帯域信号と整合しないであろう。この実施例は、2個のチャンネルから3個のチャンネルを再生成するために、別の、波形ベースでないアップミックス構造を用いることを教示する。ここで提案されるアップミックス手順は非相関ノイズ信号の場合に全てのアップミックスされたチャンネルの正しいエネルギを再生成するために設計されたものである。
式(3)で定義されたダウンミックス行列Dαが用いられると仮定する。ここでアップミックス行列Cを定義する。このアップミックスは以下のように定義される。
Figure 2008517337
エネルギがL、R、Cである、アップミックス信号l(k)、r(k)およびc(k)の正しいエネルギを再生成することのみのために、以下の式にしたがって、対角要素hat{X}・hat{X*}およびXX*が同じになるようなアップミックス行列が選ばれる。
Figure 2008517337
ダウンミックス行列の対応する表現は以下のようになる。
Figure 2008517337
Figure 2008517337
対角要素hat{X}・hat{X*}を対角要素XX *に等しく設定することは、C内の要素とL、RおよびCとの関係を定義する3個の式に変換される。
Figure 2008517337
上述のことに基づいて、アップミックス行列が定義され得る。右のダウンミックスされたチャンネルを左のアップミックスされたチャンネルに付加することなく、また逆もそうであるようなアップミックス行列を定義することが好ましい。したがって、好ましいアップミックス行列は以下のようなものであろう。
Figure 2008517337
これによって、以下のようなC行列が与えられる。
Figure 2008517337
C行列の要素は、送信された2個のパラメータc1=(L+R)/Cおよびc2=L/Rから、デコーダ側で再生成できることが示される。
図10は本発明の好ましい実施例の概略を示す図である。ここで、101−112は図1と同じであり、したがって更なる詳細は説明しない。3個のオリジナルの信号101−103が推定モジュール1001に入力される。このモジュールは2個のパラメータ、例えばc1=(L+R)/Cおよびc2=L/Rを推定し、ここからデコーダ側でC行列を導出することができる。これらのパラメータは104から出力されたパラメータとともに選択モジュール1002に入力される。好ましい実施例では、もしパラメータが波形コーデックによって符号化された周波数域に対応する場合には、選択モジュール1002は104からパラメータを出力し、パラメータがHFRによって再構築された周波数域に対応する場合には、1001からパラメータを出力する。選択モジュール1002はまた、信号の異なる周波数域についてどのパラメータ化が用いられるかの情報1005を出力する。
デコーダ側では、モジュール1004が送信されたパラメータを受け、パラメータ1005によって与えられる指示に依存して、上述のとおり、これらを予測的アップミックス109またはエネルギベースのアップミックス1003に導く。エネルギベースのアップミックス1003は式(40)に従ったアップミックス行列Cを実現する。
式(40)で概略が示されたアップミックス行列Cは、2個のダウンミックスされた信号l(k)、r(k)からの推定された(デコーダ)信号c(k)を得るために等しい重み(δ)を有する。2個のダウンミックスされた信号l(k)、r(k)において信号c(k)の相対的な量が異なるかもしれない(すなわちC/LがC/Rに等しくない)という観測に基づいて、以下のような一般的なアップミックス行列を考えることもできる。
Figure 2008517337
c(k)を推定するために、この実施例はまた2個の制御パラメータcおよびcの送信を必要とし、これらは例えばc1=a2C/(L+a2C)およびc2=a2C/(R+a2C)に等しい。したがってアップミックス行列関数fの可能な実現例は以下で与えられる。
Figure 2008517337
Figure 2008517337
Figure 2008517337
本発明に従ったSBR域のための異なるパラメータ化の信号処理は、SBRに限定されるものではない。上で概略を述べたパラメータ化は予測ベースのアップミックスの予測誤差が大きすぎると思われるいかなる周波数域でも使用可能である。したがって、モジュール1002は、送信信号の符号化方法、予測誤差等の多数の基準に依存して、1001または104からパラメータを出力することができる。
改良された予測ベースの多チャンネル再構築のための好ましい方法は、エンコーダ側で、異なる周波数域のために異なる多チャンネルパラメータ化を抽出するステップと、デコーダ側で、多チャンネルを再構築するために、周波数域にこれらのパラメータ化を適用するステップとを含む。
本発明の更なる好ましい実施例は、エンコーダ側で、用いられたダウンミックス処理の情報を抽出しその後この情報をデコーダに送るステップと、デコーダ側で、多チャンネルを再構築するために、抽出された予測パラメータとダウンミックスの情報とに基づいてアップミックスを適用するステップとを含む、改良された予測ベースの多チャンネル再構築方法を含む。
本件の発明の更なる好ましい実施例は、エンコーダ側で、ダウンミックス信号のエネルギが、抽出された予測的アップミックスパラメータについて得られた予測誤差にしたがって調整される、改良された予測ベースの多チャンネル再構築のため方法を含む。
本発明の更なる好ましい実施例は、デコーダ側で、予測誤差のために失われたエネルギが、アップミックスされたチャンネルに利得を適用することによって補償される、改良された予測ベースの多チャンネル再構築のための方法に関する。
本発明の更なる実施例は、デコーダ側で、予測誤差のために失われたエネルギが無相関化された信号によって置換される、改良された予測ベースの多チャンネル再構築のための方法に関する。
本発明の更なる好ましい実施例は、デコーダ側で、予測誤差のために失われたエネルギの一部が無相関化された信号によって置換され、失われたエネルギの一部がアップミックスされたチャンネルに利得を適用することによって置換される、改良された予測ベースの多チャンネル再構築のための方法に関する。失われたエネルギのこの部分は好ましくはエンコーダから信号で知らされる。
本発明の更なる好ましい実施例は、ダウンミックス信号のエネルギを、抽出された予測的アップミックスパラメータについて得られた予測誤差にしたがって調整する手段を含む、改良された予測ベースの多チャンネル再構築のための装置である。
本発明の更なる好ましい実施例は、予測誤差のために失われたエネルギをアップミックスされたチャンネルに利得を適用することによって補償する手段を含む、改良された予測ベースの多チャンネル再構築のための装置である。
本発明の更なる好ましい実施例は、予測誤差のために失われたエネルギを無相関化された信号によって置換する手段を含む、改良された予測ベースの多チャンネル再構築のための装置である。
本発明の更なる好ましい実施例は、予測誤差のために失われたエネルギの一部を無相関化された信号によって置換し、失われたエネルギの一部をアップミックスされたチャンネルに利得を適用することによって置換するための手段を含む、改良された予測ベースの多チャンネル再構築のための装置である。
本発明の更なる好ましい実施例は、抽出された予測的アップミックスパラメータについて得られた予測誤差にしたがってダウンミックス信号のエネルギを調整することを含む、改良された予測ベースの多チャンネル再構築のためのエンコーダである。
本発明の更なる好ましい実施例は、予測誤差のためのエネルギ損失をアップミックスされたチャンネルに利得を適用することによって補償することを含む、改良された予測ベースの多チャンネル再構築のためのデコーダである。
本発明の更なる好ましい実施例は、予測誤差のためのエネルギ損失を無相関化された信号によって置換することを含む、改良された予測ベースの多チャンネル再構築のためのデコーダに関する。
本発明の更なる好ましい実施例は、予測誤差によって失われたエネルギの一部を無相関化された信号によって置換し、失われたエネルギの一部をダウンミックスされたチャンネルに利得を適用することによって置換することを含む、改良された予測ベースの多チャンネル再構築のためのデコーダである。
図11は少なくとも1個のベースチャンネル1102を有する入力信号を用いて少なくとも3個の出力チャンネル1100を生成するための多チャンネルシンセサイザーを示し、少なくとも1個のベースチャンネルはオリジナルの多チャンネル信号から引き出されるものである。図11に示す多チャンネルシンセサイザーはアップミキサ装置1104を含み、これは図2から図10のいずれかに示すとおり実現することができる。一般に、アップミキサ装置1104は少なくとも3個の出力チャンネルが得られるようにアップミキシング規則を用いて少なくとも1個のベースチャンネルをアップミックスするように動作可能である。アップミキサ1104はエネルギ尺度1106と少なくとも2個の異なるアップミックスパラメータ1108とに応答し、エネルギ損失を伴うアップミキシング規則を用いて少なくとも3個の出力チャンネルを生成するように動作し、この少なくとも3個の出力チャンネルはエネルギ損失を伴うアップミキシング規則のみから結果として得られる信号のエネルギよりも高いエネルギを有する。しがたってエネルギ損失を伴うアップミキシング規則に依存するエネルギ誤差に関わりなく、本発明ではエネルギ補償された結果がもたらされ、ここではスケーリングおよび/または無相関化された信号の付加によってエネルギ補償を行なうことができる。少なくとも2個の異なるアップミキシングパラメータ1108とエネルギ尺度1106とは入力信号に含まれる。
好ましくは、エネルギ尺度はアップミキシング規則によって導入されるエネルギ損失に関連した何らかの尺度である。これはアップミックスにより導入されたエネルギ誤差またはアップミックス信号のエネルギ(これは通常オリジナルの信号のエネルギより低い)の絶対的な尺度であってもよいし、またはオリジナルの信号エネルギとアップミックス信号エネルギとの関係またはエネルギ誤差とオリジナルの信号エネルギとの関係、またはエネルギ誤差とアップミックス信号エネルギとの関係の相対的な尺度であってもよい。相対的なエネルギ尺度は訂正因子として用いることができるが、それにも関わらずこれはエネルギの尺度である。というのもこれはエネルギ損失を伴うアップミキシング規則、または言い方を変えれば、非エネルギ保存アップミキシング規則によって生成されたアップミックス信号に導入されたエネルギ誤差に依存するからである。
エネルギ損失を伴うアップミキシング規則(非エネルギ保存アップミキシング規則)の例は、送信された予測係数を用いたアップミックスである。フレームまたはフレームのサブバンドの不完全な予測の場合、アップミックス出力信号はエネルギ損失に対応する予測誤差の影響を受ける。当然、予測誤差はフレーム毎に変化する。というのもほとんど完璧な予測の場合には(低予測誤差)わずかな補償を行なうだけでよく(スケーリングまたは無相関化された信号の付加により)、一方予測誤差がより大きい場合には(不完全予測)より多くの補償をしなければならないからである。したがって、補償なしまたはごくわずかの補償を示す値と、大きな補償を示す値との間で、エネルギ尺度もまた変化する。
エネルギ尺度がチャンネル間コヒーレンス(ICC)の値であると考えられる場合、この考察は自然であるが、エネルギ尺度に依存してスケールされた無相関化された信号を加えることによって補償がなされる場合、好ましく用いられる相対的エネルギ尺度(ρ)は典型的には0.8から1.0の間で変化し、ここで1.0はアップミックスされた信号が要求されるとおりに無相関化されたこと、または無相関化された信号を全く付加する必要がないこと、または予測アップミックスの結果のエネルギがオリジナルの信号のエネルギと等しいこと、または予測誤差が0であること、を示す。
しかしながら、本発明はまた、他のエネルギ損失を伴うアップミキシング規則、すなわち波形整合に基づくものでなくコードブック、スペクトル整合等の他の技術に基づくもの、またはエネルギ保存を考慮しない何らかの他のアップミキシング規則に関してもまた有益である。
一般に、エネルギ補償はエネルギ損失を伴うアップミキシング規則の適用前または適用後に行なうことができる。または、エネルギ損失の補償は、エネルギ尺度を用いて元の行列係数を変更することによって新たなアップミキシング規則が生成されアップミキサによって用いられるように、アップミキシング規則内に含めることもできる。この新たなアップミキシング規則はエネルギ損失を伴うアップミキシング規則とエネルギ尺度とに基づいている。言い換えれば、この実施例はエネルギ補償が「向上された」アップミキシング規則に「混合され」、それによってエネルギ補償および/または無相関化された信号の付加が、1または2以上のアップミックス行列を入力ベクトル(1または2以上のベースチャンネル)に適用することによって行われ、(1または2以上の行列演算後に)出力ベクトル(少なくとも3個のチャンネルを有する再構築された多チャンネル信号)を得るような状況に関する。
好ましくは、アップミキサ装置は2個のベースチャンネルl、rを受け、3個の再構築されたl、rおよびcを出力する。
この後に、エンコーダ-デコーダ経路の異なる位置でのエネルギの状況を例示する図12を参照する。ブロック1200は、図1に示したような、少なくとも左チャンネル、右チャンネルおよびセンターチャンネルを有する信号等の多チャンネルオーディオ信号のエネルギを示す。図12の実施例では、図1の入力チャンネル101、102、103は完全に非相関であり、ダウンミキサはエネルギ保存型であると仮定する。この場合、ブロック1202で示された1または2以上のベースチャンネルのエネルギは多チャンネルのオリジナル信号のエネルギ1200と同一である。もしオリジナルの多チャンネル信号が互いに相関している場合には、例えば左と右が(部分的に)互いをキャンセルする場合、ベースチャンネルエネルギ1202はオリジナルの多チャンネル信号のエネルギより低くなり得る。
しかしながら以下の議論では、ベースチャンネルのエネルギ1202はオリジナルの多チャンネル信号のエネルギ1200と等しいと仮定する。
1204は図1に関連して説明した予測的アップミックスまたは非エネルギ保存アップミックスを用いてアップミックス信号(例えば、図1の110、111、112)が生成された場合の、アップミックス信号のエネルギを例示する。したがって、図14aおよび14bに関連して後で概略を述べるように、このような予測的アップミックスはエネルギ誤差Eを導入し、アップミックス結果のエネルギ1204はベースチャンネル1202のエネルギよりも低くなるであろう。
アップミキサ1104は、エネルギ1204よりも高いエネルギを有する出力チャンネルを出力するように動作する。好ましくは、アップミキサ装置1104は図11のアップミックス結果1100が1206で示されるエネルギを有するように、完全な補償を行なう。
好ましくは、そのエネルギが1204で示されるアップミックス結果は、図2に示すように単純にアップスケールされるのではなく、また図3に示すように個別にアップスケールされるのでもなく、または図4に示されるようにエンコーダ側でアップスケールされるのでもない。これに替えて、予測的アップミックスによる誤差に対応した残りのエネルギEが、無相関化された信号により「満たされる」。別の好ましい実施例では、エネルギ誤差Eは無相関化された信号によって部分的にカバーされるだけであり、エネルギ誤差の残りはアップミックス結果をアップスケールすることによって補われる。無相関化信号によるエネルギ誤差の完全なカバーが図5および図6に示され、一方「部分的」解決策が図7に示される。
図13は複数のエネルギ補償方法を示し、例えばエネルギ誤差に依存するエネルギ尺度に基づいて、出力チャンネルのエネルギが予測的アップミックスの純粋な結果よりも高い、すなわち(訂正なしの)エネルギ損失を伴うアップミックス規則の結果よりも高い、という共通の特徴を有する方法を示す。
図13の番号1はデコーダ側エネルギ補償に関するものであり、これはアップミックスに続いて行なわれる。この選択肢は図2に示され、更に図3に関連して詳細が示されており、ここではチャンネル毎に特有のアップスケール因子gが示されており、これはエネルギ尺度ρに依存するばかりでなく、チャンネルに依存するダウンミックス因子νにも依存し、ここでzはl、rまたはcを意味する。
図13の番号2はエンコーダ側エネルギ補償方法を含み、これはダウンミックスに続いて行なわれ、図4に例示される。この実施例は、エネルギ尺度ρまたはγをエンコーダからデコーダへ送信する必要がない点で好ましい。
図13の表の番号3はデコーダ側エネルギ補償に関し、これはアップミックスに先立って行われる。図2を考慮すると、図2でアップミックス後に行われるエネルギ訂正202は図2のアップミックスブロック201に先立って行われることになる。図2と比較して、この実施例は実現がより容易である。なぜなら、図3に示すようなチャンネルごとに特有の訂正因子が必要とされないからである。しかしながら、品質の損失が起こるかもしれない。
図13の番号4はさらなる実施例に関し、ここではダウンミックスの前にエンコーダ側の訂正が行われる。図1を考慮すると、チャンネル101、102、103は対応の補償因子によってアップスケールされ、ダウンミキサの出力は図12の1208で示されるように、ダウンミキシング後に増加する。したがって図13の番号4の実施例は、エンコーダによるベースチャンネルの出力について本発明の番号2の実施例と同じ結果となる。
図13の番号5は図5の実施例に関するもので、図5において無相関化された信号が非エネルギ保存アップミキシング規則109によって生成されたチャンネルから導出される場合である。
図13の表の番号6の実施例は残差エネルギの一部のみが無相関化信号によってカバーされる実施例に関する。この実施例は図7に例示される。
図13の番号8の実施例は番号5または6の実施例と同様であるが、図5のボックス501’で概略を示すように、無相関化された信号がアップミックス前にベースチャンネルから導出される。
この後、エンコーダの好ましい実施例を詳細に説明する。図14aは少なくとも2個のチャンネル、好ましくは少なくとも3個のチャンネルl、c、rを有する多チャンネル入力信号1400を処理するためのエンコーダを例示する。
エンコーダは多チャンネル入力信号1400のエネルギまたは少なくとも1個のベースチャンネル1404と、非エネルギ保存アップミックス動作1407によって生成されたアップミックス信号1406とのエネルギ差に依存する誤差尺度を計算するためのエネルギ尺度計算部1402を含む。
さらに、エンコーダはエネルギ尺度に依存したスケール因子403によってスケーリングされた(401、402)少なくとも1個のベースチャンネルを出力するか、またはエネルギ尺度そのものを出力するための出力インターフェィス1408を含む。
好ましい実施例では、エンコーダはオリジナルの多チャンネル1400から少なくとも1個のベースチャンネル1404を生成するためのダウンミキサ1410を含む。アップミックスパラメータを生成するために、差計算部1414とパラメータ最適化部1416も存在する。これらの要素はベストマッチングのアップミックスパラメータ1412を見出すように動作する。好ましい実施例では最適にフィットするアップミックスパラメータの少なくとも2個の組が、パラメータ出力として出力インターフェィスから出力される。差計算部は好ましくはパラメータ線1412で入力されるパラメータについて、オリジナルの多チャンネル信号1400とアップミキサから生成されたアップミックス信号との最小平均二乗誤差の計算を行うように動作する。このパラメータ最適化手順はいくつかの異なる最適化手順によって行うことができ、これらは全てアップミキサ1408に含まれるあるアップミックス行列によってベストマッチングのアップミックス結果1406を得るという目標によって駆動される。
図14aのエンコーダの機能を図14bに示す。ダウンミキサ1410によってダウンミキシングステップ1440が行われた後、ベースチャンネルまたは複数個のベースチャンネルが1442で示されるように出力される。その後アップミックスパラメータ最適化ステップ1444が行われ、これはある最適化戦略に依存して反復または非反復手順であり得る。しかしながら、反復手順が好ましい。一般にアップミックスパラメータ最適化手順は、アップミックス結果とオリジナルの信号との差ができるだけ低くなるように実現され得る。実現に依存して、この差は個別のチャンネル関連の差または組合せた差であり得る。一般にアップミックスパラメータ最適化ステップ1444は個別のチャンネルまたは組合されたチャンネルから導出され得るコスト関数を最小化するように動作するので、例えば他の2つのチャンネルについてよりよい整合が達成されるのであれば1つのチャンネルについてより大きな差(誤差)があっても許容される。
その後、最適にフィットするパラメータの組、例えば最適にフィットするアップミックス行列が見出されると、ステップ1444で生成されたパラメータの組の少なくとも2個のアップミキシングパラメータがステップ1446で示されるように出力インターフェィスへ出力される。
さらに、アップミックスパラメータ最適化ステップ1444が完了した後、エネルギ尺度が計算されステップ1448で示されるように出力され得る。一般にエネルギ尺度はエネルギ誤差1210に依存するはずである。好ましい実施例ではエネルギ尺度は因子ρであり、これはアップミックス結果1406のエネルギと図2に示すオリジナルの信号1400のエネルギとの関係に依存する。これに代えて、計算され出力されるエネルギ尺度はエネルギ誤差1210の絶対値であっても、またはアップミックス結果1406の絶対エネルギであってもよく、これは当然のことながら、エネルギ誤差に依存する。これに関連して、出力インターフェィス1408から出力されるエネルギ尺度は好ましくは量子化され、さらに好ましくは算術エンコーダ、ハフマンエンコーダ、またはランレングスエンコーダ等の周知のエントロピーエンコーダを用いてエントロピーによりエンコードされる。これは特に多くの後続の同一のエネルギ尺度がある場合に有益である。これに代えて、またはこれに加えて、後続の時間部分またはフレームのためのエネルギ尺度は差によりエンコードすることもできる。この差によるエンコードは好ましくはエントロピーによるコーディングの前に行われる。
この後、別のダウンミキサの実施例を示す図15aを参照する。これは本発明の好ましい実施例にしたがって図14aのエンコーダと組合わされる。図15aの実施例はSBRによる実現をカバーしたものであるが、この実施例はまたスペクトル帯域複製が行われずベースチャンネルの全帯域が送信される場合にも用いることができる。図15aのエンコーダはオリジナルの信号1500をダウンミックスして少なくとも1個のベースチャンネル1504を得る、ダウンミキサ1500を含む。非SBR実施例では、少なくとも1個のベースチャンネル1504はコアコーダ1506に入力され、これは単一のベースチャンネルの場合にはモノラル信号のためのAACエンコーダであり得るが、例えば2個のステレオベースチャンネルの場合には何らかのステレオコーダであり得る。コアコーダ1506の出力では、エンコードされたベースチャンネルを含む、または複数のエンコードされたベースチャンネルを含むビットストリームが出力される(1508)。
図15aの実施例がSBR機能を有する場合、少なくとも1個のベースチャンネル1504はコアコーダに入力される前にローパスフィルタ1510でフィルタ処理される。当然、ブロック1510および1506の機能は単一のエンコーダ装置で実現することができ、これは単一のエンコードアルゴリズム内でローパスフィルタ処理およびコアコーディングを行う。
出力1508でのエンコードされたベースチャンネルは、エンコードされた形の、ベースチャンネル1504の低帯域のみを含む。高帯域の情報はSBRスペクトルエンベロープ計算部1512によって計算され、これはSBR情報エンコーダ1514に接続されて、エンコードされたSBR側情報を生成し出力1516に出力する。
オリジナルの信号1502はエネルギ計算部1520に入力され、これはチャンネルエネルギを生成する(オリジナルのチャンネルl、c、rのある時間期間について、ここでチャンネルエネルギはL、C、Rによって示され、ブロック1520によって出力される)。チャンネルエネルギL、C、Rはパラメータ計算部ブロック1522に入力される。パラメータ計算部1522は2個のアップミックスパラメータc1、c2を出力し、これらは、例えば図15aに示したパラメータc、cであり得る。当然、全ての入力チャンネルのエネルギを含む他の(例えば線形の)エネルギの組合せがパラメータ計算部1522によって生成されデコーダに送信されてもよい。当然、送信されたアップミックスパラメータが異なれば、残りのアップミキシング行列要素を計算する方法も異なる。式(40)または式(41−44)に関連して示したとおり、エネルギに関連する図15の実施例のアップミックス行列は少なくとも4個の非ゼロ要素を有し、ここで第3行の要素は互いに等しい。したがって、パラメータ計算部1522は例えばアップミックス行列表示(40)または(41)等のアップミックス行列の4個の要素が導出できるような、エネルギL、C、Rのいかなる組合せを用いることもできる。
図15aの実施例は信号の全帯域についてエネルギ保存の、または一般的な言い方をすればエネルギ導出アップミックスを行うように動作するエンコーダを例示する。これは、図15aに例示されたエンコーダ側でパラメータ計算部1522によって出力されたパラメータ的表現が全信号について生成されることを意味する。これは、エンコードされたベースチャンネルの各サブバンドについて、対応のパラメータの組が計算され出力されることを意味する。例えば10個のサブバンドを有する全帯域幅信号であるエンコードされたベースチャンネルを考えると、パラメータ計算部はエンコードされたベースチャンネルの各サブバンドについて10個のパラメータcおよびcを出力するであろう。しかしながら、エンコードされたベースチャンネルがSBR環境における低帯域信号、例えば5個のより低いサブバンドのみをカバーするものであったとすれば、パラメータ計算部1522は5個のより低いサブバンドの各々についてパラメータの組を出力することととなり、さらに、出力1508の信号は対応するサブバンドを含んではいないが、5個のより上のサブバンドの各々についても出力するであろう。これは、図16aに関連して後で説明するように、このようなサブバンドがデコーダ側で再生成されるという事実に基づくものである。
しかしながら、好ましくは、また図10に関連して説明されたように、エネルギ計算部1520とパラメータ計算部1522とはオリジナルの信号の高帯域部分についてのみ動作し、オリジナルの信号の低帯域部分のパラメータは、図10の予測的アップミキサ109に対応する、図10の予測的パラメータ計算部104によって計算される。
図15bは図10の選択モジュール1002によって出力されるパラメータ表現の概略的な表示である。すなわち本発明に従ったパラメータ表現は(エンコードされたベースチャンネルがある場合とない場合があり、任意にはエネルギ尺度がない場合もある)、低帯域、例えばサブバンド1からiのための予測パラメータの組と、高帯域、例えばサブバンドi+1からNまでのサブバンドごとのパラメータとを含む。これに代えて予測パラメータとエネルギスタイルパラメータとを混合することもできる、例えばエネルギスタイルパラメータを有するサブバンドを予測パラメータを有するサブバンドの間に位置付けることができる。さらに、予測パラメータのみを有するフレームをエネルギスタイルパラメータのみを有するフレームの後に置くこともできる。したがって、一般的に言えば、図10に関連して議論された本発明は異なるパラメータ化に関するものであり、これは図15bに示されるように周波数の方向において異なるものであってもよく、または予測パラメータのみを有するフレームにエネルギスタイルパラメータのみを有するフレームが続く場合のように時間方向で異なるものであってもよい。当然、サブバンドのパラメータ化または分布はフレームごとに変えることができ、したがって、例えばサブバンドiは第一のフレームで図15bに示すように第一の(例えば予測)パラメータ設定を有し、別のフレームでは第二の(例えばエネルギスタイル)パラメータ設定を有する。
さらに、本発明は図14aに示された予測パラメータ化または図15aに示されたエネルギスタイルパラメータ化と異なるパラメータ化が用いられる場合にも有用である。さらにまた、予測的またはエネルギスタイルとは別に、例えばあるサブバンドまたはフレームについて、何らかのターゲットパラメータまたはターゲットイベントが、エンコーダ側またはデコーダ側での計算効率、ダウンミックスビットレート、アップミックス品質、または例えばバッテリーで動作する装置のエネルギ消費等について、第一のパラメータ化のほうが第二のパラメータ化より良いと示す場合には、別のパラメータ化を用いることができる。当然、目標とする機能は上で概略を述べた、異なる個別のターゲット/イベントの組合せであり得る。イベントの例はSBR−再構築された高帯域等である。
さらに、図10の1005で示すように、パラメータの周波数または時間選択的計算と送信とを明白に信号で知らせることもできる。または、図16aに関連して説明したように、暗示的なやり方で信号処理を行うこともできる。この場合、デコーダについて予め定義された規則が用いられる。例えば、デコーダは送信されたパラメータが図15bの高帯域に属するサブバンド用のエネルギスタイルパラメータである、すなわちスペクトル帯域複製または高周波数再生技術によって再構築されたサブバンドのためのものであると、自動的に仮定する。
さらに、エンコーダ側での1、2またはそれ以上の異なるパラメータ化の計算、および、どのパラメータ化を送信するかというエンコーダ側の選択は何らかのエンコーダ側で利用可能な情報を用いた決定に基づいてなされ(この情報は実際に用いられるターゲット機能またはSBR処理および信号処理等の他の理由で用いられる信号処理情報であり得る)、これはエネルギ尺度の送信を伴って、または伴わずに行われ得る。たとえ好ましいエネルギ訂正が全く行われなくても、例えば非エネルギ保存アップミックス(予測的アップミックス)の結果がエネルギ訂正されない場合、またはエンコーダ側で対応の前補償がない場合でも、異なるパラメータ化の間で好ましい切替を行うことは、より良い多チャンネル出力品質および/またはより低いビットレートを得るために有用である。
特に、利用可能なエンコーダ側情報に依存した異なるパラメータ化間の好ましい切替は、図5ないし図7に関連して示した予測的アップミックスによって行われるエネルギ誤差を完全にまたは少なくとも部分的にカバーする、無相関化された信号の付加とともに、またはこれなしで、用いることができる。これに関連して、図5に関連して説明した無相関化された信号の付加は予測的アップミックスパラメータが送信されたサブバンド/フレームについてのみ行われ、エネルギスタイルパラメータが送信されたサブバンドまたはフレームについては無相関化の異なる手段が用いられる。このような手段は例えば、適切にスケールされた無相関化された信号がドライ信号に付加される場合のように、ICC等の送信されたチャンネル間相関尺度によって要求されるような求められる量の無相関化が得られるように、ウェット信号をダウンスケールし、無相関化された信号を生成し、この無相関化された信号をスケーリングすることである。
この後、好ましいアップミキシングブロック201と、202での対応のエネルギ訂正とのデコーダ側での実現を例示する図16aについて説明する。図11に関連して説明したように、送信されたアップミックスパラメータ1108が、受信された入力信号から抽出される。エネルギ補償を含むアップミックス行列1602が予測的アップミックスおよび先行するまたは後続のエネルギ訂正を行うべき場合には、これら送信されたアップミックスパラメータは残りのアップミックスパラメータを計算するための計算部1600に好ましく入力される。残りのアップミックスパラメータを計算するための手順は図16bに関連して後で説明する。
アップミックスパラメータの計算は図16bの式に基づいて行われ、これはまた式(7)として繰返される。3入力信号/2出力信号の実施例において、ダウンミックス行列Dは6個の変数を有する。加えて、アップミックス行列Cもまた6個の変数を有する。しかしながら式(7)の右辺には4個の値しかない。したがって未知のダウンミックスと未知のアップミックスの場合、行列DおよびCから未知の変数は12個あり、これら12個の変数を決定するために式は4つしかない。しかしながらダウンミックスは既知であるので、未知の変数の数はアップミックス行列Cの係数に減じられ、これは6個の変数を含むが、依然としてこれら6個の変数を決定するために式が4つあるだけである。したがって、図14bのステップ1444と関連して説明し図14aで例示した最適化方法を用いて、アップミックス行列の少なくとも2個の変数、好ましくはc11およびc22を決定する。ここで例えばc12、c21、c31およびc32という4個の未知数があり、4個の式があるので、すなわち図16bの式の右辺の単位行列Iの各要素について一つの等式があるので、アップミックス行列の残りの未知の変数は直接的な方法で計算することができる。この計算は残りのアップミックスパラメータを計算するための計算部1600によって行われる。
装置1602のアップミックス行列は破線1604によって送られる2個の送信されるアップミックスパラメータと、ブロック1600によって計算される残り4個のアップミックスパラメータとによって設定される。その後アップミックス行列は線1102を介して入力されるベースチャンネルに適用される。実現に依存して、低帯域訂正のためのエネルギ尺度が線1106を介して送られ、訂正されたアップミックスが生成され、出力される。線1606を介した暗黙の信号処理によって低帯域について予測的アップミックスのみが行われ、高帯域について線1108でエネルギスタイルアップミックスパラメータが存在する場合、この事実が対応するサブバンドについて計算部1600とアップミックス行列装置1602とに信号で知らされる。エネルギスタイルの場合、アップミックス行列(40)または(41)のアップミックス行列要素を計算することが好ましい。この目的のために、下で式(40)に示される送信されたパラメータまたは下で式(41)によって示される対応するパラメータが用いられる。この実施例では送信されたアップミックスパラメータc、cをアップミックス係数として直接用いることはできず、式(40)または(41)に示されるアップミックス行列のアップミックス係数は送信されたアップミックスパラメータcおよびcを用いて計算しなければならない。
高帯域についてはエネルギベースのアップミックスパラメータについて決定されたアップミックス行列が多チャンネル出力信号の高帯域部分をアップミックスするのに用いられる。その後低帯域部分と高帯域部分とが低/高組合せ部1608で組合わされ、全帯域幅の再構築された出力チャンネルl、r、cが出力される。図16aに示されるように、ベースチャンネルの高帯域は送信された低帯域ベースチャンネルをデコードするためのデコーダを用いて生成され、ここでこのデコーダはモノラルベースチャンネルについてはモノデコーダであり、2個のステレオベースチャンネルについてはステレオデコーダである。このデコードされた低帯域ベースチャンネルはSBR装置1614に入力され、これは図15aの装置1512によって計算されたエンベロープ情報もまた付加的に受信する。低帯域部分と高帯域エンベロープ情報とに基づき、ベースチャンネルの高帯域が生成されて、線1102上で全帯域幅のベースチャンネルが得られ、これがアップミックス行列装置1602に送られる。
好ましい方法または装置またはコンピュータプログラムはいくつかの装置で実現するかまたはそこに含めることができる。図17は本発明のエンコーダを含む送信機と本発明のデコーダを含む受信機とを有する送信システムを示す。送信チャンネルは無線でも有線チャンネルでもよい。さらに図18に示すように、エンコーダをオーディオレコーダに含め、デコーダをオーディオプレーヤーに含めることもできる。オーディオレコーダからのオーディオ記録はインターネットを介してまたは郵便や宅配リソースを用いて分配される記憶媒体を介して、またはメモリカード、CDまたはDVD等の他の可能な分配記憶媒体を介してオーディオプレーヤーに分配される。
発明の方法のある実現要件に依存して、発明の方法はハードウェアまたはソフトウェアで実現できる。この実現は、電子的に可読な制御信号が記録されたデジタル記憶媒体、特にディスクまたはCDで行うことができ、これはプログラム可能なコンピュータシステムと共働して本発明の方法を行う。したがって本発明は一般に、機械可読キャリアに記憶されたプログラムコードを備えたコンピュータプログラムプロダクトであり、プログラムコードはコンピュータプログラムプロダクトがコンピュータで実行されると、本発明の方法の少なくとも1つを行うように構成される。言い換えれば、本発明の方法はコンピュータプログラムがコンピュータで実行されるときに発明の方法を実行するプログラムコードを有するコンピュータプログラムである。
添付の図面を参照して本発明を例に基づいて説明するが、これは本発明の範囲または精神を限定するものではない。
2個のチャンネルから3個のチャンネルを予測ベースで再構築することを例示する図である; エネルギ補償を伴う予測的アップミックスを例示する図である; 予測的アップミックスにおけるエネルギ補償を例示する図である; ダウンミックス信号のエネルギ補償を伴う、エンコーダ側の予測パラメータ推定部を例示する図である; 相関再構築を伴う予測的アップミックスを例示する図である; 相関再構築を伴うアップミックスにおいてアップミックスされた信号と無相関化された信号とを混合するミキシングモジュールを例示する図である; 相関再構築を伴うアップミックスにおいてアップミックスされた信号と無相関化された信号とを混合する別のミキシングモジュールを例示する図である; エンコーダ側の予測パラメータ推定を例示する図である; エンコーダ側の予測パラメータ推定を例示する図である; エンコーダ側の予測パラメータ推定を例示する図である; 本発明のアップミックス装置を例示する図である; エネルギ損失を伴うアップミックスの結果と、好ましい補償とを示すエネルギ図である; 好ましいエネルギ補償方法の表である; (a)は好ましい多チャンネルエンコーダの概略図である、(b)は(a)の装置によって行なわれる好ましい方法のフローチャートである; (a)は図14aの装置と比較される、異なるパラメータ化を生成するためのスペクトル帯域複製機能を有する多チャンネルエンコーダの図である、(b)はパラメータデータの周波数選択的生成と送信とを表の形で例示する図である;さらに (a)アップミックス行列係数の計算を例示する本発明のデコーダの図である、(b)は予測的アップミックスのためのパラメータの計算を詳細に示す図である; 送信システムの送信機および受信機の図である;さらに 本発明のエンコーダを有するオーディオレコーダと、デコーダを有するオーディオプレーヤの図である。

Claims (51)

  1. 少なくとも1個のベースチャンネル(1102)を有する入力信号を用いて少なくとも3個の出力チャンネル(1100)を生成するための多チャンネルシンセサイザであって、ベースチャンネルはオリジナルの多チャンネル信号(101、102、103)から導出され、シンセサイザはエネルギ損失を伴うアップミキシング規則(201、1407)に基づいて少なくとも一つのベースチャンネルをアップミックスして少なくとも3個の出力チャンネルが得られるようにするアップミキサ(1104)を含み、
    アップミキサ(1104)は、エネルギ尺度(1106)と少なくとも2個の異なるアップミキシングパラメータ(1108)とに応答して、少なくとも3個の出力チャンネルがエネルギ誤差の代わりにエネルギ損失を伴うアップミキシング規則のみを用いて得られる信号のエネルギより高いエネルギを有するような少なくとも3個の出力チャンネルを生成するように動作し、エネルギ誤差はエネルギ損失を伴うアップミキシング規則に依存し、
    アップミキサを制御するためのエネルギ尺度と少なくとも2個の異なるアップミキシングパラメータ(1108)とは、入力信号に含まれる、多チャンネルシンセサイザ。
  2. エネルギ損失を伴うアップミキシング規則は、予測係数に基づく行列係数を有するアップミキシング行列を用いた予測的アップミキシング規則であり、
    少なくとも2個の異なるアップミックスパラメータは、アップミキシング行列の2個の異なる要素(c11、c12)であるか、またはそこからアップミキシング行列の2個の異なる要素を導出可能なパラメータである、請求項1に記載の多チャンネルシンセサイザ。
  3. エネルギ尺度は、エネルギ損失を伴うアップミキシング規則を用いたアップミックスの結果のエネルギの、オリジナルの多チャンネル信号のエネルギに対する関係、またはエネルギ誤差のオリジナルの多チャンネル信号のエネルギに対する関係、または絶対的表現のエネルギ誤差を直接的または間接的に示す、請求項1または請求項2に記載の多チャンネルシンセサイザ。
  4. アップミキサは、少なくとも2個のアップミキシングパラメータと、オリジナルの多チャンネル信号から少なくとも1個のベースチャンネルを生成するのに用いられるダウンミックス規則の情報とに基づいて、アップミックス行列を導出する計算部(1600)を含む、先行する請求項のいずれかに記載の多チャンネルシンセサイザ。
  5. アップミキサは、左ベースチャンネルと右ベースチャンネルとを処理して左出力信号、右出力信号およびセンタ信号を出力するように動作し、左ベースチャンネルと右ベースチャンネルとは多チャンネル信号のステレオ互換表現である、先行する請求項のいずれかに記載の多チャンネルシンセサイザ。
  6. アップミキサ(1104)はスケーリング因子を用いて少なくとも3個の出力チャンネルを個別にスケーリング(304)するように動作し、出力チャンネルのためのスケーリング因子(g)は、エネルギ損失を伴うアップミキシング規則のアップミックスの結果のエネルギと、エネルギ損失を伴うアップミキシング規則を用いたアップミキシング後の出力チャンネルのエネルギと、少なくともベースチャンネルを生成するためのダウンミックス(v)の情報とに依存する、先行する請求項のいずれかに記載の多チャンネルシンセサイザ。
  7. スケーリング因子は以下の数式1のように決定される請求項6に記載の多チャンネルシンセサイザ。
    Figure 2008517337
  8. アップミキサ(1104)はさらに、少なくとも1個のベースチャンネルから、またはエネルギ損失を伴うアップミキシング規則の出力信号の少なくとも1個から、無相関化された信号を生成するための無相関化部(501、502、503、501’、503’)を含み、
    アップミキサは、出力チャンネルにおける無相関化された信号のエネルギ量がエネルギ尺度によって導出可能なエネルギ誤差の量より小さいかまたは等しくなるように動作する、請求項1から請求項6のいずれかに記載の多チャンネルシンセサイザ。
  9. アップミキサは、ダウンスケール因子によってダウンスケールされた出力チャンネルのエネルギと等しいエネルギを有する無相関化された信号を生成するように動作し、ダウンスケール因子はエネルギ尺度に依存し、
    アップミキサは無相関化された信号とエネルギ損失を伴うアップミキシング規則(109)の出力信号とを加算するように動作する、請求項8に記載の多チャンネルシンセサイザ。
  10. 無相関化部は、チャンネルごとに特有の因子(n)によって重み付けされエネルギ尺度(r)を用いて重み付けされた無相関化された信号を加算することによって少なくとも3個の出力チャンネルを個別に無相関化し、さらに重み付けされた無相関化された信号をエネルギ損失を伴うアップミキシング規則を行うアップミキサ(109)の出力信号に加算(602)するように動作する、請求項8または請求項9に記載の多チャンネルシンセサイザ。
  11. 無相関化部は、デジタルフィルタを用いて入力信号をフィルタ処理するように動作する、請求項9または請求項10に記載の多チャンネルシンセサイザ。
  12. ダウンスケーリング因子は以下の数式2のように導出される請求項9に記載の多チャンネルシンセサイザ。
    Figure 2008517337
    ここでγはダウンスケーリング因子であり、ρはエネルギ尺度である。
  13. アップミキサ(1104)は、エネルギ損失を伴うアップミキシング規則によるエネルギ損失を部分的にまたは完全に補償するために、エネルギ誤差より小さく0より大きいエネルギを有する無相関化された信号を、エネルギ損失を伴うアップミキシング規則によって生成された少なくとも1個のチャンネルに付加するように動作する、先行する請求項のいずれかに記載の多チャンネルシンセサイザ。
  14. 無相関化された信号のエネルギがエネルギ誤差より小さい場合、アップミキサは、少なくとも1個のベースチャンネルまたはアップミキシング規則によって生成された信号を、アップスケールされた信号またはアップスケールされた少なくとも1個のベースチャンネルを用いて生成されたアップミックス信号と、付加された無相関化された信号との組合されたエネルギがオリジナルの信号のエネルギと等しいかこれより小さくなるように、アップスケールするように動作する、請求項13に記載の多チャンネルシンセサイザ。
  15. 付加された無相関化された信号のエネルギは無相関化因子によって決定され、1に近い高い無相関化因子は小さいレベルの無相関化された信号を付加すべきことを示し、0に近い小さい無相関化因子は高いレベルの無相関化された信号を付加すべきことを示し、
    無相関化尺度は入力信号から抽出される、請求項14に記載の多チャンネルシンセサイザ。
  16. 少なくとも1個のベースチャンネルはダウンミキシング行列によって生成されたベースチャンネルのスケーリングされた版であり、スケーリング因子はエネルギ尺度に依存し、無相関化情報(605)は誤差エネルギにも依存する唯一の送信されたエネルギ尺度である、請求項13または請求項14に記載の多チャンネルシンセサイザ。
  17. 入力信号に含まれるエネルギ尺度はエネルギ誤差(ρ)に依存する第一のエネルギ値を含み、相関の程度(k)に依存する第二のエネルギ値を含む、請求項14に記載の多チャンネルシンセサイザ。
  18. 入力信号は、2個の異なるアップミキシングパラメータに加えて、少なくとも1個のベースチャンネルの元となるダウンミックス情報を含み、
    アップミキサは、付加的なダウンミキシング情報を用いてアップミキシング行列(802)を生成するように動作する、先行する請求項のいずれかに記載の多チャンネルシンセサイザ。
  19. ステレオ前処理(901)の計算の情報(γ)が、入力信号中にダウンミックス情報として含まれる、請求項18に記載の多チャンネルシンセサイザ。
  20. 入力信号はさらに、第一の状態で、第一のアップミキシング規則を行うべきことを示し、第二の状態で、異なるアップミキシング規則を行うべきことを示す、アップミキサモード指示(1005)を含み、
    アップミキサ(1104)はアップミキサモード指示(1005)に依存して少なくとも2個の異なるアップミキシングパラメータ(1108)を用いてアップミキシング規則のためのパラメータを計算するように動作する、先行する請求項のいずれかに記載の多チャンネルシンセサイザ。
  21. アップミキサモード指示は、サブバンドごとに、またはフレームごとに、アップミキサモードを信号で示すように動作する、請求項20に記載の多チャンネルシンセサイザ。
  22. 第一のアップミキシング規則が予測的アップミキシング規則であり、第二のアップミキシング規則がエネルギ依存のアップミキシングパラメータを有するアップミキシング規則である、請求項20または請求項21に記載の多チャンネルシンセサイザ。
  23. 第二のアップミキシング規則は以下の数式3のように行われる請求項21に記載の多チャンネルシンセサイザ。
    Figure 2008517337
    ここでLは左入力チャンネルのエネルギ値であり、Cはセンタ入力チャンネルのエネルギ値であり、Rは右入力チャンネルのエネルギ値であり、αはダウンミックスの決定されたパラメータである。
  24. 第二のアップミキシング規則は、右のダウンミックスチャンネルが左のアップミックスチャンネルに付加されず、逆もそうであるようなものである、請求項20から請求項23のいずれかに記載の多チャンネルシンセサイザ。
  25. 第一のアップミキシング規則は、オリジナルの多チャンネル信号の波形と、第一のアップミキシング規則によって生成された信号の波形との波形整合によって決定される、請求項20から請求項24のいずれかに記載の多チャンネルシンセサイザ。
  26. 第一または第二のアップミキシング規則が以下の数式4のように決定され:
    Figure 2008517337
    ここで関数f、f、fは送信された2個の異なるアップミキシング関数c、cの関数を表し、
    関数は以下の数式5のように決定される請求項20から請求項25のいずれかに記載の多チャンネルシンセサイザ。
    Figure 2008517337
    ここでαは実数値パラメータである。
  27. 入力信号に含まれる少なくとも1個のベースチャンネルの一部を用いて、送信されたベースチャンネル内に含まれていない少なくとも1個のベースチャンネルの帯域を再生成するためのSBRユニット1614をさらに含み、
    多チャンネルシンセサイザは、少なくともベースチャンネルの再生成された帯域において第二のアップミックス規則を適用し、入力信号に含まれるベースチャンネルの帯域においては第一のアップミキシング規則を適用するように動作する、請求項20から請求項27のいずれかに記載の多チャンネルシンセサイザ。
  28. アップミックスモード指示は入力信号中に含まれるSBR信号処理(1606)である、請求項28に記載の多チャンネルシンセサイザ。
  29. 多チャンネル入力信号を処理するためのエンコーダであって、多チャンネル入力信号または多チャンネル入力信号から導出される少なくとも1個のベースチャンネルと、エネルギ損失を伴うアップミキシング動作によって生成されるアップミックス信号とのエネルギ差に依存するエネルギ尺度(ρ)を計算するエネルギ尺度計算部(1402)と;
    エネルギ尺度に依存するスケーリング因子(403)によってスケーリングされた(401、402)後の少なくとも1個のベースチャンネルを出力するか、またはエネルギ尺度を出力する、出力インターフェィス(1408)を含む、エンコーダ。
  30. エネルギ尺度(ρ)は少なくとも1個のベースチャンネルをエネルギを伴うアップミキシング規則を用いてアップミキシングすることによって生成されたアップミックス信号のエネルギとオリジナルの多チャンネル信号のエネルギとの関係に基づいて決定され、スケーリング因子はエネルギ尺度を反転させることによって決定される、請求項30に記載のエンコーダ。
  31. 相関の程度(к)を決定するための相関度計算部をさらに含み、出力インターフェィスは相関度に基づいて相関尺度(к)を出力するように動作する、請求項30または請求項31に記載の多チャンネルシンセサイザ。
  32. 少なくとも2個の異なるアップミキシングパラメータ(1412)を計算するためのアップミキシングパラメータ計算部(1407、1414、1416)をさらに含み、
    出力インターフェィスは少なくとも2個の異なるアップミキシングパラメータを出力するように動作する、請求項30から請求項32のいずれかに記載のエンコーダ。
  33. 少なくとも1個のベースチャンネルを計算するためのダウンミキサ装置(1410)をさらに含み、
    出力インターフェィス(1408)はダウンミックス動作の情報を出力するように動作する、請求項30から請求項33のいずれかに記載のエンコーダ。
  34. ダウンミキサ装置はステレオ前処理装置を含み、出力インターフェィスはステレオ前処理装置の情報を出力するように動作する、請求項34に記載のエンコーダ。
  35. アップミキサパラメータ計算部は、アップミックスされたチャンネルの波形を用いてパラメータの最適化(1444)を行って、最適アップミキシングパラメータに基づいてデコーダに送信すべき少なくとも2個のアップミキシングパラメータを生成し、さらに最適アップミキシングパラメータを用いて少なくとも1個のベースチャンネルをアップミキシングすることによって生成された信号に基づきエネルギ尺度を計算し出力するように動作する、請求項33に記載のエンコーダ。
  36. エンコーダで利用可能な情報に基づいて複数個の異なるパラメータ表現のうちから特定のパラメータ表現を生成するためのパラメータ生成部(104、1001、1520、1522、1414、1416)をさらに含み、
    出力インターフェィス(1408)は生成されたパラメータ表現と、複数個の異なるパラメータ表現のうちから特定のパラメータ表現を暗示的にまたは明示的に示す情報とを出力するように動作する、請求項30から請求項36のいずれかに記載のエンコーダ。
  37. 複数個の異なるパラメータ表現は、波形ベースの予測的アップミキシングスキームのための第一のパラメータ表現と、非波形ベースのアップミキシング規則のための第二のパラメータ表現とを含む、請求項37に記載のエンコーダ。
  38. 非波形ベースのアップミキシング規則は、エネルギ保存アップミキシング規則である、請求項38に記載のエンコーダ。
  39. 第一のパラメータ表現は、そのパラメータが最適化手順によって決定されたパラメータ表現であり、
    第二のパラメータ表現は、オリジナルのチャンネルのエネルギを計算し(1502)、かつエネルギの組合せに基づいてパラメータを計算する(1522)ことによって決定される、請求項37から請求項39のいずれかに記載のエンコーダ。
  40. オリジナルの入力信号の少なくとも1の帯域であって、エンコーダによって出力されるベースチャンネルに含まれていないものについて、スペクトル帯域複製サイド情報を生成するためのスペクトル帯域複製モジュール(1512、1514)をさらに含む、請求項30から請求項40のいずれかに記載のエンコーダ。
  41. 少なくとも1個のベースチャンネル(1102)を有する入力信号を用いて少なくとも3個の出力チャンネル(1100)を生成する方法であって、ベースチャンネルはオリジナルの多チャンネル信号(101、102、103)から導出され、
    エネルギ損失を伴うアップミキシング規則(201、1408)に基づいて少なくとも一つのベースチャンネルをアップミックスして少なくとも3個の出力チャンネルが得られるようにするステップ(1104)を含み、
    アップミキシングするステップにおいて、エネルギ尺度(1106)と少なくとも2個の異なるアップミキシングパラメータ(1108)とに応答して、少なくとも3個の出力チャンネルがエネルギ誤差の代わりにエネルギ損失を伴うアップミキシング規則のみを用いて得られる信号のエネルギより高いエネルギを有するような少なくとも3個の出力チャンネルが生成され、エネルギ誤差はエネルギ損失を伴うアップミキシング規則に依存し、
    少なくとも2個の異なるアップミキシングパラメータ(1108)とアップミキサを制御するためのエネルギ尺度とは、入力信号に含まれる、方法。
  42. 多チャンネル入力信号を処理する方法であって、
    多チャンネル入力信号または多チャンネル入力信号から導出された少なくとも1個のベースチャンネルと、エネルギ損失を伴うアップミキシング動作によって生成されたアップミックス信号とのエネルギ差に依存する誤差尺度(ρ)を計算するステップ(1402)と、誤差尺度に依存するスケーリング因子(403)によってスケーリングされた(401、402)後の少なくとも1個のベースチャンネルを出力するか、またはエネルギ尺度を出力するステップ(1408)とを含む、方法。
  43. 多チャンネル入力信号または多チャンネル入力信号から導出された少なくとも1個のベースチャンネルと、エネルギ損失を伴うアップミキシング動作によって生成されたアップミックス信号とのエネルギ差に依存する誤差尺度によってスケーリングされた少なくとも1個のベースチャンネルを有するか、またはエネルギ尺度を有するか、またはエネルギ尺度を出力するための、エンコードされた多チャンネル情報信号。
  44. 請求項44に記載のエンコードされた多チャンネル情報信号を記憶する、機械可読媒体。
  45. 請求項30から請求項41のいずれかに記載のエンコーダを有する送信機またはオーディオレコーダ。
  46. 請求項1から請求項29のいずれに記載のデコーダを有する受信機またはオーディオプレーヤー。
  47. 請求項46に記載の送信機と請求項47に記載の受信機とを有する送信システム。
  48. 受信またはオーディオ再生方法であって、請求項43に記載の処理方法を有する方法。
  49. 受信またはオーディオ再生方法であって、請求項42に記載の生成方法を含む方法。
  50. 請求項50に記載の受信および請求項49に記載の送信方法。
  51. コンピュータ上で実行されると、請求項42、43、49、50または51の方法のいずれかに従った方法を行う、コンピュータプログラム。
JP2007537235A 2004-11-02 2005-10-28 予測ベースの多チャンネル再構築の性能を改善するための方法 Active JP4527781B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0402652A SE0402652D0 (sv) 2004-11-02 2004-11-02 Methods for improved performance of prediction based multi- channel reconstruction
PCT/EP2005/011586 WO2006048203A1 (en) 2004-11-02 2005-10-28 Methods for improved performance of prediction based multi-channel reconstruction

Publications (2)

Publication Number Publication Date
JP2008517337A true JP2008517337A (ja) 2008-05-22
JP4527781B2 JP4527781B2 (ja) 2010-08-18

Family

ID=33488133

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007537236A Active JP4527782B2 (ja) 2004-11-02 2005-10-28 多パラメータ化ベースの多チャンネル再構築
JP2007537235A Active JP4527781B2 (ja) 2004-11-02 2005-10-28 予測ベースの多チャンネル再構築の性能を改善するための方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007537236A Active JP4527782B2 (ja) 2004-11-02 2005-10-28 多パラメータ化ベースの多チャンネル再構築

Country Status (14)

Country Link
US (2) US7668722B2 (ja)
EP (2) EP1730726B1 (ja)
JP (2) JP4527782B2 (ja)
KR (2) KR100905067B1 (ja)
CN (2) CN1998046B (ja)
AT (2) ATE371925T1 (ja)
DE (2) DE602005002833T2 (ja)
ES (2) ES2294738T3 (ja)
HK (2) HK1097336A1 (ja)
PL (2) PL1730726T3 (ja)
RU (2) RU2369917C2 (ja)
SE (1) SE0402652D0 (ja)
TW (2) TWI338281B (ja)
WO (2) WO2006048204A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010504017A (ja) * 2006-09-14 2010-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャネル信号のためのスイートスポット操作
JP2010507115A (ja) * 2006-10-16 2010-03-04 ドルビー スウェーデン アクチボラゲット 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現
WO2010140350A1 (ja) * 2009-06-02 2010-12-09 パナソニック株式会社 ダウンミックス装置、符号化装置、及びこれらの方法
JP2013148682A (ja) * 2012-01-18 2013-08-01 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US8687829B2 (en) 2006-10-16 2014-04-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for multi-channel parameter transformation
US8818764B2 (en) 2010-03-30 2014-08-26 Fujitsu Limited Downmixing device and method
JP2014160212A (ja) * 2013-02-20 2014-09-04 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP2021047463A (ja) * 2010-04-09 2021-03-25 ドルビー・インターナショナル・アーベー ステレオオーディオ信号を出力する装置及び方法

Families Citing this family (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR101283525B1 (ko) * 2004-07-14 2013-07-15 돌비 인터네셔널 에이비 오디오 채널 변환
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
CN102117617B (zh) * 2004-10-28 2013-01-30 Dts(英属维尔京群岛)有限公司 音频空间环境引擎
US7853022B2 (en) 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
EP1866913B1 (en) * 2005-03-30 2008-08-27 Koninklijke Philips Electronics N.V. Audio encoding and decoding
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007004830A1 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR101228630B1 (ko) * 2005-09-02 2013-01-31 파나소닉 주식회사 에너지 정형 장치 및 에너지 정형 방법
RU2393646C1 (ru) * 2006-03-28 2010-06-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Усовершенствованный способ для формирования сигнала при восстановлении многоканального аудио
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
WO2008016097A1 (fr) * 2006-08-04 2008-02-07 Panasonic Corporation dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci
CN101617360B (zh) * 2006-09-29 2012-08-22 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
KR101055739B1 (ko) * 2006-11-24 2011-08-11 엘지전자 주식회사 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그 장치
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
CN101568958B (zh) 2006-12-07 2012-07-18 Lg电子株式会社 用于处理音频信号的方法和装置
EP2097895A4 (en) 2006-12-27 2013-11-13 Korea Electronics Telecomm DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION
TWI396187B (zh) 2007-02-14 2013-05-11 Lg Electronics Inc 用於將以物件為主之音訊信號編碼與解碼之方法與裝置
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
WO2008131903A1 (en) * 2007-04-26 2008-11-06 Dolby Sweden Ab Apparatus and method for synthesizing an output signal
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
MX2010004138A (es) 2007-10-17 2010-04-30 Ten Forschung Ev Fraunhofer Codificacion de audio usando conversion de estereo a multicanal.
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
WO2009084916A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2232486B1 (en) * 2008-01-01 2013-07-17 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR20100095586A (ko) 2008-01-01 2010-08-31 엘지전자 주식회사 신호 처리 방법 및 장치
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8116486B2 (en) * 2008-03-04 2012-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Mixing of input data streams and generation of an output data stream therefrom
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
US8705749B2 (en) * 2008-08-14 2014-04-22 Dolby Laboratories Licensing Corporation Audio signal transformatting
JP5326465B2 (ja) 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
EP2345027B1 (en) * 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
CN101740030B (zh) * 2008-11-04 2012-07-18 北京中星微电子有限公司 语音信号的发送及接收方法、及其装置
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
US9172572B2 (en) 2009-01-30 2015-10-27 Samsung Electronics Co., Ltd. Digital video broadcasting-cable system and method for processing reserved tone
AU2013242852B2 (en) * 2009-12-16 2015-11-12 Dolby International Ab Sbr bitstream parameter downmix
MY166998A (en) 2009-12-16 2018-07-27 Dolby Int Ab Sbr bitstream parameter downmix
US8872911B1 (en) * 2010-01-05 2014-10-28 Cognex Corporation Line scan calibration method and apparatus
CN104618065B (zh) * 2010-01-13 2018-02-23 太阳专利托管公司 发送装置、发送方法、接收装置、接收方法
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
JP5753899B2 (ja) * 2010-07-20 2015-07-22 ファーウェイ テクノロジーズ カンパニー リミテッド オーディオ信号合成器
KR101678610B1 (ko) * 2010-07-27 2016-11-23 삼성전자주식회사 롱텀 채널 정보를 기반으로 다중 노드 간 서브밴드 별 협력 통신을 수행하는 방법 및 장치
EP2673771B1 (en) * 2011-02-09 2016-06-01 Telefonaktiebolaget LM Ericsson (publ) Efficient encoding/decoding of audio signals
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
EP2560161A1 (en) 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
RU2618383C2 (ru) * 2011-11-01 2017-05-03 Конинклейке Филипс Н.В. Кодирование и декодирование аудиообъектов
JP6106983B2 (ja) 2011-11-30 2017-04-05 株式会社リコー 画像表示装置、画像表示システム、方法及びプログラム
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US20130253923A1 (en) * 2012-03-21 2013-09-26 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Multichannel enhancement system for preserving spatial cues
JP6051621B2 (ja) 2012-06-29 2016-12-27 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
JP6065452B2 (ja) 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2922053B1 (en) * 2012-11-15 2019-08-28 NTT Docomo, Inc. Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
JP6289507B2 (ja) * 2013-01-29 2018-03-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ エネルギー制限演算を用いて周波数増強信号を生成する装置および方法
ES2924427T3 (es) * 2013-01-29 2022-10-06 Fraunhofer Ges Forschung Decodificador para generar una señal de audio mejorada en frecuencia, procedimiento de decodificación, codificador para generar una señal codificada y procedimiento de codificación que utiliza información lateral de selección compacta
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
US9514761B2 (en) 2013-04-05 2016-12-06 Dolby International Ab Audio encoder and decoder for interleaved waveform coding
KR20140123015A (ko) 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
CA2919080C (en) * 2013-07-22 2018-06-05 Sascha Disch Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
CN104376857A (zh) * 2013-08-16 2015-02-25 联想(北京)有限公司 信息处理的方法及电子设备
BR112016004299B1 (pt) * 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
TWI713018B (zh) * 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
CN105531761B (zh) * 2013-09-12 2019-04-30 杜比国际公司 音频解码系统和音频编码系统
KR102244379B1 (ko) * 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
RU2641463C2 (ru) 2013-10-21 2018-01-17 Долби Интернэшнл Аб Структура декоррелятора для параметрического восстановления звуковых сигналов
CN107452391B (zh) 2014-04-29 2020-08-25 华为技术有限公司 音频编码方法及相关装置
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
AU2015326856B2 (en) * 2014-10-02 2021-04-08 Dolby International Ab Decoding method and decoder for dialog enhancement
EP3332557B1 (en) 2015-08-07 2019-06-19 Dolby Laboratories Licensing Corporation Processing object-based audio signals
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
GB2554065B (en) * 2016-09-08 2022-02-23 V Nova Int Ltd Data processing apparatuses, methods, computer programs and computer-readable media
CN109859766B (zh) * 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
DE102018127071B3 (de) 2018-10-30 2020-01-09 Harman Becker Automotive Systems Gmbh Audiosignalverarbeitung mit akustischer Echounterdrückung
EP3719799A1 (en) * 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation
TWI772930B (zh) * 2020-10-21 2022-08-01 美商音美得股份有限公司 適合即時應用之分析濾波器組及其運算程序、基於分析濾波器組之信號處理系統及程序
US11837244B2 (en) 2021-03-29 2023-12-05 Invictumtech Inc. Analysis filter bank and computing procedure thereof, analysis filter bank based signal processing system and procedure suitable for real-time applications
CN113438595B (zh) * 2021-06-24 2022-03-18 深圳市叡扬声学设计研发有限公司 音频处理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036925A2 (en) * 2003-10-02 2005-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Compatible multi-channel coding/decoding
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4744044A (en) * 1986-06-20 1988-05-10 Electronic Teacher's Aids, Inc. Hand-held calculator for dimensional calculations
DE69210689T2 (de) * 1991-01-08 1996-11-21 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6590983B1 (en) 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
EP1479071B1 (en) * 2002-02-18 2006-01-11 Koninklijke Philips Electronics N.V. Parametric audio coding
ES2351438T3 (es) 2002-04-25 2011-02-04 Powerwave Cognition, Inc. Utilización dinámica de recursos inalámbricos.
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
GB0228163D0 (en) * 2002-12-03 2003-01-08 Qinetiq Ltd Decorrelation of signals
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036925A2 (en) * 2003-10-02 2005-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Compatible multi-channel coding/decoding
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN5007018159, FALLER CHRISTOF, "PARAMETRIC CODING OF SPATIAL AUDIO − THESIS NO 3062", THESE PRESENTEE A LA FACULTE INFORMATIQUE ET COMMUNICATIONS INSTITUT DE SYSTEMES DE COMMUNICATION SE, 20040924, P.I−XIV,1−164 *
JPN5007018160, BREEBAART J., et al., "MPEG Spatial Audio Coding / MPEG Surround: Overview and Current Status", AUDIO ENGINEERING SOCIETY CONVENTION PAPER [ONLINE], 20051007, P1−17, US *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010504017A (ja) * 2006-09-14 2010-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャネル信号のためのスイートスポット操作
JP2010507115A (ja) * 2006-10-16 2010-03-04 ドルビー スウェーデン アクチボラゲット 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現
US8687829B2 (en) 2006-10-16 2014-04-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for multi-channel parameter transformation
US9565509B2 (en) 2006-10-16 2017-02-07 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
WO2010140350A1 (ja) * 2009-06-02 2010-12-09 パナソニック株式会社 ダウンミックス装置、符号化装置、及びこれらの方法
US8818764B2 (en) 2010-03-30 2014-08-26 Fujitsu Limited Downmixing device and method
JP2021047463A (ja) * 2010-04-09 2021-03-25 ドルビー・インターナショナル・アーベー ステレオオーディオ信号を出力する装置及び方法
US11217259B2 (en) 2010-04-09 2022-01-04 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US11810582B2 (en) 2010-04-09 2023-11-07 Dolby International Ab MDCT-based complex prediction stereo coding
JP2013148682A (ja) * 2012-01-18 2013-08-01 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP2014160212A (ja) * 2013-02-20 2014-09-04 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム

Also Published As

Publication number Publication date
CN1998046A (zh) 2007-07-11
ATE375590T1 (de) 2007-10-15
ATE371925T1 (de) 2007-09-15
SE0402652D0 (sv) 2004-11-02
JP2008517338A (ja) 2008-05-22
CN1969317A (zh) 2007-05-23
ES2294738T3 (es) 2008-04-01
TW200627380A (en) 2006-08-01
CN1969317B (zh) 2010-12-29
US8515083B2 (en) 2013-08-20
DE602005002833D1 (de) 2007-11-22
HK1097336A1 (en) 2007-07-27
KR100905067B1 (ko) 2009-06-30
JP4527782B2 (ja) 2010-08-18
RU2369917C2 (ru) 2009-10-10
US20060140412A1 (en) 2006-06-29
DE602005002833T2 (de) 2008-03-13
US7668722B2 (en) 2010-02-23
DE602005002256T2 (de) 2008-05-29
HK1097082A1 (en) 2007-06-15
CN1998046B (zh) 2012-01-18
KR100885192B1 (ko) 2009-02-24
TWI338281B (en) 2011-03-01
KR20070038043A (ko) 2007-04-09
US20060165237A1 (en) 2006-07-27
RU2006146948A (ru) 2008-07-10
RU2006146947A (ru) 2008-07-10
KR20070049627A (ko) 2007-05-11
TW200629961A (en) 2006-08-16
JP4527781B2 (ja) 2010-08-18
DE602005002256D1 (de) 2007-10-11
RU2369918C2 (ru) 2009-10-10
EP1730726B1 (en) 2007-10-10
ES2292147T3 (es) 2008-03-01
EP1738353A1 (en) 2007-01-03
WO2006048203A1 (en) 2006-05-11
TWI328405B (en) 2010-08-01
WO2006048204A1 (en) 2006-05-11
PL1730726T3 (pl) 2008-03-31
EP1730726A1 (en) 2006-12-13
PL1738353T3 (pl) 2008-01-31
EP1738353B1 (en) 2007-08-29

Similar Documents

Publication Publication Date Title
JP4527781B2 (ja) 予測ベースの多チャンネル再構築の性能を改善するための方法
US9361896B2 (en) Temporal and spatial shaping of multi-channel audio signal
TWI396188B (zh) 依聆聽事件之函數控制空間音訊編碼參數的技術
KR100848367B1 (ko) 레벨 파라미터를 발생하는 장치 및 방법 그리고 멀티채널표현을 발생하는 장치 및 방법
KR101175592B1 (ko) 출력신호 합성 장치 및 방법
US8249883B2 (en) Channel extension coding for multi-channel source
CN109448741B (zh) 一种3d音频编码、解码方法及装置
RU2696952C2 (ru) Аудиокодировщик и декодер

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070417

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070418

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070418

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4527781

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250