JP6163545B2 - 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え - Google Patents

可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え Download PDF

Info

Publication number
JP6163545B2
JP6163545B2 JP2015516626A JP2015516626A JP6163545B2 JP 6163545 B2 JP6163545 B2 JP 6163545B2 JP 2015516626 A JP2015516626 A JP 2015516626A JP 2015516626 A JP2015516626 A JP 2015516626A JP 6163545 B2 JP6163545 B2 JP 6163545B2
Authority
JP
Japan
Prior art keywords
time frame
signal
channel
input signal
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015516626A
Other languages
English (en)
Other versions
JP2015525375A (ja
Inventor
プルンハーゲン,ヘイコ
セルストロム,レイフ
ヨナス ローエデン,カール
ヨナス ローエデン,カール
クヨーリング,クリストファー
ヴィレモエス,ラルス
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2015525375A publication Critical patent/JP2015525375A/ja
Application granted granted Critical
Publication of JP6163545B2 publication Critical patent/JP6163545B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本稿に開示される発明は、概括的にはオーディオビジュアル・メディア配信に関する。詳細には、より高いビットレートおよびより低いビットレートのモードの両方ならびにデコードの際のシームレスなモード遷移を可能にする適応的な配信フォーマットに関する。本発明はさらに、上記配信フォーマットに基づく信号をエンコードおよびデコードする方法および装置に関する。
パラメトリック・ステレオおよびマルチチャネル符号化方法は、聴取品質の点でスケーラブルかつ効率的であることが知られており、そのため低ビットレート用途において特に魅力的なものとなっている。
しかしながら、ビットレート制限が一時的な性質のものである(たとえば、ネットワーク・ジッタ、負荷変動)場合には、利用可能なネットワーク資源の十全な恩恵は、通常条件の間は相対的により高いビットレートが使われ、ネットワークが貧弱に機能するときはより低いビットレートが使われる適応的な配信フォーマットの使用を通じて得られることがある。既存の適応的配信フォーマットおよび関連する符号化(復号)技法は、その帯域幅効率、計算効率、誤り耐性、アルゴリズム遅延の観点から、またさらにはオーディオビジュアル・メディア配信においては、いかにしてビットレート切り換えイベントが復号されるメディアを享受する人にとってどのくらい気づかれやすいかに関して、改善されうる。
本発明の実施形態について、ここで、付属の図面を参照して記述する。
本発明のある例示的な実施形態に基づくデコード・システムの一般化されたブロック図である。 図1と同様に、本発明のある例示的な実施形態に基づくエンコード・システムを示す図である。 エンコーダ側およびデコーダ側に位置するダウンミックス段の機能を示す図である。 デコード・システムにおける展開のためのある例示的な実施形態に基づくアップミックス段の詳細を示す図である。 デコード・システムにおける展開のためのある例示的な実施形態に基づく空間的合成段の詳細を示す図である。 図5の空間的合成段を備えたある例示的なデコード・システムにおいて生じるデータ信号および制御信号を示す図である。 デコード・システムにおける展開のためのある例示的な実施形態に基づく空間的合成段の詳細を示す図である。 図7の空間的合成段を備えたある例示的なデコード・システムにおいて生じるデータ信号および制御信号を示す図である。 本発明のある例示的な実施形態に基づく、情報をデコーダ装置に送信するエンコード・システムを示す図である。 図5の空間的合成段を備えたある例示的なデコード・システムにおいて生じるデータ信号および制御信号を示す図である。 本発明のある例示的な実施形態に基づくデコード・システムの一般化されたブロック図である。 デコード・システムにおける展開のためのある例示的な実施形態に基づくオーディオ・デコーダの詳細を示す図である。 すべての図面は概略的であり、一般に、本発明を例解するために必要な部分のみを示す。他の部分が省略されていたり、単に示唆されていたりすることがある。特に断わりのない限り、同様の参照符号は異なる図面における同様の部分を指す。
〈I.概観〉
本稿での用法では、オーディオ信号は、純粋なオーディオ信号、オーディオビジュアル信号もしくはマルチメディア信号のオーディオ部分またはこれらの任意のものをメタデータと組み合わせたものでありうる。
本発明の第一の側面では、例示的な実施形態は、オーディオまたはビデオ・コンテンツのようなメディア・コンテンツの適応的な配信を可能にする方法および装置であって、改善されたビットレート選択能力および/または低下した遅延をもつものを提案する。ある例示的な実施形態はさらに、そのような適応的なメディア配信に好適な符号化フォーマットであって、ビットレートの間のシームレスな遷移に寄与するものを提供する。
本発明の例示的な実施形態は、独立請求項に記載される特徴をもつエンコード方法、エンコード・システム、デコード方法、デコード・システム、オーディオ配信システムおよびコンピュータ・プログラム・プロダクトを提供する。
デコード・システムが、入力信号に基づいてオーディオ信号を再構成するよう適応される。入力信号は、デコード・システムに直接提供されてもよいし、あるいはデコード・システムによって受領されるビットストリームによってエンコードされていてもよい。入力信号は、オーディオ信号の(重なり合うまたは連続する)時間セグメントに対応する時間フレームにセグメント分割される。入力信号の一つの時間フレームは、パラメトリック符号化(parametric coding)および離散的符号化(discrete coding)を含む符号化方式の群から選択される符号化方式に従って、オーディオ信号のある時間セグメントを表わす。特に、エンコードされるオーディオ信号がnチャネル信号である場合、入力信号は、受領されるフレームの(少なくとも)同数のチャネルを含み、それらのチャネルにおいて離散的に符号化される。すなわち、離散的符号化方式では、オーディオ信号を表わすためにn個の別々にエンコードされるチャネルが使われる。パラメトリック符号化される受領されるフレームでは、入力信号はnチャネルより少ないチャネルを含む(ただし、nチャネル・フォーマットであって、いくつかのチャネルが使用されないのでもよい)が、さらにメタデータを含んでいてもよい。メタデータは、たとえば信号エネルギー値または相関係数を計算することによって、エンコード・プロセスの間にオーディオ信号から導出される少なくとも一つの混合パラメータなどである。あるいはまた、前記少なくとも一つの混合パラメータは、異なる通信経路を通じて、たとえば入力信号を担持するビットストリームとは別個のメタデータ・ビットストリームを介して、デコード・システムに供給されてもよい。上記のように、入力信号は少なくとも二つの異なる方式(すなわち、パラメトリック符号化または離散的符号化)であってもよく、それに対して、デコード・システムは、パラメトリック・モードまたは離散モードに遷移する――またはそれに留まる――ことによって反応にする。システムの遷移は有限の継続時間をもつことがあり、よってデコード・システムは、一つまたは複数の時間フレームが経過したのちにはじめて、入力信号の現在の符号化方式によって引き起こされるモードにはいる。したがって、動作では、デコード・システムのモードは入力信号の方式より、一つまたは複数の時間フレームに対応する期間だけ遅れることがある。パラメトリック符号化された時間フレームの「エピソード」とは、みなパラメトリック符号化によってオーディオ信号を表わす一つまたは複数の連続的な時間フレームのシーケンスを指す。同様に、離散的に符号化される時間フレームのエピソードとは、n個の離散的に符号化されるチャネルをもつ一つまたは複数の連続する時間フレームのシーケンスである。本稿での用法では、デコード・システム出力がフレーム継続時間の大半について空間的合成(基礎になるデータの起源は問わない)によって生成される時間フレームにおいてデコード・システムは「パラメトリック・モード」にあり、「離散モード」は、デコード・システムがパラメトリック・モードにない任意の時間フレームをいう。
デコード・システムは、入力信号に基づいてmチャネル・ダウンミックス信号を出力するよう適応されたダウンミックス段を有する。好ましくは、デコード・システムは、ダウンミックス動作の定量的および/または定性的諸側面を制御するダウンミックス指定、たとえばダウンミックス段によって形成される任意の線形結合において適用されるべき利得、を受け容れる。好ましくは、ダウンミックス指定は、データ通信または記憶媒体から少なくとも一つのさらなるダウンミックス段、たとえば前記入力信号または該入力信号をエンコードするビットストリームを前記デコード・システムに提供するエンコーダにおける同様のまたは異なる構造的特性をもつダウンミックス段に提供されることのできるデータ構造である。このように、これらのダウンミックス段は機能的に等価であること、たとえば同一の入力信号に応答して同一のダウンミックス信号を与えることが保証されてもよい。ダウンミック指定をロードすることは、展開後のダウンミックス段を構成設定し直すことに相当してもよいが、あるいはまた、その製造、初期プログラミング、インストール、展開などの間に実行されてもよい。ダウンミックス指定は入力信号の特定の形式またはフォーマット(フォーマット中のチャネルの位置および番号付けを含む)を用いて表現されてもよい。あるいはまた、ダウンミックス指定は意味的に表現されてもよい(チャネルのフォーマットに対する位置に関わりなく、チャネルの幾何学的な意義を含む)。好ましくは、ダウンミックス指定は、入力信号の現在の形式やフォーマットおよび/または入力信号の方式とは独立に定式化され、それによりダウンミックス動作は、入力信号フォーマットの変化を越えて、中断なく継続しうる。
デコード・システムはさらに、ダウンミックス信号を受領し、オーディオ信号を表わすnチャネル表現を出力するよう適応された空間的合成段を有する。空間的合成段には、そのアルゴリズム遅延の理由により、0でない通過時間が付随する。本発明の基礎にある問題の一つは、この遅延の存在にもかかわらず、なめらかな切り換えを達成することである。オーディオ信号のnチャネル表現は、デコード・システム出力として出力されてもよい;あるいはまた、オーディオ信号をより忠実におよび/またはより少ないアーチファクトおよび誤差をもって再構成するという一般的なねらいをもってさらなる処理を受ける。空間的合成段は、空間的合成動作の定量的および/または定性的諸側面を制御する少なくとも一つの混合パラメータを受け容れる。原理的には、空間的合成段は、少なくともパラメトリック・モードにおいて、たとえばダウンミックス信号が利用可能であるときにアクティブである。離散モードでは、デコード・システムは、n個の離散的にエンコードされたチャネルのそれぞれをデコードすることによって、入力信号から出力信号を導出する。
この例示的な実施形態によれば、ダウンミックス段は、離散的に符号化された時間フレームの各エピソードにおける少なくとも最初の時間フレームにおいて(たとえば該フレーム全体を通じて)および離散的に符号化された時間フレームの各エピソード後の少なくとも最初の時間フレームにおいて(たとえば該フレーム全体を通じて)、アクティブである。これは、離散的符号化からパラメトリック符号化への入力信号における遷移があったあとすぐ、mチャネル・ダウンミックス信号が利用可能となりうることを含意する。結果として、空間的合成段は、たとえ内在的な0でないアルゴリズム遅延を伴う処理、たとえば時間から周波数への変換、実から複素への変換および/またはハイブリッド分解フィルタリング(hybrid analysis filtering)を含むとしても、より短い時間でアクティブ化できる。さらに、オーディオ信号のnチャネル表現はパラメトリック・モードから離散モードへの諸遷移を通じて利用可能なままであってもよく、そのような遷移をより高速におよび/またはより気づかれにくくするために使用されてもよい。
本稿での用法では、「時間フレーム」(または「フレーム」)は、それについて符号化方式が制御できる、入力信号の最小単位である。好ましくは、入力信号の空でないチャネルが窓掛けされた変換(windowed transform)によって得られる。たとえば、各変換窓はサンプルに関連付けられていてもよく、MDCTにおけるように、連続する変換窓が重なり合ってもよい。明らかに、連続する窓が50%重なり合う場合には、時間フレームの長さは変換窓の半分の長さより小さくなく(たとえば、512サンプルの変換窓の半分の長さは256サンプルに等しい)、その場合、該変換窓は変換ストライドに等しい。切り換えイベントは、デコードされたオーディオを享受する人にとってより知覚されにくくできるので、この例示的な実施形態は、動作中に切り換えイベントの数を制限する必要がなく、ネットワーク条件の変化に注意を払って応答しうる。これは、利用可能なネットワーク資源がよりフルに利用されることを許容する。短縮されたデコード・システム遅延は、特にライブ・メディア・ストリーミングにおいて、メディアの忠実度を向上させうる。
本開示の目的のためには、ダウンミックス段がある時間フレームにおいてアクティブであるとは、ダウンミックス段が少なくとも、その時間フレームのサブセットの間アクティブであることを意味する。ダウンミックス段は、フレーム全体を通じて/フレーム全体の間、あるいはフレームの初期部分など、その時間フレームのサブセットの間のみ、アクティブであってもよい。初期部分は、フレーム長さの1/2、1/3、1/4、1/6に対応してもよい;初期部分は変換ストライドに対応してもよい;あうるいはまた、初期部分はTがフレーム長さ、pが各フレームにおいて始まる変換窓の数であるとして、T/pに対応してもよい。入力信号における符号化方式間の遷移は典型的には、前の時間フレームの符号化と現在時間フレームの符号化の間で、
時間フレームのはじまりにおける(たとえば時間フレームの最初の1/6の間のまたは1536個のうち256個の時間サンプルの間の)クロスフェードに関わる(たとえば、入力信号を、ビットストリームから該入力信号が得られうる周波数領域フォーマットから時間領域に変換するときに重なり合う変換窓を使う結果として)。ダウンミックス段は、好ましくは、入力信号の離散的符号化への/からの遷移直後の時間フレームの少なくとも初期部分の間、アクティブであってもよい。これは、ダウンミックス信号を、入力信号におけるクロスフェードの間、利用可能にする。それにより、空間的合成段は、入力信号におけるクロスフェードに関する時間フレームの部分について、オーディオ信号のnチャネル表現を出力しうる。入力信号の現在の方式(たとえばパラメトリック符号化または離散的符号化)についての情報が、入力信号と一緒に受領されてもよい。たとえば、入力信号が含まれるビットストリーム中のある位置にあるビットである。たとえば、パラメトリック符号化の間、空間的パラメータについての情報がビットストリームのある種の位置に見出されてもよく、一方、離散的符号化の間は、これらの位置/ビットは使用されない。そのようなビットの期待される位置での存在をチェックすることにより、デコード・システムは入力信号の現在の符号化方式を判定しうる。
上記の例示的な実施形態のあるさらなる発展では、入力信号の時間セグメントは、パラメトリック符号化、離散的符号化および縮小(reduced)パラメトリック符号化を含む符号化方式の群から選択される符号化方式によってオーディオ信号の時間セグメントを表現してもよい。このように、前記さらなる発展では、縮小パラメトリック符号化と称される追加的な符号化方式がある。この方式では、入力信号はmチャネル・コア信号(可能性としては混合パラメータおよび他のメタデータが付随する)である。このコア信号は、同じオーディオ信号を表わす(すなわち、最初に言及したオーディオ信号と同一のオーディオ信号を表わす)仮説的な離散的nチャネル入力信号から、前記ダウンミックス指定に従ったダウンミックスによって、得られる。逆に、離散的符号化された時間フレーム中の入力信号に基づいて、前記ダウンミックス指定は、それらのフレームにおいて同じオーディオ信号を表わすために縮小パラメトリック符号化が使われていたとしたらコア信号はどうなっていたかを決定することを可能にする。
入力信号が縮小パラメトリック符号化によってオーディオ信号を表わすフレームでは、いかなるダウンミックスも実行する必要がないことがある。実際、入力信号はmチャネル・コア信号であり、空間的合成段に送られる前にダウンミックスされる必要はない。よって、空間的合成段は好ましくは入力信号を直接受領してもよく、あるいは入力信号は、空間的合成段に到達する前に、影響を受けずにダウンミックス段を通過してもよい。したがって、入力信号が縮小パラメトリック符号化によってオーディオ信号を表わすフレームでは、空間的合成段は、入力信号および少なくとも一つの混合パラメータに基づいてオーディオ信号のnチャネル表現を出力してもよい。縮小パラメトリック符号化された時間フレームを受領するときにダウンミックス段を非アクティブ化する(またはアイドル/受動/休止モードにする)ことは、エネルギーを節約しうる。それによりたとえば、携帯機器におけるバッテリー時間が延長されうる。
ある例示的な実施形態では、ダウンミックス段は、入力信号がパラメトリック符号化によってオーディオ信号を表わす各時間フレームにおいてアクティブである。二つだけの符号化方式(パラメトリックおよび離散的)がある例では、これはダウンミックス段は、少なくとも、離散的に符号化されるのでないすべてのフレームにおいてアクティブであることを含意する。縮小パラメトリック符号化のような利用可能な追加的な符号化方式がある例では、ダウンミックス段は、離散的に符号化されるのでない時間フレームにおいて、非アクティブ/非アクティブ化状態/アイドルであるのでもよい。これは、エネルギーを節約するおよび/またはバッテリー時間を延長することができる。
ある例示的な実施形態では、デコード・システムは、パラメトリック符号化された時間フレームの間、mチャネル・コア信号(混合パラメータおよび他のメタデータがあればそれに加えて)を有する入力信号を受領するよう適応される。コア信号は、同じオーディオ信号を表わす(すなわち、最初に言及したオーディオ信号と同一のオーディオ信号を表わす)仮説的な離散nチャネル入力信号から、前記ダウンミックス指定に従ったダウンミックスによって得ることができる。逆に、離散的符号化された時間フレーム中の入力信号に基づいて、前記ダウンミックス指定は、それらのフレームにおいて同じオーディオ信号を表わすためにパラメトリック符号化が使われていたとしたらコア信号はどうなっていたかを決定することを可能にする。
しかしながら、ダウンミックス段は、入力信号がコア信号を含まないことがある少なくともいくつかの離散的に符号化された時間フレーム(たとえば、離散的に符号化された時間フレームのエピソード中の最初の時間フレームなど)においてアクティブなので、デコード・システムは、これらの離散的に符号化された時間フレームにおいてこのコア信号がどうであったかを予測することができるであろう。よって、たとえ原理的にはコア信号と離散的に符号化されたチャネルの共存はないとしても、入力信号における(パラメトリック符号化または縮小パラメトリック符号化と離散的符号化の間の)方式変更に関連するいかなる不連続も緩和されるまたは完全に回避されることができる。
上記の例示的実施形態のあるさらなる発展では、ダウンミックス段は、もし利用可能であれば入力信号中のコア信号を再生することによってダウンミックス信号を生成するよう適応されている。換言すれば、ダウンミックス段は、パラメトリック符号化された時間フレームの受領に、中でも、コア信号をコピーまたは転送することによって応答するよう適応される。それにより、ダウンミックス段は、コア信号をダウンミックス段として出力する。別の言い方をすれば、ダウンミックス信号におけるmチャネルがnチャネル入力信号の空間の部分空間と考えられる場合、ダウンミックス段は、この部分空間上への投影である。特に、入力信号のmチャネルのサブセットを、ダウンミックス段は、ダウンミックス信号におけるそれぞれのmチャネルと同一にマッピングする。これは、前記ダウンミックス指定において規定されてもよい。離散的に符号化された時間フレームについては、ダウンミックス信号は入力信号に基づいてかつ前記ダウンミックス指定に基づいて生成される。上記で論じたように、ダウンミックス指定は、コア信号と入力信号中のn個の離散的に符号化されたチャネルとの間の関係を定義する。これは、入力信号における方式変化はそれ自身としては不連続を生じさせることができないことを含意する。すなわち、オーディオ信号がモード変化をまたいで連続的であれば、ダウンミックス段出力は連続的なままであり、実質的に中断がないことになる。
上記で概説した例示的実施形態の代替として、あるいはそのさらなる発展として実施されうるある例示的な実施形態では、パラメトリック符号化方式および離散的符号化方式の両方において適用可能なフォーマットで入力信号をエンコードするビットストリームを受領するよう適応される。n個の離散的に符号化されたチャネルを受け容れるために、受領されたビットストリームは、入力信号を、nチャネル以上を含むフォーマットでエンコードする。結果として、パラメトリック符号化方式の時間フレームはたとえばn−m個の不使用のチャネルを含むことがある。パラメトリック符号化方式においてフォーマットの一様性を保存するために、不使用のチャネルは存在するが、励起なしに対応する中立値、たとえば0のシーケンスに設定される。発明者は、デコーダ・プロダクトは、フォーマット変化が頻繁でありうる適応的メディア配信設備において展開される意図なしに設計されたレガシー・コンポーネントまたは汎用コンポーネント(たとえば、ハードウェア、アルゴリズム、ソフトウェア・ライブラリ)を含むことがあることを認識するに至った。そのようなコンポーネントは、より低いビットレート・フォーマットへの検出される変化に対して、自らを非アクティブ化するまたは部分的に電源オフすることによって応答することがある。これは、コンポーネントが通常動作に復するときのフォーマット変化と関連した不連続のため、ビットレート間のなめらかな遷移を妨げたり、その達成をより難しくしたりすることがある。困難は、重複窓関数を用いた変換との関連でのように、異なる符号化方式のフレームからの寄与が合計されるときにも生じうる。本例示的実施形態では、入力フォーマットについて一様なフォーマットが使用されるので、デコード・システムにおけるこれらの特性をもつコンポーネントは典型的には、パラメトリックから離散的符号化方式への、また逆に離散的からパラメトリック符号化方式への遷移によって実質的に影響されないままである。上記は、すべての離散的符号化またはパラメトリック符号化された時間フレームについて当てはまる。いくつかの例示的実施形態では、パラメトリック符号化された時間フレームの二つのエピソードの間では、入力信号が代わりにmチャネル・フォーマット(縮小パラメトリック符号化方式)において提供されてもよい。それにより、モード遷移が切迫していないまたは実行されようとしていないときにダウンミックスの必要がなくなる。任意的に、mチャネル・フォーマット(すなわち、縮小パラメトリック符号化方式)は、離散的符号化されていないすべてのフレームにおいて使用されてもよく、デコード・システムは任意的に、少なくともいくつかのフレームにおいて、受領されたmチャネル・フォーマットをnチャネル・フォーマットにフォーマットし直すよう適応されていてもよい。たとえば、直前の縮小パラメトリック符号化された諸フレームまたは直後の離散的符号化された諸時間フレームにおいて、n−m個の中立チャネルをmチャネル・フォーマットにアペンドすることによって、縮小パラメトリック符号化が、フォーマットし直されてもよい。異なる符号化方式の間の遷移の間に同数のチャネルをもつという上記の利点の少なくともいくつかを得るためである。好ましくは、上記一様フォーマットは、パラメトリックおよび/または離散的モードにおいて使うための、混合パラメータおよび他のメタデータを受け容れる。好ましくは、入力信号はエントロピー符号化または同様のアプローチによってエンコードされ、それにより不使用のチャネルが必要とされる帯域幅を増すのは、限られた程度だけである。
ある例示的実施形態では、デコード・システムはさらに、第一の遅延線および混合器を有する。第一の遅延線は入力信号を受領し、該入力信号の遅延されたバージョンを出力するよう動作可能である。あるいはまた、第一の遅延線は、たとえば入力信号から前記n個のチャネルが導出されたあとのまたはパケット化解除後の前記入力信号の処理されたバージョンを遅延させるよう動作可能であってもよい。第一の遅延線は、モード遷移を容易にするため、パラメトリック・モードにおいては(すなわち、デコード・システム出力が空間的合成によって生成される時間フレームにおいては)アクティブである必要はないが、可能性のある例外は、デコード・システムが離散モードにある時間フレームのシーケンスにおける最初の時間フレームである。混合器は第一の遅延線出力および空間的合成段出力の両方に接続され、これら二つの源の間の選択器として作用する。パラメトリック・モードでは、混合器出力は空間的合成段出力を出力する。離散モードでは、混合器は第一の遅延線出力を出力する。入力信号における離散符号化方式とパラメトリック符号化方式(または、デコード・システムが上記のように受領された縮小パラメトリック符号化された時間フレームをnチャネル・フォーマットにフォーマットし直すよう適応されているなら縮小パラメトリック符号化方式)との間に遷移があるとき、混合器はこれら二つの出力の間の混合遷移(mixing transition)を実行する。混合遷移は、クロスフェード型動作またはあまり知覚されにくいことが知られている他の混合遷移を含みうる。混合遷移は、そこからモード遷移が起こるある時間フレームまたはある時間フレームのある割合を占めてもよい。第一の遅延線の存在により、空間的合成段によって与えられるオーディオ信号のnチャネル表現が、入力信号からn個の離散符号化されたチャネルに基づいて導出された信号と同期したままであることができる。これは、モード遷移のなめらかさを向上させる。さらに、二つの信号の予備的な整列が必要ないので、混合器は、短いレイテンシーでモード間で遷移できるであろう。特に、第一の遅延線は、入力信号を、ダウンミックス段および空間的合成段の全通過時間に対応する期間だけ遅延させるよう構成されてもよい。全通過時間は、それぞれの通過時間の和であってもよい。しかしながら、遅延短縮施策が講じられる場合には、全通過時間は前記和より短くてもよい。ダウンミックス段の通過時間は0でない数であることもあるし、あるいは特にダウンミックス段が時間領域で動作する場合には0であることもあることを注意しておく。
上記の実施形態のあるさらなる発展では、デコード・システムはさらに、混合器の下流の第二の遅延線を含む。第二の遅延線は、パラメトリック・モードおよび離散モードにおいて同様に、すなわち時間フレーム継続時間と第一の遅延線によって受ける遅延との間の差である遅延を加えることによって機能するよう構成される。よって、デコード・システムの全通過時間はちょうど一つの時間フレームである。あるいはまた、第二の遅延線によって受ける遅延は、第一の遅延線および第二の遅延線によって受ける全遅延が一時間フレームの長さの倍数であるよう選ばれる。これらの代替はいずれも、切り換えを簡単にする。特に、これは、切り換えとの関連で、デコード・システムと接続されたエンティティとの間の協働を簡単にする。
ある例示的実施形態では、空間的合成段は、時間補間によって得られた混合パラメータ値を適用するよう適応される。パラメトリックおよび縮小パラメトリック符号化方式では、時間フレームは、時間フレームの中点または末尾のような所与の時間フレーム内のある参照点(またはアンカー点)について明示的に定義される混合パラメータ(単数または複数)を担持してもよい。明示的に定義された値に基づいて、空間的合成段は、相続く(連続する)時間フレームにおけるそれぞれの参照点の間の補間によって時間的に中間的な諸点について中間混合パラメータ値を導出する。換言すれば、補間は、二つの相続く(連続する)時間フレームの間で、これら二つの時間フレームのそれぞれが混合パラメータ値を担持する場合に、たとえばこれらの時間フレームのそれぞれがパラメトリック符号化されているまたは縮小パラメトリック符号化されている場合に、実行されるのみであってもよい。この設定では、特に参照点が最初でない場合、空間的合成段は、各時間フレームがパラメトリック符号化されているまたは縮小パラメトリック符号化されている時間フレームのエピソードにおける最初の時間フレームである現在時間フレーム(すなわち、現在時間フレームの前の時間フレームは混合パラメータ値を担持しない)に対して、現在時間フレームにおける参照点から後ろ向きに現在時間フレームの先頭までの間の混合パラメータ値を外挿することによって応答するよう適応される。空間的合成段は、混合パラメータを一定値によって外挿するよう構成されていてもよい。すなわち、混合パラメータは、フレーム先頭における参照点値をもつものとされ、参照点まで変動なしにこの値を(中間的な値として)維持し、次いでその後の時間フレーム内の参照点に向かって補間を開始する。好ましくは、外挿には、デコード・システムにおけるパラメトリック・モードへの遷移が伴っていてもよい。空間的合成ユニットは、現在時間フレームにおいてアクティブ化されてもよい。現在フレームおよび/またはそのあとのフレームの間、デコード・システムは、空間的合成ユニットからのオーディオ信号出力のnチャネル表現を使ってオーディオ信号を再構成することに遷移してもよい。現在時間フレームが離散的に符号化された時間フレームのエピソードにおける最初の時間フレームであるとき、空間的合成段は、現在時間フレームの直前の時間フレームにおける参照点から(混合パラメータ値の)前方外挿を実行するよう適応されていてもよい。前方外挿は、混合パラメータ値を、現在時間フレームの終点までの最後の参照点から一定に保つことによって達成されてもよい。あるいはまた、離散モードへのモード遷移を受け容れるよう、外挿は、現在時間フレームのあとさらに一時間フレームについて進行してもよい。結果として、空間的合成段はある時間フレーム(現在時間フレームの直前の時間フレーム)から外挿された混合パラメータ値を、現在時間フレーム(またはその後の時間フレーム)からのコア信号との組み合わせにおいて、使ってもよい。現在フレームの直後のフレームおよび/またはそのあとの時間フレームの間、デコード・システムは好ましくは、入力信号に含まれるn個の離散的にエンコードされたチャネルに基づいて、オーディオ信号を導出することに遷移してもよい。
ある例示的実施形態では、空間的合成段は、ダウンミックス信号の周波数領域表現に対して作用する混合行列を含む。混合行列は、mからnへのアップミックスを実行するよう動作可能であってもよい。この目的に向け、空間的合成段はさらに、混合行列の上流に、時間から周波数への変換段を、混合行列の下流に周波数から時間への変換段を有する。追加的または代替的に、混合行列は、m個のダウンミックス・チャネルを含む線形結合によってそのn個の出力チャネルを生成するよう構成される。線形結合は、好ましくは、ダウンミックス・チャネルのうち少なくともいくつかの、脱相関されたバージョンを含んでいてもよい。混合行列は、混合パラメータを受け容れ、混合パラメータの値に基づく線形結合における、前記ダウンミックス・チャネルのうちの少なくとも一つに関係する少なくとも一つの利得を調整することによって反応する。前記少なくとも一つの利得は、前記ダウンミックス信号のmチャネル周波数領域表現におけるチャネルの一つまたは複数に適用されてもよい。混合パラメータ値における点変化は、即座のまたは漸進的な利得変化につながりうる。たとえば、漸進的な変化は、上記で概説したような相続くフレームの間の補間によって達成されうる。利得の制御可能性は、アップミックス動作がダウンミックス信号の時間領域または周波数領域表現のいずれで実行されるかに関わりなく実施されてもよいことを注意しておく。
ある例示的実施形態では、ダウンミックス段は、入力信号の時間領域表現に対して作用するよう適応されている。より精密には、mチャネル・ダウンミックス信号を生成するために、ダウンミックス段は、コア信号またはn個の離散的にエンコードされた信号の時間領域表現を供給される。時間領域におけるダウンミックスは、計算的に無駄のない技法である。これは典型的な使用では、ダウンミックス段の動作がデコード・システムにおける全計算負荷を(ダウンミックス段のないデコーダに比べて)非常にわずかな度合いしか増加させないことを含意する。すでに述べたように、ダウンミックスの定量的属性は、ダウンミックス指定によって制御可能である。特に、ダウンミックス指定は、適用されるべき利得を含んでいてもよい。
ある例示的実施形態では、空間的合成段および混合器(もしそれがデコード・システムに設けられていれば)は、たとえば有限状態機械(FSM: finite state machine)として実装されうるコントローラによって制御される。ダウンミックス段は、コントローラとは独立に動作してもよいし、あるいはダウンミックスが必要とされないとき、たとえば現在および一つ(または複数)の前の時間フレームにおいて入力信号が縮小パラメトリック符号化されるときまたは入力信号が離散的符号化されるときにコントローラによって非アクティブ化されてもよい。コントローラ(たとえば有限状態機械)は、プロセッサであってもよく、その状態は現在の時間フレームおよび前の時間フレームおよび可能性としては前の時間フレームの前の時間フレームの符号化型/方式(パラメトリック、離散的および利用可能であれば縮小パラメトリック)によって一意的に決定される。以下で見るように、コントローラは、本発明を実施できるためのプログラム命令以外の何かを記憶するスタック、暗黙的状態変数または内部メモリを含む必要はない。これは、簡単さ、透明性(たとえば検証および試験における)および/または堅牢性を提供する。
ある例示的実施形態では、オーディオ信号は、各時間フレームにおいて、離散的符号化(D)、パラメトリック符号化(P)および縮小パラメトリック符号化(rP)の三つの符号化方式に従って表現されてもよい。現在の例示的実施形態(現在の例示的実施形態ではデコード・システムは縮小パラメトリック符号化された時間フレームをnチャネル・フォーマットにフォーマットし直すよう適応されていない;上記の他の例示的実施形態ではデコード・システムはそのように適応されていてもよい)では、相続く(連続する)時間フレームの次のシーケンスが回避されてもよい:
rP D または D rP
すなわち、離散的符号化された時間フレームの(直)後または(直)前には縮小パラメトリック符号化された時間フレームがこない。換言すれば、離散的符号化された時間フレームの次には離散的符号化された時間フレームまたはパラメトリック符号化された時間フレームのどちらかがきて、離散的符号化された時間フレームの前には離散的符号化された時間フレームまたはパラメトリック符号化された時間フレームのどちらかがくる。代替的または追加的に、相続く(連続する)時間フレームの次のシーケンス:
P rP P および P rP … rP P
が、符号化効率の理由により、それぞれ:
P P P および P P … P P
より好まれる。換言すれば、パラメトリック符号化された時間フレームの直後の各時間フレームは、好ましくは、縮小パラメトリック符号化されるまたは離散的符号化されうる。これに対する例外は、非常に短いエピソードが受け容れられる実装でありうる。そのような状況では、二つの相続くパラメトリック符号化された時間フレームが起こりうるような、縮小パラメトリック符号化方式にはいる十分な時間が常にあるとは限らない。
種々の方式に従って符号化された時間フレームの順序に関する上記の規則がすべて適用されるある例示的実施形態では、入力信号中の時間フレームのシーケンスは典型的には次のようなものとなる。
D D P D D D D P rP rP rP rP rP P D D D P D P D D D P rP P D D
ここで、離散的符号化(D)とパラメトリック(P)符号化は常に縮小パラメトリック符号化(rP)によって分離されている。上記のように、上記の例示的実施形態の少なくともいくつかのもののエンコード・システムは、相続くフレーム(の符号化方式の)他の組み合わせを受領するよう適応されてもよいことを注意しておく。
ある例示的実施形態では、デコードは、現在の時間フレームおよび現在の時間フレームの直前の二つの先行する時間フレームにおいて入力信号が離散的符号化されているすべての場合において、入力信号からn個の離散的にエンコードされたチャネルを導出することによって進行する。さらに、デコードは、現在の時間フレームにおいてオーディオ信号がパラメトリック符号化されているまたは現在の時間フレームが離散的に符号化された時間フレームのエピソード中の最初の時間フレームである場合、ダウンミックス指定に従って入力信号に基づいてmチャネル・ダウンミックス信号を生成することにより、かつ現在フレームおよび二つの先行するフレームにおいてオーディオ信号がパラメトリック符号化されているすべての場合において、ダウンミックス信号に基づいてオーディオ信号のnチャネル表現を生成することによって進行する。現在フレームおよび一つのみの先行する時間フレームにおいて入力信号がパラメトリック符号化(または縮小パラメトリック符号化)されている時間フレームにおける挙動は、異なる例示的実施形態の間で異なっていてもよい。任意的に、直前の時間フレームの(直)前の時間フレームにおいてオーディオ信号がパラメトリック符号化されているときにもmチャネル・ダウンミックス信号が生成される。
この例示的実施形態のさらなる発展では、パラメトリック符号化または縮小パラメトリック符号化によって所与の時間フレームにおいてオーディオ信号を表わす入力信号を(たとえばビットストリームをデコードすることによって)受領することは、所与の時間フレーム内の最初でない点について前記少なくとも一つの混合パラメータの値を受領することを含む。現在の時間フレームが、各時間フレームがパラメトリック符号化されているか縮小パラメトリック符号化されている時間フレームのエピソード中の最初の時間フレームである場合、前記少なくとも一つの混合パラメータの受領された値は、現在の時間フレームの先頭まで後ろ向きに外挿される。追加的または代替的に、二つの相続く離散的に符号化された時間フレーム(現在および直前)がパラメトリック符号化された時間フレームのあとに受領されると、デコード・システムはパラメトリック復号を実行する(すなわち、ダウンミックス信号に基づいてオーディオ信号のnチャネル表現を生成する)。ただし、これは直前の時間フレームの直前の時間フレームに関連する混合パラメータ値に基づく。前方補間のための基礎をなすことのできる直後の時間フレームがないので、デコード・システムは、最後の明示的な混合パラメータ値を、前方に向けて、現在フレームを通じて外挿する。その間、デコード・システムは、たとえばフレームの初期部分(たとえばフレーム継続時間の1/3、1/4または1/6;その長さは上記で論じてある)にわたるクロス混合を実行することによって、離散的デコード/モードに遷移する。本方法はさらに、次の段階を含んでいてもよい:入力信号が現在の時間フレームのおよび直前の時間フレームにおいてパラメトリック符号化されており、前記直前の時間フレームの直前の時間フレームにおいて離散的に符号化されていることに応答して、現在の時間フレームの間に、前記ダウンミックス信号および少なくとも一つの混合パラメータに基づいてオーディオ信号のnチャネル表現を生成することに遷移する。
本発明のある例示的実施形態では、エンコード・システムが、時間フレームにセグメント分割されたnチャネル・オーディオ信号をエンコードするよう適応される。エンコード・システムは、パラメトリック符号化およびn個の別々にエンコードされるチャネルを使う離散的符号化を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、オーディオ信号を表わすビットストリーム(P)を出力するよう適応される。エンコード・システムは、所与の時間フレームについて、どちらのエンコード方式がオーディオ信号を表わすために使用されるかを選択するよう適応された選択器を有する。エンコード・システムはさらに、オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、コア信号および少なくとも一つの混合パラメータを出力するよう動作可能なパラメトリック分解段を有する。前記コア信号および少なくとも一つの混合パラメータは、パラメトリック符号化における出力ビットストリームの一部をなす。本例示的実施形態のあるさらなる発展では、前記符号化方式の群はさらに、縮小パラメトリック符号化を含む。本実施形態では、パラメトリック符号化は、n個の信号チャネルをもつフォーマットを使い、離散的符号化もそうである。他方、縮小パラメトリック符号化は、m個の信号チャネルをもつフォーマットを使う。ここで、n>m≧1である。
本発明の第二の側面では、nチャネル・オーディオ信号を再構成するためのデコード・システムが提供される。デコード・システムは、入力信号をエンコードするビットストリームを受領するよう適応される。入力信号は時間フレームにセグメント分割されており、オーディオ信号を表現するためにn個の別々にエンコードされるチャネルを使う離散的符号化およびn>m≧1であるとしてオーディオ信号を表現するためにmチャネル・コア信号および少なくとも一つの混合パラメータを使う縮小パラメトリック符号化を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、オーディオ信号を表現する。縮小パラメトリック符号化方式は、オーディオ信号を表現するために、コア信号に加えて、たとえば少なくとも一つの混合パラメータのようなメタデータを使ってもよいことを注意しておく。
本例示的実施形態のデコード・システムは、n個の離散的にエンコードされたチャネルに基づいてまたは空間的合成によってオーディオ信号を導出するよう動作可能である。このデコード・システムは、ビットストリームから抽出した、入力信号の周波数領域表現を、入力信号の時間領域表現に変換するよう適応されたオーディオ・デコーダを有する。デコード・システムはさらに、ダウンミックス指定に従って入力信号の時間領域表現に基づいてmチャネル・ダウンミックス信号を出力するよう動作可能なダウンミックス段と、前記ダウンミックス信号および少なくとも一つの混合パラメータ(たとえば同じビットストリームにおいて受領され、オーディオ・デコーダによって抽出されるまたはたとえば他の何らかのビットストリームにおいて別個に受領される)に基づいてオーディオ信号のnチャネル表現を出力するよう動作可能な空間的合成段とを有する。
本例示的実施形態の縮小パラメトリック符号化された時間フレームでは、入力信号の周波数領域表現がnチャネル信号である離散的に符号化された時間フレームとは異なり、入力信号の周波数領域表現は、mチャネル信号(すなわちコア信号)である。オーディオ・デコーダは、入力信号の周波数領域表現を時間領域に変換する前に、少なくとも、離散的に符号化された時間フレームに隣接する縮小パラメトリック符号化された時間フレームの諸部分において、入力信号の周波数領域表現をフォーマットし直す(すなわち、そのフォーマットを修正する)よう適応されていてもよい。それらの諸部分における入力信号の周波数領域表現が(よって時間領域表現も)離散的に符号化された時間フレームと同数のチャネルをもつようにするためである。離散的符号化と縮小パラメトリック符号化の間の遷移の際に一定数のチャネルをもつ(だが縮小パラメトリック符号化された時間フレームのエピソードの間は必ずしも一定ではない)入力信号の時間領域表現は、そのような遷移の際にもなめらかな聴取経験を提供することに寄与しうる。これは、デコード・システムのさらに下流に配置されるデコード/処理セクションにおける遷移を容易にすることによって達成される。たとえば、一定数のチャネルをもつことは、入力信号の時間領域表現においてなめらかな遷移を提供することを容易にしうる。
この目的のため、オーディオ・デコーダは、離散的に符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームの少なくとも初期部分の間および離散的に符号化された時間フレームの直前の各縮小パラメトリック符号化された時間フレームの少なくとも最終部分について、入力信号の周波数領域表現をフォーマットし直すよう適応されていてもよい。オーディオ・デコーダは、これらの部分における(縮小パラメトリック符号化された時間フレームにおいてはmチャネル・コア信号によって表現される)入力信号の周波数領域表現を、mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによって、nチャネル・フォーマットにフォーマットし直すよう適応される。中立チャネルは、中立的な信号値、たとえば0のようなオーディオ・コンテンツなしまたは励起なしに対応する値を含むチャネルであってもよい。換言すれば、中立的な値は、中立チャネルのコンテンツがオーディオ信号を含むチャネルに加えられるときに、生成されるオーディオ信号は該中立的な値によって影響されず(中立的な値に非中立的な寄与を加えたものは該非中立的な寄与に等しい)、それでいて動作としてはよく定義されているように選ばれてもよい。上記の仕方で、縮小パラメトリック符号化された時間フレーム(のうちのいくつかの、少なくとも一部)におけるオーディオ信号の周波数領域表現のmチャネル・コア信号は、オーディオ・デコーダによって、離散的に符号化された時間フレームにおける入力信号のフォーマットと同質のフォーマット、特に同数のチャネルを有するフォーマットにフォーマットし直されてもよい。
ある例示的実施形態によれば、オーディオ・デコーダは、重複変換窓を使って周波数から時間への変換を実行するよう適応されてもよい。ここで、各時間フレームは、変換窓のうちの少なくとも一つの長さの半分と等価である(たとえば同じ長さをもつ)。換言すれば、各時間フレームは、一つの変換窓と等価な時間期間の少なくとも半分である時間期間に対応してもよい。変換窓が重なり合うので〔重複〕、異なる時間フレームからの変換窓の間に重複があることがあり、したがって、所与の時間フレームにおける入力信号の時間領域表現の値は、該所与の時間フレーム以外の時間フレーム、たとえば、少なくとも前記所与の時間フレームの直前または直後の時間フレームからの寄与に基づくことがある。
ある例示的実施形態では、オーディオ・デコーダは、離散的に符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームにおいて、少なくとも、前記縮小パラメトリック符号化された時間フレームの中立チャネルの少なくとも一つからの第一の寄与および前記直前の離散的に符号化された時間フレームからの第二の寄与を合計することによって、入力信号の時間領域表現の少なくとも一つのチャネルを決定するよう適応されていてもよい。先の実施形態との関係で述べたように、mチャネル・コア信号は、(周波数領域の)入力信号を、縮小パラメトリック符号化された時間フレームにおいて表現し、オーディオ・デコーダは、離散的に符号化された時間フレームの直後の縮小パラメトリック符号化された時間フレーム(の少なくとも初期部分)においてmチャネル・コア信号にm−n個の中立チャネルをアペンドするよう適応されていてもよい。入力信号のnチャネル時間領域表現は、そのような縮小パラメトリック符号化された時間フレームにおいては、nチャネルのそれぞれについて、直前の離散的に符号化された時間フレームおよび前記縮小パラメトリック符号化された時間フレームの対応するチャネルからの寄与を合計することによって、得られてもよい。mチャネル・コア信号に対応するm個のチャネルのそれぞれについては、これは、(縮小パラメトリック符号化された時間フレームからの)コア信号のチャネルからの第一の寄与および離散的に符号化された時間フレームにおける対応するチャネルからの第二の寄与を合計することを含んでいてもよい。前記n−m個の中立チャネルに対応するn−m個のチャネルのそれぞれについては、これは、中立チャネルの一つからの第一の寄与(すなわち0のような中立的な値)および直前の離散的に符号化された時間フレームにおける対応するチャネルからの第二の寄与を合計することに対応してもよい。このようにして、離散的に符号化された時間フレームのn個のチャネルすべてからの寄与が、離散的に符号化された時間フレームの直後の縮小パラメトリック符号化された時間フレームにおいて入力信号についての時間領域表現を形成するときに使用されうる。これは、入力信号の時間領域表現におけるよりなめらかなおよび/またはより気づかれにくい遷移を許容しうる。たとえば、離散的に符号化された時間フレームからの寄与は、縮小パラメトリック符号化におけるn−m個の中立チャネルに対応するn−m個のチャネルにおいてフェードアウトすることが許容されてもよい。これは、入力信号の離散的符号化と縮小パラメトリック符号化の間の遷移の際の改善された(またはよりなめらかな)聴取経験を達成するために、デコード・システムにおけるさらに下流に配置される段/ユニットにおける入力信号の処理/デコードをも容易にしうる。
ある例示的実施形態では、オーディオ・デコーダは、パラメトリック符号化された時間フレームの直後の各離散的に符号化された時間フレームにおいて、少なくとも、前記離散的に符号化された時間フレームからの第一の寄与および前記直前の縮小パラメトリック符号化された時間フレームの中立チャネルのうち少なくとも一つからの第二の寄与を合計することによって、入力信号の時間領域表現の少なくとも一つのチャネルを決定するよう適応されていてもよい。先の実施形態との関係で述べたように、mチャネル・コア信号は、(周波数領域の)入力信号を、縮小パラメトリック符号化された時間フレームにおいて表現し、オーディオ・デコーダは、離散的に符号化された時間フレームの直前の縮小パラメトリック符号化された時間フレーム(の少なくとも最終部分)においてmチャネル・コア信号にm−n個の中立チャネルをアペンドするよう適応されていてもよい。入力信号のnチャネル時間領域表現は、そのような縮小パラメトリック符号化された時間フレームの直後の離散的に符号化された時間フレームにおいては、nチャネルのそれぞれについて、前記離散的に符号化された時間フレームおよび前記直前の縮小パラメトリック符号化された時間フレームの対応するチャネルからの寄与を合計することによって、得られてもよい。mチャネル・コア信号に対応するm個のチャネルのそれぞれについては、これは、離散的に符号化された時間フレームにおける対応するチャネルからの第一の寄与および(縮小パラメトリック符号化された時間フレームからの)コア信号の対応するチャネルからの第二の寄与を合計することを含んでいてもよい。前記n−m個の中立チャネルに対応するn−m個のチャネルのそれぞれについては、これは、離散的に符号化された時間フレームにおける対応するチャネルからの第一の寄与および直前の縮小パラメトリック符号化された時間フレームからの対応する中立チャネルの第二の寄与(すなわち0のような中立的な値)を合計することに対応してもよい。このようにして、縮小パラメトリック符号化された時間フレームにおけるコア信号のm個のチャネルからの寄与が、直後の離散的に符号化された時間フレームにおいて入力信号についての時間領域表現を形成するときに使用されうる。それによりたとえば、離散的に符号化された時間フレームの初期部分の間に、離散的に符号化された時間フレームの対応するチャネルの値がフェードインできるようにする。さらに、残りのn−m個のチャネルでは、mチャネル・コア信号にアペンドされたチャネルにおける中立的な値(たとえば0)が、離散的に符号化された時間フレームの対応するチャネルの値がフェードインできるようにするよう、使用されてもよい。特に、前に離散的に符号化された時間フレームからの、縮小パラメトリック符号化のエピソードの間に(典型的には)使用されないn−m個のチャネルに関係する、オーディオ・デコーダのバッファ/メモリ内に残っている値があったとしてもそれは、アペンドされた中立チャネルの中立的な値によって置き換えられてもよい。すなわち、この、より遅く離散的に符号化された時間フレームにおけるエンコード・システムのオーディオ出力に影響することが許されなくてもよい。上記で言及した前記前に離散的に符号化された時間フレームは、潜在的には、現在の離散的に符号化された時間フレームより多数の時間フレーム前に位置されていてもよい。すなわち、現在の離散的に符号化された時間フレームから、多くの縮小パラメトリック符号化された時間フレームによって隔てられていてもよく、潜在的には、入力信号によって表現されるオーディオ信号において数秒またさらには数分前のオーディオ・コンテンツに対応していてもよい。したがって、現在の離散的に符号化された時間フレームをデコードするとき、これら前に離散的に符号化された時間フレームに関係するデータおよび/またはオーディオ・コンテンツを使用することを避けることが望ましいことがある。
本例示的実施形態は、(縮小パラメトリック符号化から離散的符号化への遷移によって引き起こされる)入力信号の時間領域表現におけるよりなめらかなおよび/またはより気づかれにくい遷移を許容しうる。さらに、入力信号の縮小パラメトリック符号化と離散的符号化との間の遷移の際の改善された(またはよりなめらかな)聴取経験を達成するために、デコード・システムにおけるさらに下流の段/ユニットにおける入力信号のさらなる処理/デコードをも容易にしうる。
ある例示的実施形態では、ダウンミックス段は、離散的に符号化された時間フレームの各エピソードにおける少なくとも最初の時間フレームにおいておよび離散的に符号化された時間フレームの各エピソードのあとの少なくとも最初の時間フレームにおいてアクティブであるよう適応されてもよい。ダウンミックス段は、好ましくは、これらの時間フレームにおける初期部分において、すなわち入力信号についての時間領域表現における離散的符号化へのおよび該離散的符号化からの遷移の際に、アクティブであってもよい。ダウンミックス段はその際、これらの遷移の際にダウンミックス信号を提供してもよい。ダウンミックス信号は、入力信号における離散的符号化へのおよび離散的符号化からの遷移の際の改善された(またはよりなめらかな)聴取経験をもつエンコード・システムの出力を提供するために使用されてもよい。
ある例示的実施形態では、符号化方式の群はさらに、パラメトリック符号化を有していてもよい。デコード・システムは、入力信号をエンコードしているビットストリームを受領するよう適応されていてもよい。該入力信号は、該入力信号がパラメトリック符号化によってオーディオ信号を表わす各時間フレームにおいて、mチャネル・コア信号を含み、該mチャネル・コア信号は、入力信号がn個の離散的にエンコードされたチャネルとしてオーディオ信号を表わす各時間フレームにおいて、同じオーディオ信号を表わすmチャネル・コア信号が、前記入力信号からダウンミックス指定を使って取得可能であるようなものである。
本例示的実施形態では、ビットストリームを介して受領される入力信号の時間フレームは、離散的符号化、パラメトリック符号化および縮小パラメトリック符号化という三つの符号化方式のいずれを使って符号化されてもよい。特に、これらの符号化方式のうち任意のもので符号化された時間フレームが、これらの符号化方式のうち任意のもので符号化された時間フレームのあとに続くことがある。デコード・システムは、これら三つの符号化方式の任意のものを使って符号化された時間フレームの間の任意の遷移を扱うよう適応されていてもよい。
本発明の前記第二の側面において、上記の例示的実施形態のいずれかに記載されるデコード・システム(によって実行される方法)と類似の、nチャネル・オーディオ信号を再構成する方法が提供される。本方法は、ビットストリームを受領し;ビットストリームから入力信号の周波数領域表現を抽出し;入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直前の時間フレームにおいて離散的に符号化されていること、あるいは入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直後の時間フレームにおいて離散的に符号化されていることに応答して、入力信号の周波数領域表現の現在の時間フレームの少なくとも一部を、nチャネル・フォーマットにフォーマットし直し;入力信号の周波数領域表現を入力信号の時間領域表現に変換することを含んでいてもよい。本方法はさらに、入力信号が現在のおよび(一つまたは)二つの直前の時間フレームにおいて離散的に符号化されていることに応答して、n個の離散的にエンコードされたチャネルに基づいてオーディ信号を導出し;入力信号が現在のおよび(一つまたは)二つの直前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、コア信号および前記少なくとも一つの混合パラメータに基づいてオーディオ信号のnチャネル表現を生成することを含んでいてもよい。
本発明の前記第二の側面において、時間フレームにセグメント分割されたnチャネル・オーディオ信号をエンコードするエンコード・システムが提供される。本エンコード・システムは、n個の別々にエンコードされるチャネルを使う離散的符号化および縮小パラメトリック符号化を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、オーディオ信号を表わすビットストリーム(P)を出力するよう適応される。エンコード・システムは、所与の時間フレームについて、どちらのエンコード方式がオーディオ信号を表わすために使用されるかを選択するよう適応された選択器と;オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータを出力するよう動作可能なパラメトリック分解段とを有する。前記コア信号および少なくとも一つの混合パラメータは、縮小パラメトリック符号化方式における出力ビットストリームによってエンコードされる。任意的に、エンコード・システムは、所与の時間フレームにおいて、パラメトリック符号化方式にも基づいてオーディオ信号を表わす前記ビットストリームを出力するよう動作可能であってもよく、前記選択器は、所与の時間フレームについて、離散的符号化、パラメトリック符号化および縮小パラメトリック符号化の間で選択をするよう適応されていてもよい。
本発明の前記第二の側面において、上記の実施形態のいずれかのエンコード・システム(によって実行される方法)と類似の、nチャネル・オーディオ信号をビットストリームとしてエンコードする方法が提供される。本方法は、オーディオ信号のnチャネル表現を受領し;所与の時間フレームにおいて、オーディオ信号を表現するために使われるべき符号化方式を選択し;オーディオ信号を縮小パラメトリック符号化によってエンコードする選択に応答して、オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータをエンコードするビットストリームを形成し;オーディオ信号を離散的符号化によってエンコードする選択に応答して、オーディオ信号をn個の離散的にエンコードされたチャネルによってエンコードするビットストリームを出力することを含んでいてもよい。
本発明の前記第二の側面において、エンコードおよびデコード・システムの上記の実施形態のいずれかに基づくエンコード・システムおよびデコード・システムを有するオーディオ伝送システムが提供される。エンコードおよびデコード・システムは通信上接続され、エンコード・システムおよびデコード・システムのそれぞれのダウンミックス指定は等価である。
本発明の前記第二の側面の実施形態との関係で記述された符号化方式(離散的符号化、パラメトリック符号化および縮小パラメトリック符号化)は、本発明の第一の側面に関係して記述されたのと同じ符号化方式であること、本発明の前記第二の側面のすでに述べた実施形態(またはその組み合わせ)を本実施形態の前記第一の側面に関係して述べた実施形態からの特徴と組み合わせることによって、本発明の第二の側面の追加的な実施形態が得られることがあることを注意しておく。そうするにあたり、本発明の第一の側面に基づく実施形態からの少なくともいくつかの特徴について、パラメトリック符号化された時間フレームおよび縮小パラメトリック符号化された時間フレームは交換可能に使われてもよい。すなわち、これら二つの符号化方式の間の区別をする必要はないことがある。
本発明の両側面のさらなる例示的実施形態が従属請求項において記述される。本発明は、たとえ互いに異なる請求項に記載されていたとしても、特徴のあらゆる組み合わせに関することを注意しておく。
〈II.例示的実施形態〉
図1は、本発明の例示的実施形態に基づくデコード・システム100をブロック図の形で示している。オーディオ・デコーダ110はビットストリームPを受領し、それから、一つまたは複数の処理段階において、丸囲みの文字Aによって表わされる、nチャネル・オーディオ信号を表わす入力信号を生成する。一例として、ドルビー・デジタル・プラス・フォーマット(または向上AC-3)を、それに適応したオーディオ・デコーダ110とともに使ってもよい。オーディオ・デコーダ110の内部動作についてはのちにより詳細に述べる。入力信号Aは、オーディオ信号の時間セグメントに対応する時間フレームにセグメント分割される。好ましくは、相続く時間フレームは連続しており、重なり合わない。入力信号Aは、所与の時間フレームにおいて、オーディオ信号を、(b)パラメトリック符号化によってまたは(a)n個の離散的にエンコードされたチャネルWとして、表現する。パラメトリック符号化データは、オーディオ信号をダウンミックスすることによって得られるダウンミックス信号Xに対応するmチャネル・コア信号を含む。入力信号Aにおいて受領されるパラメトリック符号化データは、まとめてαによって表わされる、ダウンミックス信号Xに関連付けられている一つまたは複数の混合パラメータをも含んでいてもよい。あるいはまた、ダウンミックス信号Xに関連付けられた前記少なくとも一つの混合パラメータαは、同じビットストリームP内の前記入力信号とは別個の信号を通じてまたは異なるビットストリームを通じて受領されてもよい。入力信号の現在の符号化方式(すなわち、パラメトリック符号化または離散的符号化)についての情報は、ビットストリームPにおいて、あるいは別個の信号として受領されてもよい。図1に示されるデコード・システムでは、オーディオ信号は六つのチャネルをもち、コア信号は二つのチャネルをもつ。すなわち、m=2、n=6である。本開示のいくつかの節では、いくつかの接続線がマルチチャネル信号を伝送するよう適応されていることを明示的に示すために、これらの線は、それぞれのチャネル数の隣に横断線を与えられている。入力信号Aは、離散的符号化方式においては、チャネルL(左)、R(右)およびC(中央)、Lfe(低域効果)、Ls(左サラウンド)、Rs(右サラウンド)をもつ5.1サラウンドとしてのオーディオ信号の表現であってもよい。しかしながら、パラメトリック符号化方式では、LおよびRチャネルは2.0ステレオにおいてコア信号チャネルL0(コア左)およびR0(コア右)を伝送するために使われる。
デコード・システム100は、デコード・システム100がn個の離散的にエンコードされたチャネルWからオーディオ信号を導出する離散モードで動作可能である。デコード・システム100はまた、デコード・システム100が、空間的合成を含むアップミックス動作を実行することによって、コア信号からオーディオ信号を再構成する、パラメトリック・モードでも動作可能である。
ダウンミックス段140は、入力信号を受領し、ダウンミックス指定に従って入力信号のダウンミックスを実行し、mチャネル・ダウンミックス信号Xを出力する。本実施形態では、ダウンミックス段140は、入力信号をnチャネル信号として扱う。すなわち、入力信号がmチャネル・コア信号のみを含む場合、入力信号は空/0であるn−m個の追加的チャネルをもつと考えられる。実際上、これは、占有されていないチャネルを0のシーケンスのような中立的な値によってパディングすることに相当しうる。ダウンミックス段140は、n個の入力チャネルのmチャネル線形結合を形成し、それをダウンミックス信号Xとして出力する。ダウンミックス指定はこの線形結合の利得を指定するものであり、入力信号の符号化とは独立である。すなわち、ダウンミックス段140がアクティブであるとき、ダウンミックス段140は入力信号の符号化とは独立に動作する。
本実施形態において、オーディオ信号がパラメトリック符号化されているとき、ダウンミックス段140はmチャネル・コア信号をn−m個の空のチャネルとともに受領する。ダウンミックス指定によって指定される線形結合の利得は、オーディオ信号がパラメトリック符号化されるとき、ダウンミックス信号Xがコア信号と同じになるよう、すなわち、線形結合がコア信号を素通しにするよう、選択される。ダウンミックス段は、次のようにモデル化されうる。
Figure 0006163545
ここで、それぞれの*記号は任意のエントリーを表わす。
この例示的実施形態では、空間的合成段150はダウンミックス信号Xを受領する。パラメトリック・モードでは、空間的合成段150は、前記少なくとも一つの混合パラメータαを使ってダウンミックス信号Xに対してアップミックス動作を実行し、オーディオ信号のnチャネル表現Yを出力する。
空間的合成段150は、mチャネル・ダウンミックス信号Xの時間領域表現を受領してそれに基づいてダウンミックス信号Xの周波数領域表現Xfを出力する第一の変換段151を有する。ダウンミックス信号Xの周波数領域表現Xfおよび前記少なくとも一つの混合パラメータを、アップミックス段155が受領する。アップミックス段155は、アップミックス動作を実行して、オーディオ信号のnチャネル表現の周波数領域表現Yfを出力する。オーディオ信号のnチャネル表現Yの周波数領域表現Yfを第二の変換段152が受領し、それに基づいて、オーディオ信号のnチャネル表現の時間領域表現Yを、空間的合成段150の出力として、出力する。
デコード・システム100は、入力信号を受領して入力信号の遅延されたバージョンを出力する第一の遅延線120を有する。第一の遅延線120によって受ける遅延の量は、ダウンミックス段140および空間的合成段150に関連する全通過時間に対応する。
デコード・システム100はさらに、空間的合成150段および第一の遅延線120に通信上接続されている混合器130を有する。パラメトリック・モードでは、混合器は、空間的合成段150からのオーディオ信号のnチャネル表現Yおよび第一の遅延線120からの入力信号の遅延されたバージョンを受領する。混合器130は次いでオーディオ信号のnチャネル表現Yを出力する。離散モードでは、混合器130は遅延線120からのn個の離散的にエンコードされたチャネルWの遅延されたバージョンを受領し、これを出力する。入力信号のエンコードがパラメトリック符号化とn個の離散的にエンコードされたチャネルとの間で変わるとき、混合器130は、空間的合成段出力と遅延線出力との間の遷移を出力する。
いくつかの実施形態では、デコード・システム100はさらに、混合器130からの出力を受領し、その遅延されたバージョンを出力する第二の遅延線160を有していてもよい。第一の遅延線120および第二の遅延線160によって受ける遅延の和は、一つの時間フレームまたは時間フレーム複数個の長さに対応してもよい。
任意的に、デコード・システム100はさらに、空間的合成段150および混合器130を、デコード・システム100によって受領されるオーディオ信号の符号化方式に基づいて、ただしメモリ内容、バッファまたは他の記憶されている情報には基づかずに制御する(有限状態機械として実装されてもよい)コントローラ170を有していてもよい。コントローラ170(または有限状態機械)は空間的合成段150および混合器130を、現在フレームにおけるオーディオ信号の符号化方式および直前のフレーム(すなわち、現在フレームのすぐ前のフレーム)における符号化に基づいて、ただしフレームの中の信号値には基づかずに、制御する。コントローラ170は、さらに、前記直前の時間フレームの(直)前の時間フレームに基づいて、空間的合成段150および混合器130を制御してもよい。コントローラ170は任意的に、ダウンミックス段140をも制御してもよい。この任意的な機能を用いて、ダウンミックス段140は、必要とされない時、たとえば、縮小パラメトリック符号化において、空間的合成段150に適合するフォーマットのコア信号が入力信号から直接的な仕方で導出できる、またさらにはコピーされることができるときには、非アクティブ化されてもよい。種々の例示的実施形態に基づくコントローラ170の動作が、表1および表2ならびに図6および図8を参照してさらに後述される。
図4を参照するに、アップミックス段155は、ダウンミックス修正プロセッサ410を有していてもよい。これは、アップミックス段155のアクティブ状態において、ダウンミックス信号Xの周波数領域表現Xfを受領し、修正されたダウンミックス信号Dを出力する。修正されたダウンミックス信号Dは、ダウンミックス信号Xの周波数領域表現Xfの非線形処理によって得られてもよい。たとえば、修正されたダウンミックス信号Dは、まずダウンミックス信号Xの周波数領域表現Xfのチャネルの線形結合として新たな諸チャネルを形成し、それら新たなチャネルに諸脱相関器を通過させ、最後に脱相関されたチャネルをアーチファクト減衰にかけてから、その結果を修正されたダウンミックス信号Dとして出力することによって得られてもよい。アップミックス段155はさらに、ダウンミックス信号Xの周波数領域表現Xfおよび修正されたダウンミックス信号Dを受領し、受領されたダウンミックス信号チャネルおよび修正されたダウンミックス信号チャネルのみのnチャネル線形結合を形成し、これをオーディオ信号のnチャネル表現Yの周波数領域表現Yfとして出力する混合行列420を有していてもよい。混合行列420は、混合行列420によって形成される線形結合の利得のうちの少なくとも一つを制御する少なくとも一つの混合パラメータαを受け容れてもよい。任意的に、ダウンミックス修正プロセッサ410は、ダウンミックス修正プロセッサ410の動作を制御しうる前記少なくとも一つの混合パラメータαを受け容れてもよい。
図2は、本発明のある例示的実施形態に基づくエンコード・システム200をブロック図の形で示している。エンコード・システム200は、nチャネル・オーディオ信号のnチャネル表現Wを受領し、オーディオ信号をエンコードする出力信号Pを生成する。
エンコード・システム200は、所与の時間フレームについて、オーディオ信号を、パラメトリック符号化によってまたはn個の離散的にエンコードされるチャネルによってエンコードするかどうかを決定するよう適応されている選択器230を有する。離散的符号化は典型的には、より多くの帯域幅占有を代償として、より高い知覚される聴取品質を達成することを考えると、選択器230はその符号化モードの選択を、出力信号Pの伝送のために利用可能な下流の帯域幅の瞬間的な量に基づかせるよう構成されていてもよい。
エンコード・システム200は、オーディオ信号のnチャネル表現Wを受領し、選択器230に通信上接続されているダウンミックス段240を有する。選択器230が、オーディオ信号がパラメトリック符号化によって符号化されるべきであると決定するとき、ダウンミックス段240はダウンミックス指定に従ってダウンミックス動作を実行し、少なくとも一つの混合パラメータαを計算し、mチャネル・ダウンミックス信号Xおよび前記少なくとも一つの混合パラメータαを出力する。
エンコード・システム200はオーディオ・エンコーダ260を有する。選択器230は、スイッチ250(任意のハードウェアまたはソフトウェアによって実装される信号選択手段を象徴している)を使って、オーディオ・エンコーダ260がnチャネル・オーディオ信号のnチャネル表現Wを受領するか、あるいはダウンミックス信号X(mチャネル・ダウンミックス信号Xおよびn−m個の空/中立チャネルを含むnチャネル信号)を受領するかを制御する。あるいはまた、エンコード・システム200はさらに、ダウンミックス信号Xおよび前記少なくとも一つの混合パラメータαを受領し、これらに基づいて、パラメトリック符号化によってオーディオ信号を表わす組み合わされた信号を出力する組み合わせユニット(図示せず)を有する。その場合、選択器230は、スイッチを使って、オーディオ・エンコーダ260がnチャネル・オーディオ信号のnチャネル表現Wを受領するか、あるいは前記組み合わされた信号を受領するかを制御する。組み合わせユニットはたとえばマルチプレクサであってもよい。
オーディオ・エンコーダ260は、受領されたチャネルを個々にエンコードし、その結果を出力信号Pとして出力する。出力信号Pはたとえばビットストリームであってもよい。
図2に示されるエンコード・システム200のある代替的な実施形態では、選択器230は、所与の時間フレームについて、オーディオ信号を、縮小パラメトリック符号化(すなわち、mチャネルのダウンミックス信号を使い、パラメトリック符号化においてアペンドされている追加のn−m個の中立チャネルは使わない)によってまたはn個の離散的にエンコードされるチャネルによってエンコードするかどうかを決定するよう適応されている。選択器230は、スイッチ250によって、オーディオ・エンコーダ260がnチャネル・オーディオ信号のnチャネル表現Wを受領するか、あるいは(いかなる追加的な中立チャネルもない)mチャネル・ダウンミックス信号Xを受領するかを選択するよう適応されている。
図9は、本発明のある例示的実施形態に基づくエンコード・システムをブロック図の形で示している。本実施形態では、n=6、m=2である。本エンコード・システムは、それをデコード・システム100に接続する通信ネットワーク999と一緒に示されている。
エンコード・システムは、nチャネル・オーディオ信号のnチャネル表現Wを受領し、オーディオ信号をエンコードする出力信号Pを出力する。エンコード・システムは、オーディオ信号のnチャネル表現Wを受領するダウンミックス段240を有する。ダウンミックス段240は、ダウンミックス指定に従ってダウンミックス動作を実行し、さらに、少なくとも一つの混合パラメータαを計算し、mチャネル・ダウンミックス信号Xおよび前記少なくとも一つの混合パラメータαを出力する。
エンコード・システムは、前記ダウンミックス信号および中立的な値970をもつn−m個の空のチャネルを受領する第一のオーディオ・エンコーダ261を有する。該空のチャネルは、すなわちフォーマットにおいて存在するがオーディオ信号を表現するためには使われない四つのチャネルである。これらのチャネルは中立的な値を割り当てられてもよい。第一のエンコーダ261は、受領されたチャネルを個々にエンコードし、その結果を、nチャネル中間信号として出力する。エンコード・システムはさらに、前記中間信号および前記少なくとも一つの混合パラメータαを受領し、これらに基づいて、パラメトリック符号化によってオーディオ信号を表わす組み合わされた信号を出力する組み合わせユニット980を有する。組み合わせユニットは、たとえばマルチプレクサであってもよい。
エンコード・システムは、nチャネル・オーディオ信号のnチャネル表現Wを受領し、n個の離散的にエンコードされたチャネルを出力する第二のオーディオ・エンコーダ262を有する。
エンコード・システムはさらに、通信ネットワーク999に通信上接続されている選択器230を有する。出力信号Pは、デコード・システム100に到達する前に該通信ネットワーク999を通じて伝送される。ネットワーク999の現在の条件(たとえば瞬間的な負荷、利用可能な帯域幅など)に基づいて、選択器230は、スイッチ950(任意のハードウェアまたはソフトウェアによって実装される信号選択手段を象徴している)を使って、エンコード・システムが、所与の時間フレームにおいて、前記組み合わされた信号または前記n個の離散的にエンコードされたチャネルのどちらを出力信号Pとして出力するかを制御する。出力信号Pはたとえばビットストリームであってもよい。
本実施形態では、図2との関係で述べた実施形態と比べ、ダウンミックス段240が、選択器230の決定とは独立に、アクティブであってもよい。実のところ、図9のエンコード・システムの上および下の部分は、オーディオ信号のパラメトリック表現および離散的表現を与える。それらはこのように、出力信号Pとして使うためにどちらを選ぶかの決定に関わりなく、各所与の時間フレームにおいて形成されうるのである。
図9に示されるエンコード・システムのあるさらなる発展では、第一のオーディオ・エンコーダ261が、n−m個の空のチャネルを含めるまたは該空のチャネルを破棄するよう動作できる。第一のオーディオ・エンコーダ261が、それらのチャネルを破棄するモードにある場合、mチャネル信号を出力する。組み合わせユニット980は先の記述と同様に機能する。すなわち、mチャネル・フォーマットのコア信号および前記少なくとも一つの混合パラメータαを含む組み合わされた信号(たとえばビットストリーム)を形成する。選択器230は、n−m個の空のチャネルを含めるか含めないかに関する限り、第一のオーディオ・エンコーダ261を制御するよう構成されていてもよい。よって、スイッチ950のアクションを考慮に入れると、このさらなる発展に基づく図9のエンコード・システムは、三つの異なる型のビットストリームPを出力しうる。該三つの型は、上述したような離散的、パラメトリックおよび縮小パラメトリック符号化方式のそれぞれに対応する。
図3を参照するに、エンコード・システム200内に位置されるダウンミックス段240は、オーディオ信号のnチャネル信号表現Wを受領し、(選択器230によってアクティブ化されているとき)ダウンミックス指定に従ってmチャネル・ダウンミックス信号Xを出力する。(ダウンミックス段240は、図2を参照して先述したように混合パラメータをも出力してもよいことを注意しておくべきである。)デコード・システム100内に位置されるダウンミックス段140もmチャネル・ダウンミック信号Xを、同一のダウンミックス指定に従って出力する。しかしながら、このダウンミックス段140への入力は、オーディオ信号を、n個の離散的にエンコードされたチャネルWとして、またはパラメトリック符号化によって表現しうる。ビットストリームPがパラメトリック符号化によってオーディオ信号を表現するとき、ビットストリームPは、ダウンミックス段140を不変のまま通過し、ダウンミックス信号Xとなるコア信号を含む。パラメトリック符号化では、コア信号はnチャネル・フォーマットにおいて表現される(存在するが使われないn−m個のチャネルがある)。一方、ダウンミックス信号はmチャネル信号である。縮小パラメトリック符号化では、コア信号およびダウンミックス信号の両方がmチャネル・フォーマットであり、そのため、フォーマット変化が必要とされない。その代わり、ダウンミックス段140は非アクティブ化されてもよく、信号はダウンミックス段140と並列に配置された線を通じて空間的合成段150に供給されてもよい。
ここで図5を参照するに、図1の空間的合成段150は、上流から下流の順に挙げる、以下のユニットを有していてもよい:第一の変換ユニット501、第一の変換修正器502、アップミックス段155、第二の変換修正器503および第二の変換ユニット504。
第一の変換ユニット501は、mチャネル・ダウンミックス信号Xの時間領域表現を受領し、それを実数値の周波数領域表現に変換する。変換ユニット501は、たとえば、実数値のQMF分解バンクを利用してもよい。第一の変換修正器502は、たとえば処理が臨界サンプリングされている変換信号に対して実行される場合に現われることがあるエイリアシング効果を低減することによってデコード・システムのパフォーマンスを改善するために、この実数値の周波数領域表現を部分的に複素の周波数領域表現に変換する。ダウンミックス信号Xの複素周波数領域表現はアップミックス段155に供給される。アップミックス段155は少なくとも一つの混合パラメータαを受領し、オーディオ信号のnチャネル表現Yの周波数領域表現を出力する。混合パラメータαは、コア信号と一緒にビットストリームに含まれてもよい。第二の変換修正器503は、たとえばエイリアシングを低減するよう虚スペクトル・データに基づいて実スペクトル・データを更新することにより、この信号を修正してオーディオ信号のnチャネル表現Yの実数値の周波数領域表現にする。第二の変換ユニット504は、オーディオ信号のnチャネル表現Yの時間領域表現を、空間的合成段150の出力として出力する。
この例示的実施形態では、各時間フレームは1536時間領域サンプルからなる。すべての処理段階が一時に一つの時間領域サンプルに対して実行されることはできないので、空間的合成段における諸ユニットは、図5における時間軸510上で示される異なる(アルゴリズム)遅延に関連付けられていてもよい。その際受ける遅延は、第一の変換ユニット501については320サンプル、第一の変換修正器502については320サンプル、アップミックス段155については0サンプル、第二の変換修正器503については320サンプル、第二の変換ユニット504については257サンプルであってもよい。図1を参照して先述したように、空間的合成段150のさらに下流で、デコード・システム100における両方の処理経路を遅延させる位置において、第二の遅延線160が導入されてもよい。第二の遅延線160によって受ける遅延は319サンプルと選ばれてもよい。それにより、空間的合成段150および第二の遅延線160の組み合わされた遅延は1536サンプル、すなわち時間フレーム一つぶんの長さとなる。
表1は、デコード・システム100の(第一の型の)ある例示的実施形態の種々の部分または側面の種々の動作モードの組み合わせで、ある時間フレームにおいて生じうるものを挙げている。図1を参照するに、入力信号がパラメトリック符号化によってオーディオ信号をエンコードしているとき、少なくとも一つの混合パラメータαが空間的合成段155によって受領される。空間的合成段150における混合パラメータの使用は側面1と称される。空間的合成段150の動作は側面2と称される。デコード・システム100全体としてのモードは側面3と称される。この例のために時間フレームはそれぞれ64サンプルからなる24個のQMFスロットに分割されているとすると、混合パラメータが使用されるそのようなスロットの数は側面4として示される。
Figure 0006163545
この表およびのちには図6および図8において、R(リセット)は、空間的合成段150における重複加算(overlap-add)バッファを空にすることをいう;E(外挿)は一定の値による後方への外挿をいう;K(保持)は一定の値による前方への外挿をいう;N(通常)は相続くフレームのそれぞれの対における(最初でない)参照点について定義されている明示的な値を使ってのフレーム間補間をいう。
エンコード・システム100によって受領される入力信号におけるオーディオ信号の符号化に依存して、表1に挙げられる諸側面は、挙げられているように動作する。本実施形態では、動作モードは、表2に挙げられるように、現在の時間フレームおよび直前の時間フレームにおける符号化方式のみに依存する。ここで、Nは現在の時間フレーム、N−1は直前の時間フレームを表わす。
Figure 0006163545
表2によって記述されるデコード・システムの挙動は、空間的合成段150および混合器130に通信上接続され、これを制御するコントローラ170によって制御されてもよい。
図6は、デコード・システム100が例示的な入力信号を受領するときに例示的なデコード・システム100において生じるデータ信号および制御信号を示している。図6は、七つの時間フレーム601ないし607に分割されている。それらの時間フレームについて、符号化方式は各参照符号の下に示されている(表2の上部と同様、離散的:D;パラメトリック:P)。記号Param1、Param2、Param3は明示的な混合パラメータ値およびそのそれぞれのアンカー点を指す。アンカー点はこの例示的実施形態では時間フレームの右端の点である。
データ信号は、図1における丸囲みの文字AないしEによって示される位置に由来する。入力信号Aは、離散的符号化方式においては、上の部分におけるチャネルL(左)、R(右)および下の部分におけるC(中央)、Lfe(低域効果)、Ls(左サラウンド)、Rs(右サラウンド)をもつ5.1サラウンドとしてのオーディオ信号の表現であってもよい。しかしながら、パラメトリック符号化方式では、LおよびRチャネルはコア信号チャネルL0(コア左)およびR0(コア右)を伝送するために使われる。チャネルC、Lfe、LsおよびRsは存在するが、パラメトリック符号化方式において占有されておらず、よって信号は形式的には5.1フォーマットである。信号Aはオーディオ・デコーダ110によって供給されてもよい。信号Bはコア信号の周波数領域表現であり、パラメトリック・モードにおいては第一の変換段151によって出力されるが、好ましくは離散モードでは処理資源を節約するために、生成されない。信号C(信号Aにおける中央チャネルと混同しないこと)は、パラメトリック・モードにおいて空間的合成段150から受領されるアップミックスされた信号である。信号Dは入力信号Aの遅延されたバージョンである。ここで、チャネルは信号Aについてのようにグループ化されており、遅延は図1における、空間的合成段150を含む上の処理経路における通過時間に一致する。信号Eは混合器130出力の遅延されたバージョンである。さらに、図6は、混合器130によって信号Cに加えられる利得CxGおよび混合器130によって信号Dに加えられるDxGに関係する制御信号の時間値を半図式的に示している。明らかに、利得は区間[0,1]内の値を取り、フレーム603の間におよびフレーム606から、クロス混合遷移がある。図6は、信号型(または信号方式)を示しつつ、信号値、主としてデータ信号の値を黙示または単に示唆するに留めている点で、抽象的である。
図6は、左側の曲線矢印の形で、信号を隔てる遅延を注釈付けしてある。
表1および表2に挙げた種々の動作モードについてこれから図6を参照して述べる。
入力信号が現在の時間フレーム602および前の時間フレーム601において離散的に符号化されているとき(表2の第一列)、デコード・システム100は離散モードになる(側面3:DM)。空間的合成段150および混合パラメータは必要とされない(側面1および2:該当せず)。混合パラメータは、今の時間フレーム602のいかなる部分でも使用されない(側面4:0)。図6に示されるように、入力信号Aは5.1サラウンド・サウンドとしてのオーディオ信号の表現である。混合器130は、入力信号の遅延されたバージョンDを受領し、これをデコード・システム100の出力Eとして、可能性としては図1を参照して先述したようにさらに下流の第二の遅延線160によって遅延させて、出力する。
入力信号が現在の時間フレーム606において離散的に符号化されており、前の時間フレーム605においてパラメトリック符号化されているとき(表2の第二列)、デコード・システム100はパラメトリック・モードから離散モードに遷移する(側面3:PM→DM)。ここでもまた、ダウンミックス指定によって制御可能なダウンミックス段140の属性のおかげで、パラメトリックから離散へのモード遷移にわたるすべての時点において、安定したコア信号を得ることが可能であり、モード遷移はほぼ気づかれない仕方で実行できる。空間的合成段150は前の時間フレームに関連付けられた混合パラメータを受け取っている。これらは現在の時間フレームの間保持される(側面1:K)。フレーム間補間のための第二の参照値のはたらきをすることができる、受領される新たな混合パラメータがないことがありうるからである。空間的合成段150は、入力信号Aとしてエンコード・システム100によって受領されたパラメトリック符号化された信号のコア信号であることから、離散的に符号化された入力信号Aのダウンミックス信号であることに遷移する信号を受領する。空間的合成段は150は前の時間フレーム605からの通常動作を現在の時間フレーム606の間、続ける(側面2:N)。混合パラメータは時間フレーム全体の間、使用される(側面4:24)。現在の時間フレーム606の間、混合器130は、空間的分解段150から受領されるアップミックスされた信号Cを出力することから、入力信号の遅延されたバージョンDを出力することに遷移する。結果として、デコード・システム100の出力Eは(第二の遅延線160によって受ける319サンプルの遅延のため次の時間フレーム607の間に)、ダウンミックスされた信号をパラメトリックにアップミックスすることによって生成される、オーディオ信号の再構成されたバージョンから、n個の離散的にエンコードされたチャネルによってオーディオ信号を表わす真のマルチチャネル信号に遷移する。
入力信号が現在の時間フレーム603においてパラメトリック符号化されており、前の時間フレーム602において離散的に符号化されているとき(表2の第三列)、デコード・システム100は離散モードからパラメトリック・モードに遷移する(側面3:DM→PM)。この時間フレーム603が示すように、たとえ原理的にはコア信号と離散的に符号化されたチャネルとの共存がないとしても、入力信号における(パラメトリック符号化と離散的符号化の間の)方式変化に関連したいかなる不連続も緩和されるか完全に回避される。システムは、遷移を通じて安定したコア信号へのアクセスをもつからである。空間的合成段150は、フレームの終わりに現在の時間フレーム603に関連する混合パラメータを受領する。前の時間フレーム602のために利用可能な混合パラメータがないので、新しいパラメータは後ろ向きに時間フレーム603全体に外挿され(側面1;E)、空間的合成段150によって使用される。空間的合成段150は前の時間フレーム602ではアクティブではなかったので、空間的合成段150は現在の時間フレーム603を、リセットによって始める(側面2:R)。混合パラメータは、時間フレーム全体の間、使用される(側面4:24)。信号Cの「DC」(don't care[どうでもよい])と記される部分は、利得CxGが0なので、出力には寄与しない;「外挿」と記される部分は、外挿された混合パラメータ値を使って空間的合成段150において生成される;「OK」と記される部分は通常の仕方で、明示的な値の間のフレーム間補間によって得られた瞬間的な混合パラメータを使って生成される;部分「Keep1」は、(最新のパラメトリック符号化された時間フレーム605からの)最新の明示的な混合パラメータ値を維持し、それに空間的合成段150の定量的属性を制御させることによって生成される。時間フレーム603は、そのような外挿が行なわれるほんの一例である。よって、現在の時間フレーム603の間に、混合器130は入力信号の遅延されたバージョンCの出力から、空間的分解段150から受領されたアップミックス信号Cを出力することに遷移する。結果として、デコード・システム100の出力Eは(第二の遅延線160によって受ける319サンプルの遅延のため次の時間フレーム604の間に)、n個の離散的にエンコードされたチャネルによってオーディオ信号を表わす真のマルチチャネル信号から、ダウンミックスされた信号をアップミックスすることによって生成される、オーディオ信号の再構成されたバージョンに遷移する。
入力信号が現在の時間フレーム605および前の時間フレーム604においてパラメトリック符号化されているとき(表2の第四列)、デコード・システム100はパラメトリック・モードにある(側面3:PM)。空間的合成段150は、混合パラメータの、前の時間フレームに関連付けられた値を受領しており、混合パラメータの、現在の時間フレームに関連付けられた値も受領し、通常のフレームごとの補間を可能にする。該補間は、アップミックスの際に適用される利得などを制御する瞬間的な混合パラメータ値を与える。これで図5、図6、表1および表2に関係した議論を終わる。
ここで、図7を参照するに、あるさらなる例示的実施形態に基づく、ハイブリッド・フィルタバンクを有するデコード・システム100の詳細が示されている。いくつかのアプリケーションでは、ハイブリッド・フィルタバンクの向上した分解能が有益であることがある。図7によれば、空間的合成段150における第一の変換段151は、(QWFフィルタバンクのような)時間から周波数への変換ユニット701を有し、それに実から複素への変換ユニット702およびハイブリッド分解ユニット705が続く。第一の変換段151の下流には、アップミックス段155があり、それに第二の変換段152が続く。第二の変換段152は、ハイブリッド合成ユニット706、実から複素への変換ユニット703および周波数から時間への変換ユニット704がこの順で配列されて続く。それぞれの通過時間(サンプル単位)は破線710の下に示されている。通過時間0というのは、アルゴリズム遅延が0であるサンプルごとの処理として理解される。実際の通過時間は十分な計算パワーを割り当てることによって任意に小さくできる。ハイブリッド分解および合成段705、706の存在は、上記の例示的実施形態との関係で、有意な相違をなす。本実施形態では、分解能はより高いが、遅延はより長くなり、コントローラ170(または有限状態機械)は、エンコード・システム100を制御する場合に、(下記で表4に示されるような)より複雑な状態構造を扱う必要がある。表3が示すように、これらのユニットの利用可能な動作モードは上記の場合と同様である。
Figure 0006163545
さらなる説明については、表1およびその後の議論が参照される。(側面4における)新しいフラッシュ(flush)・モードは、パラメトリックnチャネル出力から離散的nチャネル出力への時間領域のクロスフェードを可能にする。
下記の表4に示されるように、本例示的実施形態に基づくデコード・システム100は、コントローラ170(または有限状態機械)によって制御可能である。該コントローラ170(または有限状態機械)の状態は、現在の時間フレームの前に受領された二つの時間フレームにおける符号化方式(離散的またはパラメトリック)の組み合わせによって決定される。表2と同じ記法を使って、コントローラ(または有限状態機械)は次のようにプログラムされうる。
Figure 0006163545
表4のプログラミング・スキームの適用は図8に例解されている。図8は、図1の丸囲みの文字AないしDによって示される位置で観察されるデータ信号AないしDを、七つの相続く時間フレーム801ないし807にわたる時間の関数として視覚化するものである。
図6における離散的復号モード、パラメトリック復号モードおよび離散からパラメトリックへの遷移に関係する上記の議論は、適宜調整して、図8に示される状況にも当てはまる。一つの注目すべき相違は、本実施形態におけるパラメトリック復号計算におけるより大きなアルゴリズム遅延(1217サンプルでなく1536サンプル)に起因する。1536サンプルより多くのアルゴリズム遅延をもつデコード・システムでは、パラメトリックから離散への遷移は、一つの追加的な時間フレームを占有する。よって、さらなる時間フレーム(の一部)についての信号Cを提供するためには、クロスフェードが行なわれうるよう、最新の受領された明示的な混合パラメータ値が、「Keep1」「Keep2」によって示されるように、二つの時間フレームにわたって前方に外挿される必要があることがある。結論として、引き続きアルゴリズム遅延が1536サンプルまたはフレーム全体を超えるデコード・システムを参照するに、パラメトリックから離散的復号モードへの遷移は、パラメトリック・エピソードから離散エピソードへの入力信号における符号化方式変化によってトリガーされる。ここで、最新の明示的な混合パラメータ値が、関連付けられた時間フレーム後の二つのフレームの末尾まで前方に外挿される(保持される)。ここで、デコード・システムは、第一の受領された離散的に符号化された時間フレーム後の第二の時間フレームにおいて離散モードにはいる。
ここで、図5のような一般的構造をもつ空間的合成段をもつ(よって図6に示されるのと同じアルゴリズム遅延値をもつ)が、縮小パラメトリック方式にある入力信号を処理する能力をもつデコード・システムについて述べる。縮小パラメトリック符号化方式の属性は、パラメトリックおよび離散的符号化方式に対する差を含めて上記で概説した。
ここで考えられるデコード・システムでは、ダウンミックス段140の動作を制御する追加的な責務をもつコントローラ170が提供される。図1では、このことは、コントローラ170からダウンミックス段140への破線矢印によって示唆されている。本デコード・システムは、図11に示される機能的構造に従って編成されると言われてもよい。ここで、システムへの入力信号はオーディオ・デコーダ110およびコントローラ170の両方に供給される。コントローラ170は、入力信号の検出された符号化方式に基づいて、混合器130およびパラメトリック・マルチチャネル・デコーダ1100のそれぞれを制御するよう構成される。該パラメトリック・マルチチャネル・デコーダ1100内に、ダウンミックス段(図11には示さず)および空間的合成段(図11には示さず)が含まれる。混合器130は、パラメトリック・マルチチャネル・デコーダ1100からおよび第一の遅延線120から入力を受け取る。パラメトリック・マルチチャネル・デコーダ1100および第一の遅延線120のそれぞれは、その処理を、入力信号からオーディオ・デコーダ110によって抽出されたデータに基づかせる。デコード・システムが縮小パラメトリック符号化方式から裨益するために、コントローラ170は、パラメトリック・マルチチャネル・デコーダ1100におけるダウンミックス段を非アクティブ化するために動作可能である。好ましくは、ダウンミックス段は、入力信号が、空間的合成段に供給されるべきコア信号が(通常のパラメトリック・モードにおけるようなnチャネル・フォーマットでなく)mチャネル・フォーマットで表わされる縮小パラメトリック方式にあるときには、非アクティブ化される。たとえ前記のようにコア信号を表わすnチャネル・フォーマットのそれらの信号がダウンミックス段を不変のまま通過するとしても、コア信号が、nチャネル・フォーマットとmチャネル・フォーマットの間の変換の必要なしに空間的合成段に直接供給されることができるという事実は、計算資源の潜在的な節約を含意する。
コントローラ170は、ダウンミックス段140を制御するようにも適応されるので、デコード・システムにおける利用可能なモードの表は、上記の表1に対して拡張される。
Figure 0006163545
側面2におけるR(リセット)およびN(通常)は先に定義されている。新しいNDB(通常、ダウンミックスはバイパスされる)モードでは、ダウンミックス段140が非アクティブ化され、コア信号は、チャネル数の変更を伴うフォーマット変換なしに、空間的合成段150に供給される
コントローラ170の状態は、相変わらず、現在および直前の時間フレームにおける符号化方式の組み合わせによって一意的に決定される。この新しい符号化方式の存在は、表2に比べ、FSMプログラミング表のサイズを増大させる。
Figure 0006163545
表6は、二つの場合(D,rP)および(rP,D)は扱っていない。これらは、この例示的実施形態に基づくシステムの障害状態以外では起こらないと期待される。いくつかの実装はさらに、第四列で言及されている場合(P,P)も除外してもよい。入力信号をできるだけ早くrP方式に切り換えさせることがより経済的でありうるからである。しかしながら、エンコーダが非常に高速な切り換えのために構成されている場合、二つの離散的に符号化されたエピソードが、非常に少数の、他の符号化方式に属する時間フレームによって隔てられることがあり、(P,P)を通常の場合として受け容れることが必要になることがある。異なる言い方をすれば、非常に短いパラメトリック・エピソードは、なめらかな切り換えを達成するために必要な部分によって占められることがあり、エンコード・システムが縮小パラメトリック符号化モードにはいるために時間がないほどであることがある。
図10を参照するに、デコード・システムは、時間フレーム1001においては表6の第一または第二列に対応するモードにあり;時間フレーム1002では第一列に対応するモードにあり;時間フレーム1003では第三列に対応するモードにあり;時間フレーム1004では第七列に対応するモードにあり;時間フレーム1005では第五列に対応するモードにあり;時間フレーム1006では第二列に対応するモードにあり;時間フレーム1007では第一列に対応するモードにある。この例においては、時間フレーム1004は、受領される入力信号が縮小パラメトリック方式にある唯一の時間フレームであるが、より現実的な例では、縮小パラメトリック符号化方式にある時間フレームのエピソードは典型的にはもっと長く、その端点における、比較的より少数のパラメトリック符号化された時間フレームよりも多数の時間フレームを占める。この型のより現実的な例は、表6の第六列に対応する二つの相続くrP,rP符号化された時間フレームの受領に応答してデコード・システムがはいるモードを示すことになろう。だが、その表における第六列および第七列は、側面1〜4に関する限り、違いはないので、当業者は、図10および上記の議論を研究することによって、そのような時間フレームにおけるデコード・システムの望ましい挙動を理解し、実装することができるであろうと考えられる。
締めくくりとして、表5〜表6および図10は、表3〜表4および図7〜図8を出発点として用いても同じくらいよく導出できたはずであることを注意しておく。実際、そこに示されるデコード・システムはより大きなアルゴリズム遅延に関わるものの、縮小パラメトリック符号化方式において入力信号を受領し、処理する能力は、実質的には、上記と同じ仕方で実装されうる。しかしながら、アルゴリズム遅延が一時間フレームを超える場合には、デコード・システムにおけるコントローラ170の状態は、現在の時間フレームおよび二つの前の時間フレームにおける符号化方式によって決定されることになる。可能なコントローラ状態の総数は33=27であるが、これらのうちのかなりの数((rP,D)または(D,rP)を含む任意の三フレームのシーケンスを含む)は、エンコード側の障害の結果として出現するだけであろうから、考慮から除外されてもよい。この最後の陳述は、主として上記の例示的実施形態に当てはまるのであって、本発明のそのような本質的な限定に関するものではないことを強調しておく。実際、縮小パラメトリックおよび離散的(および可能性としてはパラメトリック)時間フレームの任意のシーケンスに基づくオーディオ信号を再構成できる実施形態が、図12の記述のあとで、下記で論じられる。
図12は、図1のデコード・システム100または同様のデコード・システムの一部をなすオーディオ・デコーダ110の可能な実装を示している。オーディオ・デコーダ110は、入来ビットストリームPに基づいて入力信号W、Xの時間領域表現を出力するよう適応されている。この目的のため、デマルチプレクサ111はビットストリームPから、入力信号W、Xにおける各チャネルに関連付けられているチャネル・サブストリーム(そのそれぞれは入力信号におけるあるチャネルの周波数領域表現と見なされてもよい)を抽出する。それぞれのチャネル・サブストリームは、可能性としては追加的な処理のあとに、複数のチャネル・デコーダ113に供給される。チャネル・デコーダは、入力信号のチャネルL、R、……のそれぞれを与える。チャネル・デコーダ113のそれぞれは好ましくは、現在の時点において重なる少なくとも二つの窓からの寄与を合計することによって、関連付けられたチャネルの時間値を与える。これは、多くのフーリエ関係の変換、特にMDCTについて成り立つ。たとえば、一つの変換窓は、512サンプルと等価であってもよい。チャネル・デコーダ113の内部の動作は、図の下部に示されている。これは、逆変換部115を有し、それに重複加算部116が続く。いくつかの実装では、逆変換部115は、逆MDCTを実行するよう構成されていてもよい。N−1、NおよびN+1とラベル付けされた三つのプロットは、三つの相続く変換窓についての逆変換部115からの出力信号を視覚化している。(N−1)番目およびN番目の変換窓が重なる時間期間では、重複加算部116は、(N−1)番目およびN番目の変換窓内の逆変換された値を加算することによって、当該チャネルの時間値を形成する。その後の時間期間においては、同様に、N番目および(N+1)番目の変換窓に関する逆変換された値を加算することによって、当該チャネル信号の時間値が得られる。明らかに、(N−1)番目およびN番目の変換窓は、時間フレーム境界近傍の入力信号の異なる時間フレームに由来する。図12の主たる部分に戻ると、チャネル・デコーダ113の下流に位置する組み合わせユニット114は、諸チャネルを、その後の処理に好適な仕方で、たとえば各時間フレームがその時間フレーム内のすべてのチャネルを再構成するための必要なデータを含むよう時間フレームを形成することによって、組み合わせる。
先述したように、オーディオ信号は、(b)パラメトリック符号化によってまたは(a)n個の離散的にエンコードされたチャネルWとして(n>m)、表現されうる。パラメトリック符号化では、オーディオ信号を表わすためにm個の信号が使われるが、nチャネル・フォーマットが使われる。そのため、上記で説明したように、n−m個の信号は情報を担持しないまたは中立的な値を割り当てられてもよい。例示的実装では、これは、前記チャネル・サブストリームのうちn−m個が中立的な信号値を表わすことを含意しうる。不使用チャネルにおいて中立的な信号値が受領されるという事実は、パラメトリック符号化から離散的符号化へのまたはその逆の符号化方式変化との関連で有益である。そのような符号化方式変化の近傍では、異なる符号化方式をもつフレームに属する二つの変換窓が重なり合い、当該チャネルの時間表現に寄与する。しかしながら、中立的な値の存在のおかげにより、それらの寄与を合計する動作は相変わらずよく定義されていることになる。
いくつかの例示的実施形態では、デコード・システム100はさらに、(c)縮小パラメトリック符号化されている入力信号の時間フレームを受領するよう適応される。ここで、入力信号はmチャネル・フォーマットにある。これは、パラメトリック符号化方式において中立的な値を担持するn−m個のチャネルが完全に不在であることを意味する。符号化方式変化を横断してもチャネル・デコーダ113のなめらかな機能を保証するために、前記チャネル・デコーダ113のうち少なくともn−m個のチャネル・デコーダには、図12の下部に詳細に示される前処理器112が先行する。前処理器112は、中立的な値(「0」と表わされている)をエンコードするチャネル・サブストリームを生成するよう動作可能である。前処理器は、素通しモードと中立的な値が出力されるモードとの間で切り替え可能な選択器によって記号的に示されている。入力信号W、Xの対応するチャネルは、符号化方式変化の少なくとも一方の側において中立的な値を含むことになる。
前処理器112は、デコード・システム100内のコントローラ170によって制御可能であってもよい。たとえば、前処理器112は、(b)離散的符号化と(c)縮小パラメトリック符号化との間の、中間のパラメトリック符号化された時間フレームがないそのような方式変化においてアクティブ化されてもよい。入力信号W、Xは、離散的エピソードに隣接する時間フレームにおいてダウンミックス段140に供給されるので、そのような状況では、入力信号が十分に安定していることが必要である。これを達成するために、コントローラ170は、前処理器112およびダウンミックス段140をアクティブ化することによってこの型の検出される方式変化に応答する。これらの前処理器112の集団的なアクションは、入力信号にn−m個のチャネルをアペンドすることである。抽象的な観点からは、これらの前処理器112は、mチャネル・フォーマットからnチャネル・フォーマットへの(たとえば、ドルビー・デジタル・プラスの枠組みではacmod2からacmod7への)フォーマット変換を達成する。
図12を参照して上述したオーディオ・デコーダ110は、縮小パラメトリック符号化から離散的符号化へのおよびその逆の方式変化をまたいでも安定した入力信号を――よって安定したダウンミックス信号を――供給することを可能にする。実際、図5および図7に詳細を描いたデコード・システムは、上記の特性をもつオーディオ・デコーダを備えてもよい。すると、これらのシステムは、それぞれ図6および図8に従って動作することにより、
D D D rP rP … rP D D D
の型の時間フレーム・シーケンスを扱うことができるようになる。
特に図6に目を転じると、時間フレーム603、604および605の符号化領域が縮小パラメトリック(rP)になる。時間フレーム603では、信号をnチャネル・フォーマットにフォーマットし直してダウンミックス段140が方式変化(L、RからL0、R0)を横断して中断なく動作するようにするために、オーディオ・デコーダ110における前記少なくとも一つの前処理器112がアクティブ化される。好ましくは、前処理器は、時間フレーム603の、異なる符号化方式に属する変換窓が重なると期待される時間区間に対応する初期部分の間のみアクティブである。時間フレーム604では、フォーマットし直すことは必要ではないが、入力信号Aが空間的合成段151の入力側に直接回送されてもよく、ダウンミックス段140は一時的に非アクティブ化されることができる。しかしながら、時間フレーム605は、縮小パラメトリック・エピソードにおける最後のものであり、その第二の端点を次のフレーム内にもつ少なくとも一つの変換窓を含んでいるので、オーディオ・デコーダ110は、フォーマットし直すモード(前処理器112がアクティブ)に設定される。すると、時間フレーム606では、ダウンミックス段140がアクティブ化されており、この時間フレーム606の先頭における入力信号Aのコンテンツの変化は、ダウンミックス段140にとって気づかれなくなる。ダウンミックス段140は代わりに、コンテンツ変化を横断した不連続なダウンミックス信号Xを与えることになる。ここでもまた、前処理器112は時間フレーム605の最後の部分の間にのみアクティブであることが十分であり、実際それが好ましい。該最後の部分は、第一の離散的に符号化された時間フレーム606の第一の変換窓と重なる変換窓の先頭が位置している部分である。
時間フレーム803、804および805において縮小パラメトリック符号化されたデータ(rP)が受領される図8の同様の変形も可能である。好適には、前段および他所で述べた理由により、オーディオ・デコーダ110のフォーマット変換機能は時間フレーム803(の始まり)および時間フレーム805(の終わり)においてアクティブであり、それによりデコーダは、二つの方式変化をまたいですべての時点においてダウンミックス段140に均質で安定した信号を供給しうる。この例示的な実施形態はハイブリッド・フィルタバンクを有することが想起されるが、この事実はオーディオ・デコーダ110の動作には格別な意義はない。たとえば混合パラメータαが外挿される必要がある期間とは異なり、信号コンテンツの変化から生じる潜在的な信号不連続の継続時間は、システムにおけるアルゴリズム遅延とは独立であり、システムを通る途上、時間的に局在化されたままである。換言すれば、図6に比べて図8に示される例示的実施形態においてより長い時間期間にわたって前処理器112を動作させる必要はない。
〈III.等価物、拡張、代替その他〉
上記の記述を研究したあとでは、当業者には本発明のさらなる実施形態が明白となるであろう。本稿および図面が実施形態および例を開示しているとはいえ、本発明はそうした個別的な例に制約されるものではない。付属の請求項によって定義される本発明の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
上記に開示されるシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述において言及される機能ユニット間のタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働していくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたは全部のコンポーネントがデジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてもしくは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアはコンピュータ可読媒体上で配信されてもよい。コンピュータ可読媒体は、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含みうる。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータといった情報の記憶のための任意の方法または技術で実装された、揮発性および不揮発性、リムーバブルおよび非リムーバブルな媒体をいずれも含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは所望される情報を記憶するために使用できコンピュータによってアクセスされることができる他の任意の媒体を含むがそれに限られない。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現するものであり、任意の情報送達媒体を含むことは当業者にはよく知られている。
いくつかの態様を記載しておく。
〔態様1〕
nチャネル・オーディオ信号を再構成するデコード・システムであって、当該デコード・システムは、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化
を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領するよう適応されており、
当該デコード・システムは、前記n個の別々にエンコードされるチャネルに基づいてまたは空間的合成によって前記オーディオ信号を導出するよう動作可能であり、
当該デコード・システムは:
前記ビットストリームから前記入力信号の周波数領域表現を抽出し、それを前記入力信号の時間領域表現に変換するよう適応されたオーディオ・デコーダと;
ダウンミックス指定に従って、前記入力信号の前記時間領域表現に基づいてmチャネル・ダウンミックス信号を出力するよう動作可能なダウンミックス段と;
前記ダウンミックス信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を出力するよう動作可能な空間的合成段とを有しており、
前記オーディオ・デコーダはさらに、前記入力信号の前記周波数領域表現を、それを前記時間領域表現に変換する前にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直すよう適応されており、前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームの少なくとも初期部分についておよび離散的符号化された時間フレームの直前の各縮小パラメトリック符号化された時間フレームの少なくとも最後の部分について前記フォーマットし直すことを実行するよう適応されている、
デコード・システム。
〔態様2〕
前記オーディオ・デコーダは、重複変換窓を使う時間から周波数への変換を実行するよう適応されており、
前記時間フレームのそれぞれが前記変換窓のうちの少なくとも一つの長さの半分と等価である、
態様1記載のデコード・システム。
〔態様3〕
前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームにおいて、少なくとも、前記縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第一の寄与および直前の離散的符号化された時間フレームからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、態様1または2記載のデコード・システム。
〔態様4〕
前記オーディオ・デコーダは、パラメトリック符号化された時間フレームの直後の各離散的符号化された時間フレームにおいて、少なくとも、前記離散的符号化された時間フレームからの第一の寄与および直前の縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、態様1ないし3のうちいずれか一項記載のデコード・システム。
〔態様5〕
前記ダウンミックス段が、離散的符号化された各エピソードにおける少なくとも最初の時間フレームにおいておよび離散的符号化された時間フレームの各エピソード後の少なくとも最初の時間フレームにおいてアクティブであるよう適応されている、態様1ないし4のうちいずれか一項記載のデコード・システム。
〔態様6〕
前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなmチャネル・コア信号の形を、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてもつ入力信号をエンコードするビットストリームを受領するよう適応されている、態様1ないし5のうちいずれか一項記載のデコード・システム。
〔態様7〕
前記入力信号を受領するよう適応された第一の遅延線;および
前記空間的合成段および前記第一の遅延線に通信上接続された混合器をさらに有する、態様1ないし6のうちいずれか一項記載のデコード・システムであって、
前記混合器は、当該システムのパラメトリック・モードでは、前記空間的合成段の出力またはそれから導出される信号を出力し;
当該システムの離散モードでは、前記第一の遅延線の出力を出力し;
前記入力信号において生起する縮小パラメトリック符号化と離散的符号化との間の変化に応答して、前記空間的合成段の出力と前記第一の遅延線の出力との間の混合遷移を出力するよう適応されている、
デコード・システム。
〔態様8〕
前記第一の遅延線が、前記ダウンミックス段および前記空間的合成段に付随する全通過時間に対応する遅延を受けるよう動作可能である、態様7記載のデコード・システム。
〔態様9〕
前記混合器の出力を受領するよう適応された第二の遅延線(160)をさらに有し、前記第一および第二の遅延線によって受ける全遅延が一つの時間フレームの長さの倍数に対応する、態様8記載のデコード・システム。
〔態様10〕
前記空間的合成段は、縮小パラメトリック符号化または該当するならパラメトリック符号化における前記入力信号が、当該時間フレームにおける最初でない点についての明示的な混合パラメータ値を定義しているような相続く時間フレームどうしの間の補間によって得られる混合パラメータ値を適用するよう適応されている、態様1ないし9のうちいずれか一項記載のデコード・システム。
〔態様11〕
前記空間的合成段は、現在時間フレームが、各時間フレームが縮小パラメトリック符号化されているまたは該当するならパラメトリック符号化されている時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も早い明示的な混合パラメータ値を現在の時間フレームの先頭まで後ろ向きに外挿することを含む離散からパラメトリックへの遷移を開始するよう適応されている、態様10記載のデコード・システム。
〔態様12〕
前記空間的合成段は、現在時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も遅い明示的な混合パラメータ値を少なくとも現在の時間フレームの終わりまで前向きに外挿することを含むパラメトリックから離散への遷移を開始するよう適応されている、態様10または11記載のデコード・システム。
〔態様13〕
前記空間的合成段が:
前記mチャネル・ダウンミックス信号の時間領域表現を受領してそれに基づいて前記ダウンミックス信号の周波数領域表現を出力するよう適応された第一の変換段と;
前記ダウンミックス信号の前記周波数領域表現および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号の前記nチャネル表現の周波数領域表現を出力するよう適応されているアップミックス段と;
前記オーディオ信号の前記nチャネル表現の前記周波数領域表現を受領し、それに基づいて、前記オーディオ信号の前記nチャネル表現の時間領域表現を、前記空間的合成段の出力として出力するよう適応されている、第二の変換段とを有する、
態様1ないし12のうちいずれか一項記載のデコード・システム。
〔態様14〕
前記アップミックス段が、前記ダウンミックス信号の前記mチャネル周波数領域表現におけるチャネルを含む線形結合を形成し、これを前記オーディオ信号の前記nチャネル表現の前記周波数領域表現として出力するよう適応されており、前記少なくとも一つの混合パラメータは、前記線形結合における前記ダウンミックス信号の前記mチャネル周波数領域表現における少なくとも一つのチャネルに関係する少なくとも一つの利得を制御する、態様13記載のデコード・システム。
〔態様15〕
前記ダウンミックス段が、前記入力信号の時間領域表現のチャネルの線形結合を形成するよう適応されている、態様1ないし14のうちいずれか一項記載のデコード・システム。
〔態様16〕
前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび直前の時間フレームの符号化方式に基づいて制御するコントローラをさらに有する、態様1ないし15のうちいずれか一項記載のデコード・システム。
〔態様17〕
前記コントローラが、前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび二つの直前の時間フレームの符号化方式に基づいて制御する、態様16記載のデコード・システム。
〔態様18〕
前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わし、直前に縮小パラメトリック符号化された時間フレームまたは該当するならパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記入力信号および前記少なくとも一つの混合パラメータに基づいて前記オーディオ信号の前記nチャネル表現を出力するよう動作可能である、態様1ないし17のうちいずれか一項記載のデコード・システム。
〔態様19〕
符号化方式の前記群がさらに、
a)パラメトリック符号化
を含み、当該デコード・システムは、前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなものであるmチャネル・コア信号を、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいて含む入力信号をエンコードするビットストリームを受領するよう適応されている、態様1ないし18のうちいずれか一項記載のデコード・システム。
〔態様20〕
前記ダウンミックス段が、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わし、前に縮小パラメトリック符号化された時間フレームまたはパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記オーディオ信号の前記パラメトリック表現の前記コア信号を前記ダウンミックス信号として再生することによって、前記ダウンミックス信号を生成するよう適応されている、態様19記載のデコード・システム。
〔態様21〕
当該デコード・システムが、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてnチャネル信号である入力信号をエンコードするビットストリームを受領するよう適応されており、前記nチャネル信号においてn−m個のチャネルは前記オーディオ信号を表現するために使われない、態様19または20記載のデコード・システム。
〔態様22〕
nチャネル・オーディオ信号を再構成する方法であって、当該方法は、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
b)n個の別々にエンコードされるチャネルを使う離散的符号化:および
c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領する段階と;
前記ビットストリームから前記入力信号の周波数領域表現を抽出する段階と;
前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直前の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも初期部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直後の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも最後の部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
前記入力信号の前記周波数領域表現を前記入力信号の時間領域表現に変換する段階と;
前記入力信号が現在および二つの直前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および二つの直前の時間フレームにおいてパラメトリック符号化されていることに応答して、前記コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
方法。
〔態様23〕
前記入力信号が現在および前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および直前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
態様22記載の方法。
〔態様24〕
現在の時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることまたは現在の時間フレームが、離散的符号化された時間フレームのエピソード後の最初の時間フレームであることに応答して、ダウンミックス指定に従って、前記入力信号に基づいてmチャネル・ダウンミックス信号を生成する段階をさらに含む、
態様22または23記載の方法。
〔態様25〕
縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法がさらに、
前記入力信号が現在の時間フレームにおいて離散的符号化されており、前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記ダウンミックス信号に基づきかつ前記少なくとも一つの混合パラメータの、前記前の時間フレームに関連付けられている少なくとも一つの値に基づき、前記オーディオ信号のnチャネル表現を生成し、現在の時間フレームの間に、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出することに遷移する段階をさらに含む、態様24記載の方法。
〔態様26〕
縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法が、
現在時間フレームが、縮小パラメトリック符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、前記少なくとも一つの混合パラメータの受領された値を現在の時間フレームの先頭まで後ろ向きに外挿する段階をさらに含む、
態様22ないし25のうちいずれか一項記載の方法。
〔態様27〕
時間フレームにセグメント分割されたnチャネル・オーディオ信号をエンコードするエンコード・システムであって、当該エンコード・システムは、
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)縮小パラメトリック符号化
を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、前記オーディオ信号を表わすビットストリーム(P)を出力するよう適応されており、
当該エンコード・システムは:
所与の時間フレームについて、どのエンコード方式が前記オーディオ信号を表わすために使用されるかを選択するよう適応された選択器と;
前記オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータを出力するよう動作可能なパラメトリック分解段とを有しており、前記mチャネル・コア信号および少なくとも一つの混合パラメータは、縮小パラメトリック符号化方式における前記出力ビットストリームによってエンコードされ、n>m≧1である、
エンコード・システム。
〔態様28〕
符号化方式の前記群がさらに、
a)パラメトリック符号化
を含み、前記パラメトリック符号化方式および前記離散的符号化方式においてはnチャネル信号フォーマットが使われ、前記縮小パラメトリック符号化方式においてはmチャネル信号フォーマットが使われる、
態様27記載のエンコード・システム。
〔態様29〕
態様27または28記載のエンコード・システムおよび態様1ないし21のうちいずれか一項記載のデコード・システムを有するオーディオ配信システムであって、前記エンコード・システムおよび前記デコード・システムは通信上接続されており、前記エンコード・システムおよび前記デコード・システムのそれぞれのダウンミックス指定は等価である、オーディオ配信システム。
〔態様30〕
nチャネル・オーディオ信号をビットストリームとしてエンコードする方法であって:
前記オーディオ信号のnチャネル表現を受領する段階と;
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)縮小パラメトリック符号化
を含む群から、所与の時間フレームにおいて、前記オーディオ信号を表現するために使われる符号化方式を選択する段階と;
縮小パラメトリック符号化によって前記オーディオ信号をエンコードするとの選択に応答して、前記オーディオ信号の前記nチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータをエンコードするビットストリームを形成する段階であって、n>m≧1である、段階と;
離散的符号化によって前記オーディオ信号をエンコードするとの選択に応答して、n個の別々にエンコードされる信号によって前記オーディオ信号をエンコードするビットストリームを出力する段階とを含む、
方法。
〔態様31〕
態様22ないし26および30のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様32〕
n=6かつm=2である、態様1ないし31のうちいずれか一項記載の装置または方法。

Claims (32)

  1. nチャネルのオーディオ信号を再構成するデコード・システムであって、当該デコード・システムは、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
    b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
    c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化
    を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領するよう適応されており、
    当該デコード・システムは、前記n個の別々にエンコードされるチャネルに基づいてまたは空間的合成によって前記オーディオ信号を導出するよう動作可能であり、
    当該デコード・システムは:
    前記ビットストリームから前記入力信号の周波数領域表現を抽出し、それを前記入力信号の時間領域表現に変換するよう適応されたオーディオ・デコーダと;
    ダウンミックス指定に従って、前記入力信号の前記時間領域表現に基づいてmチャネルのダウンミックス信号を出力するよう動作可能なダウンミックス段と;
    前記ダウンミックス信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を出力するよう動作可能な空間的合成段とを有しており、
    前記オーディオ・デコーダはさらに、前記入力信号の前記周波数領域表現を、それを前記時間領域表現に変換する前にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直すよう適応されており、前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームの少なくとも初期部分についておよび離散的符号化された時間フレームの直前の各縮小パラメトリック符号化された時間フレームの少なくとも最後の部分について前記フォーマットし直すことを実行するよう適応されている、
    デコード・システム。
  2. 前記オーディオ・デコーダは、重複変換窓を使う時間から周波数への変換を実行するよう適応されており、
    前記時間フレームのそれぞれが前記重複変換窓のうちの少なくとも一つの長さの半分と等価である、
    請求項1記載のデコード・システム。
  3. 前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームにおいて、少なくとも、前記縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第一の寄与および直前の離散的符号化された時間フレームからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、請求項1または2記載のデコード・システム。
  4. 前記オーディオ・デコーダは、パラメトリック符号化された時間フレームの直後の各離散的符号化された時間フレームにおいて、少なくとも、前記離散的符号化された時間フレームからの第一の寄与および直前の縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、請求項1ないし3のうちいずれか一項記載のデコード・システム。
  5. 前記ダウンミックス段が、離散的符号化された各エピソードにおける少なくとも最初の時間フレームにおいておよび離散的符号化された時間フレームの各エピソード後の少なくとも最初の時間フレームにおいてアクティブであるよう適応されている、請求項1ないし4のうちいずれか一項記載のデコード・システム。
  6. 前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなmチャネル・コア信号の形を、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてもつ入力信号をエンコードするビットストリームを受領するよう適応されている、請求項1ないし5のうちいずれか一項記載のデコード・システム。
  7. 前記入力信号を受領するよう適応された第一の遅延線;および
    前記空間的合成段および前記第一の遅延線に通信上接続された混合器をさらに有する、請求項1ないし6のうちいずれか一項記載のデコード・システムであって、
    前記混合器は、当該システムのパラメトリック・モードでは、前記空間的合成段の出力またはそれから導出される信号を出力し;
    当該システムの離散モードでは、前記第一の遅延線の出力を出力し;
    前記入力信号において生起する縮小パラメトリック符号化と離散的符号化との間の変化に応答して、前記空間的合成段の出力と前記第一の遅延線の出力との間の混合遷移を出力するよう適応されている、
    デコード・システム。
  8. 前記第一の遅延線が、前記ダウンミックス段および前記空間的合成段に付随する全通過時間に対応する遅延を受けるよう動作可能である、請求項7記載のデコード・システム。
  9. 前記混合器の出力を受領するよう適応された第二の遅延線(160)をさらに有し、前記第一および第二の遅延線によって受ける全遅延が一つの時間フレームの長さの倍数に対応する、請求項8記載のデコード・システム。
  10. 前記空間的合成段は、縮小パラメトリック符号化または該当するならパラメトリック符号化における前記入力信号が、当該時間フレームにおける最初でない点についての明示的な混合パラメータ値を定義しているような相続く時間フレームどうしの間の補間によって得られる混合パラメータ値を適用するよう適応されている、請求項1ないし9のうちいずれか一項記載のデコード・システム。
  11. 前記空間的合成段は、現在時間フレームが、各時間フレームが縮小パラメトリック符号化されているまたは該当するならパラメトリック符号化されている時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も早い明示的な混合パラメータ値を現在の時間フレームの先頭まで後ろ向きに外挿することを含む離散からパラメトリックへの遷移を開始するよう適応されている、請求項10記載のデコード・システム。
  12. 前記空間的合成段は、現在時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も遅い明示的な混合パラメータ値を少なくとも現在の時間フレームの終わりまで前向きに外挿することを含むパラメトリックから離散への遷移を開始するよう適応されている、請求項10または11記載のデコード・システム。
  13. 前記空間的合成段が:
    前記mチャネルのダウンミックス信号の時間領域表現を受領してそれに基づいて前記ダウンミックス信号の周波数領域表現を出力するよう適応された第一の変換段と;
    前記ダウンミックス信号の前記周波数領域表現および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号の前記nチャネル表現の周波数領域表現を出力するよう適応されているアップミックス段と;
    前記オーディオ信号の前記nチャネル表現の前記周波数領域表現を受領し、それに基づいて、前記オーディオ信号の前記nチャネル表現の時間領域表現を、前記空間的合成段の出力として出力するよう適応されている、第二の変換段とを有する、
    請求項1ないし12のうちいずれか一項記載のデコード・システム。
  14. 前記アップミックス段が、前記mチャネルのダウンミックス信号の前記周波数領域表現におけるチャネルを含む線形結合を形成し、これを前記オーディオ信号の前記nチャネル表現の前記周波数領域表現として出力するよう適応されており、前記少なくとも一つの混合パラメータは、前記線形結合における前記mチャネルのダウンミックス信号の前記周波数領域表現における少なくとも一つのチャネルに関係する少なくとも一つの利得を制御する、請求項13記載のデコード・システム。
  15. 前記ダウンミックス段が、前記入力信号の時間領域表現のチャネルの線形結合を形成するよう適応されている、請求項1ないし14のうちいずれか一項記載のデコード・システム。
  16. 前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび直前の時間フレームの符号化方式に基づいて制御するコントローラをさらに有する、請求項1ないし15のうちいずれか一項記載のデコード・システム。
  17. 前記コントローラが、前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび二つの直前の時間フレームの符号化方式に基づいて制御する、請求項16記載のデコード・システム。
  18. 前記空間的合成段が、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わし、直前に縮小パラメトリック符号化された時間フレームまたは該当するならパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記入力信号および前記少なくとも一つの混合パラメータに基づいて前記オーディオ信号の前記nチャネル表現を出力するよう動作可能である、請求項1ないし17のうちいずれか一項記載のデコード・システム。
  19. 符号化方式の前記群がさらに、
    a)パラメトリック符号化
    を含み、当該デコード・システムは、前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなものであるmチャネル・コア信号を、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいて含む入力信号をエンコードするビットストリームを受領するよう適応されている、請求項1ないし18のうちいずれか一項記載のデコード・システム。
  20. 前記ダウンミックス段が、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わし、前に縮小パラメトリック符号化された時間フレームまたはパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームの前記mチャネル・コア信号を前記ダウンミックス信号として再生することによって、前記ダウンミックス信号を生成するよう適応されている、請求項19記載のデコード・システム。
  21. 当該デコード・システムが、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてnチャネル信号である入力信号をエンコードするビットストリームを受領するよう適応されており、前記nチャネル信号においてn−m個のチャネルは前記オーディオ信号を表現するために使われない、請求項19または20記載のデコード・システム。
  22. nチャネルのオーディオ信号を再構成する方法であって、当該方法は、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
    b)n個の別々にエンコードされるチャネルを使う離散的符号化:および
    c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領する段階と;
    前記ビットストリームから前記入力信号の周波数領域表現を抽出する段階と;
    前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直前の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも初期部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
    前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直後の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも最後の部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
    前記入力信号の前記周波数領域表現を前記入力信号の時間領域表現に変換する段階と;
    前記入力信号が現在および二つの直前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
    前記入力信号が現在および二つの直前の時間フレームにおいてパラメトリック符号化されていることに応答して、前記mチャネル・コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
    方法。
  23. 前記入力信号が現在および前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
    前記入力信号が現在および直前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
    請求項22記載の方法。
  24. 現在の時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることまたは現在の時間フレームが、離散的符号化された時間フレームのエピソード後の最初の時間フレームであることに応答して、ダウンミックス指定に従って、前記入力信号に基づいてmチャネルのダウンミックス信号を生成する段階をさらに含む、
    請求項22または23記載の方法。
  25. 縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法がさらに、
    前記入力信号が現在の時間フレームにおいて離散的符号化されており、前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記ダウンミックス信号に基づきかつ前記少なくとも一つの混合パラメータの、前記前の時間フレームに関連付けられている少なくとも一つの値に基づき、前記オーディオ信号のnチャネル表現を生成し、現在の時間フレームの間に、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出することに遷移する段階をさらに含む、請求項24記載の方法。
  26. 縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法が、
    現在時間フレームが、縮小パラメトリック符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、前記少なくとも一つの混合パラメータの受領された値を現在の時間フレームの先頭まで後ろ向きに外挿する段階をさらに含む、
    請求項22ないし25のうちいずれか一項記載の方法。
  27. 時間フレームにセグメント分割されたnチャネルのオーディオ信号をエンコードするエンコード・システムであって、当該エンコード・システムは、
    a)パラメトリック符号化;
    b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
    c)縮小パラメトリック符号化
    を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、前記オーディオ信号を表わすビットストリーム(P)を出力するよう適応されており、前記パラメトリック符号化および前記離散的符号化においてはnチャネル信号フォーマットが使われ、前記縮小パラメトリック符号化においてはmチャネル信号フォーマットが使われ、
    当該エンコード・システムは:
    所与の時間フレームについて、どのエンコード方式が前記オーディオ信号を表わすために使用されるかを選択するよう適応された選択器と;
    前記オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、縮小パラメトリック符号化方式の場合に前記ビットストリーム中にエンコードされるmチャネル・コア信号および少なくとも一つの混合パラメータを出力するよう動作可能なダウンミックス段とを有しており、n>m≧1である、
    エンコード・システム。
  28. 請求項27記載のエンコード・システムおよび請求項1ないし21のうちいずれか一項記載のデコード・システムを有するオーディオ配信システムであって、前記エンコード・システムおよび前記デコード・システムは通信上接続されており、前記エンコード・システムおよび前記デコード・システムのそれぞれのダウンミックス指定は等価である、オーディオ配信システム。
  29. nチャネルのオーディオ信号をビットストリームとしてエンコードする方法であって:
    前記オーディオ信号のnチャネル表現を受領する段階と;
    a)パラメトリック符号化;
    b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
    c)縮小パラメトリック符号化
    を含む群から、所与の時間フレームにおいて、前記オーディオ信号を表現するために使われる符号化方式を選択する段階であって、前記パラメトリック符号化および前記離散的符号化においてはnチャネル信号フォーマットが使われ、前記縮小パラメトリック符号化においてはmチャネル信号フォーマットが使われる、段階と;
    縮小パラメトリック符号化によって前記オーディオ信号をエンコードするとの選択に応答して、前記オーディオ信号の前記nチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータをエンコードするビットストリームを形成する段階であって、n>m≧1である、段階と;
    離散的符号化によって前記オーディオ信号をエンコードするとの選択に応答して、n個の別々にエンコードされる信号によって前記オーディオ信号をエンコードするビットストリームを出力する段階とを含む、
    方法。
  30. コンピュータに請求項22ないし26のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
  31. コンピュータに請求項29記載の方法を実行させるためのコンピュータ・プログラム。
  32. n=6かつm=2である、請求項1ないし21のうちいずれか一項記載のデコード・システム
JP2015516626A 2012-06-14 2013-06-14 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え Active JP6163545B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261659602P 2012-06-14 2012-06-14
US61/659,602 2012-06-14
US201261713025P 2012-10-12 2012-10-12
US61/713,025 2012-10-12
PCT/EP2013/062340 WO2013186344A2 (en) 2012-06-14 2013-06-14 Smooth configuration switching for multichannel audio rendering based on a variable number of received channels

Publications (2)

Publication Number Publication Date
JP2015525375A JP2015525375A (ja) 2015-09-03
JP6163545B2 true JP6163545B2 (ja) 2017-07-12

Family

ID=48626053

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015516625A Active JP6133413B2 (ja) 2012-06-14 2013-06-14 マルチチャネル・オーディオのためのなめらかな構成切り換え
JP2015516626A Active JP6163545B2 (ja) 2012-06-14 2013-06-14 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015516625A Active JP6133413B2 (ja) 2012-06-14 2013-06-14 マルチチャネル・オーディオのためのなめらかな構成切り換え

Country Status (5)

Country Link
US (2) US9552818B2 (ja)
EP (2) EP2862168B1 (ja)
JP (2) JP6133413B2 (ja)
CN (2) CN104364843B (ja)
WO (2) WO2013186344A2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
JP6224850B2 (ja) 2014-02-28 2017-11-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 会議における変化盲を使った知覚的連続性
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
WO2017207465A1 (en) * 2016-06-01 2017-12-07 Dolby International Ab A method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
CN106919108B (zh) * 2017-03-23 2019-02-01 南京富岛信息工程有限公司 一种红外热轴音频通道信号测量方法
CN111210837B (zh) * 2018-11-02 2022-12-06 北京微播视界科技有限公司 音频处理方法和装置
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
CN113539286B (zh) * 2020-06-09 2024-06-04 深圳声临奇境人工智能有限公司 音频装置、音频系统和音频处理方法

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
SE523112C2 (sv) 2001-07-05 2004-03-30 Anoto Ab Förfaringssätt för kommunikation mellan en användarenhet som har möjlighet att läsa information från en yta, och servrar som exekverar tjänster som stöder användarenheten
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003069954A2 (en) 2002-02-18 2003-08-21 Koninklijke Philips Electronics N.V. Parametric audio coding
EP1394772A1 (en) 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
EP1427252A1 (en) 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
US7519538B2 (en) * 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
CN1890712A (zh) 2003-12-04 2007-01-03 皇家飞利浦电子股份有限公司 音频信号编码
RU2391714C2 (ru) 2004-07-14 2010-06-10 Конинклейке Филипс Электроникс Н.В. Преобразование аудиоканалов
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US8917874B2 (en) * 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
CA2620627C (en) * 2005-08-30 2011-03-15 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
JP5587551B2 (ja) 2005-09-13 2014-09-10 コーニンクレッカ フィリップス エヌ ヴェ オーディオ符号化
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
CN101484935B (zh) * 2006-09-29 2013-07-17 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
EP2118887A1 (en) 2007-02-06 2009-11-18 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
RU2010125221A (ru) * 2007-11-21 2011-12-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) Способ и устройство для обработки сигнала
JP5122681B2 (ja) 2008-05-23 2013-01-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
WO2010003532A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
CA2730315C (en) 2008-07-11 2014-12-16 Jeremie Lecomte Audio encoder and decoder for encoding frames of sampled audio signals
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
PL2146344T3 (pl) 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
ATE557387T1 (de) 2008-07-30 2012-05-15 France Telecom Rekonstruktion von mehrkanal-audiodaten
WO2010097748A1 (en) 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
CA3152894C (en) 2009-03-17 2023-09-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
TWI441164B (zh) 2009-06-24 2014-06-11 Fraunhofer Ges Forschung 音訊信號解碼器、用以將音訊信號解碼之方法、以及運用級聯音訊物件處理級之電腦程式
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
EP3779975B1 (en) 2010-04-13 2023-07-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction
MY156027A (en) 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
WO2012026092A1 (ja) 2010-08-23 2012-03-01 パナソニック株式会社 音声信号処理装置及び音声信号処理方法

Also Published As

Publication number Publication date
EP2862168A2 (en) 2015-04-22
WO2013186344A2 (en) 2013-12-19
US9552818B2 (en) 2017-01-24
JP6133413B2 (ja) 2017-05-24
US20150187361A1 (en) 2015-07-02
CN104364843B (zh) 2017-03-29
US9601122B2 (en) 2017-03-21
JP2015525375A (ja) 2015-09-03
WO2013186343A2 (en) 2013-12-19
WO2013186343A3 (en) 2014-02-06
WO2013186344A3 (en) 2014-02-06
JP2015525532A (ja) 2015-09-03
CN104380376A (zh) 2015-02-25
EP2862165B1 (en) 2017-03-08
EP2862168B1 (en) 2017-08-09
EP2862165A2 (en) 2015-04-22
CN104364843A (zh) 2015-02-18
CN104380376B (zh) 2017-03-15
US20150154970A1 (en) 2015-06-04

Similar Documents

Publication Publication Date Title
JP6163545B2 (ja) 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え
JP6407928B2 (ja) オーディオ処理システム
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
JP2008519307A (ja) 多チャンネル音声信号の符号化及び復号化
KR101981936B1 (ko) 다중 채널 오디오 코딩에서의 잡음 충진
AU2004298708A1 (en) Fidelity-optimised variable frame length encoding
US9460723B2 (en) Error concealment strategy in a decoding system
JP7009437B2 (ja) マルチチャネル・オーディオ信号のパラメトリック・エンコードおよびデコード
JP7420829B2 (ja) 予測コーディングにおける低コスト誤り回復のための方法および装置
TW202411984A (zh) 用於具有元資料之參數化經寫碼獨立串流之不連續傳輸的編碼器及編碼方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170619

R150 Certificate of patent or registration of utility model

Ref document number: 6163545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250