JP6219527B2 - ジョイント・マルチチャネル符号化のための方法および装置 - Google Patents

ジョイント・マルチチャネル符号化のための方法および装置 Download PDF

Info

Publication number
JP6219527B2
JP6219527B2 JP2016541902A JP2016541902A JP6219527B2 JP 6219527 B2 JP6219527 B2 JP 6219527B2 JP 2016541902 A JP2016541902 A JP 2016541902A JP 2016541902 A JP2016541902 A JP 2016541902A JP 6219527 B2 JP6219527 B2 JP 6219527B2
Authority
JP
Japan
Prior art keywords
stereo
encoding
channel
channels
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016541902A
Other languages
English (en)
Other versions
JP2016535316A (ja
Inventor
クヨーリング,クリストファー
ミュント,ハーラルト
プルンハーゲン,ヘイコ
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2016535316A publication Critical patent/JP2016535316A/ja
Application granted granted Critical
Publication of JP6219527B2 publication Critical patent/JP6219527B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Quality & Reliability (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

関連出願への相互参照
本願は2013年9月12日に出願された米国仮特許出願第61/877,189号の優先権を主張するものである。同出願はここに参照によってその全体において組み込まれる。
技術分野
本稿に開示される発明は、概括的にはオーディオ・エンコードおよびデコードに関する。特に、複数のステレオ変換を実行することによってマルチチャネル・オーディオ・システムのチャネルをエンコードおよびデコードするよう適応されたオーディオ・エンコーダおよびオーディオ・デコーダに関する。
マルチチャネル・オーディオ・システムのチャネルをエンコードするための従来技術の技法がある。マルチチャネル・オーディオ・システムの例は、中央チャネル(C)、左前方チャネル(Lf)、右前方チャネル(Rf)、左サラウンド・チャネル(Ls)、右サラウンド・チャネル(Rs)および低域効果(Lfe)チャネルを含む5.1チャネル・システムである。そのようなシステムを符号化するある既存のアプローチは、中央チャネルCを別個に符号化し、前方チャネルLfおよびRfのジョイントステレオ符号化およびサラウンド・チャネルLsおよびRsのジョイントステレオ符号化を実行するというものである。Lfeチャネルも別個に符号化され、以下では常に別個に符号化されると想定される。
この既存のアプローチは、いくつかの欠点がある。たとえば、LfおよびLsチャネルが同様の音量の同様のオーディオ信号を有する状況を考えてみる。そのようなオーディオ信号は、LfスピーカーとLsスピーカーの空いたに位置する仮想音源からくるかのように聞こえる。しかしながら、上記のアプローチは、そのようなオーディオ信号を効率的に符号化することができない。LfおよびLsチャネルのジョイント符号化を実行する代わりに、LfチャネルがRfチャネルと一緒に符号化されることを規定しているからである。このように、LfおよびLsスピーカーのオーディオ信号の間の類似性が効率的な符号化を達成するために活用できない。
よって、マルチチャネル・システムの符号化に関する限り、さらなる柔軟性をもつエンコード/デコード・フレームワークが必要とされている。
以下では、例示的実施形態が付属の図面を参照してより詳細に記述される。
aは、例示的な二チャネル・セットアップを示し、bおよびcは一例に基づくステレオ・エンコードおよびデコード・コンポーネントを示す。 aは、例示的な三チャネル・セットアップを示し、bおよびcは一例に基づく三チャネル・セットアップのためのそれぞれエンコード装置およびデコード装置を示す。 aは、例示的な四チャネル・セットアップを示し、bおよびcはある例示的実施形態に基づく四チャネル・セットアップのためのそれぞれエンコード装置およびデコード装置を示す。 aは、例示的な五チャネル・セットアップを示し、bおよびcはある例示的実施形態に基づく五チャネル・セットアップのためのそれぞれエンコード装置およびデコード装置を示す。 例示的なマルチチャネル・セットアップを示す。 ある例示的実施形態に基づくマルチチャネル・セットアップのためのエンコード装置を示す。 ある例示的実施形態に基づくマルチチャネル・セットアップのためのデコード装置を示す。 a、b、c、d、eは一例に基づく五チャネル・オーディオ・システムの符号化構成を示す。 諸実施形態に基づくデコード装置を示す。
上記に鑑み、マルチチャネル・オーディオ・システムのチャネルの柔軟かつ効率的な符号化を提供するエンコード装置およびデコード装置ならびに関連する方法を提供することが目的である。
〈I.概観――エンコーダ〉
第一の側面によれば、マルチチャネル・オーディオ・システムにおけるエンコード方法、エンコード装置およびコンピュータ・プログラム・プロダクトが提供される。
例示的実施形態によれば、少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるエンコード方法であって、第一の対の入力チャネルおよび第二の対の入力チャネルを受領する段階と;前記第一の対の入力チャネルを第一のステレオ・エンコードにかける段階と;前記第二の対の入力チャネルを第二のステレオ・エンコードにかける段階と;前記第一のステレオ・エンコードから帰結する第一のチャネルおよび前記第二のステレオ・エンコードから帰結する第一のチャネルに関連付けられたオーディオ・チャネルを第三のステレオ・エンコードにかけて第一の対の出力チャネルを得る段階と;前記第一のステレオ・エンコードから帰結する第二のチャネルおよび前記第二のステレオ・エンコードから帰結する第二のチャネルを第四のステレオ・エンコードにかけて第二の対の出力チャネルを得る段階と;前記第一および第二の対の出力チャネルの出力とを含む、方法が提供される。
入力チャネルの前記第一の対および前記第二の対は、エンコードされるべきチャネルに対応する。出力チャネルの前記第一の対および前記第二の対は、エンコードされたチャネルに対応する。
Lfチャネル、Rfチャネル、LsチャネルおよびRsチャネルを含む例示的なオーディオ・システムを考える。LfチャネルおよびLsチャネルが前記第一の対の入力チャネルに関連付けられ、RfチャネルおよびRsチャネルが前記第二の対の入力チャネルに関連付けられるとすると、上記の例示的実施形態は、LfおよびLsチャネルが合同で〔ジョイントで〕符号化され、RfおよびRsチャネルが合同で符号化されることを含意する。換言すれば、それらのチャネルはまず前後方向に符号化される。第一の(前後の)符号化の結果は次いで再び符号化される。つまり、左右方向で符号化が適用される。
もう一つのオプションは、LfチャネルおよびRfチャネルを前記第一の対の入力チャネルに、LsチャネルおよびRsチャネルを前記第二の対の入力チャネルに関連付けることである。チャネルのそのようなマッピングは、まず左右方向の符号化が実行され、前後方向の符号化がそれに続くことを含意する。
換言すれば、上記のエンコード方法は、マルチチャネル・システムのチャネルをどのようにジョイント符号化するかについての増大した柔軟性を許容する。
例示的実施形態によれば、前記第二のステレオ・エンコードから帰結する前記第一のチャネルに関連付けられた前記オーディオ・チャネルは、前記第二のステレオ・エンコードから帰結する前記第一のチャネルである。そのような実施形態は、四チャネル・セットアップのための符号化を実行するときに効率的である。
他の例示的実施形態によれば、前記第一のステレオ・エンコードから帰結する前記第二のチャネルは、前記第四のステレオ・エンコードにかけられる前にさらに符号化される。たとえば、本エンコード方法はさらに:第五の入力チャネルを受領する段階と;前記第五の入力チャネルおよび前記第二のステレオ・エンコードから帰結する前記第一のチャネルを第五のステレオ・エンコードにかける段階とを含み、前記第二のステレオ・エンコードから帰結する前記第一のチャネルに関連付けられた前記オーディオ・チャネルは前記第五のステレオ・エンコードから帰結する第一のチャネルであり、前記第五のステレオ・エンコードから帰結する第二のチャネルが第五の出力チャネルとして出力される。
このようにして、前記第五の入力チャネルはこうして前記第一のステレオ・エンコードから帰結する前記第二のチャネルと一緒にジョイント符号化される。たとえば、前記第五の入力チャネルは前記中央チャネルに対応していてもよく、前記第一のステレオ・エンコードから帰結する前記第二のチャネルはRfおよびRsチャネルのジョイント符号化またはLfおよびLsチャネルのジョイント符号化に対応してもよい。換言すれば、例によれば、中央チャネルCは、前記チャネル・セットアップの左側または右側に関してジョイント符号化されうる。
上記に開示された例示的実施形態は、四つまたは五つのチャネルを含むオーディオ・システムに関する。しかしながら、本稿に開示される原理は、六つのチャネル、七つのチャネルなどに拡張されうる。特に、入力チャネルの追加的な対が四チャネル・セットアップに追加されて、六チャネル・セットアップとなってもよい。同様に、入力チャネルの追加的な対が五チャネル・セットアップに追加されて、七チャネル・セットアップとなってもよい。
特に、例示的実施形態によれば、本エンコード方法はさらに:第三の対の入力チャネルを受領する段階と;前記第一の対の入力チャネルの第二のチャネルおよび前記第三の対の入力チャネルの第一のチャネルを第六のステレオ・エンコードにかける段階と;前記第二の対の入力チャネルの第二のチャネルおよび前記第三の対の入力チャネルの第二のチャネルを第七のステレオ・エンコードにかける段階であって前記第六のステレオ・エンコードから帰結する第一のチャネルおよび前記第一の対の入力チャネルの第一のチャネルは前記第一のステレオ・エンコードにかけられ、前記第七のステレオ・エンコードから帰結する第一のチャネルおよび前記第二の対の入力チャネルの第一のチャネルは前記第二のステレオ・エンコードにかけられる、段階と;前記第六のステレオ・エンコードから帰結する第二のチャネルおよび前記第七のステレオ・エンコードから帰結する第二のチャネルを第八のステレオ・エンコードにかけて第三の対の出力チャネルを得る段階とを含んでいてもよい。
上記は、チャネル・セットアップに追加的なチャネル対を追加する柔軟なアプローチを提供する。
例示的実施形態によれば、前記第一、第二、第三および第四のステレオ・エンコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、左右符号化(LR符号化)、和差符号化(またはミッド‐サイド符号化、MS符号化)および向上された和差符号化(または向上されたミッド‐サイド符号化、向上されたMS符号化)を含む符号化方式に従ってステレオ・エンコードを実行することを含む。
これは、前記システムの柔軟性にさらに追加するという点で有理である。より詳細には、異なる型の符号化方式を選択することにより、符号化は、扱っているオーディオ信号のための符号化を最適化するために適応されうる。
下記では種々の符号化方式についてより詳細に述べる。しかしながら、手短かには、左右符号化とは、入力信号が素通りさせられることを意味する(出力信号は入力信号に等しい)。和差符号化とは、出力信号の医歩婦は入力信号の和であり、他方の出力信号は入力信号の差であることを意味する。向上されたMS符号化は、出力信号の一方が入力信号の重み付けされた和であり、他方の出力信号が入力信号の重み付けされた差であることを意味する。
前記第一、第二、第三および第四のステレオ・エンコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、みな同じステレオ符号化方式を適用してもよい。しかしながら、前記第一、第二、第三および第四のステレオ・エンコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、異なるステレオ・エンコード方式を適用してもよい。
例示的実施形態によれば、異なる周波数帯域について異なる符号化方式が使用されてもよい。このようにして、符号化は、種々の周波数帯域におけるオーディオ・コンテンツに関して最適化されてもよい。たとえば、耳が最も敏感である低周波数帯域においては(符号化に費やされるビット数の点で)より洗練された符号化が適用されてもよい。
例示的実施形態によれば、異なる時間フレームについて異なる符号化方式が使用されてもよい。このようにして、符号化は、種々の時間フレームにおけるオーディオ・コンテンツに関して適応され、最適化されてもよい。たとえば、耳が最も敏感である低周波数帯域においては(符号化に費やされるビット数の点で)より洗練された符号化が適用されてもよい。
前記第一、第二、第三および第四ならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、臨界サンプリングされた修正離散コサイン変換MDCT領域において実行される。臨界サンプリングされたとは、符号化された信号のサンプル数がもとの信号のサンプル数に等しいことを意味する。
MDCTは信号を時間領域からMDCT領域に、窓シーケンスに基づいて変換する。一部の例外的な場合のほかは、諸入力チャネルは、窓サイズおよび変換長の両方の点で同じ窓を使ってMDCT領域に変換される。これは、ステレオ符号化が、信号のミッド‐サイドおよび向上されたMS符号化を適用することを可能にする。
例示的実施形態は、上記に開示したエンコード方法のいずれかを実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトにも関する。コンピュータ可読媒体は、非一時的なコンピュータ可読媒体であってもよい。
例示的実施形態によれば、少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるエンコード装置であって、第一の対の入力チャネルおよび第二の対の入力チャネルを受領するよう構成された受領コンポーネントと;前記第一の対の入力チャネルを第一のステレオ・エンコードにかけるよう構成された第一のステレオ・エンコード・コンポーネントと;
前記第二の対の入力チャネルを第二のステレオ・エンコードにかけるよう構成された第二のステレオ・エンコード・コンポーネントと;前記第一のステレオ・エンコードから帰結する第一のチャネルおよび前記第二のステレオ・エンコードから帰結する第一のチャネルに関連付けられたオーディオ・チャネルを第三のステレオ・エンコードにかけて第一の対の出力チャネルを提供するよう構成された第三のステレオ・エンコード・コンポーネントと;前記第一のステレオ・エンコードから帰結する第二のチャネルおよび前記第二のステレオ・エンコードから帰結する第二のチャネルを第四のステレオ・エンコードにかけて第二の対の出力チャネルを得るよう構成された第四のステレオ・エンコード・コンポーネントと;前記第一および第二の対の出力チャネルを出力するよう構成された出力コンポーネントとを有する、エンコード装置が提供される。
例示的実施形態は、上記に基づくエンコード装置を有するオーディオ・システムをも提供する。
〈II.概観――デコーダ〉
第二の側面によれば、マルチチャネル・オーディオ・システムにおけるデコード方法、デコード装置およびコンピュータ・プログラム・プロダクトが提供される。
第二の側面は、第一の側面と一般に同じ特徴および利点をもちうる。
例示的実施形態によれば、少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるデコード方法であって、第一の対の入力チャネルおよび第二の対の入力チャネルを受領する段階と;前記第一の対の入力チャネルを第一のステレオ・デコードにかける段階と;前記第二の対の入力チャネルを第二のステレオ・デコードにかける段階と;前記第一のステレオ・デコードから帰結する第一のチャネルおよび前記第二のステレオ・デコードから帰結する第一のチャネルを第三のステレオ・デコードにかけて第一の対の出力チャネルを得る段階と;前記第一のステレオ・デコードから帰結する第二のチャネルに関連付けられたオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第二のチャネルを第四のステレオ・デコードにかけて第二の対の出力チャネルを得る段階と;前記第一および第二の対の出力チャネルの出力とを含む、方法が提供される。
入力チャネルの前記第一の対および前記第二の対は、デコードされるべきエンコードされたチャネルに対応する。出力チャネルの前記第一の対および前記第二の対は、デコードされたチャネルに対応する。
たとえば、前記第一のステレオ・デコードから帰結する前記第二のチャネルに関連付けられた前記オーディオ・チャネルは、前記第一のステレオ・デコードから帰結する前記第二のチャネルに等しくてもよい。
たとえば、本方法はさらに:第五の入力チャネルを受領する段階と;前記第五の入力チャネルおよび前記第一のステレオ・デコードから帰結する前記第二のチャネルを第五のステレオ・デコードにかける段階とを含み、前記第一のステレオ・デコードから帰結する前記第二のチャネルに関連付けられた前記オーディオ・チャネルは前記第五のステレオ・デコードから帰結する第一のチャネルに等しく、前記第五のステレオ・デコードから帰結する第二のチャネルが第五の出力チャネルとして出力される。
本デコード方法はさらに:第三の対の入力チャネルを受領する段階と;前記第三の対の入力チャネルを第六のステレオ・デコードにかける段階と;前記第一の対の出力チャネルの第二のチャネルおよび前記第六のステレオ・デコードから帰結する第一のチャネルを第七のステレオ・デコードにかける段階と;前記第二の対の出力チャネルの第二のチャネルおよび前記第六のステレオ・デコードから帰結する第二のチャネルを第八のステレオ・デコードにかける段階と;前記第一の対の出力チャネルの前記第一のチャネル、前記第七のステレオ・デコードから帰結するチャネル対、前記第二の対の出力チャネルの前記第一のチャネルおよび前記第八のステレオ・デコードから帰結するチャネル対の出力とを含んでいてもよい。
例示的実施形態によれば、前記第一、第二、第三および第四のステレオ・デコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・デコードは、左右符号化、和差符号化および向上された和差符号化を含む符号化方式に従ってステレオ・デコードを実行することを含む。
異なる周波数帯域について異なる符号化方式が使用される。異なる時間フレームについて異なる符号化方式が使用される。
前記第一、第二、第三および第四ならびに該当する場合には前記第五、第六、第七および第八のステレオ・デコードは、好ましくは、臨界サンプリングされた修正離散コサイン変換MDCT領域において実行される。好ましくは、すべての入力チャネルが窓形状および変換長の両方に関して同じ窓を使ってMDCT領域に変換される。
前記第二の対の入力チャネルは、第一の周波数閾値までの周波数帯域に対応するスペクトル内容を有していてもよい。ここで、前記第二のステレオ・デコードから帰結するチャネル対は、前記第一の周波数閾値より上の周波数帯域については0に等しい。たとえば、前記第二の対の入力チャネルのスペクトル内容は、デコーダに伝送されるべきデータの量を減らすために、エンコーダ側で0に設定される必要があってもよい。
前記第二の対の入力チャネルが、第一の周波数閾値までの周波数帯域に対応するスペクトル内容を有し、前記第一の対の入力チャネルが、前記第一の周波数閾値より大きい第二の周波数閾値までの周波数帯域に対応するスペクトル内容を有する場合、本方法はさらに、前記第二の対の入力チャネルの周波数制限を補償するために前記第一の周波数より上の周波数についてパラメトリック・アップミックス技法を適用してもよい。特に、本方法は、前記第一の対の出力チャネルを第一の和信号および第一の差信号として表現し、前記第二の対の出力チャネルを第二の和信号および第二の差信号として表現し;高周波再構成を実行することにより前記第一の和信号および前記第二の和信号を前記第二の周波数閾値より上の周波数範囲に延長し;前記第一の和信号および前記第一の差信号を混合し、ここで、前記第一の周波数閾値より下の周波数については、該混合は前記第一の和信号および前記第一の差信号の逆和差変換を実行することを含み、前記第一の周波数閾値より上の周波数については、該混合は前記第一の周波数閾値より上の周波数帯域に対応する前記第一の和信号の部分のパラメトリック・アップミックスを実行することを含み;前記第二の和信号および前記第二の差信号を混合し、ここで、前記第一の周波数閾値より下の周波数については、該混合は前記第二の和信号および前記第二の差信号の逆和差変換を実行することを含み、前記第一の周波数閾値より上の周波数については、該混合は前記第一の周波数閾値より上の周波数帯域に対応する前記第二の和信号の部分のパラメトリック・アップミックスを実行することを含む。
前記第一の和信号および前記第二の和信号を前記第二の周波数閾値より上の周波数範囲に延長する段階、前記第一の和信号および前記第一の差信号を混合する段階および前記第二の和信号および前記第二の差信号を混合する段階は、好ましくは、直交ミラー・フィルタQMF領域で実行される。これは、典型的にはMDCT領域で実行される前記第一、第二、第三および第四のステレオ・デコードと対照的である。
例示的実施形態によれば、上記請求項のいずれか一項の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクトが提供される。コンピュータ可読媒体は、非一時的なコンピュータ可読媒体であってもよい。
例示的実施形態によれば、少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるデコード装置であって、第一の対の入力チャネルおよび第二の対の入力チャネルを受領するよう構成された受領コンポーネントと;前記第一の対の入力チャネルを第一のステレオ・デコードにかけるよう構成された第一のステレオ・デコード・コンポーネントと;前記第二の対の入力チャネルを第二のステレオ・デコードにかけるよう構成された第二のステレオ・デコード・コンポーネントと;前記第一のステレオ・デコードから帰結する第一のチャネルおよび前記第二のステレオ・デコードから帰結する第一のチャネルを第三のステレオ・デコードにかけて第一の対の出力チャネルを得るよう構成された第三のステレオ・デコード・コンポーネントと;前記第一のステレオ・デコードから帰結する前記第二のチャネルに関連付けられたオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第二のチャネルを第四のステレオ・デコードにかけて第二の対の出力チャネルを得るよう構成された第四のステレオ・デコード・コンポーネントと;前記第一および第二の対の出力チャネルを出力するよう構成された出力コンポーネントとを有する、デコード装置が提供される。
例示的実施形態によれば、上記に基づくデコード装置を有するオーディオ・システムが提供される。
〈III.概観――信号伝達フォーマット〉
第三の側面によれば、少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムのオーディオ・コンテンツを表わす信号をデコードするときに使う符号化構成をエンコーダによってデコーダに指示するための信号伝達フォーマットが提供される。ここで、前記少なくとも四つのチャネルは複数の構成に基づいて異なるグループに分割可能であり、各グループはジョイント・エンコードされるチャネルに対応する。当該信号伝達フォーマットは、前記デコーダによって適用されるべき前記複数の構成の一つを指示する少なくとも二つのビットを有する。
これは、複数の可能な符号化構成のうちのどの符号化構成をデコード時に使うべきかをデコーダに伝える効率的な仕方を提供する点で有理である。
符号化構成は、識別番号に関連付けられていてもよい。このため、前記少なくとも二つのビットは、前記複数の構成の一つを、前記複数の構成の前記一つの識別番号を指示することによって指示する。
例示的実施形態によれば、前記マルチチャネル・オーディオ・システムは五つのチャネルを含み、上記の複数の符号化構成は、五つのチャネルのジョイント符号化;四つのチャネルのジョイント符号化および最後のチャネルの別個の符号化;三つのチャネルのジョイント符号化および他の二つのチャネルの別個のジョイント符号化;および二つのチャネルのジョイント符号化、他の二つのチャネルの別個のジョイント符号化および最後のチャネルの別個の符号化に対応する。
前記少なくとも二つのビットが二つのチャネルのジョイント符号化、他の二つのチャネルの別個のジョイント符号化および最後のチャネルの別個の符号化を指示する場合、前記少なくとも二つのビットはさらに、どの二つのチャネルがジョイント符号化されるべきで、どの他の二つのチャネルがジョイント符号化されるべきかを指示するビットを含んでいてもよい。
〈IV.例示的実施形態〉
図1のaは、この場合左スピーカーLに対応する第一のチャネル102と、この場合右スピーカーRに対応する第二のチャネル104とを含むオーディオ・システムのチャネル・セットアップ100を示している。第一102および第二104のチャネルは、ジョイントステレオ・エンコードおよびデコードにかけられてもよい。
図1のbは、図1のaの第一のチャネル102および第二のチャネル104のジョイントステレオ・エンコードを実行するために使われうるステレオ・エンコード・コンポーネント110を示している。一般に、ステレオ・エンコード・コンポーネント110は、ここでLnで表わされる第一のチャネル112(図1のaの第一のチャネル102など)およびここでRnで表わされる第二のチャネル114(図1のaの第二のチャネル104など)をここでAnで表わされる第一の出力チャネル116およびここでBnで表わされる第二の出力チャネル118に変換する。エンコード・プロセスの間、ステレオ・エンコード・コンポーネント110は、のちにより詳細に論じるパラメータを含むサイド情報115を抽出してもよい。パラメータは、異なる周波数帯域については異なっていてもよい。
エンコード・コンポーネント110は第一の出力チャネル116、第二の出力チャネル118およびサイド情報115を量子化し、それをビットストリームの形に符号化して、該ビットストリームが対応するデコーダに送られる。
図1のcは、対応するステレオ・デコード・コンポーネント120を示している。ステレオ・デコード・コンポーネント120はエンコード装置110からビットストリームを受領し、(エンコーダ側での第一の出力チャネル116に対応する)第一のチャネル116’An、(エンコーダ側での第二の出力チャネル118に対応する)第二のチャネル118’Bnおよびサイド情報115’をデコードし、量子化解除する。ステレオ・デコード・コンポーネント120は、第一の出力チャネル112’Lnおよび第二の出力チャネル114’Rnを出力する。ステレオ・デコード・コンポーネント120はさらに、サイド情報115’を入力として取ってもよい。これはエンコーダ側で抽出されたサイド情報115に対応する。
ステレオ・エンコード/デコード・コンポーネント110、120は、異なる符号化方式を適用してもよい。どの符号化方式を適用すべきかは、エンコード・コンポーネント110によってサイド情報115においてデコード・コンポーネント120に信号伝達されてもよい。エンコード・コンポーネント110は、後述する三つの異なる符号化方式のどれを使うべきかを決定する。この決定は、信号適応的であり、よってフレームからフレームへと時間とともに変わることができる。さらに、異なる周波数帯域の間で変わることもできる。エンコーダにおける実際の決定プロセスはきわめて複雑であり、典型的にはMDCT領域での量子化/符号化の効果ならびに知覚的側面およびサイド情報のコストを考慮に入れる。
本稿で左右符号化「LR符号化」と称される第一の符号化方式によれば、ステレオ変換コンポーネント110および120の入力および出力チャネルは、次式によって関係付けられる:
Ln=An; Rn=Bn
換言すれば、LR符号化は単に入力チャネルの素通しを含意する。そのような符号化は、入力チャネルが非常に異なっている場合に有用でありうる。
本稿でミッド‐サイド符号化(または和差符号化)「MS符号化」と称される第二の符号化方式によれば、ステレオ・エンコード/デコード・コンポーネント110および120の入力および出力チャネルは、次式によって関係付けられる:
Ln=(An+Bn); Rn=(An−Bn)
エンコーダの観点からは、対応する式は:
An=0.5(Ln+Rn); Bn=0.5(Ln−Rn)
となる。換言すれば、MS符号化は、入力チャネルの和と差を計算することに関わる。このため、チャネルAn(エンコーダ側での第一の出力チャネル116およびデコーダ側での第一の入力チャネル116’)は第一および第二のチャネルLnおよびRnのミッド信号(和信号)と見なされてもよく、チャネルBnは第一および第二のチャネルLnおよびRnのサイド信号(差信号)と見なされてもよい。MS符号化は、入力チャネルLnおよびRnが信号形状および音量に関して似通っている場合に有用でありうる。そのような場合には、サイド信号Bnは0に近くなるからである。そのような状況では、音源はあたかも図1のaの第一のチャネル102と第二のチャネル104の間の中間に位置しているかのように聞こえる。
ミッド‐サイド符号化方式は、本稿で「向上されたMS符号化」(または向上された和差符号化)と称される第三の符号化方式に一般化されうる。向上されたMS符号化では、ステレオ・エンコード/デコード・コンポーネント110および120の入力および出力チャネルは、次式によって関係付けられる:
Ln=(1+α)An+Bn; Rn=(1−α)An−Bn
ここで、αはサイド情報115、115’の一部をなし得るパラメータである。上式は、デコーダの観点からの、すなわちAn、BnからLn、Rnへのプロセスを記述している。この場合も、信号Anはミッド信号と考えられてもよく、信号Bnは修正されたサイド信号と考えられてもよい。特に、α=0については、向上されたMS符号化方式はミッド‐サイド符号化に帰着する。向上されたMS符号化は、似通っているが異なる音量の信号を符号化するために有用でありうる。たとえば、図1のaの左チャネル102および右チャネル104が同じ信号を含むが音量が左チャネル102のほうが大きい場合、音源は、図1のaの項目105によって示されるように、左側により近く位置しているかのように聞こえる。そのような状況では、ミッド‐サイド符号化は0でないサイド信号を生成することになる。だが、0から1までの間のαの適切な値を選択することによって、修正されたサイド信号Bnは0に等しくまたは0に近くなりうる。同様に、0からマイナス1までの間のαの値は右チャネルの音量のほうが大きい場合に対応する。
上記によれば、ステレオ・エンコード/デコード・コンポーネント110および120は、このように、種々のステレオ符号化方式を適用するよう構成されていてもよい。ステレオ・エンコード/デコード・コンポーネント110および120はまた、異なる周波数帯域について異なるステレオ符号化方式を適用してもよい。たとえば、第一のステレオ符号化方式が第一の周波数までの周波数に適用されてもよく、第二のステレオ符号化方式が該第一の周波数より上の周波数帯域に適用されてもよい。さらに、パラメータαは周波数依存であることができる。
ステレオ・エンコード/デコード・コンポーネント110および120は、重複窓シーケンス領域である臨界サンプリングされた修正された離散コサイン変換(MDCT)領域で動作するよう構成される。臨界サンプリングされたとは、周波数領域信号におけるサンプル数が時間領域信号におけるサンプル数に等しいことを意味する。ステレオ・エンコード/デコード・コンポーネント110および120がLR符号化方式を適用するよう構成されている場合、入力チャネル112および114は異なる窓を使って符号化されてもよい。しかしながら、ステレオ・エンコード/デコード・コンポーネント110および120がMS符号化または向上されたMS符号化のいずれかを適用するよう構成されている場合には、入力信号は、窓形状および変換長に関して同じ窓を使って符号化される必要がある。
ステレオ・エンコード/デコード・コンポーネント110および120は、三つ以上のチャネルを含むオーディオ・システムについて柔軟な符号化/復号方式を実装するために構成ブロックとして使われてもよい。原理を例解するために、マルチチャネル・オーディオ・システムの三チャネル・セットアップ200が図2のaに示されている。オーディオ・システムは、第一のオーディオ・チャネル202(ここでは左チャネルL)、第二のオーディオ・チャネル204(ここでは右チャネルR)および第三のチャネル206(ここでは中央チャネルC)を含む。
図2のbは、図2のaの三つのチャネル202、204、206をエンコードするためのエンコード装置210を示している。エンコード装置210は、縦続して結合されている第一のステレオ・エンコード・コンポーネント210aおよび第二のステレオ・エンコード・コンポーネント210bを有する。
エンコード装置210は、第一の入力チャネル212(たとえば図2のaの第一のチャネル202に対応)、第二の入力チャネル214(たとえば図2のaの第二のチャネル204に対応)、第三の入力チャネル216(たとえば図2のaの第三のチャネル206に対応)を受領する。第一のチャネル212および第三の入力チャネル216は、上記のステレオ符号化方式のいずれかに従ってステレオ・エンコードを実行する第一のステレオ・エンコード・コンポーネント210aに入力される。結果として、第一のステレオ・エンコード・コンポーネント210aは、第一の中間出力チャネル213および第二の中間出力チャネル215を出力する。本稿での用法では、中間出力チャネルはステレオ・エンコードまたはステレオ・デコードの結果をいう。中間出力チャネルは典型的には、必ず生成されるまたは実際的な実装において測定できるという意味での物理的な信号ではない。むしろ、中間出力チャネルは本稿では、異なるステレオ・エンコードまたはデコード・コンポーネントが互いにどのように組み合わされおよび/または配列されうるかを示すために使われる。中間的とは、出力チャネル213および215が、前記エンコードされたチャネルを表わす出力チャネルではなく、エンコード装置210の中間的な段を表わしていることを意味する。たとえば、第一の中間出力チャネル213はミッド信号であることができ、第二の中間出力チャネル215は修正されたサイド信号であることができる。
図1のaの例示的なチャネル・セットアップを参照するに、第一のステレオ・エンコード・コンポーネント210aによって実行される処理は、たとえば、左チャネル202および中央チャネル206のジョイントステレオ符号化207に対応することができる。異なる音量の左チャネル202および中央チャネル206における同様の信号の場合には、そのようなジョイントステレオ符号化は、左チャネル202および中央チャネル206の間に位置される仮想音源205を捕捉するのに効率的でありうる。
第一の中間的出力チャネル213および第二の入力チャネル214が次いで、上記のステレオ符号化方式のいずれかに従ってステレオ・エンコードを実行する第二のステレオ・エンコード・コンポーネント210bに入力される。第二のステレオ・エンコード・コンポーネント210bは第一の出力チャネル217および第二の出力チャネル218を出力する。図1のaの例示的なチャネル・セットアップを参照するに、第二のステレオ・エンコード・コンポーネント210bによって実行される処理は、たとえば、右チャネル204と、第一のステレオ・エンコード・コンポーネント210aによって生成された左チャネル202および中央チャネル206のミッド信号とのジョイントステレオ符号化208に対応することができる。
エンコード装置210は、第一の出力チャネル217、第二の出力チャネル218および第三の出力チャネルとしての第二の中間チャネル215を出力する。たとえば、第一の出力チャネル217はミッド信号に対応してもよく、第二および第三の出力チャネル218および215はそれぞれ修正されたサイド信号に対応してもよい。
エンコード装置210は、それらの出力信号を量子化して、サイド情報と一緒に、デコーダに伝送されるべきビットストリームに符号化する。
対応するデコード装置220が図2cに示されている。デコード装置220は第一のステレオ・デコード・コンポーネント220bおよび第二のステレオ・デコード・コンポーネント220aを有する。デコード装置220における第一のステレオ・デコード・コンポーネント220bは、エンコーダ側の第二のステレオ・エンコード・コンポーネント210bの符号化方式の逆である符号化方式を適用するよう構成される。同様に、デコード装置220における第二のステレオ・デコード・コンポーネント220aは、エンコーダ側の第一のステレオ・エンコード・コンポーネント210aの符号化方式の逆である符号化方式を適用するよう構成される。デコーダ側で適用すべき符号化方式は、エンコード装置210からデコード装置220に送られるビットストリーム中での信号伝達によって示されてもよい。これはたとえば、LR符号化、MS符号化または向上されたMS符号化のどれをステレオ・デコーダ・コンポーネント220bおよび220aが適用すべきかを指示することを含む。さらに、中央チャネルが左チャネルまたは右チャネルのどちらと一緒に符号化されるべきかを示す一つまたは複数のビットがあってもよい。
デコード装置220は、エンコード装置210から送信されるビットストリームを受領し、デコードし、量子化解除する。このようにして、デコード装置220は、第一の入力チャネル217’(エンコード装置210の第一の出力チャネルに対応)、第二の入力チャネル218’(エンコード装置210の第二の出力チャネルに対応)および第三の入力チャネル215’(エンコード装置210の第三の出力チャネルに対応)を受領する。第一および第二の入力チャネル217’および218’は第一のステレオ・デコード・コンポーネント220bに入力される。第一のステレオ・デコード・コンポーネント220bは、エンコーダ側で第二のステレオ・エンコード・コンポーネント210bにおいて適用された逆符号化方式に従ってステレオ・デコードを実行する。その結果として、第一の中間出力チャネル213’および第二の中間出力チャネル214’が第一のステレオ・デコード・コンポーネント220bから出力される。次に、第一の中間出力チャネル213’および第三の入力チャネル215’が第二のステレオ・デコード・コンポーネント220aに入力される。第二のステレオ・デコード・コンポーネント220aは、エンコーダ側での第一のステレオ・エンコード・コンポーネント210aにおいて適用された符号化方式の逆である符号化方式に従ってその入力信号のステレオ・デコードを実行する。第二のステレオ・デコード・コンポーネント220aは、第一の出力チャネル212’(エンコーダ側での第一の入力信号212に対応)、第二の出力チャネル214’(エンコーダ側での第二の入力信号214に対応)および第三の出力チャネル216’としての第二の中間出力チャネル214’(エンコーダ側での第三の入力信号216に対応)を出力する。
上記の例では、第一の入力チャネル212は左チャネル202に対応してもよく、第二の入力チャネル214は右チャネル204に対応してもよく、第三の入力チャネル216は中央チャネル206に対応してもよい。しかしながら、第一、第二および第三の入力チャネル212、214、216は、任意の順列に従って図2のaのチャネル202、204、206に対応しうる。このように、エンコード装置およびデコード装置210、220は、図2のaの三つのチャネル202、204、206をエンコード/デコードするための非常に柔軟な方式を提供する。さらに、ステレオ・エンコード・コンポーネント210aおよび210bの符号化方式は任意の仕方で選択されうるという点で柔軟性は一層高められる。たとえば、ステレオ・エンコード・コンポーネント210aおよび210bは両方とも、向上されたMS符号化のような同じ符号化方式を、あるいは異なる符号化方式を適用してもよい。さらに、符号化方式は符号化されるべき周波数帯域に依存しておよび/または符号化されるべき時間フレームに依存して変わってもよい。適用すべき符号化方式は、エンコード装置210からデコード装置220にサイド情報として信号伝達されてもよい。
ここで図3のa〜cを参照して例示的な実施形態を述べる。図3のaは、マルチチャネル・オーディオ・システムの四チャネル・セットアップ300を示している。オーディオ・システムは、第一のチャネル302(ここでは左前方スピーカーLfに対応)、第二のチャネル304(ここでは右スピーカーRfに対応)、第三のチャネル306(ここでは左サラウンド・スピーカーLsに対応)および第四のチャネル308(ここでは右サラウンド・スピーカーRsに対応)を含む。
図3のbおよびcはそれぞれ、図3のaの四つのチャネル302、304、306、308をエンコード/デコードするために使用されうるエンコード装置310およびデコード装置320を示している。
エンコード装置310は、第一のステレオ・エンコード・コンポーネント310a、第二のステレオ・エンコード・コンポーネント310b、第三のステレオ・エンコード・コンポーネント310cおよび第四のステレオ・エンコード・コンポーネント310dを有する。エンコード装置310の動作についてここで説明する。
エンコード装置310は、入力チャネルの第一の対を受領する。入力チャネルの第一の対は第一の入力チャネル312(たとえば図3のaのLfチャネル302に対応してもよい)および第二の入力チャネル316(たとえば図3のaのLsチャネル306に対応してもよい)を含む。エンコード装置310はさらに、入力チャネルの第二の対を受領する。入力チャネルの第二の対は第一の入力チャネル314(たとえば図3のaのRfチャネル304に対応してもよい)および第二の入力チャネル318(たとえば図3のaのRsチャネル308に対応してもよい)を含む。第一および第二の対の入力チャネル312、316、314、318は典型的にはMDCTスペクトルの形で表わされる。
第一の対の入力チャネル312、316は第一のステレオ・エンコード・コンポーネント310aに入力される。該第一のステレオ・エンコード・コンポーネント310aは、第一の対の入力チャネル312、316を先述したステレオ符号化方式のいずれかに基づくステレオ・エンコードにかける。第一のステレオ・エンコード・コンポーネント310aは、第一のチャネル313および第二のチャネル317を含む第一の対の中間出力チャネルを出力する。例として、MS符号化または向上されたMS符号化が適用される場合、第一のチャネル313はミッド信号に対応してもよく、第二のチャネル317は修正されたサイド信号に対応してもよい。
同様に、第二の対の入力チャネル314、318は第二のステレオ・エンコード・コンポーネント310bに入力される。該第二のステレオ・エンコード・コンポーネント310bは、第二の対の入力チャネル314、318を先述したステレオ符号化方式のいずれかに基づくステレオ・エンコードにかける。第二のステレオ・エンコード・コンポーネント310bは、第一のチャネル315および第二のチャネル319を含む第二の対の中間出力チャネルを出力する。例として、MS符号化または向上されたMS符号化が適用される場合、第一のチャネル315はミッド信号に対応してもよく、第二のチャネル319は修正されたサイド信号に対応してもよい。
図3のaのチャネル・セットアップを考えると、第一のステレオ・エンコード・コンポーネント310aによって適用される処理は、Lfチャネル302およびLsチャネル306のジョイントステレオ符号化303を実行することに対応してもよい。同様に、第二のステレオ・エンコード・コンポーネント310bによって適用される処理は、Rfチャネル304およびRsチャネル308のジョイントステレオ符号化305を実行することに対応してもよい。
中間出力チャネルの第一の対の第一のチャネル313および中間出力チャネルの第二の対の第一のチャネル315は次いで、第三のステレオ・エンコード・コンポーネント310cに入力される。第三のステレオ・エンコード・コンポーネント310cは、チャネル313および315を、上記のステレオ符号化方式のいずれかに基づくステレオ・エンコードにかける。第三のステレオ・エンコード・コンポーネント310cは、第一の出力チャネル322および第二の出力チャネル324からなる出力チャネルの第一の対を出力する。
同様に、中間出力チャネルの第一の対の第二のチャネル317および中間出力チャネルの第二の対の第二のチャネル319は、第四のステレオ・エンコード・コンポーネント310dに入力される。第四のステレオ・エンコード・コンポーネント310dは、チャネル317および319を、上記のステレオ符号化方式のいずれかに基づくステレオ・エンコードにかける。第四のステレオ・エンコード・コンポーネント310dは、第一の出力チャネル326および第二の出力チャネル328からなる出力チャネルの第二の対を出力する。
再び図3のaのチャネル・セットアップを考えると、第三および第四のステレオ・エンコード・コンポーネント310cおよび310dによって実行される処理は、該チャネル・セットアップの左および右側のジョイントステレオ符号化307に似ていることがありうる。たとえば、中間出力チャネルの第一および第二の対のそれぞれ第一のチャネル313および315がミッド信号である場合、第三のステレオ・エンコード・コンポーネント310cは、それらのミッド信号のジョイントステレオ符号化を実行する。同様に、中間出力チャネルの第一および第二の対のそれぞれ第二のチャネル317および319が(修正された)サイド信号である場合、第三のステレオ・エンコード・コンポーネント310cは、それらの(修正された)サイド信号のジョイントステレオ符号化を実行する。例示的実施形態によれば、(修正された)サイド信号317および319は、ある周波数閾値より上の周波数についてなど、より高い周波数範囲については0に設定されてもよい(ミッド信号313および315についてエネルギー補償が必要)。例として、周波数閾値は10kHzであってもよい。
エンコード装置310は、それらの出力信号322、324、326、328を量子化し、符号化し、デコード装置に送られるビットストリームを生成する。
ここで図3のcを参照するに、対応するデコード装置320が示されている。デコード装置320は第一のステレオ・デコード・コンポーネント320c、第二のステレオ・デコード・コンポーネント320d、第三のステレオ・デコード・コンポーネント320aおよび第四のステレオ・デコード・コンポーネント320bを有する。デコード装置320の動作についてここで説明する。
デコード装置320は、エンコード装置310から受領されるビットストリームを受領し、デコードし、量子化解除する。このようにして、デコード装置320は、第一のチャネル322’(図3のbの出力チャネル322に対応)および第二のチャネル324’(図3のbの出力チャネル324に対応)からなる第一の対の入力チャネルを受領する。エンコード装置320はさらに、第一のチャネル326’(図3のbの出力チャネル326に対応)および第二のチャネル328’(図3のbの出力チャネル328に対応)からなる第二の対の入力チャネルを受領する。第一および第二の対の入力チャネルは典型的にはMDCTスペクトルの形である。
第一の対の入力チャネル322’、324’は第一のステレオ・デコード・コンポーネント320cに入力され、そこでエンコーダ側の第三のステレオ・エンコード・コンポーネント310cによって適用されたステレオ符号化方式の逆であるステレオ・デコード方式に基づくステレオ・デコードにかけられる。第一のステレオ・デコード・コンポーネント320cは、第一のチャネル313’および第二のチャネル315’を含む第一の対の中間チャネルを出力する。
同様に、第二の対の入力チャネル326’、328’は第二のステレオ・デコード・コンポーネント320dに入力され、該第二のステレオ・デコード・コンポーネント320dはエンコーダ側の第四のステレオ・エンコード・コンポーネント310dによって適用されたステレオ符号化方式の逆であるステレオ・コード方式を適用する。第二のステレオ・デコード・コンポーネント320dは、第一のチャネル317’および第二のチャネル319’からなる第二の対の中間チャネルを出力する。
中間出力チャネルの第一および第二の対の第一のチャネル313’および317’は次いで、第三のステレオ・デコード・コンポーネント320aに入力される。該第三のステレオ・デコード・コンポーネント320aは、エンコーダ側の第一のステレオ・エンコード・コンポーネント310aにおいて適用されたステレオ符号化方式の逆であるステレオ・コード方式を適用する。第三のステレオ・デコード・コンポーネント320aは、出力チャネル312’(エンコーダ側での入力チャネル312に対応)および出力チャネル316’(エンコーダ側での入力チャネル316に対応)を含む出力チャネルの第一の対を出力する。
同様に、中間出力チャネルの第一および第二の対の第二のチャネル315’および319’は、第四のステレオ・デコード・コンポーネント320bに入力される。該第四のステレオ・デコード・コンポーネント320bは、エンコーダ側の第一のステレオ・エンコード・コンポーネント310bにおいて適用されたステレオ符号化方式の逆であるステレオ・コード方式を適用する。このようにして、第三のステレオ・デコード・コンポーネント320aは、出力チャネル312’(エンコーダ側での入力チャネル312に対応)および出力チャネル316’(エンコーダ側での入力チャネル316に対応)を含む出力チャネルの第二の対を出力する。
上記の例では、第一の入力チャネル312はLfチャネル302に対応し、第二の入力チャネル316はLsチャネル306に対応し、第三の入力チャネル314はRfチャネル304に対応し、第四の入力チャネルはRsチャネル308に対応する。しかしながら、図3のbの入力チャネル312、314、316、318に対する図3のaのチャネル302、304、306、308の任意の順列が等しく可能である。このように、エンコード/デコード装置310、320は、どの順序でどのチャネルをペアごとにエンコードするよう選択するかについて柔軟なフレームワークをなす。選択は、たとえば、チャネル間の類似性に関係する事情に基づいていてもよい。
ステレオ・エンコード・コンポーネント310a、310b、310c、310dによって適用される符号化方式が選択されうるので、さらなる柔軟性が加えられる。符号化方式は好ましくは、エンコーダからデコーダへ伝送されるデータの総量が最小化されるよう選ばれる。デコーダ側の種々のステレオ・デコード・コンポーネント320a〜dによって使用されるべき符号化方式の選択は、エンコーダ装置310によってサイド情報としてデコーダ装置320に信号伝達されてもよい(図1のb〜cの項目115、115’参照)。ステレオ変換コンポーネント310a、310b、310c、310dはこのように、異なるステレオ符号化方式を適用してもよい。しかしながら、いくつかの実施形態では、すべてのステレオ変換コンポーネント310a、310b、310c、310dは同じステレオ変換方式、たとえば向上されたMS符号化方式を適用する。
ステレオ・エンコード・コンポーネント310a、310b、310c、310dはさらに、異なる周波数帯域について異なるステレオ符号化方式を適用しうる。さらに、異なる時間フレームについて異なるステレオ符号化方式が適用されてもよい。
上記で論じたように、ステレオ・エンコード/デコード・コンポーネント310a〜dおよび320a〜dは、臨界サンプリングされたMDCT領域で動作する。窓の選択は、適用されるステレオ符号化方式によって制約される。より詳細には、ステレオ・エンコード・コンポーネント310a〜dはMS符号化または向上されたMS符号化を適用する場合、その入力信号は、窓形状および変換長の両方に関して同じ窓を使って符号化される必要がある。このように、いくつかの実施形態では、入力信号312、314、316および318のすべては同じ窓を使って符号化される。
ある例示的実施形態について、ここで図4a〜cを参照して述べる。図4のaは、オーディオ・システムの五チャネル・セットアップ400を示している。図3のaを参照して論じた四チャネル・セットアップ300と同様に、五チャネル・セットアップは、第一のチャネル402、第二のチャネル404、第三のチャネル406および第四のチャネル408を含み、それぞれLfスピーカー、Rfスピーカー、Lsスピーカー、Rsスピーカーに対応する。加えて、五チャネル・セットアップ400は中央スピーカーCに対応する第五のチャネル409を含む。
図4のbはそれぞれ、たとえば図4のaの五チャネル・セットアップの五つのチャネルをエンコードするために使用されうるエンコード装置410を示している。図4のbのエンコード装置410は、さらに第五のステレオ・エンコード・コンポーネント410eを有しているという点で、図3のaのエンコード装置310と異なる。さらに、動作の間、エンコード装置410は第五の入力チャネル419(これはたとえば、図4のaの中央チャネル409に対応しうる)を受領する。第五の入力チャネル419と、第二の対の中間出力チャネルの第一のチャネル317とが第五のステレオ・エンコード・コンポーネント410eに入力される。該第五のステレオ・エンコード・コンポーネント410eは、上記に開示したステレオ符号化方式のいずれかに従ってステレオ・エンコードを実行する。第五のステレオ・エンコード・コンポーネント410eは、第一のチャネル417および第二のチャネル421からなる第三の対の中間出力チャネルを出力する。第三の対の中間出力チャネルの第一のチャネル417と、第一の対の中間出力チャネルの第一のチャネル313とが次いで、出力チャネル422、424の第一の対を生成するために第三のステレオ・エンコード・コンポーネント310cに入力される。エンコード装置410は、五つの出力チャネル、すなわち第一の対の出力チャネル422、424、第五のステレオ・エンコード・コンポーネント410eから出力される第三の中間対の出力チャネルの第二のチャネル421および第四のステレオ・エンコード・コンポーネント310dから出力される第二の対の出力チャネル326、328を出力する。
出力チャネル422、424、421、326、328は、対応するデコード装置に伝送されるべきビットストリームを生成するために、量子化され、符号化される。
図4のaの五チャネル・セットアップと、入力チャネル312へのLfチャネル402、入力チャネル316へのLsチャネル406、入力チャネル419へのCチャネル、入力チャネル314へのRfチャネル402および入力チャネル318へのRsチャネル318を考えると、以下の実装が得られる。第一に、第一および第二のステレオ・エンコード・コンポーネント310aおよび310bは、LfとLsチャネル、RfとRsチャネルのジョイントステレオ・エンコードをそれぞれ実行する。第二に、第五のステレオ・エンコード・コンポーネント410eは中央チャネルCの、RfとRsチャネルのジョイント符号化の結果とのジョイントステレオ符号化を実行する。第三に、第三および第四のステレオ・エンコード・コンポーネント310cおよび310dは、チャネル・セットアップ400の左側と右側の間のジョイントステレオ符号化を実行する。一例によれば、ステレオ・エンコード・コンポーネント310aおよび310bが素通しに、すなわちLR符号化を実行するよう設定されている場合、エンコード装置410は三つの前方チャネルC、Lf、Rfを合同してエンコードし、二つのサラウンド・チャネルLsおよびRsが合同して符号化される。しかしながら、先の諸実施形態との関連で論じたように、チャネル・セットアップ400における五つのチャネルの入力チャネル312、314、316、318、419へのマッピングはいかなる入れ替えに従って実行されてもよい。たとえば、中央チャネル409は、チャネル・セットアップの右側ではなく、チャネル・セットアップの左側と合同で符号化されてもよい。さらに、第五のステレオ・エンコード・コンポーネント410eがLR符号化、すなわちその入力信号の素通しを実行する場合、エンコード装置410は、エンコード装置310と同様の入力チャネル312、314、316、318のジョイント符号化と、入力チャネル419の別個の符号化を実行することを注意しておく。
図4のcはエンコード装置410に対応するデコード装置420を示している。図3のcのデコード装置と比べ、デコード装置420は、第五のステレオ・デコード・コンポーネント420eを有している。第一の対の入力チャネル422’、424’および第二の対の入力チャネル326’、328’に加えて、デコード装置420は、エンコーダ側での出力チャネル421に対応する第五の入力チャネル421’を受領する。第一の対の入力チャネル422’、424’を第一のステレオ・デコード・コンポーネント320aにおけるステレオ・デコードにかけたのち、該第一のステレオ・デコード・コンポーネント320aの第二の出力チャネル417’および第五の入力チャネル421が第五のステレオ・デコード・コンポーネント420eに入力される。第五のステレオ・デコード・コンポーネント420eは、エンコーダ側での第五のステレオ・エンコード・コンポーネント410eによって適用されたステレオ符号化方式の逆であるステレオ符号化方式を適用する。第五のステレオ・デコード・コンポーネント420eは、第一のチャネル315’および第二のチャネル419’からなる第三の対の中間出力チャネルを出力する。第一のチャネル315’は次いで、第二の対の中間出力チャネルの第二のチャネル319’と一緒に、第四のステレオ・デコード・コンポーネント320dに入力される。デコード装置420は、第三の出力デコード・コンポーネント320cの出力チャネル312’、316’、第三の対の中間出力チャネルの第二のチャネル419’および第四の出力デコード・コンポーネント320dの出力チャネル314’、318’を出力する。
上記において、中間出力チャネルの概念は、ステレオ・エンコード/デコード・コンポーネントが互いに対してどのように組み合わされうるまたは配列されうるかを説明するために使われた。しかしながら、上記でさらに論じたように、中間出力チャネルは単に、ステレオ・エンコードまたはステレオ・デコードの結果をいう。特に、中間出力チャネルは典型的には、必ず生成されるまたは実際的な実装において測定できるという意味での物理的な信号ではない。行列演算に基づく実装の例についてこれから説明する。
図3のa〜c(四チャネルの場合)および図4のa〜c(五チャネルの場合)を参照して述べたエンコード/デコード方式は、行列演算を実行することによって実装されてもよい。たとえば、第一のデコード・コンポーネント320cは第一の2×2行列A1と関連付けられていてもよく、第二のデコード・コンポーネント320dは第二の2×2行列B1と関連付けられていてもよく、第三のデコード・コンポーネント320aは第三の2×2行列A2と関連付けられていてもよく、第四のデコード・コンポーネント320bは第四の2×2行列B2と関連付けられていてもよく、第五のデコード・コンポーネント420eは第五の2×2行列Aと関連付けられていてもよい。対応するエンコード・コンポーネント310a、310b、410e、310c、310dは同様に、デコーダ側での対応する行列の逆である2×2行列に関連付けられてもよい。
一般的な場合、これらの行列は次のように定義される。
Figure 0006219527
上記の行列の要素は、適用される符号化方式(LR符号化、MS符号化、向上されたMS符号化)に依存する。たとえば、LR符号化については、対応する2×2行列は恒等行列に等しい。すなわち、
Figure 0006219527
MS符号化については、対応する2×2行列は次から得られる:
Figure 0006219527
向上されたMS符号化については、対応する2×2行列は次から得られる:
Figure 0006219527
適用されるべき符号化方式は、エンコーダからデコーダにサイド情報として信号伝達される。
いくつかの異なる例がここで開示される。これらの例の目的のためには、チャネル312、312’はLfチャネル402と同定され、チャネル316、316’はLsチャネル406と同定され、チャネル419はCチャネル409と同定され、チャネル314、314’はRfチャネル404と同定され、チャネル318、318’はRsチャネル408と同定される。さらに、チャネル422’、424’、421’、326’および328’はそれぞれx1,x2,x3,x4およびx5と記される。
〈例1:四つのチャネルのジョイント符号化および中央チャネルの別個の符号化〉
この例によれば、Lf、Ls、Rf、Rsチャネルはジョイント符号化され、Cチャネルは別個に符号化される。そのような符号化構成の図解はたとえば図6のdを参照。Lf、Ls、RfおよびRsチャネルを合同して符号化するために、これらのチャネルを表わすMDCTスペクトルが、窓形状および変換長に関して共通の窓を用いて符号化されるべきである。
中央チャネルの別個の符号化を達成するために、デコード・コンポーネント420eは素通し(LR符号化)するよう設定される。これは、行列Aが恒等行列に等しいことを含意する。
Lf、Ls、RfおよびRsチャネルは次の行列演算に従って合同でデコードされうる:
Figure 0006219527
〈例2:四つのチャネルの対ごとの符号化および中央チャネルの別個の符号化〉
この例によれば、LfおよびLsチャネルは合同で符号化される。さらに、RfおよびRsチャネルは(RfおよびRsチャネルとは別個に)合同で符号化され、Cチャネルは別個に符号化される。そのような符号化構成の図解についてはたとえば図6のbを参照。(図6のaの事例はチャネルの入れ替えによって達成できる。)
中央チャネルの別個の符号化を達成するために、デコード・コンポーネント420eは素通し(LR符号化)するよう設定される。これは、行列Aが恒等行列に等しいことを含意する。
さらに、Lf/LsおよびRf/Rsの別個の符号化を達成するために、デコード・コンポーネント320c、320dは素通し(LR符号化)するよう設定される。これは、行列A1およびB1が恒等行列に等しいことを含意する。さらに、LfおよびLsチャネルを表わすMDCTスペクトルが、窓形状および変換長に関して共通の窓を用いて符号化されるべきである。また、RfおよびRsチャネルを表わすMDCTスペクトルが、窓形状および変換長に関して共通の窓を用いて符号化されるべきである。しかしながら、Lf/Lsについての窓はRf/Rsについての窓とは異なっていてもよい。Lf、Ls、RfおよびRsチャネルは次の行列演算に従ってデコードされうる:
Figure 0006219527
〈例3:五つのチャネルのジョイント符号化〉
この例によれば、Lf、Ls、Rf、RsおよびCチャネルが合同で符号化される。そのような符号化構成の図解についてはたとえば図6のeを参照。Lf、Ls、Rf、RsおよびCチャネルを合同で符号化するために、これらのチャネルを表わすMDCTスペクトルが、窓形状および変換長に関して共通の窓を用いて符号化されるべきである。Lf、Ls、RfおよびRsチャネルは次の行列演算に従ってデコードされうる:
Figure 0006219527
ここで、Mは、上記の例1の行列Mと同様に、行列A1、B1、A、A2、B2によって定義される。
〈例4:前方チャネルのジョイント符号化およびサラウンド・チャネルのジョイント符号化〉
この例によれば、C、LfおよびRfチャネルが合同で符号化され、Rs、Lsチャネルが合同で符号化される。そのような符号化構成の図解についてはたとえば図6のcを参照。C、LfおよびRfチャネルを合同で符号化するために、これらのチャネルを表わすMDCTスペクトルが、窓形状および変換長に関して共通の窓を用いて符号化されるべきである。また、RsおよびLsチャネルを表わすMDCTスペクトルが、窓形状および変換長に関して共通の窓を用いて符号化されるべきである。しかしながら、C/Lf/Rfについての窓はRs/Lsについての窓とは異なっていてもよい。前方チャネルおよびサラウンド・チャネルの別個の符号化を達成するためには、行列A2およびB2は恒等行列に設定されるべきである。
前方チャネルは
Figure 0006219527
に従ってデコードされてもよい。ここで、MはA1およびAによって定義される。サラウンド・チャネルは
Figure 0006219527
に従ってデコードされてもよい。
いくつかの場合には、エンコード装置310および410は、出力チャネル326、328の第二の対を、ここで第一の周波数と称されるある周波数より上では0に設定してもよい(第一の対の出力チャネル322、324または422、424についてのエネルギー補償が必要とされる)。その理由は、エンコード装置310、410から対応するデコード装置320、420に送られるデータの量を減らすことである。そのような場合、デコーダ側における入力チャネル326’、328’の第二の対は、第一の周波数より上の周波数帯域については0に等しい。これは、第二の対の中間チャネル317’、319’も第一の周波数より上ではスペクトル内容をもたないことを含意する。例示的な諸実施形態によれば、第二の対の入力チャネル326’、328’は(修正された)サイド信号であるという解釈をもつ。こうして、上記の状況は、第一の周波数より上の周波数については、第三および第四のデコード・コンポーネント320a、320bへの(修正された)サイド信号がないことを含意する。
図7は、デコード装置320および420の変形であるデコード装置720を示している。デコード装置720は、図3のcおよび図4のcの第二の対の入力チャネル326’、328’の限られたスペクトル内容について補償する。特に、第二の対の入力チャネル326’、328’がある第一の周波数までの周波数帯域に対応するスペクトル内容をもち、第一の対の入力チャネル322’、324’(または422’、424’)が、前記第一の周波数より大きい第二の周波数までの周波数帯域に対応するスペクトル内容をもつことが想定される。
デコード装置720は、デコード装置320または420のいずれかに対応する第一のデコード・コンポーネントを有する。デコード装置720はさらに、第一の対の出力チャネル312’、316’を第一の和信号712および第一の差信号716として表わすよう構成されている表現コンポーネント722を有する。より詳細には、第一の周波数より下の周波数帯域については、表現コンポーネント722は、上記の式に従って、図3のcまたは図4のcの第一の対の出力チャネル312’、316’を左右フォーマットからミッド‐サイド・フォーマットに変換する。第一の周波数より上の周波数帯域については、表現コンポーネント722は、図3のcまたは図4のcのチャネル313’のスペクトル内容を第一の和信号にマッピングする(そして第一の差信号は、第一の周波数より上の周波数帯域については0に等しい)。
同様に、表現コンポーネント722は、第二の対の出力チャネル314’、318’を第二の和信号714および第二の差信号718として表わす。より詳細には、前記第一の周波数より下の周波数帯域については、表現コンポーネント722は、上記の式に従って、図3のcまたは図4のcの第二の対の出力チャネル314、318を左右フォーマットからミッド‐サイド・フォーマットに変換する。第一の周波数より上の周波数帯域については、表現コンポーネント722は、図3のcまたは図4のcのチャネル315’のスペクトル内容を第二の和信号にマッピングする(そして第二の差信号は、第一の周波数より上の周波数帯域については0に等しい)。
デコード装置720はさらに、周波数拡張コンポーネント724を有する。周波数拡張コンポーネント724は、高周波再構成を実行することによって、第一の和信号および第二の和信号を第二の周波数閾値より上の周波数範囲に拡張するよう構成されている。周波数拡張された第一および第二の和信号は728および730によって表わされる。たとえば、周波数拡張コンポーネント724は、第一および第二の和信号をより高い周波数に拡張するためにスペクトル帯域複製技法を適用してもよい(たとえばEP1285436B1参照)。
デコード装置720はさらに、混合コンポーネント726を有する。混合コンポーネント726は周波数拡張された和信号728および第一の差信号716の混合を実行する。第一の周波数より下の周波数については、該混合は、周波数拡張された第一の和と第一の差信号の逆和差変換を実行することを含む。結果として、混合コンポーネント726の出力チャネル732、734は、第一の周波数より下の周波数帯域については、図3のcおよび図4のcの第一の対の出力チャネル312’、316’に等しい。
第一の周波数閾値より上の周波数については、前記混合は、第一の周波数閾値より上の周波数帯域に対応する周波数拡張された第一の和信号の部分の(一つの信号から二つの信号732、734への)パラメトリック・アップミックスを実行することを含む。適用可能なパラメトリック・アップミックス手順はたとえばEP1410687B1に記載されている。パラメトリック・アップミックスは、周波数拡張された第一の和信号728の脱相関されたバージョンを生成し、それが次いで、混合コンポーネント726に入力されるパラメータ(エンコーダ側で抽出される)に従って、前記周波数拡張された第一の和信号728と混合されることを含んでいてもよい。このように、第一の周波数より上の周波数については、混合コンポーネント726の出力チャネル732、734は周波数拡張された第一の和信号728のアップミックスに対応する。
同様に、混合コンポーネントは周波数拡張された第二の和信号730および第二の差信号718を処理する。
五チャネル・システムの場合(デコード装置720がデコード装置420であるとき)、周波数拡張コンポーネント724は第五の出力チャネル419を周波数拡張にかけて、拡張された第五の出力チャネル740を生成してもよい。
第一の和信号712および第二の和信号714を第二の周波数より上の周波数に拡張し、第一の和信号728および第一の差信号716を混合し、第二の和信号730および第二の差信号718を混合する工程は、典型的には直交ミラー・フィルタQMF領域において実行される。したがって、デコード装置720は、周波数拡張および混合を実行するのに先立ち、和および差信号712、716、714、718(および第五の出力チャネル419)をQMF領域に変換するQMF変換コンポーネントを有していてもよい。さらに、デコード装置720は、出力信号732、734、736、738(および740)を時間領域に変換する逆QMF変換コンポーネントを有していてもよい。
図5のa、bおよびcは、図1のa〜c、図2ののa〜c、図3ののa〜cおよび図4ののa〜cに関して述べたエンコード/デコード・フレームワークにどのようにして追加的なチャネル対が含められうるかを示している。図5のaは、第一のチャネル・セットアップ502および二つの追加的なチャネル506および508を含むマルチチャネル・セットアップ500を示している。第一のチャネル・セットアップ502は少なくとも二つのチャネル502aおよび502bを有し、たとえば、図1のa、図2のa、図3のaおよび図4のaに示されるチャネル・セットアップの任意のものに対応してもよい。図示した例では、第一のチャネル・セットアップ502は五つのチャネルを含み、よって図4のaのチャネル・セットアップに対応する。図示した例では、二つの追加的なチャネル506、508はたとえば、左後方サラウンド・スピーカーLbsおよび右後方サラウンド・スピーカーRbsに対応してもよい。
図5のbは、チャネル・セットアップ500をエンコードするために使われてもよい。エンコード装置510を示している。
エンコード装置510は、第一のエンコード・コンポーネント510aと、第二のエンコード・コンポーネント510bと、第三のエンコード・コンポーネント510cと、第四のエンコード・コンポーネント510dとを有する。第一510a、第二510bおよび第四510dのエンコード・コンポーネントは、図1のbに示したもののような、ステレオ・エンコード・コンポーネントである。
第三のエンコード・コンポーネント510cは、少なくとも二つの入力チャネルを受領し、それらを同数の出力チャネルに変換するよう構成されている。たとえば、第三のエンコード・コンポーネント510cは、図1のb、図2のb、図3のb、図4のbのエンコード装置110、210、310、410のいずれに対応していてもよい。しかしながら、より一般に、第三のエンコード・コンポーネント510cは、少なくとも二つの入力チャネルを受領し、それらを同数の出力チャネルに変換するよう構成されている任意のエンコード・コンポーネントであってもよい。
エンコード装置510は第一のチャネル・セットアップ502のチャネル数に対応する第一の数の入力チャネルを受領する。よって、上記によれば、第一の数は少なくとも2に等しく、第一の数の入力チャネルは第一の入力チャネル512aおよび第二の入力チャネル512b(および可能性としてはいくつかの残りのチャネル512cも)を含む。図示した例では、第一および第二の入力チャネル512a、512bは、図5のaのチャネル502aおよび502bに対応してもよい。
エンコード装置510はさらに、二つの追加的な入力チャネル、第一の追加的入力チャネル516および第二の追加的入力チャネル518を受領する。入力チャネル512a〜c、516、518は典型的にはMDCTスペクトルとして表現される。
第一の入力チャネル512aおよび第一の追加的チャネル516は第一のステレオ・エンコード・コンポーネント510aに入力される。第一のステレオ・エンコード・コンポーネント510aは、上記に開示したステレオ符号化方式のいずれかに従ってステレオ・エンコードを実行する。第一のステレオ・エンコード・コンポーネント510aは、第一のチャネル513および第二のチャネル517を含む第一の対の中間出力チャネルを出力する。
同様に、第二の入力チャネル512bおよび第二の追加的チャネル518は第二のステレオ・エンコード・コンポーネント510bに入力される。第二のステレオ・エンコード・コンポーネント510bは、上記に開示したステレオ符号化方式のいずれかに従ってステレオ・エンコードを実行する。第二のステレオ・エンコード・コンポーネント510aは、第一のチャネル515および第二のチャネル519を含む第二の対の中間出力チャネルを出力する。
図5のaの例示的なチャネル・セットアップを考えると、第一および第二のステレオ・エンコード・コンポーネント510a、510bによって実行される処理は、それぞれLbsチャネル506のLsチャネル502aとのステレオ符号化およびRbsチャネル508のRsチャネル502bとのステレオ符号化に対応する。しかしながら、他の例示的チャネル・セットアップでは他の解釈が得られることは理解しておくものとする。
第一の対の中間出力チャネルの第一のチャネル513と、第二の対の中間出力チャネルの第一のチャネル515とが次いで、第一の入力チャネル512aおよび第二の入力チャネル512bを別にした前記第一の数の入力チャネル512cと一緒に、第三のエンコード・コンポーネント510cに入力される。第三のエンコード・コンポーネント510cは、その入力チャネル513、515、512cを変換して、第一の対の出力チャネル522、524および該当するならさらなる出力チャネル521を含む同量の出力チャネルを生成する。第三のエンコード・コンポーネントはたとえば、その入力チャネル513、515、512cを、図1のb、図2のb、図3のbおよび図4のbに関して開示したのと同様に変換してもよい。
同様に、第一の対の中間出力チャネルの第二のチャネル517と、第二の対の中間出力チャネルの第二のチャネル519とが第四のステレオ・エンコード・コンポーネント510dに入力される。該第四のステレオ・エンコード・コンポーネント510dは、上記で論じたステレオ・エンコード方式のいずれかに従ってステレオ・エンコードを実行する。第四のステレオ・エンコード・コンポーネントは第二の対の出力チャネル526、528を出力する。
出力チャネル521、522、524、526、528は量子化され、符号化されて、対応するデコード装置に伝送されるべきビットストリームを形成する。
図5のcは、対応するデコード装置520を示している。デコード装置520は、第一のデコード・コンポーネント520c、第二のデコード・コンポーネント520d、第三のデコード・コンポーネント520aおよび第四のデコード・コンポーネント520bを有する。第二520d、第三520aおよび第四520bのデコード・コンポーネントは、図1のcに示したもののような、ステレオ・デコード・コンポーネントである。
第一のデコード・コンポーネント520aは、少なくとも二つの入力チャネルを受領し、それらを同数の出力チャネルに変換するよう構成されている。たとえば、第一のデコード・コンポーネント520cは、図1のb、図2のb、図3のb、図4のbのデコード装置120、220、320、420のいずれに対応していてもよい。しかしながら、より一般には、第一のデコード・コンポーネント520cは、少なくとも二つの入力チャネルを受領し、それらを同数の出力チャネルに変換するよう構成されている任意のデコード・コンポーネントであってもよい。
デコード装置520は、エンコード装置510によって伝送されたビットストリームを受領し、デコードし、量子化解除する。このようにして、デコード装置520は、エンコード装置510の出力チャネル521、522、524に対応する第一の数の入力チャネル521’、522’、524’を受領する。上記によれば、第一の数の入力チャネルは第一の入力チャネル522’および第二の入力チャネル524’を(および可能性としてはいくつかの残りのチャネル521’も)含む。
デコード装置520はさらに、二つの追加的な入力チャネル、第一の追加的入力チャネル526’および第二の追加的入力チャネル528’(エンコーダ側の出力チャネル526、528に対応)を受領する。
第一の数の入力チャネル521’、522’、524’は第一のデコード・コンポーネント520cに入力される。第一のデコード・コンポーネント520cは、その入力チャネル521’、522’、524’を変換して、第一の対の中間出力チャネル513’、515’および該当するならさらなる出力チャネル512c’を含む同量の出力チャネルを生成する。第一のデコード・コンポーネント520cはたとえば、その入力チャネル521’、522’、524’を、図1のc、図2のc、図3のcおよび図4のcに関して開示したのと同様に変換してもよい。特に、第一のデコード・コンポーネント520cは、エンコーダ側で第三のエンコード・コンポーネント510cによって実行されたエンコードの逆であるデコードを実行するよう構成される。
第一の追加的入力チャネル526および第二の追加的入力チャネル528は第二のステレオ・デコード・コンポーネント520dに入力される。該第二のステレオ・デコード・コンポーネント520dは、エンコーダ側で第四のステレオ・エンコード・コンポーネント510dによって実行されたエンコードの逆に対応するステレオ・デコードを実行する。第二のステレオ・デコード・コンポーネント520dは、第二の対の中間出力チャネル517’、519’を出力する。
第一の対の中間出力チャネルの第一のチャネル513’と、第二の対の中間出力チャネルの第一のチャネル517’とが、第三のステレオ・デコード・コンポーネント520aに入力される。第三のステレオ・デコード・コンポーネント520aは、エンコーダ側で第一のステレオ・エンコード・コンポーネント510aによって実行されたエンコードの逆に対応するステレオ・デコードを実行する。第三のステレオ・デコード・コンポーネント520aは、第一のチャネル512a’および第二のチャネル516’を含む第一の対の出力チャネルを出力する。
同様に、第一の対の中間出力チャネルの第二のチャネル515’と、第二の対の中間出力チャネルの第二のチャネル519’とが、第四のステレオ・デコード・コンポーネント520bに入力される。第四のステレオ・デコード・コンポーネント520bは、エンコーダ側で第二のステレオ・エンコード・コンポーネント510bによって実行されたエンコードの逆に対応するステレオ・デコードを実行する。第四のステレオ・デコード・コンポーネント520aは、第一のチャネル512b’および第二のチャネル518’を含む第二の対の出力チャネルを出力する。
図6のa、b、c、dおよびeは、五チャネル・システムの五つのチャネルを示している。五つのチャネルは異なる符号化構成を形成するために異なるグループに分割されてもよい。各グループは、上記に従ってエンコード装置を使うことによって合同してエンコードされるチャネルに対応する。
第一の符号化構成610が図6のaに示されている。第一の符号化構成610は、一つのチャネル(ここでは中央チャネルC)からなる第一のグループ612、二つのチャネル(ここではLfおよびRfチャネル)からなる第二のグループ614および二つのチャネル(ここではLsおよびRsチャネル)からなる第三のグループ616を含む。第一のグループ612のチャネルは別個に符号化され、第二のグループ614のチャネルは合同して符号化され、第三のグループ616のチャネルは合同して符号化される。そのようなエンコードはたとえば、図4のbのエンコード装置410によって、Lfチャネルを入力チャネル312に、Lsチャネルを入力チャネル316に、Cチャネルを入力チャネル419に、Rfチャネルを入力チャネル314に、Rsチャネルを入力チャネル318にマッピングすることによって、達成されることができる。さらに、第一310a、第二310bおよび第四410eのステレオ・エンコード・コンポーネントの符号化方式はLR符号化(入力信号の素通し)に設定されるべきである。図6のbは、第一の符号化構成610の変形610’を示す。第一の符号化構成の変形610’では、第二のグループ614’がLfおよびLsチャネルに対応し、第三のグループ616’がRfおよびRsチャネルに対応する。図6のaおよびbの符号化構成は、以下では1-2-2符号化構成と称される。
第二の符号化構成620が図6のcに示されている。第二の符号化構成620は、三つのチャネル(ここでは中央チャネルC、LfチャネルおよびRfチャネル)からなる第一のグループ622および二つのチャネル(ここではLsおよびRsチャネル)からなる第二のグループ624を含む。図6のcの符号化構成は、以下では2-3符号化構成と称される。第一のグループ622のチャネルは合同して符号化され、第二のグループ624のチャネルは第一のグループとは別個に合同して符号化される。そのようなエンコードはたとえば、図4のbのエンコード装置410によって、Lfチャネルを入力チャネル312に、Lsチャネルを入力チャネル316に、Cチャネルを入力チャネル419に、Rfチャネルを入力チャネル314に、Rsチャネルを入力チャネル318にマッピングすることによって、達成されることができる。さらに、第一310a、第二310bのステレオ・エンコード・コンポーネントの符号化方式はLR符号化(入力信号の素通し)に設定されるべきである。
第三の符号化構成630が図6のdに示されている。第三の符号化構成620は、一つのチャネル(ここでは中央チャネルC)からなる第一のグループ632、四つのチャネル(ここではLfおよびRfチャネル)からなる第二のグループ634を含む。図6のdの符号化構成は、以下では1-4符号化構成と称される。第一のグループ632のチャネルは別個に符号化され、第二のグループ634のチャネルは合同して符号化される。そのようなエンコードはたとえば、図4のbのエンコード装置410によって、Lfチャネルを入力チャネル312に、Lsチャネルを入力チャネル316に、Cチャネルを入力チャネル419に、Rfチャネルを入力チャネル314に、Rsチャネルを入力チャネル318にマッピングすることによって、達成されることができる。さらに、第五のステレオ・エンコード・コンポーネント410eの符号化方式はLR符号化(入力信号の素通し)に設定されるべきである。
第四の符号化構成640が図6のeに示されている。第四の符号化構成640は、五つ全部のチャネルからなる単一のグループ642を含む。つまり、全部のチャネルがジョイント符号化される。図6のeの符号化構成は以下では0-5符号化と称される。たとえば、それらのチャネルは、図4のbのエンコード装置410によって、Lfチャネルを入力チャネル312に、Lsチャネルを入力チャネル316に、Cチャネルを入力チャネル419に、Rfチャネルを入力チャネル314に、Rsチャネルを入力チャネル318にマッピングすることによって、合同してエンコードされうる。
上記の符号化構成は五チャネル・システムに関して説明したが、四つ以上のチャネルをもつシステムにも等しく適用可能である。
このように、エンコード装置は、種々の符号化構成610、610’、620、630、640に従ってマルチチャネル・システム構成のオーディオ・コンテンツを符号化してもよい。エンコーダ側で使われた符号化構成はデコーダに通信される必要がある。この目的のために、具体的な信号伝達フォーマットが使用されてもよい。少なくとも四つのチャネルを含むオーディオ・システムについて、信号伝達フォーマットは、デコーダ側で適用されるべき前記複数の構成610、610’、620、630、640の一つを指示する少なくとも二つのビットを含む。たとえば、各符号化構成は、識別番号に関連付けられてもよく、前記少なくとも二つのビットは、デコーダにおいて適用すべき符号化構成の識別番号を指示してもよい。
図6のa〜eに示される五チャネル・システムについては、1-2-2構成、2-3構成、1-4または0-5構成の間で選択をするために、二つのビットが使われてもよい。該二つのビットが1-2-2構成を指示する場合は、信号伝達フォーマットは、1-2-2構成のどの変形を選択すべきか、すなわち図6のaの左右符号化構成または図6のbの前後構成のどちらが適用されるべきかを指示する第三のビットを含んでいてもよい。次の擬似コードは、これがどのように実装されうるかの例を与える。
switch(high_mid_coding_config){
case l_2_2_coding:
1_2_2_channel_mapping /* 0=Lf/Rf, Ls/Rs; 1=Lf/Ls+Rf/Rs */
two_channel_data(); /* Lf/Rf または Lf/Ls */
two_channel_data(); /* Ls/Rs または Rf/Rs */
mono_data() /* C */
break;
case 3ch_joint_coding:
three_channel_data() /* L/R/C */
two_channel_data() /* Ls/Rs */
break;
case 4ch_joint_coding:
four_channel_data() /* L/R/Ls/Rs */
mono_data() /* C */
break;
case 5ch_joint_coding:
five_channel_data()
break;
}
上記の擬似コードに関し、信号伝達フォーマットは、パラメータhigh_mid_coding_configを符号化するために2ビットを使い、パラメータ1_2_channel_,mappingを符号化するために1ビットを使う。
〈等価物、拡張、代替その他〉
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
さらに、図面、本開示および付属の請求項の吟味から、本開示を実施する当業者によって、開示される実施形態に対する変形が理解され、実施されることができる。請求項において、「有する/含む」の語は他の要素またはステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項に記載されているというだけの事実がこれらの施策の組み合わせが有利に使用できないことを示すものではない。
上記で開示されたシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。逆に、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働していくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的な媒体)および通信媒体(または一時的な媒体)を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことは当業者にはよく知られている。
いくつかの態様を記載しておく。
〔態様1〕
少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるデコード方法であって、
第一の対の入力チャネルおよび第二の対の入力チャネルを受領する段階と;
前記第一の対の入力チャネルを第一のステレオ・デコードにかける段階と;
前記第二の対の入力チャネルを第二のステレオ・デコードにかける段階と;
前記第一のステレオ・デコードから帰結する第一のチャネルおよび前記第二のステレオ・デコードから帰結する第一のチャネルを第三のステレオ・デコードにかけて第一の対の出力チャネルを得る段階と;
前記第一のステレオ・デコードから帰結する第二のチャネルに関連付けられたオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第二のチャネルを第四のステレオ・デコードにかけて第二の対の出力チャネルを得る段階と;
前記第一および第二の対の出力チャネルの出力とを含む、
デコード方法。
〔態様2〕
前記第一のステレオ・デコードから帰結する第二のチャネルに関連付けられた前記オーディオ・チャネルは、前記第一のステレオ・デコードから帰結する前記第二のチャネルである、態様1記載のデコード方法。
〔態様3〕
第五の入力チャネルを受領する段階と;
前記第五の入力チャネルおよび前記第一のステレオ・デコードから帰結する前記第二のチャネルを第五のステレオ・デコードにかける段階とをさらに含み、
前記第一のステレオ・デコードから帰結する前記第二のチャネルに関連付けられた前記オーディオ・チャネルは前記第五のステレオ・デコードから帰結する第一のチャネルに等しく、
前記第五のステレオ・デコードから帰結する第二のチャネルが第五の出力チャネルとして出力される、
態様1記載のデコード方法。
〔態様4〕
第三の対の入力チャネルを受領する段階と;
前記第三の対の入力チャネルを第六のステレオ・デコードにかける段階と;
前記第一の対の出力チャネルの第二のチャネルおよび前記第六のステレオ・デコードから帰結する第一のチャネルを第七のステレオ・デコードにかける段階と;
前記第二の対の出力チャネルの第二のチャネルおよび前記第六のステレオ・デコードから帰結する第二のチャネルを第八のステレオ・デコードにかける段階と;
前記第一の対の出力チャネルの前記第一のチャネル、前記第七のステレオ・デコードから帰結するチャネル対、前記第二の対の出力チャネルの前記第一のチャネルおよび前記第八のステレオ・デコードから帰結するチャネル対の出力と
をさらに含む、態様1ないし3のうちいずれか一項記載のデコード方法。
〔態様5〕
前記第一、第二、第三および第四のステレオ・デコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・デコードは、左右符号化、和差符号化および向上された和差符号化を含む符号化方式に従ってステレオ・デコードを実行することを含む、態様1ないし4のうちいずれか一項記載のデコード方法。
〔態様6〕
異なる周波数帯域について異なる符号化方式が使用される、態様5記載のデコード方法。
〔態様7〕
異なる時間フレームについて異なる符号化方式が使用される、態様5または6記載のデコード方法。
〔態様8〕
前記第一、第二、第三および第四ならびに該当する場合には前記第五、第六、第七および第八のステレオ・デコードは、臨界サンプリングされた修正離散コサイン変換(MDCT)領域において実行される、態様1ないし7のうちいずれか一項記載のデコード方法。
〔態様9〕
すべての入力チャネルが同じ窓を使ってMDCT領域に変換される、態様8記載のデコード方法。
〔態様10〕
前記第二の対の入力チャネルは、第一の周波数閾値までの周波数帯域に対応するスペクトル内容を有し、前記第二のステレオ・デコードから帰結するチャネル対は、前記第一の周波数閾値より上の周波数帯域については0に等しい、態様1ないし9のうちいずれか一項記載のデコード方法。
〔態様11〕
前記第二の対の入力チャネルが、第一の周波数閾値までの周波数帯域に対応するスペクトル内容を有し、前記第一の対の入力チャネルが、前記第一の周波数閾値より大きい第二の周波数閾値までの周波数帯域に対応するスペクトル内容を有しており、当該方法はさらに、
前記第一の対の出力チャネルを第一の和信号および第一の差信号として表現し、前記第二の対の出力チャネルを第二の和信号および第二の差信号として表現する段階と;
高周波再構成を実行することにより前記第一の和信号および前記第二の和信号を前記第二の周波数閾値より上の周波数範囲に延長する段階と;
前記第一の和信号および前記第一の差信号を混合する段階であって、前記第一の周波数閾値より下の周波数については、前記混合は前記第一の和信号および前記第一の差信号の逆和差変換を実行することを含み、前記第一の周波数閾値より上の周波数については、前記混合は前記第一の周波数閾値より上の周波数帯域に対応する前記第一の和信号の部分のパラメトリック・アップミックスを実行することを含む、段階と;
前記第二の和信号および前記第二の差信号を混合する段階であって、前記第一の周波数閾値より下の周波数については、前記混合は前記第二の和信号および前記第二の差信号の逆和差変換を実行することを含み、前記第一の周波数閾値より上の周波数については、前記混合は前記第一の周波数閾値より上の周波数帯域に対応する前記第二の和信号の部分のパラメトリック・アップミックスを実行することを含む、段階とを含む、
態様1ないし10のうちいずれか一項記載のデコード方法。
〔態様12〕
前記第一の和信号および前記第二の和信号を前記第二の周波数閾値より上の周波数範囲に延長する段階、前記第一の和信号および前記第一の差信号を混合する段階および前記第二の和信号および前記第二の差信号を混合する段階は、直交ミラー・フィルタ(QMF)領域で実行される、態様11記載の方法。
〔態様13〕
態様1ないし12のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様14〕
少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるデコード装置であって、
第一の対の入力チャネルおよび第二の対の入力チャネルを受領するよう構成された受領コンポーネントと;
前記第一の対の入力チャネルを第一のステレオ・デコードにかけるよう構成された第一のステレオ・デコード・コンポーネントと;
前記第二の対の入力チャネルを第二のステレオ・デコードにかけるよう構成された第二のステレオ・デコード・コンポーネントと;
前記第一のステレオ・デコードから帰結する第一のチャネルおよび前記第二のステレオ・デコードから帰結する第一のチャネルを第三のステレオ・デコードにかけて第一の対の出力チャネルを得るよう構成された第三のステレオ・デコード・コンポーネントと;
前記第一のステレオ・デコードから帰結する前記第二のチャネルに関連付けられたオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第二のチャネルを第四のステレオ・デコードにかけて第二の対の出力チャネルを得るよう構成された第四のステレオ・デコード・コンポーネントと;
前記第一および第二の対の出力チャネルを出力するよう構成された出力コンポーネントとを有する、
デコード装置。
〔態様15〕
態様14記載のデコード装置を有するオーディオ・システム。
〔態様16〕
少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるエンコード方法であって、
第一の対の入力チャネルおよび第二の対の入力チャネルを受領する段階と;
前記第一の対の入力チャネルを第一のステレオ・エンコードにかける段階と;
前記第二の対の入力チャネルを第二のステレオ・エンコードにかける段階と;
前記第一のステレオ・エンコードから帰結する第一のチャネルおよび前記第二のステレオ・エンコードから帰結する第一のチャネルに関連付けられたオーディオ・チャネルを第三のステレオ・エンコードにかけて第一の対の出力チャネルを得る段階と;
前記第一のステレオ・エンコードから帰結する第二のチャネルおよび前記第二のステレオ・エンコードから帰結する第二のチャネルを第四のステレオ・エンコードにかけて第二の対の出力チャネルを得る段階と;
前記第一および第二の対の出力チャネルの出力とを含む、
エンコード方法。
〔態様17〕
前記第二のステレオ・エンコードから帰結する前記第一のチャネルに関連付けられた前記オーディオ・チャネルは、前記第二のステレオ・エンコードから帰結する前記第一のチャネルである、態様16記載のエンコード方法。
〔態様18〕
第五の入力チャネルを受領する段階と;
前記第五の入力チャネルおよび前記第二のステレオ・エンコードから帰結する前記第一のチャネルを第五のステレオ・エンコードにかける段階とをさらに含み、
前記第二のステレオ・エンコードから帰結する前記第一のチャネルに関連付けられた前記オーディオ・チャネルは前記第五のステレオ・エンコードから帰結する第一のチャネルであり、
前記第五のステレオ・エンコードから帰結する第二のチャネルが第五の出力チャネルとして出力される、
態様16記載のエンコード方法。
〔態様19〕
第三の対の入力チャネルを受領する段階と;
前記第一の対の入力チャネルの第二のチャネルおよび前記第三の対の入力チャネルの第一のチャネルを第六のステレオ・エンコードにかける段階と;
前記第二の対の入力チャネルの第二のチャネルおよび前記第三の対の入力チャネルの第二のチャネルを第七のステレオ・エンコードにかける段階であって、
前記第六のステレオ・エンコードから帰結する第一のチャネルおよび前記第一の対の入力チャネルの第一のチャネルは前記第一のステレオ・エンコードにかけられ、
前記第七のステレオ・エンコードから帰結する第一のチャネルおよび前記第二の対の入力チャネルの第一のチャネルは前記第二のステレオ・エンコードにかけられる、段階と;
前記第六のステレオ・エンコードから帰結する第二のチャネルおよび前記第七のステレオ・エンコードから帰結する第二のチャネルを第八のステレオ・エンコードにかけて第三の対の出力チャネルを得る段階とを含む、
態様16ないし18のうちいずれか一項記載のエンコード方法。
〔態様20〕
前記第一、第二、第三および第四のステレオ・エンコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、左右符号化、和差符号化および向上された和差符号化を含む符号化方式に従ってステレオ・エンコードを実行することを含む、態様16ないし19のうちいずれか一項記載のエンコード方法。
〔態様21〕
異なる周波数帯域について異なる符号化方式が使用される、態様20記載のエンコード方法。
〔態様22〕
異なる時間フレームについて異なる符号化方式が使用される、態様20または21記載のエンコード方法。
〔態様23〕
前記第一、第二、第三および第四ならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、臨界サンプリングされた修正離散コサイン変換(MDCT)領域において実行される、態様16ないし22のうちいずれか一項記載のエンコード方法。
〔態様24〕
すべての入力チャネルが、同じ窓を使ってMDCT領域に変換される、態様23記載のエンコード方法。
〔態様25〕
態様16ないし24のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様26〕
少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるエンコード装置であって、
第一の対の入力チャネルおよび第二の対の入力チャネルを受領するよう構成された受領コンポーネントと;
前記第一の対の入力チャネルを第一のステレオ・エンコードにかけるよう構成された第一のステレオ・エンコード・コンポーネントと;
前記第二の対の入力チャネルを第二のステレオ・エンコードにかけるよう構成された第二のステレオ・エンコード・コンポーネントと;
前記第一のステレオ・エンコードから帰結する第一のチャネルおよび前記第二のステレオ・エンコードから帰結する第一のチャネルに関連付けられたオーディオ・チャネルを第三のステレオ・エンコードにかけて第一の対の出力チャネルを提供するよう構成された第三のステレオ・エンコード・コンポーネントと;
前記第一のステレオ・エンコードから帰結する第二のチャネルおよび前記第二のステレオ・エンコードから帰結する第二のチャネルを第四のステレオ・エンコードにかけて第二の対の出力チャネルを得るよう構成された第四のステレオ・エンコード・コンポーネントと;
前記第一および第二の対の出力チャネルを出力するよう構成された出力コンポーネントとを有する、
エンコード装置。
〔態様27〕
態様26記載のエンコード装置を有するオーディオ・システム。
〔態様28〕
少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムのオーディオ・コンテンツを表わす信号をデコードするときに使う符号化構成をエンコーダによってデコーダに指示するための信号伝達フォーマットであって、前記少なくとも四つのチャネルは複数の構成に基づいて異なるグループに分割可能であり、各グループはジョイント・エンコードされるチャネルに対応し、当該信号伝達フォーマットは、前記デコーダによって適用されるべき前記複数の構成の一つを指示する少なくとも二つのビットを有する、信号伝達フォーマット。
〔態様29〕
前記少なくとも二つのビットは、前記複数の構成の一つを、前記複数の構成の前記一つの識別番号を指示することによって指示する、態様28記載の信号伝達フォーマット。
〔態様30〕
前記マルチチャネル・オーディオ・システムは五つのチャネルを含み、前記複数の符号化構成は、
五つのチャネルのジョイント符号化;
四つのチャネルのジョイント符号化および最後のチャネルの別個の符号化;
三つのチャネルのジョイント符号化および他の二つのチャネルの別個のジョイント符号化;および
二つのチャネルのジョイント符号化、他の二つのチャネルの別個のジョイント符号化および最後のチャネルの別個の符号化
に対応する、態様28または29記載の信号伝達フォーマット。
〔態様31〕
前記少なくとも二つのビットが二つのチャネルのジョイント符号化、他の二つのチャネルの別個のジョイント符号化および最後のチャネルの別個の符号化を指示する場合、前記少なくとも二つのビットは、どの二つのチャネルがジョイント符号化されるべきで、どの他の二つのチャネルがジョイント符号化されるべきかを指示するビットを含む、態様30記載の信号伝達フォーマット。

Claims (36)

  1. 少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるデコード方法であって、
    第一の対の入力オーディオ・チャネルおよび前記第一の対の入力オーディオ・チャネルとは異なる第二の対の入力オーディオ・チャネルを受領する段階と;
    前記第一の対の入力オーディオ・チャネルを第一のステレオ・デコードにかける段階と;
    前記第二の対の入力オーディオ・チャネルを第二のステレオ・デコードにかける段階と;
    前記第一のステレオ・デコードから帰結する第一のオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第一のオーディオ・チャネルを第三のステレオ・デコードにかけて第一の対の出力オーディオ・チャネルを得る段階と;
    前記第一のステレオ・デコードから帰結する第二のオーディオ・チャネルに関連付けられたオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第二のオーディオ・チャネルを第四のステレオ・デコードにかけて前記第一の対の出力オーディオ・チャネルとは異なる第二の対の出力オーディオ・チャネルを得る段階であって、前記第一のステレオ・デコードから帰結する第二のチャネルに関連付けられた前記オーディオ・チャネルは、前記第一のステレオ・デコードから帰結する前記第二のオーディオ・チャネルである、または第五の入力オーディオ・チャネルおよび前記第一のステレオ・デコードから帰結する前記第二のオーディオ・チャネルの第五のステレオ・デコードから帰結するオーディオ・チャネルである、段階と;
    前記第一および第二の対の出力チャネルの出力とを含み、
    前記第一、第二、第三および第四のステレオ・デコードのうち少なくとも二つは、少なくとも一つの周波数帯域および少なくとも一つの時間フレームについて、それぞれのステレオ・デコードにかけられた二つのオーディオ・チャネルの重み付けされたまたは重み付けされない和と、それぞれのステレオ・デコードにかけられた二つのオーディオ・チャネルの間の重み付けされたまたは重み付けされない差とを形成することを含む、
    デコード方法。
  2. サイド情報を受領する段階を含み、
    前記第一、第二、第三および第四のステレオ・デコードについて、
    前記サイド情報に基づいて、左右符号化、和差符号化および向上された和差符号化を含む群から符号化方式を選択し、
    選択された符号化方式に従ってステレオ・デコードを実行することを含む、
    請求項1記載のデコード方法。
  3. 前記第一のステレオ・デコードから帰結する第二のチャネルに関連付けられた前記オーディオ・チャネルは、前記第一のステレオ・デコードから帰結する前記第二のチャネルである、請求項1または2記載のデコード方法。
  4. 前記第五の入力オーディオ・チャネルを受領する段階と;
    前記第五の入力オーディオ・チャネルおよび前記第一のステレオ・デコードから帰結する前記第二のオーディオ・チャネルを前記第五のステレオ・デコードにかける段階とをさらに含み、
    前記第一のステレオ・デコードから帰結する前記第二のオーディオ・チャネルに関連付けられた前記オーディオ・チャネルは前記第五のステレオ・デコードから帰結する第一のオーディオ・チャネルに等しく、
    前記第五のステレオ・デコードから帰結する第二のオーディオ・チャネルが第五の出力チャネルとして出力される、
    請求項1または2記載のデコード方法。
  5. 第三の対の入力オーディオ・チャネルを受領する段階と;
    前記第三の対の入力オーディオ・チャネルを第六のステレオ・デコードにかける段階と;
    前記第一の対の出力オーディオ・チャネルの第二のオーディオ・チャネルおよび前記第六のステレオ・デコードから帰結する第一のオーディオ・チャネルを第七のステレオ・デコードにかける段階と;
    前記第二の対の出力オーディオ・チャネルの第二のオーディオ・チャネルおよび前記第六のステレオ・デコードから帰結する第二のオーディオ・チャネルを第八のステレオ・デコードにかける段階と;
    前記第一の対の出力オーディオ・チャネルの前記第一のオーディオ・チャネル、前記第七のステレオ・デコードから帰結するオーディオ・チャネル対、前記第二の対の出力チャネルの前記第一のオーディオ・チャネルおよび前記第八のステレオ・デコードから帰結するオーディオ・チャネル対の出力と
    をさらに含む、請求項1ないし4のうちいずれか一項記載のデコード方法。
  6. 前記第一、第二、第三および第四のステレオ・デコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・デコードは、左右符号化、和差符号化および向上された和差符号化を含む群からの符号化方式に従ってステレオ・デコードを実行することを含む、請求項1ないし5のうちいずれか一項記載のデコード方法。
  7. 異なる周波数帯域について異なる符号化方式が使用される、請求項6記載のデコード方法。
  8. 異なる時間フレームについて異なる符号化方式が使用される、請求項6または7記載のデコード方法。
  9. 前記第一、第二、第三および第四ならびに該当する場合には前記第五、第六、第七および第八のステレオ・デコードは、臨界サンプリングされた修正離散コサイン変換(MDCT)領域において実行される、請求項1ないし8のうちいずれか一項記載のデコード方法。
  10. すべての入力オーディオ・チャネルが同じ窓を使ってMDCT領域に変換される、請求項9記載のデコード方法。
  11. 前記第二の対の入力オーディオ・チャネルは、第一の周波数閾値までの周波数帯域に対応するスペクトル内容を有し、前記第二のステレオ・デコードから帰結するチャネル対は、前記第一の周波数閾値より上の周波数帯域については0に等しい、請求項1ないし10のうちいずれか一項記載のデコード方法。
  12. 前記第二の対の入力オーディオ・チャネルが、第一の周波数閾値までの周波数帯域に対応するスペクトル内容を有し、前記第一の対の入力オーディオ・チャネルが、前記第一の周波数閾値より大きい第二の周波数閾値までの周波数帯域に対応するスペクトル内容を有しており、当該方法はさらに、
    前記第一の対の出力オーディオ・チャネルを第一の和信号および第一の差信号として表現し、前記第二の対の出力オーディオ・チャネルを第二の和信号および第二の差信号として表現する段階と;
    高周波再構成を実行することにより前記第一の和信号および前記第二の和信号を前記第二の周波数閾値より上の周波数範囲に延長する段階と;
    前記第一の和信号および前記第一の差信号を混合する段階であって、前記第一の周波数閾値より下の周波数については、前記混合は前記第一の和信号および前記第一の差信号の逆和差変換を実行することを含み、前記第一の周波数閾値より上の周波数については、前記混合は前記第一の周波数閾値より上の周波数帯域に対応する前記第一の和信号の部分のパラメトリック・アップミックスを実行することを含む、段階と;
    前記第二の和信号および前記第二の差信号を混合する段階であって、前記第一の周波数閾値より下の周波数については、前記混合は前記第二の和信号および前記第二の差信号の逆和差変換を実行することを含み、前記第一の周波数閾値より上の周波数については、前記混合は前記第一の周波数閾値より上の周波数帯域に対応する前記第二の和信号の部分のパラメトリック・アップミックスを実行することを含む、段階とを含む、
    請求項1ないし11のうちいずれか一項記載のデコード方法。
  13. 前記第一の和信号および前記第二の和信号を前記第二の周波数閾値より上の周波数範囲に延長する段階、前記第一の和信号および前記第一の差信号を混合する段階および前記第二の和信号および前記第二の差信号を混合する段階は、直交ミラー・フィルタ(QMF)領域で実行される、請求項12記載の方法。
  14. 請求項1ないし13のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
  15. 少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるデコード装置であって、
    第一の対の入力オーディオ・チャネルおよび前記第一の対の入力オーディオ・チャネルとは異なる第二の対の入力オーディオ・チャネルを受領するよう構成された受領コンポーネントと;
    前記第一の対の入力オーディオ・チャネルを第一のステレオ・デコードにかけるよう構成された第一のステレオ・デコード・コンポーネントと;
    前記第二の対の入力オーディオ・チャネルを第二のステレオ・デコードにかけるよう構成された第二のステレオ・デコード・コンポーネントと;
    前記第一のステレオ・デコードから帰結する第一のオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第一のオーディオ・チャネルを第三のステレオ・デコードにかけて第一の対の出力オーディオ・チャネルを得るよう構成された第三のステレオ・デコード・コンポーネントと;
    前記第一のステレオ・デコードから帰結する前記第二のオーディオ・チャネルに関連付けられたオーディオ・チャネルおよび前記第二のステレオ・デコードから帰結する第二のオーディオ・チャネルを第四のステレオ・デコードにかけて前記第一の対の出力オーディオ・チャネルとは異なる第二の対の出力オーディオ・チャネルを得るよう構成された第四のステレオ・デコード・コンポーネントであって、前記第一のステレオ・デコードから帰結する第二のチャネルに関連付けられた前記オーディオ・チャネルは、前記第一のステレオ・デコードから帰結する前記第二のオーディオ・チャネルである、または第五の入力オーディオ・チャネルおよび前記第一のステレオ・デコードから帰結する前記第二のオーディオ・チャネルの第五のステレオ・デコードから帰結するオーディオ・チャネルである、第四のステレオ・デコード・コンポーネントと;
    前記第一および第二の対の出力オーディオ・チャネルを出力するよう構成された出力コンポーネントとを有しており、
    前記第一、第二、第三および第四のステレオ・デコードのうち少なくとも二つは、少なくとも一つの周波数帯域および少なくとも一つの時間フレームについて、それぞれのステレオ・デコードにかけられた二つのオーディオ・チャネルの重み付けされたまたは重み付けされない和と、それぞれのステレオ・デコードにかけられた二つのオーディオ・チャネルの間の重み付けされたまたは重み付けされない差とを形成することを含む、
    デコード装置。
  16. サイド情報を受領するよう構成されており、
    前記第一、第二、第三および第四のステレオ・デコード・コンポーネントについて、
    前記サイド情報に基づいて、左右符号化、和差符号化および向上された和差符号化を含む群から符号化方式を選択し、
    選択された符号化方式に従ってステレオ・デコードを実行するよう構成されている、
    請求項15記載のデコード装置。
  17. 請求項15または16記載のデコード装置を有するオーディオ・システム。
  18. 少なくとも四つのオーディオ・チャネルをもつマルチチャネル・オーディオ・システムにおけるエンコード方法であって、
    第一の対の入力オーディオ・チャネルおよび前記第一の対の入力オーディオ・チャネルとは異なる第二の対の入力オーディオ・チャネルを受領する段階と;
    前記第一の対の入力オーディオ・チャネルを第一のステレオ・エンコードにかける段階と;
    前記第二の対の入力オーディオ・チャネルを第二のステレオ・エンコードにかける段階と;
    前記第一のステレオ・エンコードから帰結する第一のオーディオ・チャネルおよび前記第二のステレオ・エンコードから帰結する第一のオーディオ・チャネルに関連付けられたオーディオ・チャネルを第三のステレオ・エンコードにかけて第一の対の出力オーディオ・チャネルを得る段階と;
    前記第一のステレオ・エンコードから帰結する第二のオーディオ・チャネルおよび前記第二のステレオ・エンコードから帰結する第二のオーディオ・チャネルを第四のステレオ・エンコードにかけて前記第一の対の出力オーディオ・チャネルとは異なる第二の対の出力オーディオ・チャネルを得る段階と;
    前記第一および第二の対の出力オーディオ・チャネルの出力とを含み、
    前記第二のステレオ・エンコードから帰結する第一のオーディオ・チャネルに関連付けられた前記オーディオ・チャネルは、前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルである、または第五の入力オーディオ・チャネルおよび前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルの第五のステレオ・エンコードから帰結するオーディオ・チャネルであり、
    前記第一、第二、第三および第四のステレオ・エンコードのうち少なくとも二つは、少なくとも一つの周波数帯域および少なくとも一つの時間フレームについて、それぞれのステレオ・エンコードにかけられた二つのオーディオ・チャネルの重み付けされたまたは重み付けされない和と、それぞれのステレオ・エンコードにかけられた二つのオーディオ・チャネルの間の重み付けされたまたは重み付けされない差とを形成することを含む、
    エンコード方法。
  19. 前記第一、第二、第三および第四のステレオ・エンコードについて、
    左右符号化、和差符号化および向上された和差符号化を含む群から符号化方式を選択し、
    選択された符号化方式に従ってステレオ・エンコードを実行することを含み、
    当該エンコード方法はさらに、
    選択された符号化方式を指示するサイド情報を出力することを含む、
    請求項18記載のエンコード方法。
  20. 前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルに関連付けられた前記オーディオ・チャネルは、前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルである、請求項18または19記載のエンコード方法。
  21. 前記第五の入力オーディオ・チャネルを受領する段階と;
    前記第五の入力オーディオ・チャネルおよび前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルを前記第五のステレオ・エンコードにかける段階とをさらに含み、
    前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルに関連付けられた前記オーディオ・チャネルは前記第五のステレオ・エンコードから帰結する第一のオーディオ・チャネルであり、
    前記第五のステレオ・エンコードから帰結する第二のオーディオ・チャネルが第五の出力オーディオ・チャネルとして出力される、
    請求項18または19記載のエンコード方法。
  22. 第三の対の入力オーディオ・チャネルを受領する段階と;
    前記第一の対の入力オーディオ・チャネルの第二のオーディオ・チャネルおよび前記第三の対の入力オーディオ・チャネルの第一のオーディオ・チャネルを第六のステレオ・エンコードにかける段階と;
    前記第二の対の入力オーディオ・チャネルの第二のオーディオ・チャネルおよび前記第三の対の入力オーディオ・チャネルの第二のオーディオ・チャネルを第七のステレオ・エンコードにかける段階であって、
    前記第六のステレオ・エンコードから帰結する第一のオーディオ・チャネルおよび前記第一の対の入力オーディオ・チャネルの第一のオーディオ・チャネルは前記第一のステレオ・エンコードにかけられ、
    前記第七のステレオ・エンコードから帰結する第一のオーディオ・チャネルおよび前記第二の対の入力チャネルの第一のオーディオ・チャネルは前記第二のステレオ・エンコードにかけられる、段階と;
    前記第六のステレオ・エンコードから帰結する第二のオーディオ・チャネルおよび前記第七のステレオ・エンコードから帰結する第二のオーディオ・チャネルを第八のステレオ・エンコードにかけて第三の対の出力オーディオ・チャネルを得る段階とを含む、
    請求項18ないし21のうちいずれか一項記載のエンコード方法。
  23. 前記第一、第二、第三および第四のステレオ・エンコードならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、左右符号化、和差符号化および向上された和差符号化を含む群からの符号化方式に従ってステレオ・エンコードを実行することを含む、請求項18ないし22のうちいずれか一項記載のエンコード方法。
  24. 異なる周波数帯域について異なる符号化方式が使用される、請求項23記載のエンコード方法。
  25. 異なる時間フレームについて異なる符号化方式が使用される、請求項23または24記載のエンコード方法。
  26. 前記第一、第二、第三および第四ならびに該当する場合には前記第五、第六、第七および第八のステレオ・エンコードは、臨界サンプリングされた修正離散コサイン変換(MDCT)領域において実行される、請求項18ないし25のうちいずれか一項記載のエンコード方法。
  27. すべての入力オーディオ・チャネルが、同じ窓を使ってMDCT領域に変換される、請求項26記載のエンコード方法。
  28. 請求項18ないし27のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
  29. 少なくとも四つのチャネルをもつマルチチャネル・オーディオ・システムにおけるエンコード装置であって、
    第一の対の入力オーディオ・チャネルおよび前記第一の対の入力オーディオ・チャネルとは異なる第二の対の入力オーディオ・チャネルを受領するよう構成された受領コンポーネントと;
    前記第一の対の入力オーディオ・チャネルを第一のステレオ・エンコードにかけるよう構成された第一のステレオ・エンコード・コンポーネントと;
    前記第二の対の入力オーディオ・チャネルを第二のステレオ・エンコードにかけるよう構成された第二のステレオ・エンコード・コンポーネントと;
    前記第一のステレオ・エンコードから帰結する第一のオーディオ・チャネルおよび前記第二のステレオ・エンコードから帰結する第一のオーディオ・チャネルに関連付けられたオーディオ・チャネルを第三のステレオ・エンコードにかけて第一の対の出力オーディオ・チャネルを提供するよう構成された第三のステレオ・エンコード・コンポーネントと;
    前記第一のステレオ・エンコードから帰結する第二のオーディオ・チャネルおよび前記第二のステレオ・エンコードから帰結する第二のオーディオ・チャネルを第四のステレオ・エンコードにかけて前記第一の対の出力オーディオ・チャネルとは異なる第二の対の出力オーディオ・チャネルを得るよう構成された第四のステレオ・エンコード・コンポーネントと;
    前記第一および第二の対の出力オーディオ・チャネルを出力するよう構成された出力コンポーネントとを有しており、
    前記第二のステレオ・エンコードから帰結する第一のオーディオ・チャネルに関連付けられた前記オーディオ・チャネルは、前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルである、または第五の入力オーディオ・チャネルおよび前記第二のステレオ・エンコードから帰結する前記第一のオーディオ・チャネルの第五のステレオ・エンコードから帰結するオーディオ・チャネルであり、
    前記第一、第二、第三および第四のステレオ・エンコードのうち少なくとも二つは、少なくとも一つの周波数帯域および少なくとも一つの時間フレームについて、それぞれのステレオ・エンコードにかけられた二つのオーディオ・チャネルの重み付けされたまたは重み付けされない和と、それぞれのステレオ・エンコードにかけられた二つのオーディオ・チャネルの間の重み付けされたまたは重み付けされない差とを形成することを含む、
    エンコード装置。
  30. 前記第一、第二、第三および第四のステレオ・エンコード・コンポーネントについて、
    左右符号化、和差符号化および向上された和差符号化を含む群から符号化方式を選択し、
    選択された符号化方式に従ってステレオ・エンコードを実行するよう構成されており、
    当該エンコード装置はさらに、
    選択された符号化方式を指示するサイド情報を出力するよう構成されている、
    請求項29記載のエンコード装置。
  31. 請求項30記載のエンコード装置を有するオーディオ・システム。
  32. 請求項2記載の方法であって、前記マルチチャネル・オーディオ・システムの前記少なくとも四つのチャネルは複数の構成に基づいて異なるグループに分割可能であり、各グループはジョイント・エンコードされるオーディオ・チャネルに対応し、前記サイド情報は、デコードするときに適用されるべき前記複数の構成の一つを指示する少なくとも二つのビットを有し、それぞれのステレオ・デコードの符号化方式は指示された構成に従って選択される、方法。
  33. 請求項19記載の方法であって、前記マルチチャネル・オーディオ・システムの前記少なくとも四つのチャネルは複数の構成に基づいて異なるグループに分割可能であり、各グループはジョイント・エンコードされるオーディオ・チャネルに対応し、当該方法は、前記複数の構成の一つを選択することを含み、それぞれのステレオ・エンコードの符号化方式は選択された構成に従って選択され、前記サイド情報は選択された構成を指示する少なくとも二つのビットを有する、方法。
  34. 前記少なくとも二つのビットは、前記複数の構成の一つの構成を、前記複数の構成の前記一つの構成の識別番号を指示することによって指示する、請求項32または33記載の方法。
  35. 前記マルチチャネル・オーディオ・システムは五つのオーディオ・チャネルを含み、前記複数の構成は、
    五つのオーディオ・チャネルのジョイント符号化;
    四つのオーディオ・チャネルのジョイント符号化および最後のオーディオ・チャネルの別個の符号化;
    三つのオーディオ・チャネルのジョイント符号化および他の二つのオーディオ・チャネルの別個のジョイント符号化;および
    二つのオーディオ・チャネルのジョイント符号化、他の二つのオーディオ・チャネルの別個のジョイント符号化および最後のオーディオ・チャネルの別個の符号化
    に対応する、請求項32ないし34のうちいずれか一項記載の方法。
  36. 前記少なくとも二つのビットが二つのオーディオ・チャネルのジョイント符号化、他の二つのオーディオ・チャネルの別個のジョイント符号化および最後のオーディオ・チャネルの別個の符号化を指示する場合、前記少なくとも二つのビットは、どの二つのオーディオ・チャネルがジョイント符号化されるべきで、どの他の二つのオーディオ・チャネルがジョイント符号化されるべきかを指示するビットを含む、請求項35記載の方法。
JP2016541902A 2013-09-12 2014-09-08 ジョイント・マルチチャネル符号化のための方法および装置 Active JP6219527B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361877189P 2013-09-12 2013-09-12
US61/877,189 2013-09-12
PCT/EP2014/069043 WO2015036351A1 (en) 2013-09-12 2014-09-08 Methods and devices for joint multichannel coding

Publications (2)

Publication Number Publication Date
JP2016535316A JP2016535316A (ja) 2016-11-10
JP6219527B2 true JP6219527B2 (ja) 2017-10-25

Family

ID=51492966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016541902A Active JP6219527B2 (ja) 2013-09-12 2014-09-08 ジョイント・マルチチャネル符号化のための方法および装置

Country Status (23)

Country Link
US (6) US9761231B2 (ja)
EP (4) EP3330963B1 (ja)
JP (1) JP6219527B2 (ja)
KR (1) KR101777626B1 (ja)
CN (7) CN117612541A (ja)
AR (2) AR097627A1 (ja)
AU (1) AU2014320540B2 (ja)
BR (1) BR112016004674B1 (ja)
CA (1) CA2920963C (ja)
DK (1) DK3044785T3 (ja)
ES (1) ES2657316T3 (ja)
HK (3) HK1217565A1 (ja)
HU (1) HUE035582T2 (ja)
IL (1) IL243959A (ja)
MX (1) MX354658B (ja)
MY (1) MY179475A (ja)
NO (1) NO2993357T3 (ja)
PL (1) PL3044785T3 (ja)
RU (1) RU2653285C2 (ja)
SG (2) SG11201600827VA (ja)
TW (5) TWI671734B (ja)
UA (1) UA115928C2 (ja)
WO (1) WO2015036351A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6392353B2 (ja) 2013-09-12 2018-09-19 ドルビー・インターナショナル・アーベー マルチチャネル・オーディオ・コンテンツの符号化
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
DK3353779T3 (da) 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
CN109219847B (zh) * 2016-06-01 2023-07-25 杜比国际公司 将多声道音频内容转换成基于对象的音频内容的方法及用于处理具有空间位置的音频内容的方法
CN106710600B (zh) * 2016-12-16 2020-02-04 广州广晟数码技术有限公司 多声道音频信号的去相关编码方法和装置
TWI634549B (zh) * 2017-08-24 2018-09-01 瑞昱半導體股份有限公司 音訊強化裝置及方法
EP4336497A3 (en) * 2018-07-04 2024-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multisignal encoder, multisignal decoder, and related methods using signal whitening or signal post processing
US11172477B2 (en) * 2018-11-02 2021-11-09 Qualcomm Incorproated Multi-transport block scheduling
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19721487A1 (de) * 1997-05-23 1998-11-26 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen
SE519552C2 (sv) 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
KR100981699B1 (ko) * 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
CN1922654A (zh) * 2004-02-17 2007-02-28 皇家飞利浦电子股份有限公司 音频分发系统、音频编码器、音频解码器及其操作方法
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
DE112006001825T5 (de) 2005-07-08 2008-05-21 Matsushita Electric Industrial Co., Ltd., Kadoma Elektronikbauteilmontagevorrichtung, Höhenerfassungsverfahren für elektronische Bauteile, und Optikachsenanpassungsverfahren für eine Bauteilhöhenerfassungseinheit
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
ES2374309T3 (es) * 2005-07-14 2012-02-15 Koninklijke Philips Electronics N.V. Decodificación de audio.
KR101356586B1 (ko) * 2005-07-19 2014-02-11 코닌클리케 필립스 엔.브이. 다중 채널 오디오 신호를 생성하기 위한 디코더, 수신기 및 방법
AU2006285538B2 (en) * 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
BRPI0707969B1 (pt) * 2006-02-21 2020-01-21 Koninklijke Philips Electonics N V codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
US8126152B2 (en) 2006-03-28 2012-02-28 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
KR100829560B1 (ko) * 2006-08-09 2008-05-14 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
DE102007017254B4 (de) 2006-11-16 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Kodieren und Dekodieren
EP2102858A4 (en) 2006-12-07 2010-01-20 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
KR101450940B1 (ko) 2007-09-19 2014-10-15 텔레폰악티에볼라겟엘엠에릭슨(펍) 멀티채널 오디오의 조인트 인핸스먼트
BRPI0816556A2 (pt) 2007-10-17 2019-03-06 Fraunhofer Ges Zur Foerderung Der Angewandten Forsschung E V codificação de áudio usando downmix
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
CN101582259B (zh) * 2008-05-13 2012-05-09 华为技术有限公司 立体声信号编解码方法、装置及编解码系统
ATE557386T1 (de) * 2008-06-26 2012-05-15 France Telecom Raumsynthese mehrkanaliger tonsignale
CN102257562B (zh) 2008-12-19 2013-09-11 杜比国际公司 用空间线索参数对多通道音频信号应用混响的方法和装置
AU2013206557B2 (en) * 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
EP2535892B1 (en) 2009-06-24 2014-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
CN102656627B (zh) 2009-12-16 2014-04-30 诺基亚公司 多信道音频处理方法和装置
US9313598B2 (en) * 2010-03-02 2016-04-12 Nokia Technologies Oy Method and apparatus for stereo to five channel upmix
ES2950751T3 (es) * 2010-04-13 2023-10-13 Fraunhofer Ges Forschung Codificador de audio o vídeo, decodificador de audio o vídeo y métodos relacionados para procesar señales de audio o vídeo multicanal usando una dirección de predicción variable
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
EP2676270B1 (en) * 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
KR101748760B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
US9537306B2 (en) 2015-02-12 2017-01-03 Taiwan Semiconductor Manufacturing Company Limited ESD protection system utilizing gate-floating scheme and control circuit thereof

Also Published As

Publication number Publication date
CN110189758B (zh) 2024-01-02
CN110189759A (zh) 2019-08-30
TW202322101A (zh) 2023-06-01
US10497377B2 (en) 2019-12-03
EP3044785A1 (en) 2016-07-20
US20180366132A1 (en) 2018-12-20
RU2016113712A (ru) 2017-10-17
HK1221063A1 (zh) 2017-05-19
US9761231B2 (en) 2017-09-12
EP4339944A3 (en) 2024-05-29
US20220335957A1 (en) 2022-10-20
SG10201807851YA (en) 2018-10-30
TWI774136B (zh) 2022-08-11
CN117636886A (zh) 2024-03-01
US11380336B2 (en) 2022-07-05
IL243959A0 (en) 2016-04-21
CN110189759B (zh) 2023-05-23
UA115928C2 (uk) 2018-01-10
TW202018699A (zh) 2020-05-16
ES2657316T3 (es) 2018-03-02
WO2015036351A1 (en) 2015-03-19
EP3330963B1 (en) 2021-11-03
KR101777626B1 (ko) 2017-09-13
EP4339944A2 (en) 2024-03-20
JP2016535316A (ja) 2016-11-10
EP3989221A1 (en) 2022-04-27
CN117612541A (zh) 2024-02-27
US20160217797A1 (en) 2016-07-28
US20240062765A1 (en) 2024-02-22
TWI713018B (zh) 2020-12-11
TW202113806A (zh) 2021-04-01
IL243959A (en) 2016-10-31
TWI634547B (zh) 2018-09-01
US20170309281A1 (en) 2017-10-26
MX2016002885A (es) 2016-07-26
BR112016004674B1 (pt) 2023-02-23
DK3044785T3 (en) 2018-02-05
MY179475A (en) 2020-11-07
HK1248911A1 (zh) 2018-10-19
US11749288B2 (en) 2023-09-05
CN110176240A (zh) 2019-08-27
US10083701B2 (en) 2018-09-25
AU2014320540A1 (en) 2016-02-18
TW201905899A (zh) 2019-02-01
EP3330963A1 (en) 2018-06-06
MX354658B (es) 2018-03-14
AR115788A2 (es) 2021-02-24
EP3989221B1 (en) 2023-11-29
BR112016004674A2 (ja) 2017-08-01
CA2920963A1 (en) 2015-03-19
CN117558282A (zh) 2024-02-13
TWI671734B (zh) 2019-09-11
EP3044785B1 (en) 2017-12-13
SG11201600827VA (en) 2016-03-30
AR097627A1 (es) 2016-04-06
NO2993357T3 (ja) 2018-07-21
CA2920963C (en) 2018-03-13
RU2653285C2 (ru) 2018-05-07
TW201528253A (zh) 2015-07-16
US20200066282A1 (en) 2020-02-27
CN105531760B (zh) 2019-07-16
HK1217565A1 (zh) 2017-01-13
KR20160042104A (ko) 2016-04-18
CN105531760A (zh) 2016-04-27
AU2014320540B2 (en) 2017-09-28
PL3044785T3 (pl) 2018-04-30
CN110176240B (zh) 2023-12-29
HUE035582T2 (en) 2018-05-28
CN110189758A (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
JP6219527B2 (ja) ジョイント・マルチチャネル符号化のための方法および装置
JP2018146975A (ja) マルチチャネル・オーディオ・コンテンツの符号化

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170927

R150 Certificate of patent or registration of utility model

Ref document number: 6219527

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250