JP5097702B2

JP5097702B2 - オーディオエンコード及びデコード

Info

Publication number: JP5097702B2
Application number: JP2008521009A
Authority: JP
Inventors: エリックジーピースハイゥイェルス; ヘラルトエイチホト; ハイコプルンハーゲン; ヴォルフガンクエイシルドバッハ; ホルゲルホーリッヒ; ハンスエムケイキョーリング; カールジェイローデーン
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2005-07-14
Filing date: 2006-07-07
Publication date: 2012-12-12
Anticipated expiration: 2026-07-07
Also published as: RU2010137467A; EP2088580B1; CN101223575B; EP2088580A3; PL2088580T3; CN101223575A; JP5269039B2; MX2008000504A; EP1902443B1; ATE433182T1; CN102013256A; US20080255856A1; DE602006007139D1; JP2011059711A; EP2088580A2; RU2418385C2; KR20080037672A; WO2007007263A3; CN102013256B; KR20100134084A

Description

本発明は、階層型エンコード構造及び／又は階層型デコーダ構造を用いたオーディオエンコード及び／又はデコードに関する。

オーディオ処理の分野においては、幾つかのオーディオチャネルを、他のより多くのオーディオチャネルに変換することは良く知られている。斯かる変換は、種々の理由により実行され得る。例えば、オーディオ信号は、改善されたユーザの経験を提供するために、他のフォーマットへと変換され得る。例えば伝統的なステレオ記録は２個のチャネルのみを有していたが、近年の高度なオーディオシステムは一般に、普及している５．１サランウド音声システムにおけるように、５又は６個のチャネルを利用する。従って、該高度なオーディオシステムを十分に利用するため、２個のステレオチャネルは５又は６個のチャネルへと変換され得る。

チャネル変換の他の理由は、符号化効率である。例えばステレオオーディオ信号は、オーディオ信号の空間的特性を記述するパラメータビットストリームと結合された単一チャネルのオーディオ信号としてエンコードされ得ることが分かっている。デコーダは、非常に十分な精度でステレオオーディオ信号を再生することができる。このようにして、かなりのビットレートの削減が得られる。

オーディオ信号の空間的特性を記述するために利用され得る、幾つかのパラメータがある。斯かるパラメータの１つはチャネル間の相互相関であり、例えばステレオ信号においては左チャネルと右チャネルとの間の相互相関である。他のパラメータは、チャネルのパワー比である。所謂（パラメトリック）空間オーディオ符号化器（エンコーダ）においては、これら及びその他のパラメータは、例えば１つだけのチャネルのような、減少された数のチャネルと、それに加えて元のオーディオ信号の空間的特性を記述するパラメータのセットとを持つオーディオ信号を生成するため、元のオーディオ信号から抽出される。所謂（パラメトリック）空間オーディオデコーダにおいて、元のオーディオ信号が復元される。

空間オーディオ符号化（Spatial Audio Coding）は、多チャネルのオーディオマテリアルを効率的に符号化するための、近年導入された手法である。空間オーディオ符号化においては、Ｍチャネルのオーディオ信号が、Ｎチャネルオーディオ信号及び対応する空間パラメータのセットとして記述される。ここでＮは一般にＭより小さい。それ故空間オーディオエンコーダにおいては、Ｍチャネルの信号がＮチャネルの信号へとダウンミックス（down-mix）され、空間パラメータが抽出される。デコーダにおいて、Ｎチャネル信号と空間パラメータとが、Ｍチャネル信号を（知覚的に）復元するために利用される。

斯かる空間オーディオ符号化は好ましくは、エンコーダ及びデコーダにおいて標準的なユニットを有する縦続接続された又は木ベースの階層構造を利用する。エンコーダにおいて、これらの標準的なユニットは、チャネルを組み合わせてより少ない数のチャネルとするダウンミクサ（例えば２つから１つへ（２−１）、３つから１つへ（３−１）、３つから２つへ（３−２）等のダウンミクサ）であっても良い。一方デコーダにおいては、対応する標準的なユニットは、チャネルをより多い数のチャネルへと分割するアップミクサ（例えば１つから２つへ（１−２）、２つから３つへ（２−３）のアップミクサ）であっても良い。

しかしながら、斯かる方法の問題点は、デコーダ構造がエンコーダの構造と合致する必要がある点である。このことは標準化されたエンコーダ及びデコーダの使用により実現され得るが、斯かる方法は柔軟性を欠き、最適ではない性能に帰着する傾向がある。

それ故、改善されたシステムが有利となり得、とりわけ増大された柔軟性、低減された複雑さ及び／又は改善された性能を可能とするシステムが有利となり得る。

従って、本発明の目的は、上述した不利点のうち１つ以上を、単独で又はいずれかの組み合わせで、好適に軽減、緩和又は除去することにある。

本発明の第１の態様によれば、幾つかの出力オーディオチャネルを生成するための装置であって、前記装置は、幾つかの入力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを受信するための手段を有し、前記データストリームは更に、階層型デコーダ構造についてのデコーダ木構造データを有し、前記デコーダ木構造データは、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有し、前記装置は更に、前記デコーダ木構造データに応じて前記階層型デコーダ構造を生成するための手段と、前記階層型デコーダ構造を利用して前記データストリームから前記幾つかの出力オーディオチャネルを生成するための手段と、を有する装置が提供される。

本発明は、オーディオチャネルの柔軟な生成を可能とし、とりわけデコーダ機能がデータストリームを生成するために利用されるエンコーダ構造に適応することを可能し得る。本発明は例えば、エンコーダが多チャネル信号のための適切なエンコード手法を選択することを可能とし、また本装置がそれに自動的に適応することを可能とし得る。本発明は、データストリームが改善された品質−ビットレート比を持つことを可能とし得る。とりわけ本発明は、自動適応及び／又は高度な柔軟性を可能とし、一方で階層型エンコード／デコード構造により達成可能な改善されたオーディオ品質を提供し得る。本発明は更に、階層型デコーダ構造の情報の効率的な通信を可能とし得る。具体的には本発明は、デコーダ木構造データについての低いオーバヘッドを可能とし得る。本発明は、受信されたビットストリームに自動的に適応し、いずれかの適切な階層型エンコード構造を用いて利用され得る装置を提供し得る。

各オーディオチャネルは、個々のオーディオ信号をサポートし得る。データストリームは、単一のビットストリームであっても良いし、又は例えば種々の分散チャネルに分散させられた複数のサブビットストリームの組み合わせであっても良い。データストリームは、所与のサイズのデータファイルに対応する一定の継続時間のような、制限された継続時間を持ち得る。チャネル分割特性は、或る階層において所与のオーディオチャネルが幾つのチャネルに分割されるかを示す特性であり得る。例えば、チャネル分割特性は、所与のオーディオチャネルが分割されないか否か、又は２つのオーディオチャネルに分割されるか否かを反映し得る。

デコーダ木構造データは、複数のオーディオチャネルの階層型デコーダ構造のためのデータを有し得る。具体的には、デコーダ木構造データは、幾つかの入力オーディオチャネルのそれぞれについてのデータのセットを有し得る。例えば、デコーダ木構造データは、各入力信号について、デコーダ木構造のためのデータを有し得る。

本発明の任意の特徴によれば、前記デコーダ木構造データは複数のデータ値を有し、各前記データ値は、前記階層型デコーダ構造の１つの階層における１つのチャネルについてのチャネル分割特性を示す。

このことは、データの本装置がデータストリームのために利用されるエンコードに適応することを可能とする。デコーダ木構造データは特に、階層型デコーダ構造における各チャネル分割機能について１つのデータ値を有し得る。デコーダ木構造データはまた、所与の階層の信号について、更なるチャネル分割が発生しないことを示す１つのデータ値を、各出力チャネルについて有し得る。

本発明の任意の特徴によれば、所定の前記データ値が、前記階層において前記チャネルについてのチャネル分割がないことを示す。

このことは、データの効率的な通信を提供し、本装置がデータストリームのために利用されるエンコードに効果的且つ信頼性高く適応することを可能とする。

本発明の任意の特徴によれば、所定の前記データ値が、前記階層における前記チャネルについての１つから２つへのチャネル分割を示す。

このことは、データの効率的な通信を提供し、本装置がデータストリームのために利用されるエンコードに効果的且つ信頼性高く適応することを可能とする。とりわけ、このことは、低い複雑さを持つ標準的なチャネル分割機能を利用する多くの階層型システムに対して、非常に効率的な情報伝送を可能とし得る。

本発明の任意の特徴によれば、前記複数のデータ値はバイナリデータ値である。

このことは、データの効率的な通信を提供し、本装置がデータストリームのために利用されるエンコードに効果的且つ信頼性高く適応することを可能とする。とりわけ、このことは、１つからつ２への（１−２）チャネル分割機能のような特定のチャネル分割機能を主に利用するシステムに対して、非常に効率的な情報伝送を可能とし得る。

本発明の任意の特徴によれば、一方の所定の前記バイナリデータ値が１つから２つへのチャネル分割を示し、他方の所定のバイナリデータ値がチャネル分割がないことを示す。

このことは、データの効率的な通信を提供し、本装置がデータストリームのために利用されるエンコードに効果的且つ信頼性高く適応することを可能とする。とりわけ、このことは、低い複雑さを持つ１−２チャネル分割機能に基づくシステムに対して、非常に効率的な情報伝送を可能とし得る。低い複雑さを持つデータに応答して生成され得る低い複雑さを持つ階層型デコーダ構造により、効率的なデコードが達成され得る。該特徴は、デコーダ木構造データの通信についての低いオーバヘッドを可能とし得、単純なエンコード機能によりエンコードされるデータストリームに対して特に適したものであり得る。

本発明の任意の特徴によれば、前記データストリームは更に、入力チャネルの数のインジケータを有する。

このことは、デコード及びデコード構造の生成を容易化し得、及び／又はデコーダ木構造データにおける階層型デコーダ構造の情報のより効率的なエンコードを可能とし得る。とりわけ、階層型デコーダ構造を生成するための手段は、入力チャネルの数のインジケータに応じてこのことを為しても良い。例えば、多くの実際の状況においては入力チャネルの数はデータストリームから導出され得るが、幾つかの実際の場合において、オーディオデータとパラメータデータとが分離されている場合がある。斯かる場合においては、データストリームデータが操作されている（例えばステレオからモノラルへとダウンミックスされている）場合があるため、入力チャネルの数が既知であることが有利となり得る。

本発明の任意の特徴によれば、前記データストリームは更に、出力チャネルの数のインジケータを有する。

このことは、デコード及びデコード構造の生成を容易化し得、及び／又はデコーダ木構造データにおける階層型デコーダ構造の情報のより効率的なエンコードを可能とし得る。とりわけ、階層型デコーダ構造を生成するための手段は、出力チャネルの数のインジケータに応じてこのことを為しても良い。また該インジケータは、デコーダ木構造データの誤りチェックとして利用されても良い。

本発明の任意の特徴によれば、前記データストリームは更に、前記階層型デコーダ構造における幾つかの１つから２つへのチャネル分割機能のインジケータを有する。

このことは、デコード及びデコード構造の生成を容易化し得、及び／又はデコーダ木構造データにおける階層型デコーダ構造の情報のより効率的なエンコードを可能とし得る。とりわけ、階層型デコーダ構造を生成するための手段は、階層型デコーダ構造における１−２チャネル分割機能の数のインジケータに応じてこのことを為しても良い。

本発明の任意の特徴によれば、前記データストリームは更に、前記階層型デコーダ構造における幾つかの２つから３つへのチャネル分割機能のインジケータを有する。

このことは、デコード及びデコード構造の生成を容易化し得、及び／又はデコーダ木構造データにおける階層型デコーダ構造の情報のより効率的なエンコードを可能とし得る。とりわけ、階層型のデコーダ構造を生成するための手段は、階層型デコーダ構造における２−３チャネル分割機能の数のインジケータに応じてこのことを為しても良い。

本発明の任意の特徴によれば、前記デコーダ木構造データは、２つから３つへのチャネル分割機能の存在に応じて順序付けられた複数のデコーダ木構造についてのデータを有する。

このことは、デコード及びデコード構造の生成を容易化し得、及び／又はデコーダ木構造データにおける階層型デコーダ構造の情報のより効率的なエンコードを可能とし得る。とりわけ本特徴は、２−３チャネル分割がルートの層においてのみ発生し得るシステムにおいて有利な性能を可能とし得る。例えば、階層型デコーダ構造を生成するための手段は最初に、２つの入力チャネルに対する２−３チャネル分割機能を生成し、１−２チャネル分割機能のみを利用する残りの構造の生成が後続しても良い。該残りの構造は特に、バイナリのデコーダ木構造データに応じて生成されても良く、かくして必要とされるビットレートを低減しても良い。データストリームは更に、複数のデコーダ木構造の順序の情報を含んでも良い。

本発明の任意の特徴によれば、少なくとも１つの入力チャネルについての前記デコーダ木構造データは、２つから３つへのチャネル分割機能がルート層に存在することを示すインジケータを有し、該インジケータはバイナリデータに後続され、各前記バイナリデータの値は、分割機能がないことか又は２つから３つへの分割機能の従属する層についての１つから２つへのチャネル分割機能を示す。

このことは、デコード及びデコード構造の生成を容易化し得、及び／又はデコーダ木構造データにおける階層型デコーダ構造の情報のより効率的なエンコードを可能とし得る。とりわけ本特徴は、２−３チャネル分割がルートの層においてのみ発生し得るシステムにおいて有利な性能を可能とし得る。例えば、階層型デコーダ構造を生成するための手段は最初に、１つの入力チャネルに対する２−３チャネル分割機能を生成し、１−２チャネル分割機能のみを利用した残りの構造の生成が後続しても良い。該残りの構造は特に、バイナリのデコーダ木構造データに応じて生成されても良く、かくして必要とされるビットレートを低減しても良い。データストリームは更に、複数のデコーダ木構造の順序の情報を含んでも良い。

本発明の任意の特徴によれば、前記データストリームは更に、少なくとも１つの前記出力チャネルについてのラウドスピーカ位置のインジケータを有する。

このことは容易化されたデコードを可能とし得、また改善された性能及び／又は本装置の適応を提供し得、かくして増大させられた柔軟性を提供し得る。

本発明の任意の特徴によれば、前記階層型デコーダ構造を生成するための手段は、前記デコーダ木構造データに応じて、前記階層のチャネル分割機能についての乗算パラメータを決定するように構成された。

このことは、改善された性能及び／又は改善された適応／柔軟性を可能とし得る。とりわけ、本特徴は、階層型デコーダ構造のみならず、チャネル分割機能の動作もが、受信されたデータストリームに適応することを可能とし得る。乗算パラメータは、行列乗算パラメータであっても良い。

本発明の任意の特徴によれば、前記デコーダ木構造は、少なくとも１つの階層における少なくとも１つのチャネル分割機能を有し、前記少なくとも１つのチャネル分割機能は、前記データストリームのオーディオ入力チャネルから非相関信号を直接に生成するための非相関手段と、より高い階層からのオーディオチャネル及び前記非相関信号から、複数の階層出力チャネルを生成するための少なくとも１つのチャネル分割ユニットと、前記デコーダ木構造データに応じて、非相関フィルタ又は前記チャネル分割ユニットの少なくとも１つの特性を決定するための手段と、を有する。

このことは、改善された性能及び／又は改善された適応／柔軟性を可能とし得る。とりわけ、本特徴は、改善されたデコード性能を持ち、増大させられたオーディオ品質を持つ出力チャネルを生成し得る、階層型デコーダ構造を可能とし得る。とりわけ、縦続接続された非相関フィルタにより非相関信号が生成されない階層型デコーダ構造が達成され得、受信されたデータストリームに対して動的且つ自動的に適応され得る。

非相関フィルタは、変更のない、特にいずれの先行する信号のフィルタリング（他の非相関フィルタによるもののような）のない、データストリームのオーディオ入力チャネルを受信する。非相関フィルタの利得は特に、デコーダ木構造データに応じて決定されても良い。

本発明の任意の特徴によれば、前記非相関手段は、前記オーディオ入力チャネルに対してオーディオレベル補償を実行してレベル補償されたオーディオ信号を生成するためのレベル補償手段と、前記レベル補償されたオーディオ信号をフィルタリングして非相関信号を生成するための非相関フィルタと、を有する。

このことは、改善された品質及び／又は容易化された実装を可能とし得る。

本発明の任意の特徴によれば、前記レベル補償手段は、プリ行列による行列乗算を有する。このことは、効率的な実装を可能とし得る。

本発明の任意の特徴によれば、前記プリ行列の係数は、１−２チャネル分割機能のみを有する階層型デコーダ構造についての少なくとも１つの１の値を持つ。

このことは複雑さを低減し、効率的な実装を可能とし得る。階層型デコーダ構造は１−２チャネル分割機能の他の機能を有し得るが、本特徴により、他のチャネル分割機能は有さないこととなる。

本発明の任意の特徴によれば、本装置は更に、より高い階層におけるチャネル分割機能のパラメータに応じて、少なくとも１つの階層における少なくとも１つのチャネル分割機能についてのプリ行列を決定するための手段を有する。

このことは、効率的な実装及び／又は改善された性能を可能とし得る。より高い階層におけるチャネル分割機能は、例えばデコーダ木構造のルート層に位置する、２−３チャネル分割機能を含み得る。

本発明の任意の特徴によれば、本装置は更に、少なくとも１つの階層における少なくとも１つのチャネル分割機能のパラメータに応じて、前記少なくとも１つのチャネル分割機能についてのチャネル分割行列を決定するための手段を有する。

このことは、効率的な実装及び／又は改善された性能を可能とし得る。このことは、１−２チャネル分割機能のみを有する階層型デコーダ木構造に対して、特に有利であり得る。

本発明の任意の特徴によれば、本装置は更に、より高い階層の２つから３つへのチャネル分割機能のパラメータに応じて、少なくとも１つの階層における少なくとも１つのチャネル分割機能についてのプリ行列を決定するための手段を有する。

このことは、効率的な実装及び／又は改善された性能を可能とし得る。このことは、デコーダ木構造のルート層において２−３チャネル分割機能を有する階層型デコーダ木構造に対して、特に有利であり得る。

本発明の任意の特徴によれば、前記プリ行列を決定するための手段は、２つから３つへのアップミクサの第１の入力に対応する第１のサブプリ行列及び前記２つから３つへのアップミクサの第２の入力に対応する第２のサブプリ行列の決定に応じて、少なくとも１つのチャネル分割機能についてのプリ行列を決定するように構成される。

本発明の他の態様によれば、幾つかの出力オーディオチャネルを有するデータストリームを生成するための装置であって、幾つかの入力オーディオチャネルを受信するための手段と、前記幾つかの入力オーディオチャネルをパラメトリックにエンコードし、前記幾つかの出力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを生成するための階層型エンコード手段と、前記階層型エンコード手段に対応する階層型デコーダ構造を決定するための手段と、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、前記データストリームに含めるための手段と、を有する装置が提供される。

本発明の他の態様によれば、幾つかのエンコードされたオーディオチャネルと、パラメトリックオーディオデータと、階層型デコーダ構造についてのデコーダ木構造データと、を有し、前記デコーダ木構造データは、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有する、データストリームが提供される。

本発明の他の態様によれば、上述したような信号が保存された記憶媒体が提供される。

本発明の他の態様によれば、幾つかの出力オーディオチャネルを生成する方法であって、前記方法は、幾つかの入力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを受信するステップを有し、前記データストリームは更に、階層型デコーダ構造についてのデコーダ木構造データを有し、前記デコーダ木構造データは、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有し、前記方法は更に、前記デコーダ木構造データに応じて前記階層型デコーダ構造を生成するステップと、前記階層型デコーダ構造を利用して前記データストリームから前記幾つかの出力オーディオチャネルを生成するステップと、を有する方法が提供される。

本発明の他の態様によれば、幾つかの出力オーディオチャネルを有するデータストリームを生成する方法であって、幾つかの入力オーディオチャネルを受信するステップと、前記幾つかの入力オーディオチャネルをパラメトリックにエンコードし、前記幾つかの出力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを生成するステップと、前記階層型エンコード手段に対応する階層型デコーダ構造を決定するステップと、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、前記データストリームに含めるステップと、を有する方法が提供される。

本発明の他の態様によれば、幾つかの出力オーディオチャネルを生成するための受信器であって、前記受信器は、幾つかの入力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを受信するための手段を有し、前記データストリームは更に、階層型デコーダ構造についてのデコーダ木構造データを有し、前記デコーダ木構造データは、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有し、前記受信器は更に、前記デコーダ木構造データに応じて前記階層型デコーダ構造を生成するための手段と、前記階層型デコーダ構造を利用して前記データストリームから前記幾つかの出力オーディオチャネルを生成するための手段と、を有する受信器が提供される。

本発明の他の態様によれば、幾つかの出力オーディオチャネルを有するデータストリームを生成するための送信器であって、幾つかの入力オーディオチャネルを受信するための手段と、前記幾つかの入力オーディオチャネルをパラメトリックにエンコードし、前記幾つかの出力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを生成するための階層型エンコード手段と、前記階層型エンコード手段に対応する階層型デコーダ構造を決定するための手段と、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、前記データストリームに含めるための手段と、を有する送信器が提供される。

本発明の他の態様によれば、データストリームを生成するための送信器と、幾つかの出力オーディオチャネルを生成するための受信器とを有する伝送システムであって、前記送信器は、幾つかの入力オーディオチャネルを受信するための手段と、前記幾つかの入力オーディオチャネルをパラメトリックにエンコードし、前記幾つかの出力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを生成するための階層型エンコード手段と、前記階層型エンコード手段に対応する階層型デコーダ構造を決定するための手段と、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、前記データストリームに含めるための手段と、前記データストリームを前記受信器に送信するための手段と、を有し、前記受信器は、前記データストリームを受信するための手段と、前記デコーダ木構造データに応じて前記階層型デコーダ構造を生成するための手段と、前記階層型デコーダ構造を利用して前記データストリームから前記幾つかの出力オーディオチャネルを生成するための手段と、を有する伝送システムが提供される。

本発明の他の態様によれば、データストリームを受信する方法であって、前記方法は、幾つかの入力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを受信するステップを有し、前記データストリームは更に、階層型デコーダ構造についてのデコーダ木構造データを有し、前記デコーダ木構造データは、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有し、前記方法は更に、前記デコーダ木構造データに応じて前記階層型デコーダ構造を生成するステップと、前記階層型デコーダ構造を利用して前記データストリームから前記幾つかの出力オーディオチャネルを生成するステップと、を有する方法が提供される。

本発明の他の態様によれば、幾つかの出力オーディオチャネルを有するデータストリームを送信する方法であって、幾つかの入力オーディオチャネルを受信するステップと、前記幾つかの入力オーディオチャネルをパラメトリックにエンコードし、前記幾つかの出力オーディオチャネル及びパラメトリックオーディオデータを有するデータストリームを生成するステップと、前記階層型エンコード手段に対応する階層型デコーダ構造を決定するステップと、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、前記データストリームに含めるステップと、前記データストリームを送信するステップと、を有する方法が提供される。

本発明の他の態様によれば、上述した方法のいずれかを実行するためのコンピュータプログラムが提供される。

本発明の他の態様によれば、上述した装置を有するオーディオ再生装置が提供される。

本発明の他の態様によれば、上述した装置を有するオーディオ記録装置が提供される。

本発明のこれらの及び他の態様、特徴及び利点は、以下に説明される実施例を参照しながら説明され明らかとなるであろう。

本発明の実施例は、添付図面を参照しながら、単に例として以下に説明される。

以下の説明は、幾つかの低い複雑さを持つチャネルダウンミクサ及びアップミクサを利用する、多チャネルオーディオ信号のエンコード及びデコードに適用可能な本発明の実施例に焦点を当てる。しかしながら、本発明は当該用途に限定されるものではない。ダウンミクサは、幾つかのオーディオチャネルを組み合わせて、より少ない数のオーディオチャネル及び付加的なパラメトリックデータとするように構成され、アップミクサは、より少ない数のオーディオチャネル及びパラメトリックデータから、幾つかのオーディオチャネルを生成するように構成されることは、当業者には理解されるであろう。かくして、アップミクサはチャネル分割機能を提供する。

図１は、本発明の幾つかの実施例によるオーディオ信号の通信のための伝送システム１００を示す。伝送システム１００は、とりわけインターネットであっても良いネットワーク１０５を通して受信器１０３に結合された、送信器１０１を有する。

本例においては、送信器１０１は信号記録装置であり、受信器は信号再生装置１０３であるが、他の実施例においては送信器及び受信器は他の用途で及び他の目的のために利用され得ることは理解されるであろう。例えば、送信器１０１及び／又は受信器１００３はトランスコード機能の一部であっても良く、例えば他の信号源又は送信先へのインタフェースを提供しても良い。

信号記録機能がサポートされる本例においては、送信器１０１はアナログ信号を受信するディジタイザ１０７を有し、該アナログ信号は、サンプリング及びアナログ−ディジタル変換によりディジタルＰＣＭ信号に変換される。

送信器１０１は図１のエンコーダ１０９に結合され、エンコーダ１０９はエンコードアルゴリズムに従ってＰＣＭ信号をエンコードする。エンコーダ１０９はネットワーク送信器１１１に結合され、ネットワーク送信器１１１はエンコードされた信号を受信しインターネット１０５へとインタフェース接続する。該ネットワーク送信器は、インターネット１０５を通して、エンコードされた信号を受信器１０３へと送信し得る。

受信器１０３はネットワーク受信器１１３を有し、ネットワーク受信器１１３はインターネット１０５にインタフェース接続し、エンコードされた信号を送信器１０１から受信するように構成される。

ネットワーク受信器１１３は、デコーダ１１５に結合される。デコーダ１１５は、エンコードされた信号を受信し、該信号をデコードアルゴリズムに従ってデコードする。

信号再生機能がサポートされる本例においては、受信器１０３は更に信号再生器１１７を有する。信号再生器１１７は、デコーダ１１５からデコードされたオーディオ信号を受信し、該信号をユーザに提示する。具体的には、信号再生器１１７は、ディジタル−アナログ変換器、増幅器、及びデコードされたオーディオ信号を出力するためのスピーカを必要に応じて有する。

図１の例において、エンコーダ１０９及びデコーダ１１５は、小型の構造ブロックから成る縦続接続された又は木ベースの構造を利用する。エンコード１０９はかくして階層型エンコード構造を利用し、ここでオーディオチャネルは該階層構造における種々の層において漸進的に処理される。斯かる構造は、高いオーディオ品質を持ち、更にエンコーダ１０９の低い複雑さ及び実装の容易性を伴う、特に有利なエンコードに導き得る。

図２は、本発明の幾つかの実施例において利用され得る階層型エンコーダ構造の例を示す。

本例において、エンコーダ１０９は、左前（ｌ_ｆ）、左サラウンド（ｌ_ｓ）、右前（ｒ_ｆ）、右サラウンド（ｒ_ｓ）、中央（Ｃ_０）及びサブウーファ又は低周波強調（ｌｆｅ）信号から成る、５．１チャネルサラウンド音声入力信号をエンコードする。該チャネルは最初に、セグメント化ブロック２０１においてセグメント化され、周波数ドメインへと変換される。その結果の周波数ドメイン信号は、対毎に２つから１つへの（ＴＴＯ）ダウンミクサ２０３に供給され、該ダウンミクサ２０３は２つの入力信号を単一の出力チャネルへとダウンミックスし、対応するパラメータを抽出する。かくして、３つのＴＴＯダウンミクサ２０３が、６つの入力チャネルを３つのオーディオチャネルとパラメータとにダウンミックスする。

図２に示されるように、ＴＴＯダウンミクサ２０３の出力は、他のダウンミクサ２０５及び２０７の入力として利用される。とりわけ、ＴＴＯダウンミクサ２０３のうち２つが第４のＴＴＯダウンミクサ２０５に結合され、第４のＴＴＯダウンミクサ２０５は対応するチャネルを単一のチャネルへと結合する。ＴＴＯダウンミクサ２０３のうち第３のものは、第４のＴＴＯダウンミクサ２０５と共に第５のＴＴＯダウンミクサ２０７に結合され、第５のＴＴＯダウンミクサ２０７は、残りの２つのチャネルを単一のチャネル（Ｍ）へと結合する。該信号は最後に変換され時間ドメインへと戻され、エンコードされた多チャネルオーディオビットストリームｍに帰着する。

ＴＴＯダウンミクサ２０３はエンコード構造の第１の層を有すると考えられ得る。このとき第２の層は第４のダウンミクサ２０５を有し、第３の層は第５のダウンミクサ２０７を有する。かくして、幾つかのオーディオチャネルの、より少ない数のオーディオチャネルへの結合は、階層型エンコーダ構造の各層において実行される。

エンコーダ１０９の階層型エンコード構造は、低い複雑さに対しては、非常に効率的且つ高品質のエンコードに帰着し得る。更に、階層型エンコード構造は、エンコードされる信号の性質に応じて変化させられても良い。例えば、単純なステレオ信号がエンコードされる場合、このことは単一のＴＴＯダウンミクサ及び単一の層のみを有する階層型エンコード構造により達成され得る。

種々の階層型エンコード構造を用いてエンコードされた信号をデコーダ１１５が処理するために、該デコーダは当該信号のために利用された階層型エンコード構造に適応することが可能である必要がある。具体的には、デコーダ１１５は、エンコーダ１０９の階層型エンコード構造に合致する階層型デコーダ構造を持つように自身を構成するための機能を有する。しかしながら、このようにするためには、デコーダ１１５は、受信されたビットストリームのために利用された階層型エンコード構造の情報を供給される必要がある。

図３は、本発明の幾つかの実施例によるエンコーダ１０９の例を示す。

エンコーダ１０９は、幾つかの入力オーディオチャネルを受信する受信プロセッサ３０１を有する。図２の例については、エンコーダ１０９は、６つの入力チャネルを受信する。受信プロセッサ３０１は、階層型エンコード構造を持つエンコードプロセッサ３０３に結合される。例えば、エンコードプロセッサ３０３の階層型エンコード構造は、図２に示されたものと対応しても良い。

エンコードプロセッサ３０３は更に、エンコードプロセッサ３０３により利用される階層型エンコード構造を決定するように構成されたエンコード構造プロセッサ３０５に結合される。エンコードプロセッサ３０３は、構造データをエンコード構造プロセッサ３０５に明示的に供給しても良い。それに応答して、エンコード構造プロセッサ３０５は、エンコードプロセッサ３０３により生成されたエンコードされた信号をデコードするためにデコーダにより利用される必要がある階層型デコーダ構造を示す、デコーダ木構造データを生成する。

デコーダ木構造データは、階層型エンコード構造を記述するデータとして直接に決定されても良いし、又は利用される必要がある階層型デコーダ構造を直接に記述するデータであっても良い（例えばエンコードプロセッサ３０３の構造に対して相補的な構造を記述しても良い）ことは、理解されるであろう。

デコーダ木構造データは具体的には、階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有する。かくして、デコーダ木構造データは、デコーダにおいてオーディオチャネルがどこで分割される必要があるかを示す少なくとも１つのインジケータを有しても良い。斯かるインジケータは例えば、エンコード構造がダウンミクサを有する層を示すインジケータであっても良いし、アップミクサを有する必要があるデコーダ木構造の層を示すインジケータであっても同等に良い。

エンコードプロセッサ３０３及びエンコード構造プロセッサ３０５は、データストリーム生成器３０７に結合される。データストリーム生成器３０７は、エンコードプロセッサ３０３からのエンコードされたオーディオと、エンコード構造プロセッサ３０５からのデコーダ木構造データとを有するビットストリームを生成する。該データストリームは次いで、受信器１０３への通信のため、ネットワーク送信器１１１に供給される。

図４は、本発明の幾つかの実施例によるデコーダ１１５の例を示す。

デコーダ１１５は、ネットワーク受信器１１３から送信されたデータストリームを受信する受信器４０１を有する。デコーダは１１５更に、受信器４０１に結合された、デコードプロセッサ４０３とデコーダ構造プロセッサ４０５とを有する。

受信器４０１はデコーダ木構造データを抽出し、該データをデコーダ構造プロセッサ４０５に供給する。デコーダ構造プロセッサ４０５において、幾つかのオーディオチャネル及びパラメトリックオーディオデータを有するオーディオエンコードデータが、デコードプロセッサ４０３に供給される。

デコーダ構造プロセッサ４０５は、受信されたデコーダ木構造データに応じて、階層型デコーダ構造を決定するように構成される。具体的には、デコーダ構造プロセッサ４０５は、データ分割を規定するデータ値を抽出し、エンコードプロセッサ３０３の階層型エンコード構造と相補的な階層型デコーダ構造の情報を生成しても良い。該情報はデコードプロセッサ４０３に供給され、デコードプロセッサ４０３が規定された階層型デコーダ構造のために設定されるようにする。

続いて、デコーダ構造プロセッサ４０５は、該階層型デコーダ構造を用いて、エンコーダ１０９への元の入力に対応する出力チャネルを生成する。

かくして本システムは、特に多チャネルオーディオ信号のようなオーディオ信号の、効率的且つ高品質のエンコード、デコード及び配布を可能とし得る。デコーダがエンコーダに自動的に適応し、該デコーダがかくして多くの異なるエンコーダと共に利用され得るような、非常に柔軟なシステムが可能とされる。

デコーダ木構造データは、階層型デコーダ構造の種々の階層において、オーディオチャネルについてのチャネル分割特性を示すデータ値を利用して、効果的に通信される。かくして、デコーダ木構造データは、柔軟且つ高性能な階層型エンコード及びデコード構造のために最適化される。

例えば、５．１チャネル信号（即ち６チャネル信号）は、ステレオ信号及び空間パラメータのセットとしてエンコードされ得る。斯かるエンコードは、単純なＴＴＯ又は３つから２つへの（ＴＴＴ）ダウンミクサを利用する多くの異なる階層型エンコード構造により実現され得、従って１つから２つへの（ＯＴＴ）又は２つから３つへの（ＴＴＴ）アップミクサを用いて多くの異なる階層型デコーダ構造が可能である。かくして、対応する空間ビットストリームをデコードするためには、デコーダはエンコーダにおいて利用された階層型エンコード構造の知識を持っているべきである。単純な一手法は、ルックアップテーブルへのインデクスを用いてビットストリーム中の木を信号表現することである。適切なルックアップテーブルの例は、以下のようになり得る：

しかしながら、斯かるルックアップテーブルを用いることは、利用され得る全ての階層型エンコード構造が該ルックアップテーブルに明示的に規定されている必要があるという欠点を持つ。しかしながらこのことは、新たな階層型エンコード構造を本システムに導入するためには、全てのデコーダ／エンコーダが更新されたルックアップテーブルを受信する必要があることを要求する。このことは非常に望ましくなく、複雑な動作及び柔軟性に欠くシステムに帰着する。

それに対し、データ値が階層型デコーダ構造の種々の層におけるチャネル分割を示すデコーダ木構造データの利用は、いずれの階層型デコーダ構造をも記述し得るデコーダ木構造データの単純で汎用的な通信を可能とする。従って、新たなエンコード構造が、対応するデコーダの事前の通知を必要とすることなく、容易に利用され得る。

かくして、ルックアップテーブルベースの手法とは異なり、図１のシステムは、最大限の柔軟性を維持しつつ、任意の数の入力及び出力チャネルに対処することができる。このことは、ビットストリーム中のエンコーダ／デコーダ木の記述を規定することにより実現される。デコーダは該記述から、ビットストリーム中のエンコードされた後続パラメータをどこで及びどのように適用するべきかを導出することができる。

デコーダ木構造データは、具体的に複数のデータ値を有しても良く、各データ値が、階層型デコーダ構造の１つの階層における１つのチャネルについてのチャネル分割特性を示しても良い。具体的には、デコーダ木構造データは、階層型デコーダ構造に含まれるべき各アップミクサについて１つのデータ値を有しても良い。更に、１つのデータ値は、更に分割されない各チャネルについて含まれても良い。かくして、デコーダ木構造データのデータ値が１つの特定の所定データに対応する値をもつ場合、このことは対応するチャネルが更に分割されるべきはなく、実際にはデコーダ１１５の出力チャネルであることを示しても良い。

幾つかの実施例において、本システムはＴＴＯダウンミクサのみを用いるエンコーダのみを組み込んでも良く、対応してＯＴＴアップミクサのみを利用してデコーダが実装されても良い。斯かる実施例においては、データ値はデコーダの各チャネルに対して含まれても良い。更にデータ値は、チャネルが分割されないことを示す一方の値と、チャネルがＯＴＴアップミクサにより２つのチャネルに分割されることを示す他方の値との２つのとり得る値のうち、一方の値をとっても良い。更に、デコーダ木構造データ中のデータ値の順序が、どのチャネルが分割されるか、及び従って階層型デコーダ構造におけるＯＴＴアップミクサの位置を示しても良い。かくして、必要とされる階層型デコーダ構造を完全に記述する単純なバイナリ値を有するデコーダ木構造データが、実現され得る。

具体例として、図５のデコーダの階層型デコーダ構造のビット列記述の導出が説明される。

本例において、エンコーダはＴＴＯダウンミクサのみを利用し、従ってデコーダ木はバイナリ列により記述されることが仮定される。図５の例においては、単一の入力オーディオチャネルが、ＯＴＴアップミクサを利用して、５個のチャネル出力信号へと拡張される。本例において、４層の深さが区別され、０と示される第１のものは入力信号の層にあり、３と示される最後のものは出力信号の層にある。本説明において、層は層境界を形成するアップミクサを伴うオーディオチャネルにより特徴付けられ、層はアップミクサを有する又はアップミクサにより形成されるとみなされ得ることは、理解されるであろう。

本例において、図５の階層型デコーダ構造は、以下のステップにより導出されるビット列「１１１００１０００」により記述され得る：
１：層０における入力信号ｔ_０が分割される（ＯＴＴアップミクサＡ）。結果として層０における全ての信号が考慮されたこととなり、層１へと進む。
１：層１における第１の信号（ＯＴＴアップミクサＡの上部から出力される）が分割される（ＯＴＴアップミクサＢ）。
１：層１における第２の信号（ＯＴＴアップミクサＡの下部から出力される）が分割される（ＯＴＴアップミクサＣ）。層１の全ての信号が記述されたこととなり、層２へと進む。
０：層２における第１の信号（ＯＴＴアップミクサＢの上部）は、これ以上分割されない。
０：層２における第２の信号（ＯＴＴアップミクサＢの下部）は、これ以上分割されない。
１：層２における第３の信号（ＯＴＴアップミクサＣの上部）は、更に分割される。
０：層２における第４の信号（ＯＴＴアップミクサＣの下部）は、これ以上分割されない。層２の全ての信号が記述されたこととなり、層３へと進む。
０：層３における第１の信号（ＯＴＴアップミクサＤの上部）は、これ以上分割されない。
０：層３における第２の信号（ＯＴＴアップミクサＤの下部）は、これ以上分割されない。これで全ての信号が記述されたこととなる。

幾つかの実施例において、エンコードはＴＴＯ及びＴＴＴダウンミクサのみを利用することに制限され、従ってデコードはＯＴＴ及びＴＴＴアップミクサのみを利用することに制限され得る。ＴＴＴアップミクサは多くの種々の構成において利用され得るが、２つの入力信号から３つの出力信号を正確に推定するために（波形）予測が利用される方法において、ＴＴＴアップミクサを利用することが特に有利である。ＴＴＴアップミクサの当該予測特性のため、これらアップミクサのための論理位置は木のルートとなる。このことは、ＯＴＴアップミクサが元の波形を壊し、それにより予測を不適切なものとすることによる。かくして、幾つかの実施例においては、デコーダ構造において利用されるアップミクサは、ルート層におけるＯＴＴアップミクサ又はＴＴＴアップミクサのみである。

それ故、斯かるシステムについては、併せて全体の木記述を可能とする、３つの異なる状況が区別され得る：
１）ルートとしてＴＴＴアップミクサを持つ木
２）ＯＴＴアップミクサのみから成る木
３）「空の木」即ち入力チャネルから出力チャネルへの直接のマッピング

図６はルートにＴＴＴアップミクサを持つ階層型デコーダ構造の例を示し、図７は複数のデコーダ木構造を有する階層型デコーダ構造の例を示す。図７の階層型デコーダ構造は、上述した３つの例の全てによるデコーダ木構造を有する。

幾つかの実施例においては、デコーダ木構造データは、入力チャネルがＴＴＴアップミクサを有するか否かを示す順序に並べられる。デコーダ木構造データは、より低い層のチャネルがＯＴＴアップミクサにより分割されるか又はそれ以上分割されないかを示すバイナリデータに後続される、ＴＴＴアップミクサがルート層において存在することを示すインジケータを有しても良い。このことは、ビットレート及び低信号コストの面で、性能を改善し得る。

例えば、デコーダ木構造データは、階層型デコーダ構造にどれだけ多くのＴＴＴアップミクサが含まれるかを示し得る。各木構造はルートレベルに位置する１つのＴＴＴアップミクサのみを有するため、木の残りは上述したようなバイナリ列により記述され得る（即ち、木はより低い層についてのみＯＴＴアップミクサ木であるため、ＯＴＴアップミクサのみの階層型デコーダ構造について上述したものと同様の手法が適用されることができる）。

また、残りの木構造は、ＯＴＴアップミクサのみの木か、又は同様にバイナリ列により記述されることができる空の木である。従って、全ての木がバイナリデータ値により記述されることができ、バイナリ列の解釈は木がどのカテゴリに属するかに依存し得る。該情報は、デコーダ木構造データにおける木の位置により提供され得る。例えば、ＴＴＴアップミクサを有する全ての木が最初にデコーダ木構造データにおいて位置特定され、ＯＴＴアップミクサのみの木により後続され、更に空の木により後続される。階層型デコーダ構造におけるＴＴＴアップミクサ及びＯＴＴアップミクサの数がデコーダ木構造データに含まれる場合、デコーダは更なるデータを必要とすることなく設定されることができる。かくして、必要とされるデコーダの情報の非常に効率的な通信が実現される。デコーダ木構造データを通信するオーバヘッドは非常に低く保たれ得、更に、多様な階層型デコーダ構造を記述し得る非常に柔軟なシステムが提供される。

具体例として、図７のデコーダの階層型デコーダ構造が、以下の処理によりデコーダ木構造データから導出されても良い：
−入力信号の数が（ことによるとエンコードされた）ダウンミックスから導出される。
−木全体のＯＴＴアップミクサ及びＴＴＴアップミクサの数がデコーダ木構造データ中に信号表現され、そこから抽出される。出力信号の数は、出力信号の数＝入力信号の数＋ＴＴＴアップミクサの数＋ＯＴＴアップミクサの数、と導出される。
−再マッピングの後に、最初に状況１）による木が遭遇され、状況２）による木により後続され、次いで状況３）による木に後続されるように、デコーダ木構造データにおいて入力チャネルが再マッピングされる。図７の例については、このことは３、０、１、２、４の順に帰着し、即ち信号０が再マッピングの後の信号３、信号１が再マッピングの後の信号０、等となる。
−各ＴＴＴアップミクサについて、上述した方法を用いて、３つのＯＴＴのみの木記述が与えられる（ＴＴＴ出力チャネル毎に１つの、ＯＴＴのみの木）。
−残りの全ての入力信号について、ＯＴＴのみの記述が与えられる。

幾つかの実施例において、出力チャネルについてのラウドスピーカ位置のインジケータが、デコーダ木構造データに含まれる。例えば以下のような、所定のラウドスピーカ位置のルックアップテーブルが利用されても良い：

代替として、ラウドスピーカ位置は階層的手法を用いて表現されても良い。例えば、数個の先頭のビットがｘ軸を規定し（例えばＬ、Ｒ、Ｃ）、次いで数個のビットがｙ軸を規定し（例えば前、横、サラウンド）、更なる数個のビットがｚ軸（高さ）を規定する。

具体例として、以下は上述した指針に従うビットストリーム構文の例を示す。本例において、入力及び出力信号の数は、ビットストリームに明示的に符号化される。斯かる情報は、ビットストリームの一部を有効にするために利用され得る。
Syntax
TreeDescription()
{
numInChan=bsNumInChan+1;
numOutChan=bsNumOutChan+2;
numTttUp_mixers=bsNumTttUp_mixers;
numOttUp_mixers=bsNumOttUp_mixers;
For(ch=0;ch<numInChan;ch++){
bsChannelRemapping[ch]
}
For(ch=0;ch<numOutChan;ch++){
bsOutputChannelPos[ch]
}
Idx=0
ottUp_MixerIdx=0;
For(i=0;i<numTttUp_mixers;i++){
TttConfig(i);
for(ch=0;ch<3;ch++,idx++){
OttTreeDescription(idx)
}
}
while(ottUp_mixerIdx<numOttUp_mixersidx<numInChan+numTttUp_mixers){
OttTreeDescription(idx);
idx++;
}
numOttUp_mixers=ottUp_mixerIdx+1;
}

本例においては、各OttTreeは、以下に示されるOttTreeDescription()において処理される。
Syntax
OttTreeDescription(idx)
{
CurrLayerSignals=1
NexLayerSignals=0
while(CurrLayerSignals>0){
bsOttUp_mixerPresent
if(bsOttUp_mixerPresent==1){
OttConfig(ottUp_mixerIdx);
ottDefaultCld[ottUp_mixerIdx]=bsOttDefaultCld[ottUp_mixerIdx];
ottModeLfe[ottUp_mixerIdx]=bsOttModeLfe[ottUp_mixerIdx];
NextLayerSignals+=2;
ottUp_mixerIdx++;
}
CurrLayerSignals--;
if((currLayerSignals==0)&&(NextLayerSignals>0)){
CurrLayerSignals=NextLayerSignals;
NextLayerSignals=0;
}
}
}

以上の構文において、下線はビットストリームから読み取られる要素を示すために用いられている。

階層の概念は斯かる記述において必要とされないことが、理解されるであろう。例えば、「開いた端がある限り、更に入力されるビットがある」という原則に基づく記述もが適用され得る。データをデコードするために、該概念が幾分か有用となり得る。

ＯＴＴアップミクサが存在するか否かを示すビットの他に、ＯＴＴアップミクサについて以下のデータが含まれる：
−デフォルトのチャネルレベル差
−ＯＴＴアップミクサがＬＦＥ（低周波拡張型）ＯＴＴアップミクサであるか否か、即ちパラメータが帯域制限されたもののみであり相関／一貫性データを含まないか否か

加えてデータは、例えば本例のＴＴＴアップミクサにおいてはどのモードを利用するか（波形ベースの予測、エネルギーベースの予測等）といった、アップミクサの特定の特性を規定しても良い。

当業者には分かるように、ＯＴＴアップミクサは、単一のチャネルを２つのチャネルに分割するために、非相関信号を利用する。更に、該非相関信号は、単一の入力チャネル信号から導出される。図８は、本手法によるＯＴＴアップミクサの例を示す。かくして、図５のデコーダの例は、非相関信号を生成する非相関ブロックが明示的に示された図９の図により表され得る。

しかしながら、理解され得るように、当該手法は非相関ブロックの縦続接続に導き、それにより低い層のＯＴＴアップミクサについての非相関信号が、他の非相関信号から生成された入力信号から生成される。かくして、より低い層の非相関信号は、ルートレベルにおいて元の入力信号から生成されるのではなく、幾つかの非相関ブロックにより処理されたものとなる。各非相関ブロックは非相関フィルタを有するため、該手法は非相関信号の「汚れ」に導く（例えば過渡信号が著しく歪まされ得る）。このことは、出力信号に対するオーディオ品質劣化に帰着する。

かくして、オーディオ品質を改善するために、デコーダのアップミックスにおいて適用される非相関化器はそれ故、幾つかの実施例においては、非相関信号の縦続接続が回避されるように移動させられても良い。図１０は、図９のものに対応するデコーダ構造の例を示すが、ここでは入力チャネルに直接結合された非相関化器を用いる。かくして、前のＯＴＴアップミクサの出力を非相関化器への入力として用いる代わりに、非相関アップミクサは、利得アップミクサＧ_Ｂ、Ｇ_Ｃ及びＧ_Ｄにより前処理された元の入力信号ｔ_０を直接用いる。これらの利得は、非相関化器の入力部におけるパワーが、図９の構造における非相関化器の入力において実現されたであろうパワーと等しくなることを確実にする。このように得られる構造は、非相関化器の縦続接続を含まず、それにより改善されたオーディオ品質に帰着する。

以下、デコーダ木構造データに応答して階層のアップミクサについての行列乗算を決定する方法の例が説明される。本説明はとりわけ、アップミクサの非相関信号を生成するための非相関フィルタが、デコード構造のオーディオ入力チャネルに直接接続されている実施例に焦点を当てる。かくして本説明は、図１０に示されたもののようなエンコーダの実施例に焦点を当てる。

図１１は、本発明の幾つかの実施例によるデコードの方法のためのフロー図の例を示す。

ステップ１１０１において、量子化され符号化されたパラメータが、受信されたビットストリームからデコードされる。当業者には理解されるように、このことは以下のような従来のパラメトリックオーディオ符号化パラメータの幾つかのベクトルに帰着する：
ＣＬＤ_０＝［−１０１５１０１２ … １０］
ＣＬＤ_１＝［５１２１５１０ … ２］
ＩＣＣ_０＝［１０．６０．９０．３ … −１］
ＩＣＣ_１＝［０１０．６０．９ … ０．３］等

各ベクトルは、周波数軸に沿ったパラメータを表す。

ステップ１１０１はステップ１１０３に後続され、ステップ１１０３において、デコードされたパラメトリックデータから個々のアップミクサについての行列が決定される。

（周波数非依存の）一般化されたＯＴＴ及びＴＴＴ行列は、それぞれ以下のように与えられる：

信号ｘ_ｉ、ｄ_ｉ及びｙ_ｉはそれぞれ、入力信号、信号ｘ_ｉから導出された非相関信号、及び出力信号を表す。行列のエントリＨ_ｉｊ及びＭ_ｉｊは、ステップ１１０３において導出されるパラメータの関数である。

本方法は次いで２つの並行する経路に分かれ、一方の経路は木プリ行列（pre-matrix）値の導出（ステップ１１０５）に向けたものであり、他方の経路は木ミックス行列（mix-matrix）値の導出（ステップ１１０７）に向けたものである。

プリ行列は、非相関化及び行列適用の前に入力信号に適用される行列乗算に対応する。具体的には、プリ行列は、非相関フィルタの前に入力信号に適用される利得アップミクサに対応する。

更に詳細には、単純なデコーダ実装は一般に、例えば図９において適用されたような、非相関フィルタの縦続接続に導く。上述したように、該縦続接続を回避することが好ましい。そのため、図１０において示されるように、非相関フィルタは全て同一の階層レベルに移動させられる。非相関信号が適切な、即ち図９の単純な場合における非相関信号のレベルと等しいエネルギーレベルを持つことを確実とするため、プリ行列は非相関化の前に適用される。

例えば、図１０における利得Ｇ_Ｂは以下のように導出される。最初に、１−２アップミクサが、入力信号パワーを該１−２アップミクサの上部及び下部の出力に分割することに留意することが重要である。この特性は、チャネル間強度差（Inter-channel Intensity Difference、ＩＩＤ）又はチャネル間レベル差（Inter-channel Level Difference、ＩＣＬＤ）パラメータに反映される。それ故利得Ｇ_Ｂは、１−２アップミクサの上部及び下部の出力の合計により除算された、上部の出力のエネルギー比として算出される。ＩＩＤ又はＩＣＬＤパラメータは時間及び周波数により変化し得るため、該利得もまた時間及び周波数の両方により変化し得ることは、理解されるであろう。

ミックス行列は、付加的なチャネルを生成するために、アップミクサにより入力信号に適用される行列である。

最終的なプリ及びミックス行列式は、ＯＴＴ及びＵＴＴアップミクサの縦続接続の結果である。非相関化器の縦続接続を防ぐためデコーダ構造が修正されているため、このことは最終的な式を決定するときに考慮に入れられる必要がある。

所定の構成のみが利用される実施例においては、行列のエントリＨ_ｉｊ及びＭ_ｉｊと最終的な行列式との間の関係は一定であり、標準的な変更が適用されても良い。

しかしながら、以上に説明した、より柔軟且つ動的な手法については、プリ及びミックス行列値の決定は、後述されるような、より複雑な手法によって決定されても良い。

ステップ１１０５はステップ１１０９に後続され、ステップ１１０９において、ステップ１００５において導出されたプリ行列が、時間ドメイン信号を周波数ドメインに変換する（ステップ１１１３）ために適用される実際の周波数グリッドにマッピングされる。

ステップ１１０９はステップ１１１１に後続され、ステップ１１１１において、周波数行列パラメータの補間が内挿される。具体的には、パラメータの時間更新がステップ１１１３の時間−周波数変換の更新に対応するか否かに依存して、補間が適用されても良い。

ステップ１１１３において、該マッピングされ任意に補間されたプリ行列を適用するため、入力信号が周波数ドメインに変換される。

ステップ１１１５がステップ１１１１及びステップ１１１３に後続し、プリ行列を周波数ドメイン入力信号に適用するステップを有する。実際の行列適用は、行列乗算のセットである。

ステップ１１１５はステップ１１１７に後続され、ステップ１１１７において、ステップ１１１５の行列適用に起因する信号の一部が、非相関信号を生成するため非相関フィルタに供給される。

同様の手法が、ミックス行列式を導出するために適用される。

具体的には、ステップ１１０７がステップ１１１９により後続され、ステップ１１１９において、ステップ１１０７において決定された式が、ステップ１１１３の時間−周波数変換の周波数グリッドにマッピングされる。

ステップ１１１９はステップ１１２１に後続され、ステップ１１２１において、ここでもまたパラメータ及び変換の時間更新に依存して、ミックス行列値が任意に補間される。

ステップ１１１５、１１１７及び１１２１において生成された値はかくして、アップミックス行列乗算のために必要とされるパラメータを形成し、該乗算はステップ１１２３において実行される。

ステップ１１２３はステップ１１２５により後続され、ステップ１１２５において、結果の出力が変換され時間ドメインへと戻される。

図１１におけるステップ１１１５、１１１７及び１１２３に対応するステップは、図１２により更に説明される。図１２は、本発明の幾つかの実施例による行列デコーダ構造の例を示す。

図１２は、多チャネル出力を復元するために、入力ダウンミックスチャネルがどのように利用され得るかを示す。以上に概説されたように、本処理は、中間の非相関ユニットを伴う、２つの行列乗算により記述され得る。

それ故、出力チャネルを形成するための入力チャネルの処理は、以下のように記述されることができる：
ｖ^ｎ，ｋ＝Ｍ_１ ^ｎ、ｋｘ^ｎ、ｋ
ｙ^ｎ，ｋ＝Ｍ_２ ^ｎ、ｋｗ^ｎ、ｋ

Ｍ_１ ^ｎ、ｋは、特定の数の入力チャネルを、非相関化器へと入力される特定の数のチャネルへとマッピングする２次元の行列であり、各時間スロットｎ及び各サブバンドｋについて定義される。

Ｍ_２ ^ｎ、ｋは、特定の数の前処理されたチャネルを、特定の数の出力チャネルへとマッピングする２次元の行列であり、各時間スロットｎ及び各ハイブリッドサブバンドｋについて定義される。

以下、ステップ１１０５及び１１０７のプリ及びミックス行列式が、デコーダ木構造データからどのように生成され得るかの例が説明される。

最初に、ＯＴＴアップミクサのみを持つデコーダ木構造が、図１３の木の例を参照しながら考慮される。

このタイプの木については、幾つかの支援変数を定義することが有益である。

は、各ＯＴＴアップミクサについて遭遇されるＯＴＴアップミクサのインデクスを記述する（即ち、本例においては、第４のＯＴＴアップミクサに入力される信号は、Ｔｒｅｅ^１行列における第５列により与えられるように、第０及び第１のＯＴＴアップミクサを通過している。同様に、第２のＯＴＴアップミクサに入力される信号は、Ｔｒｅｅ^１行列における第３列により与えられるように、第０のＯＴＴボックスを通過している等する）。

は、各ＯＴＴアップミクサについて、上の経路が辿られるか下の経路が辿られるかを示す。正の符号は上の経路を示し、負の符号は下の経路を示す。

該行列はＴｒｅｅ^１行列に対応し、それ故、Ｔｒｅｅ^１行列における特定の列及び行が特定のＯＴＴアップミクサを指す場合、Ｔｒｅｅ^１ _ｓｉｇｎ行列における同じ列及び行が、当該特定の列の第１行に与えられるＯＴＴアップミクサに到達するために当該特定のＯＴＴアップミクサの下部が利用されるか上部が利用されるかを示す（即ち、本例においては、第４のＯＴＴアップミクサに入力される信号は、（Ｔｒｅｅ^１ _ｓｉｇｎ行列における第３行第５列により示されるように）第０のＯＴＴアップミクサの上の経路と、Ｔｒｅｅ^１ _ｓｉｇｎ行列における第２行第５列により示されるように）第１のＯＴＴアップミクサの下の経路とを通過している）。

Ｔｒｅｅ^１ _{ｄｅｐｔｈ}＝［１２２３３］
は、各ＯＴＴアップミクサについての木の深さを示し（即ち、本例においては、アップミクサ０が層１にあり、アップミクサ１及び２が層２にあり、アップミクサ３及び４が層３にある）、
Ｔｒｅｅ_{ｅｌｅｍｅｎｔｓ}＝［５］
は、木における要素の数を示す（即ち、本例においては、木は５個のアップミクサを有する）。

非相関信号のみについてのプリ行列を記述する一時行列Ｋ_１が、以下のように定義される：

ここで、

は、ＯＴＴボックスの上の出力が利用されるか下の出力が利用されるかに依存する、Ｔｒｅｅ^１（ｉ，ｐ）により示されるＯＴＴアップミクサについての利得値であり、

である。

ＩＩＤ値は、ビットストリームから取得されるチャネル間強度差である。

最終的なプリ行列Ｍ_１が次いで、以下のように構築される：

プリ−ミックス行列の目的が、ＯＴＴボックスの前に、図１３におけるＯＴＴアップミクサに含まれる非相関化器を移動させることを可能とすることであることを考慮する。それ故、プリ−ミックス行列は、ＯＴＴアップミクサにおける全ての非相関化器について「ドライ（dry）な」入力信号を供給する必要があり、このとき入力信号は、非相関化器を木の前に移動させる前に非相関化器が配置されていた特定の位置において持っていたであろうレベルを持つ。

また、プリ行列は非相関化器に入力される信号に対してのみプリ利得を適用すること、及び非相関信号と「ドライな」ダウンミックス信号との混合はミックス行列Ｍ_２において行われること（以下に詳述される）を考慮すると、プリ−ミックス行列の最初の要素は、Ｍ_２行列に直接結合される出力を与える（線ｍ／ｃがこのことを示している、図１２を参照されたい）。

ＯＴＴアップミクサのみの木が現在対象とされているとすると、プリ−ミックスベクトルＭ_１の第２の要素が１であることが明らかである。なぜなら、ＯＴＴアップミクサ０における非相関化器に入力される信号が、正確にダウンミックス入力信号であるからである。また、該ＯＴＴアップミクサについて、木全体の前に非相関化器を移動させるための差分がないことも明らかである。なぜなら、既に木における最初のものであるからである。

更に、非相関化器への入力ベクトルがｖ^ｎ，ｋ＝Ｍ_１ ^ｎ，ｋｘ^ｎ，ｋにより与えられると仮定し、図１３及び図１２並びにＭ_１ ^ｎ，ｋ行列における要素が導出された方法を参照すると、Ｍ_１の第１行が図１２におけるｍ信号に対応すること、及び後続する行がＯＴＴボックス０、…、４の非相関化器入力信号に対応することが明らかである。それ故、ｗ^ｎ，ｋベクトルは、以下のようになる：

ここでｅ_ｎは、図１３におけるｎ番目のＯＴＴボックスからの非相関化器出力を示す。

ここでミックス行列Ｍ_２をみると、該行列の要素は同様に推論されることができる。しかしながら、該行列については、ドライな信号を利得調節すること及び該信号を関連する非相関化器出力と混合することが目的である。木における全てのＯＴＴアップミクサは、以下のように記述され得ることを考慮する：

ここで、Ｙ_１はＯＴＴボックスの上の出力であり、Ｙ_２は下の出力であり、Ｘはドライな入力信号であり、Ｑは非相関化器信号である。

出力チャネルは行列乗算ｙ^ｎ，ｋ＝Ｍ_２ ^ｎ，ｋｗ^ｎ，ｋにより形成され、ｗ^ｎ，ｋベクトルは図１２に示されるようにダウンミックス信号と非相関化器の出力との組み合わせとして形成されるため、Ｍ_２行列の全ての行が出力チャネルに対応し、特定の行における全ての要素が、特定の出力チャネルを形成するためにダウンミックス信号及び種々の非相関化器のうちどれだけが混合されるべきかを示す。

例えば、ミックス行列Ｍ_２の第１行をみる。

Ｍ_２における第１行の第１の要素は「ｍ」信号の寄与に対応し、ＯＴＴアップミクサ０、１及び３の上の出力により与えられる出力に対する寄与である。上述のＨ行列を仮定すると、このことはＨ１１_０、Ｈ１１_１及びＨ１１_３に対応する。なぜなら、ＯＴＴボックスの上の出力についてのドライな信号の量は、ＯＴＴアップミクサのＨ１１要素により与えられるからである。

第２の要素は、以上によればＯＴＴアップミクサ０に配置されている非相関化器Ｄ１の寄与に対応する。それ故、この寄与はＨ１１_０、Ｈ１１_３及びＨ１２_０である。このことは、Ｈ１２_０要素がＯＴＴアップミクサ０からの非相関化器出力を与え、当該信号が続いてドライな信号の一部としてＯＴＴアップミクサ１及び３を通過させられ、かくしてＨ１１_０及びＨ１１_３要素に従って利得調節されるため、明らかである。

同様に、第３の要素は、以上によればＯＴＴアップミクサ１に配置されている非相関化器Ｄ２の寄与に対応する。それ故、この寄与はＨ１２_０及びＨ１１_３である。

第５の要素は、以上によればＯＴＴアップミクサ３に配置されている非相関化器Ｄ３の寄与に対応する。それ故、この寄与はＨ１２_３である。

第１列の第４及び第６の要素は、ゼロである。なぜなら、非相関化器Ｄ４又はＤ６の寄与は、該行列の第１行に対応する出力チャネルの一部ではないからである。

以上の段階的な例は、行列要素がＯＴＴアップミクサ行列要素Ｈの積として推論され得ることを明らかとする。

一般的な木についてミックス行列Ｍ_２を導出するために、行列Ｍ_１についてのものと同様の手順が導出され得る。最初に以下の支援変数が導出される：

行列Ｔｒｅｅは、全ての出力チャネルについて列を持ち、各出力チャネルに到達するために信号が通過する必要があるＯＴＴアップミクサのインデクスを記述する。

行列Ｔｒｅｅ_ｓｉｇｎは、現在の出力チャネルに到達するために、上の経路（１）が利用されるべきか下の経路（−１）が利用されるべきかを示すためのインジケータを、木における全てのアップミクサについて保持する。

Ｔｒｅｅ_{ｄｅｐｔｈ}ベクトルは、特定の出力チャネルに到着するまでに通過される必要があるアップミクサの数を保持する。
Ｔｒｅｅ_{ｄｅｐｔｈ}＝［３３３３２２］

Ｔｒｅｅ_{ｅｌｅｍｅｎｔｓ}ベクトルは、木全体の全てのサブ木におけるアップミクサの数を保持する。
Ｔｒｅｅ_{ｅｌｅｍｅｎｔｓ}＝［５］

以上に定義された表記が信号表現され得る全ての木を記述するために十分であるとすると、Ｍ_２行列が定義され得る。１つの入力チャネルからＮ個の出力チャネルを生成する、サブ木ｋについての行列は、以下により定義される：

ここで、

である。ここでＨ要素は、インデクスＴｒｅｅ（ｐ，ｊ）を持つＯＴＴアップミクサに対応するパラメータにより定義される。

以下、例えば図１４のデコーダ構造のような、ルートレベルにおいてＴＴＴアップミクサを含む、より一般的な木が仮定される。２つの変数Ｍ１_ｉ及びＭ２_ｉを含むアップミクサがＯＴＴ木を示し、かくして必ずしも単一のＯＴＴアップミクサではない。更に、最初に、ＴＴＴアップミクサが非相関信号を利用しないこと、即ちＴＴＴ行列が３ｘ２行列として記述され得ることが仮定される：

これらの仮定の下では、第１のＴＴＴアップミクサについて最終的なプリ及びミックス行列を導出するために、各ＯＴＴ木についてプリ−ミックス行列の２つのセットが導出される。１つはＴＴＴアップミクサの第１の入力信号についてのプリ行列化を記述し、他方はＴＴＴアップミクサの第２の入力信号についてのプリ行列化を記述する。両方のプリ行列化ブロック及び非相関化の適用の後、信号が合計され得る。

出力信号はかくして、以下のように導出される。

最後に、ＴＴＴアップミクサが非相関化を利用する場合においては、非相関信号の寄与が、後処理の形で加算され得る。ＴＴＴアップミクサ非相関信号が導出された後、各出力信号に対する寄与は単に、各後続するＯＴＴアップミクサのＩＩＤにより配布される［Ｍ_１３，Ｍ_２３，Ｍ_３３］ベクトルにより与えられる寄与である。

図１５は、本発明の幾つかの実施例によるオーディオ信号を送信及び受信する方法を示す。

本方法は、送信器が幾つかの入力オーディオチャネルを受信するステップ１５０１において開始する。

ステップ１５０１はステップ１５０３に後続され、ステップ１５０３において、送信器が該幾つかの入力オーディオチャネルをパラメトリックにエンコードし、幾つかのオーディオチャネルとパラメトリックオーディオデータとを有するデータストリームを生成する。

ステップ１５０３はステップ１５０５に後続され、ステップ１５０５において、階層型エンコード手段に対応する階層型デコーダ構造が決定される。

ステップ１５０５はステップ１５０７に後続され、ステップ１５０７において、階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、送信器がデータストリーム中に含ませる。

ステップ１５０７はステップ１５０９に後続され、ステップ１５０９において、送信器が該データストリームを受信器に送信する。

ステップ１５０９はステップ１５１１に後続され、ステップ１５１１において、受信器がデータストリームを受信する。

ステップ１５１１はステップ１５１３に後続され、ステップ１５１３において、受信器によって利用されるべき階層型デコーダ構造が、デコーダ木構造データに応じて決定される。

ステップ１５１３はステップ１５１５に後続され、ステップ１５１５において、受信器が階層型デコーダ構造を利用して該データストリームから幾つかの出力オーディオチャネルを生成する。

以上の記載は、明確さのため、種々の機能ユニット及びプロセッサと関連して本発明の実施例を説明したものであることは理解されるであろう。しかしながら、種々の機能ユニット又はプロセッサ間の機能のいずれの適切な分散もが、本発明から逸脱することなく利用され得ることは、明らかであろう。例えば、別個のプロセッサ又はコントローラにより実行されるように説明された機能は、同一のプロセッサ又はコントローラにより実行されても良い。それ故、特定の機能ユニットへの参照は、厳密な論理的又は物理的な構造を示すものではなく、単に説明された機能を提供するための適切な手段への参照として考えられるべきである。

本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらのいずれかの組み合わせを含む、いずれの適切な形態で実装されても良い。本発明は任意に、少なくとも部分的に、１以上のデータプロセッサ及び／又はディジタル信号プロセッサ上で動作するコンピュータソフトウェアとして実装されても良い。本発明の実施例の要素は、物理的、機能的及び論理的に、いずれの適切な態様で実装されても良い。実際には、機能は単一のユニットで実装されても良いし、複数のユニットで実装されても良いし、又は他の機能ユニットの一部として実装されても良い。本発明自体、単一のユニットで実装されても良いし、種々のユニット及びプロセッサ間で物理的及び機能的に分散されても良い。

本発明は幾つかの実施例と関連して説明されたが、本発明はここで開示された特定の形態に限定されることを意図したものではない。本発明の範囲は、添付する請求項によってのみ限定される。加えて、特定の実施例に関連して特徴が説明されたが、説明された実施例の種々の特徴が、本発明に従って組み合わせられても良いことは、当業者は理解するであろう。請求項において、「有する（comprise）」なる語は、他の要素又はステップの存在を除外するものではない。

更に、複数の手段、要素又は方法ステップは、別個に列記されていても、例えば単一のユニット又はプロセッサにより実装されても良い。加えて、個々の特徴が異なる請求項に含められ得るが、これら特徴は有利に組み合わせられても良く、異なる請求項に含められていることは、これら特徴の組み合わせが利用可能ではない及び／又は有利ではないことを意味するものではない。或るカテゴリの請求項に特徴を含むことは、該カテゴリに対する限定を意味するものではなく、該特徴が他の請求項のカテゴリに適宜等しく適用可能であることを示す。更に、請求項における特徴の順序は、これら特徴が動作する必要のある順序を示すものではなく、またとりわけ、方法の請求項における個々のステップの順序は、これらステップが該順序で実行される必要があることを示すものではない。これらステップは、いずれの適切な順序で実行されても良い。加えて、単数形の参照は複数を除外するものではない。従って、「１つの（a、an）」、「第１の（first）」及び「第２の（second）」等への参照は、複数を除外するものではない。請求項における参照記号は単に明確化のための例であり、いずれの態様においても請求項の範囲を限定するものとして解釈されるべきではない。

本発明の幾つかの実施例によるオーディオ信号の通信のための伝送システムを示す。本発明の幾つかの実施例において利用され得る階層型エンコーダ構造の例を示す。本発明の幾つかの実施例によるエンコーダの例を示す。本発明の幾つかの実施例によるデコーダの例を示す。本発明の幾つかの実施例において利用され得る幾つかの階層型デコーダ構造の例を示す。ルートにおいて２−３アップミクサを持つ階層型デコーダ構造の例を示す。複数のデコーダ木構造を有する階層型デコーダ構造の例を示す。１−２アップミクサの例を示す。本発明の幾つかの実施例において利用され得る幾つかの階層型デコーダ構造の例を示す。本発明の幾つかの実施例において利用され得る幾つかの階層型デコーダ構造の例を示す。本発明の幾つかの実施例によるデコードの方法のためのフロー図の例を示す。本発明の幾つかの実施例によるマトリクスデコーダ構造の例を示す。本発明の幾つかの実施例において利用され得る階層型デコーダ構造の例を示す。本発明の幾つかの実施例において利用され得る階層型デコーダ構造の例を示す。本発明の幾つかの実施例によるオーディオ信号を送信及び受信する方法を示す。

Claims

幾つかの出力オーディオチャネルを生成するための装置であって、前記装置は、
１以上である幾つかの入力オーディオチャネル及び空間的特性を記述するパラメトリックオーディオデータを有するデータストリームを受信するための手段を有し、前記データストリームは更に、階層型デコーダ構造についてのデコーダ木構造データを有し、前記デコーダ木構造データは、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有し、前記装置は更に、
前記デコーダ木構造データに応じて前記階層型デコーダ構造を生成するための手段と、
前記階層型デコーダ構造を利用して前記データストリームから前記幾つかの出力オーディオチャネルを生成するための手段と、
を有する装置。
前記デコーダ木構造データは複数のデータ値を有し、各前記データ値は、前記階層型デコーダ構造の１つの階層における１つのチャネルについてのチャネル分割特性を示す、請求項１に記載の装置。
所定の前記データ値が、前記階層において前記チャネルについてのチャネル分割がないことを示す、請求項２に記載の装置。
所定の前記データ値が、前記階層における前記チャネルについての１つから２つへのチャネル分割を示す、請求項２に記載の装置。
前記複数のデータ値はバイナリデータ値である、請求項２に記載の装置。
第１の所定の前記バイナリデータ値が１つから２つへのチャネル分割を示し、第２の所定のバイナリデータ値がチャネル分割がないことを示し、
前記第２の所定のバイナリデータ値は前記第１の所定のバイナリデータ値と異なる、請求項５に記載の装置。
前記データストリームは更に、入力オーディオチャネルの数についての情報を有する、請求項１に記載の装置。
前記データストリームは更に、出力オーディオチャネルの数についての情報を有する、請求項１に記載の装置。
前記データストリームは更に、前記階層型デコーダ構造における幾つかの１つから２つへのチャネル分割機能についての情報を有し、１つから２つへのチャネル分割機能は、１つのチャネルと前記パラメトリックオーディオデータから２つのチャネルを生成する、請求項１に記載の装置。
前記データストリームは更に、前記階層型デコーダ構造における幾つかの２つから３つへのチャネル分割機能についての情報を有し、２つから３つへのチャネル分割機能は、２つのチャネルと前記パラメトリックオーディオデータから３つのチャネルを生成する、請求項１に記載の装置。
前記デコーダ木構造データは、２つから３つへのチャネル分割機能の存在に応じて順序付けられた複数のデコーダ木構造についてのデータを有し、１つから２つへのチャネル分割機能は、１つのチャネルと前記パラメトリックオーディオデータから２つのチャネルを生成する、請求項１に記載の装置。
少なくとも１つの入力チャネルについての前記デコーダ木構造データは、２つから３つへのチャネル分割機能がルート層におけるチャネルに対して存在することについての制御情報を有し、該制御情報はバイナリデータに後続され、各前記バイナリデータの値は、分割機能がないことか又は２つから３つへの分割機能の従属する層のチャネルについての１つから２つへのチャネル分割機能を示し、前記デコーダ木構造データの従属する層は、前記デコーダ木構造データの前記ルート層に続く層であり、１つから２つへのチャネル分割機能は、１つのチャネルと前記パラメトリックオーディオデータから２つのチャネルを生成し、２つから３つへのチャネル分割機能は、２つのチャネルと前記パラメトリックオーディオデータから３つのチャネルを生成する、請求項１に記載の装置。
前記データストリームは更に、少なくとも１つの前記出力チャネルについてのラウドスピーカ位置についての情報を有する、請求項１に記載の装置。
前記デコーダ木構造は、少なくとも１つの階層における少なくとも１つのチャネル分割機能を有し、前記少なくとも１つのチャネル分割機能は、
前記データストリームのオーディオ入力チャネルから非相関信号を直接に生成するための非相関フィルタを有し、前記非相関信号は、前記オーディオ入力チャネルから非相関とされ、
より高い階層からのオーディオチャネル及び前記非相関信号から、複数の階層出力チャネルを生成するための少なくとも１つのチャネル分割ユニットと、
前記デコーダ木構造データに応じて、非相関フィルタ又は前記チャネル分割ユニットの少なくとも１つの特性を決定するための手段と、
をさらに有する、請求項１に記載の装置。
前記非相関手段は、前記オーディオ入力チャネルに対してオーディオレベル補償を実行してレベル補償されたオーディオ信号を生成するためのレベル補償手段と、前記レベル補償されたオーディオ信号をフィルタリングして非相関信号を生成するための非相関フィルタと、を有する、請求項１４に記載の装置。
前記レベル補償手段は、前記レベル補償されたオーディオ信号が前記非相関フィルタに入力される前に、前記レベル補償されたオーディオ信号を得るために前記オーディオ入力チャネルに適用されるプリ行列による行列乗算を有する、請求項１５に記載の装置。
前記プリ行列の係数は、１つから２つへのチャネル分割機能のみを有する階層型デコーダ構造についての少なくとも１つの１に等しい値を持つ、請求項１６に記載の装置。
前記階層型デコーダ構造の少なくとも１つの階層に関するより高い階層におけるチャネル分割機能のパラメータに応じて、前記少なくとも１つの階層における少なくとも１つのチャネル分割機能についてのプリ行列を決定するための手段を更に有する、請求項１６に記載の装置。
１つから２つへのチャネル分割機能、または２つから３つへのチャネル分割機能を備える、少なくとも１つの階層における少なくとも１つのチャネル分割機能のパラメータに応じて、前記少なくとも１つのチャネル分割機能についてのチャネル分割行列を決定するための手段を有し、前記１つから２つへのチャネル分割機能は、１つのチャネルと前記パラメトリックオーディオデータから２つのチャネルを生成し、前記２つから３つへのチャネル分割機能は、２つのチャネルと前記パラメトリックオーディオデータから３つのチャネルを生成する、請求項１６に記載の装置。
前記階層型デコーダ構造の少なくとも１つの階層に関するより高い階層の２つから３つへのチャネル分割機能のパラメータに応じて、前記少なくとも１つの階層における少なくとも１つのチャネル分割機能についてのプリ行列を決定するための手段を更に有し、前記２つから３つへのチャネル分割機能は、２つのチャネルと前記パラメトリックオーディオデータから３つのチャネルを生成する、請求項１６に記載の装置。
前記プリ行列を決定するための手段は、２つから３つへのアップミクサの第１の入力に対応する第１のサブプリ行列及び前記２つから３つへのアップミクサの第２の入力に対応する第２のサブプリ行列の決定に応じて、少なくとも１つのチャネル分割機能についてのプリ行列を決定するように構成された、請求項２０に記載の装置。
幾つかの出力オーディオチャネルを有するデータストリームを生成するための装置であって、
１以上である幾つかの入力オーディオチャネルを受信するための手段と、
前記幾つかの入力オーディオチャネルをパラメトリックにエンコードし、前記幾つかの出力オーディオチャネル及び空間的特性を記述するパラメトリックオーディオデータを有するデータストリームを生成するための階層型エンコード手段と、
前記階層型エンコード手段に対応する階層型デコーダ構造を決定するための手段と、
前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、前記データストリームに含めるための手段と、
を有する装置。
幾つかの出力オーディオチャネルを生成する方法であって、前記方法は、
１以上である幾つかの入力オーディオチャネル及び空間的特性を記述するパラメトリックオーディオデータを有するデータストリームを受信するステップを有し、前記データストリームは更に、階層型デコーダ構造についてのデコーダ木構造データを有し、前記デコーダ木構造データは、前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有し、前記方法は更に、
前記デコーダ木構造データに応じて前記階層型デコーダ構造を生成するステップと、
前記階層型デコーダ構造を利用して前記データストリームから前記幾つかの出力オーディオチャネルを生成するステップと、
を有する方法。
１以上である幾つかの出力オーディオチャネルを有するデータストリームを生成する方法であって、
幾つかの入力オーディオチャネルを受信するステップと、
前記幾つかの入力オーディオチャネルをパラメトリックにエンコードし、前記幾つかの出力オーディオチャネル及び空間的特性を記述するパラメトリックオーディオデータを有するデータストリームを生成するステップと、
前記階層型エンコード手段に対応する階層型デコーダ構造を決定するステップと、
前記階層型デコーダ構造の階層におけるオーディオチャネルについてのチャネル分割特性を示す少なくとも１つのデータ値を有するデコーダ木構造データを、前記データストリームに含めるステップと、
を有する方法。
幾つかの出力オーディオチャネルを生成するための受信器であって、前記受信器は、
請求項１の装置を有する受信器。
幾つかの出力オーディオチャネルを有するデータストリームを生成するための送信器であって、
請求項２２の装置を有する送信器。
請求項２６の送信器と、請求項２５の受信器とを有する伝送システム。
データストリームを受信する方法であって、前記方法は、
請求項２３に記載の方法を有する方法。
幾つかの出力オーディオチャネルを有するデータストリームを送信する方法であって、
請求項２４に記載の方法を有する方法。
データストリームを送信及び受信する方法であって、前記方法は、送信器において実行される、請求項２９に記載の方法と、
受信器において実行される、請求項２８に記載の方法と
を有する方法。
請求項２３、２４、２８、２９及び３０のいずれか一項に記載の方法を実行するためのコンピュータプログラム。
請求項１に記載の装置を有するオーディオ再生装置。
請求項２２に記載の装置を有するオーディオ記録装置。