JP6313439B2

JP6313439B2 - ダウンミックス行列を復号及び符号化するための方法、音声コンテンツを呈示するための方法、ダウンミックス行列のためのエンコーダ及びデコーダ、音声エンコーダ及び音声デコーダ

Info

Publication number: JP6313439B2
Application number: JP2016525036A
Authority: JP
Inventors: フローリーンギード、; アヒムクンツ、; ベルンハルトグリル、
Original assignee: フラウンホーファーゲゼルシャフトツールフォルデルングデルアンゲヴァンテンフォルシユングエー．フアー．
Priority date: 2013-10-22
Filing date: 2014-10-13
Publication date: 2018-04-25
Anticipated expiration: 2034-10-13
Also published as: PL3061087T3; MY176779A; KR101798348B1; US20160232901A1; CN105723453A; AU2014339167B2; US20200090666A1; EP3061087B1; ES2655046T3; CN110675882B; US11922957B2; US20230005489A1; MX353997B; MX2016004924A; US10468038B2; CA2926986C; TWI571866B; EP2866227A1; ZA201603298B; WO2015058991A1

Description

本発明は、音声符号化・復号の分野に関するものであり、特に、空間音声符号化及び空間音声オブジェクト符号化、例えば３Ｄ音声コーデックシステムの分野に関するものである。

本発明の実施例は、音声コンテンツについての複数の入力チャネルを複数の出力チャネルに対してマッピングするためのダウンミックス行列を符号化及び復号するための方法、音声コンテンツを呈示するための方法、ダウンミックス行列を符号化するためのエンコーダ、ダウンミックス行列を復号するためのデコーダ、音声エンコーダ及び音声デコーダに関するものである。

空間音声符号化ツールが当該技術において周知であり、ＭＰＥＧサラウンド標準規格などにおいて規格化されている。空間音声符号化は、複数の元の入力、例えば５つ又は７つの入力チャネルから開始し、これらは再生設備における位置付けによって識別され、例えば左チャネル、センターチャネル、右チャネル、左サラウンドチャネル、右サラウンドチャネル及び低周波数強調チャネルとして識別される。空間音声エンコーダは、元のチャネルから１つ以上のダウンミックスチャネルを導き出すことができ、さらに、例えば、チャネルコヒーレンス値におけるチャネル間レベル差、チャネル間位相差、チャネル間時間差等の空間キューに関係するパラメータデータを導き出すことができる。１つ以上のダウンミックスチャネルは、最終的に、元の入力チャネルの近似のバージョンである出力チャネルを得るために、空間キューを示すパラメータ付随情報とともに、ダウンミックスチャネル及び関連のパラメータデータを復号するための空間音声デコーダへ送信される。出力設備におけるチャネルの位置付けは固定される場合があり、例えば５．１フォーマット、７．１フォーマットなどとなる。

また、空間音声オブジェクト符号化ツールが当該技術において周知であり、例えばＭＰＥＧＳＡＯＣ標準規格（ＳＡＯＣ＝空間音声オブジェクト符号化）において規格化されている。元のチャネルから開始する空間音声符号化とは対照的に、空間音声オブジェクト符号化は、特定のレンダリング再生設備に対して自動的に専用化されない音声オブジェクトから開始する。むしろ、再生シーンにおける音声オブジェクトの位置付けは、柔軟であり、例えば、特定のレンダリング情報を空間音声オブジェクト符号化デコーダに入力することで、ユーザにより設定されるものであってもよい。これに代えて、又は、これに加えて、レンダリング情報は、追加の付随情報又はメタデータとして送信することができる。レンダリング情報は、特定の音声オブジェクトが再生設備におけるどの位置に置かれるべきか（例えば時間の経過に伴って）についての情報を含み得る。特定のデータ圧縮を得るために、入力オブジェクトから、特定のダウンミックス情報に従ってオブジェクトをダウンミックスすることによって１つ以上のトランスポートチャネルを算出するＳＡＯＣエンコーダを用いて、いくつかの音声オブジェクトは、符号化される。更に、ＳＡＯＣエンコーダは、オブジェクトレベル差（ＯＬＤ）、オブジェクトコヒーレンス値といったオブジェクト間キューを表すパラメータ付随情報を算出する。ＳＡＣ（ＳＡＣ＝空間音声符号化）におけるのと同様、オブジェクト間パラメータデータは、個々の時間・周波数タイルについて算出される。各々のフレーム及び各々の周波数帯域についてパラメータデータが得られるように、音声信号の特定のフレーム（例えば１０２４又は２０４８サンプル）について、複数の周波数帯域（例えば２４帯域、３２帯域、又は６４帯域）が考慮される。例えば、１つの音声片は２０フレームを有し、各々のフレームが更に３２周波数帯域に分割される場合、時間・周波数タイルの数は６４０である。

３Ｄ音声システムにおいては、受信機において利用可能であるスピーカー構成を用いて受信機において音声信号の空間的印象をもたらすことが望ましい場合があるが、このスピーカー構成は、元の音声信号についての元のスピーカー構成とは異なる場合がある。このような状況においては、ある変換を実行することが必要となり、これは「ダウンミックス」と呼ぶ場合があり、これに従って、音声信号の元のスピーカー構成に従う入力チャネルが、受信機のスピーカー構成に従って規定される出力チャネルに対してマッピングされる。

本発明の目的は、受信機にダウンミックス行列を与えるための向上したアプローチを提供することである。

この目的は、請求項１，２，２０に記載の方法、請求項２４に記載のエンコーダ、請求項２６に記載のデコーダ、請求項２８に記載の音声エンコーダ、及び請求項２９に記載の音声デコーダによって達成される。

本発明は、それぞれのチャネルに関連付けられたスピーカーの位置付けに関して入力チャネル構成及び出力チャネル構成において見られる対称性を活用することによって、安定したダウンミックス行列のより効率的な符号化を達成することができるという知見に基づく。本発明の発明者は、このような対称性を活用することによって、対称配置されたスピーカーを、ダウンミックス行列の共通の行／列へと組み合わせることが可能となることを見出した。そして、そのようなスピーカーは、例えば、聴取者の位置に対して、同じ仰角を有し、かつ、絶対値は同じであるが符号が異なる方位角を有する位置にあるスピーカーである。これによって、元のダウンミックス行列と比べてより容易に、かつ、より効率的に符号化することができる、サイズを減少させたコンパクトなダウンミックス行列を生成することが可能となる。

実施例によると、対称のスピーカー群が規定されるだけでなく、実際には３種類のスピーカー群が設けられ、即ち、上述の対称スピーカー、センタースピーカー及び非対称スピーカーであり、これらを用いてコンパクトな表現を生成することができる。このアプローチは、それぞれの種類のスピーカーを異なった態様で、かつ、これにより、より効率的に取り扱うことができるため、有利である。

実施例によると、コンパクトダウンミックス行列を符号化することは、実際のコンパクトダウンミックス行列についての情報とは別個のゲイン値を符号化することを含む。実際のコンパクトダウンミックス行列についての情報は、コンパクトな有意性行列を作成することによって符号化され、この行列は、入力及び出力対称スピーカー対の各々を１つの群にまとめることによって、コンパクトな入力・出力チャネル構成について非ゼロのゲインの存在を示す。このアプローチは、ラン長方式に基づいて有意性行列の効率的な符号化を可能にするため、有用である。

実施例によると、テンプレート行列の行列要素における成分が、コンパクトダウンミックス行列における行列要素における成分に実質的に対応する点において、コンパクトダウンミックス行列と類似するテンプレート行列をもたらすことができる。一般的に、このようなテンプレート行列は、エンコーダ及びデコーダにおいてもたらされ、行列要素の数が減少している点でのみコンパクトダウンミックス行列と異なるため、このようなテンプレート行列を有するコンパクト有意性行列に要素毎のＸＯＲを適用することによって、１の数は劇的に減少する。このアプローチは、例えば、ラン長方式を用いて、有意性行列を符号化する効率を更に上昇させることができるため、有用である。

更なる実施例によると、符号化は、更に、通常スピーカーが通常スピーカーとのみミックスされ、かつ、ＬＦＥスピーカーがＬＦＥスピーカーとのみミックスされるのか否かを示す情報に基づく。これは、更に、有意性行列の符号化を向上させるため有利である。

更なる実施例によると、コンパクト有意性行列、又は上述のＸＯＲ演算の結果は、１次元ベクトルに関して得られ、この１次元ベクトルにランレングス符号化を適用することで、これを複数の０からなるランと、それに続く１とに変換する。これにより、極めて効率的に情報を符号化できるため、有利である。更に効率的な符号化を実現するために、実施例によると、限定的ゴロム・ライス符号化をラン長の値に適用する。

更なる実施例によると、各々の出力スピーカー群について、対称性及び分離性の特性が、これらを生成する全ての対応の入力スピーカー群に当てはまるか否かが示される。これは、例えば左スピーカー及び右スピーカーからなるスピーカー群において、入力チャネル群における左スピーカーが、対応する出力スピーカー群における左チャネルのみに対してマッピングされ、入力チャネル群における右スピーカーが、出力チャネル群における右スピーカーのみに対してマッピングされ、左チャネルから右チャネルへの混合はないことを示すため、有利である。これにより、元のダウンミックス行列における２×２の部分行列内の４つのゲイン値を、コンパクト行列中に導入され得る、又は、コンパクト行列が有意性行列の場合には別個に符号化され得る単一のゲイン値と交換することができる。どのような場合でも、符号化されるべきゲイン値の数は全体的に減少する。従って、示された対称性及び分離性の特性により、入力及び出力スピーカー群の各対に対応する部分行列を効率的に符号化することができるため、有利である。

実施例によると、ゲイン値の符号化について、示された最小ゲイン及び最大ゲインを用いて、更に示された所望な正確さを用いて、可能なゲインのリストを特定の順番で作成する。ゲイン値は、よく用いられるゲインがリスト又は表の先頭に来るような順番で作成される。これは、最も頻繁に用いられるゲインに、これらを符号化するための最短符号ワードを適用することによってゲイン値を効率的に符号化することを可能にするため、有利である。

実施例によると、生成されるゲイン値はリストにおいて与えることができ、リスト中の各成分にはインデックスが関連付けられる。ゲイン値を符号化する場合、実際の値を符号化する代わりに、ゲインのインデックスを符号化する。これは、例えば、限定的ゴロム・ライス符号化アプローチを適用することによって行うことができる。ゲイン値をこのように取り扱うことは、その効率的な符号化を可能にするため有利である。

実施例によると、イコライザ（ＥＱ）パラメータは、ダウンミックス行列とともに送信することができる。

本発明の実施例について、添付の図面を参照しながら説明する。

３Ｄ音声システムの３Ｄ音声エンコーダの概観を示す図。３Ｄ音声システムの３Ｄ音声デコーダの概観を示す図。図２の３Ｄ音声デコーダにおいて実現され得るバイノーラルレンダリング部の実施例を示す図。２２．２入力構成から５．１出力構成へとマッピングするための当該技術において公知のダウンミックス行列の一例を示す図。図４の元のダウンミックス行列をコンパクトダウンミックス行列に変換するための本発明の実施例を概略的に示す図。図４の元のダウンミックス行列をコンパクトダウンミックス行列に変換するための本発明の実施例を概略的に示す図。本発明の実施例による図５のコンパクトダウンミックス行列であって、有意性値を表す行列成分を有する変換後の入力及び出力チャネル構成を有するものを示す図。テンプレート行列を用いた図５のコンパクトダウンミックス行列の構造を符号化するための本発明の更なる実施例を示す図。図８（ａ）〜（ｇ）は、入力スピーカー及び出力スピーカーのそれぞれ異なる組合せによる、図４に示すダウンミックス行列から導き出され得る可能な部分行列を示す図である。

本発明のアプローチの実施例について説明する。以下の記載では、まず、本発明のアプローチが実現され得る３Ｄ音声コーデックシステムのシステム概観を説明する。

図１及び図２は、実施例による３Ｄ音声システムのアルゴリズムブロックを示す。より具体的には、図１は、３Ｄ音声エンコーダ１００の概観を示す。音声エンコーダ１００は、任意に設けられ得る前レンダリング・混合回路１０２において、入力信号を受け取る。この入力信号は、より具体的には、音声エンコーダ１００に複数のチャネル信号１０４、複数のオブジェクト信号１０６及び対応するオブジェクトメタデータ１０８を入力する複数の入力チャネルである。前レンダリング・混合部１０２によって処理されるオブジェクト信号１０６（信号１１０を参照）は、ＳＡＯＣエンコーダ１１２（ＳＡＯＣ＝空間音声オブジェクト符号化）に入力することができる。ＳＡＯＣエンコーダ１１２は、ＵＳＡＣエンコーダ１１６（ＵＳＡＣ＝音声音響統合符号化）に入力されるＳＡＯＣトランスポートチャネル１１４を生成する。これに加えて、信号ＳＡＯＣ−ＳＩ１１８（ＳＡＯＣ−ＳＩ＝ＳＡＯＣ付随情報）もまたＵＳＡＣエンコーダ１１６に入力される。ＵＳＡＣエンコーダ１１６は更に、前レンダリング・混合部から直接にオブジェクト信号１２０並びにチャネル信号及び前レンダリングされたオブジェクト信号１２２を受け取る。オブジェクトメタデータ情報１０８はＯＡＭエンコーダ１２４（ＯＡＭ＝オブジェクト関連メタデータ）に入力され、このＯＡＭエンコーダは、圧縮されたオブジェクトメタデータ情報１２６をＵＳＡＣエンコーダに入力する。ＵＳＡＣエンコーダ１１６は、上述の入力信号に基づいて、１２８に示す圧縮済の出力信号ｍｐ４を生成する。

図２は、３Ｄ音声システムの３Ｄ音声デコーダ２００の概観を示す。図１の音声エンコーダ１００によって生成されたエンコーダ信号１２８（ｍｐ４）は、音声デコーダ２００、より具体的にはＵＳＡＣデコーダ２０２において受信される。ＵＳＡＣデコーダ２０２は、受信した信号１２８を、チャネル信号２０４、前レンダリングされたオブジェクト信号２０６、オブジェクト信号２０８及びＳＡＯＣトランスポートチャネル信号２１０に復号する。更に、圧縮済のオブジェクトメタデータ情報２１２及び信号ＳＡＯＣ−ＳＩ２１４がＵＳＡＣデコーダ２０２によって出力される。オブジェクト信号２０８は、オブジェクトレンダリング部２１６に入力され、このオブジェクトレンダリング部は、レンダリングされたオブジェクト信号２１８を出力する。ＳＡＯＣトランスポートチャネル信号２１０はＳＡＯＣデコーダ２２０に供給され、このＳＡＯＣデコーダは、レンダリングされたオブジェクト信号２２２を出力する。圧縮済のオブジェクトメタ情報２１２はＯＡＭデコーダ２２４に供給され、このＯＡＭデコーダは、それぞれの制御信号をオブジェクトレンダリング部２１６及びＳＡＯＣデコーダ２２０に出力することにより、レンダリングされたオブジェクト信号２１８及びレンダリングされたオブジェクト信号２２２を生成する。デコーダは更に、図２に示すように入力信号２０４、２０６、２１８、２２２を受け取ってチャネル信号２２８を出力する混合部２２６を備える。チャネル信号は、スピーカー、例えば２３０で示す３２チャネルスピーカーに直接出力することができる。信号２２８は、フォーマット変換回路２３２に入力することができ、このフォーマット変換回路は、チャネル信号２２８を変換する方法を示す再生レイアウト信号を、制御入力として、受け取る。図２に示す実施例では、２３４で示す５．１スピーカーシステムに信号を入力できるように変換を行う場合を想定している。また、チャネル信号２２８はバイノーラルレンダリング部２３６に入力することができ、このバイノーラルレンダリング部は、２３８で示す２つの出力信号を、例えばヘッドフォン用に生成する。

本発明の実施例においては、図１及び図２に示す符号化・復号システムは、チャネル及びオブジェクト信号（信号１０４，１０６を参照）の符号化のためのＭＰＥＧ−ＤＵＳＡＣコーデックに基づいている。大量のオブジェクトを符号化する効率性を向上させるために、ＭＰＥＧＳＡＯＣ技術を使用することができる。３種類のレンダリング部が、オブジェクトをチャネルにレンダリングし、チャネルをヘッドフォンにレンダリングし、又はチャネルを異なるスピーカー設備にレンダリングするタスクを実行することができる（図２の参照符号２３０，２３４，２３８を参照）。オブジェクト信号が、明示的に送信される場合、又は、ＳＡＯＣを用いてパラメータ的に符号化される場合、対応するオブジェクトメタデータ情報１０８は圧縮され（信号１２６を参照）、３Ｄ音声ビットストリーム１２８へと多重化される。

図１，２に示す全体的な３Ｄ音声システムのアルゴリズムブロックについて、以下により詳細に説明する。

符号化前にチャネル＋オブジェクト入力シーンをチャネルシーンに変換するために、前レンダリング・混合部１０２が任意に設けられ得る。機能的には、これは後述のオブジェクトレンダリング・混合部と同一である。オブジェクトの前レンダリングは、同時にアクティブなオブジェクト信号の数とは基本的に独立の、エンコーダ入力における決定性信号エントロピーを確保するために望ましい場合がある。オブジェクトの前レンダリングでは、オブジェクトメタデータを送信する必要はない。離散的オブジェクト信号は、エンコーダが使用するように構成されるチャネルレイアウトへとレンダリングされる。各々のチャネルについてのオブジェクトの重みは、関連付けられたオブジェクトメタデータ（ＯＡＭ）から得られる。

ＵＳＡＣエンコーダ１１６は、スピーカーチャネル信号、離散的オブジェクト信号、オブジェクトダウンミックス信号、及び、前レンダリングされた信号のためのコアコーデックである。ＵＳＡＣエンコーダはＭＰＥＧ−ＤＵＳＡＣ技術に基づく。ＵＳＡＣエンコーダは、入力チャネル及びオブジェクト割り当ての幾何学的情報及び意味論的情報に基づいてチャネル・オブジェクトマッピング情報を作成することにより、上記の信号の符号化に対処する。このマッピング情報は、入力チャネル及びオブジェクトを、ＵＳＡＣチャネル要素、例えばチャネル対要素（ＣＰＥ）、信号チャネル要素（ＳＣＥ）、低周波数効果（ＬＦＥ）及びクワッドチャネル要素（ＱＣＥ）並びにＣＰＥ、ＳＣＥ及びＬＦＥ、に対してどのようにマッピングするかを記述し、対応する情報がデコーダへ送信される。例えば、ＳＡＯＣデータ１１４，１１８又はオブジェクトメタデータ１２６のような追加のペイロードは、エンコーダのレート制御において、全て、考慮される。レート／歪み要件と、レンダリング部についてのインタラクト性要件とに応じて、それぞれ異なる態様で、オブジェクトを符号化することが可能である。実施例によると、以下のオブジェクト符号化の変形例が可能である。

・前レンダリングされたオブジェクト：オブジェクト信号は、前レンダリングされ、２２．２チャネル信号にミックスされてから符号化される。後続の符号化チェーンは、２２．２チャネル信号を参照する。

・離散的オブジェクト波形：オブジェクトは、モノフォニック波形としてエンコーダに供給される。エンコーダは、単一のチャネル要素（ＳＣＥ）を用いて、チャネル信号に加えてオブジェクトを送信する。復号されたオブジェクトは、受信側でレンダリングされてミックスされる。圧縮されたオブジェクトメタデータ情報が受信機・レンダリング部に送信される。

・パラメータ的オブジェクト波形：オブジェクト特性及びその互いの関係は、ＳＡＯＣパラメータによって記述される。オブジェクト信号のダウンミックスは、ＵＳＡＣによって符号化される。パラメータ情報がともに送信される。ダウンミックスチャネルの数は、オブジェクトの数と、全体的なデータレートとに応じて選択される。圧縮されたオブジェクトメタデータ情報は、ＳＡＯＣレンダリング部に送信される。

オブジェクト信号についてのＳＡＯＣエンコーダ１１２及びＳＡＯＣデコーダ２２０は、ＭＰＥＧＳＡＯＣ技術に基づくものであってもよい。このシステムは、少数の送信されるチャネル及び追加のパラメータデータ、例えばＯＬＤ、ＩＯＣ（オブジェクト間コヒーレンス）、ＤＭＧ（ダウンミックスゲイン）、に基づいて、或る数の音声オブジェクトを再作成、変更及びレンダリングすることができる。追加のパラメータデータは、全てのオブジェクトを個々に送信するために必要とされるよりも大幅に低いデータレートであるため、符号化が極めて効率的である。ＳＡＯＣエンコーダ１１２は、入力として、モノフォニック波形といったオブジェクト・チャネル信号を受け取り、パラメータ情報（３Ｄ音声ビットストリーム１２８にパックされる）及びＳＡＯＣトランスポートチャネル（単一のチャネル要素を用いて符号化されて送信される）を出力する。ＳＡＯＣデコーダ２２０は、復号されたＳＡＯＣトランスポートチャネル２１０及びパラメータ情報２１４からオブジェクト・チャネル信号を復元し、再生レイアウト、圧縮解除されたオブジェクトメタデータ情報、及び任意にユーザ対話情報に基づいて、出力音声シーンを生成する。

オブジェクトメタデータコーデック（ＯＡＭエンコーダ１２４及びＯＡＭデコーダ２２４を参照）は、各々のオブジェクトについて、３Ｄ空間におけるオブジェクトの幾何学的位置及びボリュームを特定するための、関連付けられたメタデータが、時間及び空間におけるオブジェクトのプロパティを量子化することで効率的に符号化されるように、設けられている。圧縮されたオブジェクトメタデータｃＯＡＭ１２６は、付随情報として受信機２００に送信される。

オブジェクトレンダリング部２１６は、圧縮されたオブジェクトメタデータを利用して、所与の再生フォーマットに従ってオブジェクト波形を生成する。各々のオブジェクトは、そのメタデータに従って特定の出力チャネルにレンダリングされる。このブロックの出力は、部分的な結果の総和の結果として得られる。チャネルベースのコンテンツ及び離散的・パラメータ的オブジェクトの両方が復号される場合、チャネルベースの波形及びレンダリングされたオブジェクト波形は混合部２２６によって混合されて、結果として得られる波形２２８を出力し、又は、これらを後処理モジュール、例えばバイノーラルレンダリング部２３６又はスピーカーレンダリングモジュール２３２に入力する。

バイノーラルレンダリングモジュール２３６は、多チャンネル音声素材のバイノーラルダウンミックスを生成し、各々の入力チャネルが仮想音源によって表されるようにする。この処理は、ＱＭＦ（４分ミラーフィルタバンク）領域においてフレーム毎に実行され、バイノーラル化は、測定されたバイノーラル室内インパルス応答に基づく。

スピーカーレンダリング部２３２は、送信されたチャネル構成２２８と、所望の再生フォーマットとの間で変換を行う。これは「フォーマット変換部」とも呼ぶことができる。フォーマット変換部は、より少ない数の出力チャネルへの変換を行う、即ちダウンミックスを作成する。

図３は、図２のバイノーラルレンダリング部２３６の実施例を示す。バイノーラルレンダリングモジュールは、多チャネル音声素材のバイノーラルダウンミックスを与えることができる。バイノーラル化は、測定されたバイノーラル室内インパルス応答に基づくものであってもよい。室内インパルス応答は、実際の室内の音響的特性の「指紋」と見做すことができる。室内インパルス応答は測定されて記憶され、任意の音響信号にこの「指紋」を付与することができ、こうして、室内インパルス応答に関連付けられた室内の音響特性のシミュレーションを聴取者に可能にする。バイノーラルレンダリング部２３６は、頭に関連した転送関数又はバイノーラル室内インパルス応答（ＢＲＩＲ）を用いて、出力チャネルを２つのバイノーラルチャネルへとレンダリングするように、プログラムされ、又は、構成され得る。例えば、移動機器の場合、このような移動機器に取り付けられたヘッドフォン又はスピーカーについてバイノーラルレンダリングが望ましい。このような移動機器においては、各種制約のため、デコーダ及びレンダリングの複雑度を制限することが必要な場合がある。このような処理シナリオにおいて相関解除を省略することに加えて、ダウンミックス部２５０を用いて、中間ダウンミックス信号２５２へ、即ち、少ない数の出力チャネル（実際のバイノーラル変換部２５４について少ない数の入力チャネルを結果として伴う）へのダウンミックスを最初に実行することが好ましい場合がある。例えば、２２．２チャネル素材は、ダウンミックス部２５０によって５．１中間ダウンミックスにダウンミックスすることができ、又は、これに代えて、中間ダウンミックスは、図２のＳＡＯＣデコーダ２２０によって、ある種の「ショートカット」モードとして直接算出することができる。次に、バイノーラルレンダリングは、それぞれ異なる位置での５つの個々のチャネルをレンダリングするために１０個のＨＲＴＦ（頭に関連した転送関数）又はＢＲＩＲ関数を適用するだけでよく、これは、２２．２入力チャネルを直接レンダリングする場合に４４個のＨＲＴＦ又はＢＲＩＲ関数を適用するのとは対照的である。バイノーラルレンダリングに必要な畳み込み演算は、多くの処理能力を必要とするため、受け入れられる音声品質を得ながらこの処理能力を低減することは、移動機器において特に有用である。バイノーラルレンダリング部２３６は、多チャネル音声素材２２８のバイノーラルダウンミックス２３８を生成し、各々の入力チャネル（ＬＦＥチャネルを除く）が仮想音源によって表されるようにする。この処理は、ＱＭＦ領域においてフレーム毎に実行することができる。このバイノーラル化は、測定されたバイノーラル室内インパルス応答に基づくものであり、直接音及び早い段階の反射は、ＱＭＦ領域の高速畳み込みオントップを用いた疑似ＦＦＴ領域において畳み込み処理を介して音声素材に刻印される一方、後の段階の反響は別個に処理され得る。

多チャネル音声フォーマットは、現在多くの種類の構成で存在しており、例えば、ＤＶＤ及びブルーレイディスクで提供される音声情報を提供するために用いられる、上で詳述した３Ｄ音声システムにおいて用いられている。１つの重要な問題は、既存の利用可能な顧客の物理的スピーカー設備との互換性を維持しながら、多チャネル音声のリアルタイム伝送に対応することである。１つの解決策は、例えば、典型的に多数の出力チャネルを有する制作時に使用される元のフォーマットで音声コンテンツを符号化することである。これに加えて、ダウンミックス付随情報を与えて、より独立性の低いチャネルを有する他のフォーマットを生成する。例えば、或る個数Ｎの入力チャネル及び或る個数Ｍの出力チャネルを想定すると、受信機におけるダウンミックス手順は、Ｎ×Ｍのサイズを有するダウンミックス行列によって特定することができる。この具体的な手順は、上述のフォーマット変換部又はバイノーラルレンダリング部のダウンミックス部において実行され得るものであるが、受動的なダウンミックスを表すものであり、実際の音声コンテンツに依存する適応信号処理が入力信号又はダウンミックス後の出力信号に適用されないことを意味する。

ダウンミックス行列は、音声情報の物理的な混合のみをマッチングすることを試みるのではなく、送信される実際のコンテンツについての自分自身の知見を用い得る制作者の芸術的意図をも伝えることがある。従って、ダウンミックス行列を生成するいくつかの方法が存在する。例えば、手動で、入力スピーカー及び出力スピーカーの役割及び位置についての一般的な音響的知見を使用したり、手動で、実際のコンテンツ及び芸術的意図についての知見を使用したり、自動的に、例えば所与の出力スピーカーを用いた近似を計算するソフトウェアツールを使用したりする。

このようなダウンミックス行列をもたらすために、当該技術ではいくつかの公知のアプローチが存在する。しかし、既存の方式においては、多くの想定がなされており、実際のダウンミックス行列の構造及び内容の重要な部分がハードコードされている。先行技術文献［１］では、５．１チャネル構成（先行技術文献［２］を参照）を２．０チャネル構成へ、６．１又は７．１前方又は前方高さ又はサラウンド後方のものから５．１又は２．０チャネル構成へダウンミックスするように明示的に規定される特定のダウンミックス手順を使用することが記載されている。これら公知のアプローチの欠点は、ダウンミックス方式が限られた自由度しかないことであり、即ち、入力チャネルのいくつかが予め規定された重みと混合され（例えば、７．１サラウンド後方を５．１構成に対してマッピングする場合、Ｌ、Ｒ、Ｃ入力チャネルが対応の出力チャネルに対して直接マッピングされる）、減少した個数のゲイン値が他のいくつかの入力チャネルと共有される（例えば、７．１前方を５．１構成に対してマッピングする場合、Ｌ、Ｒ、Ｌｃ及びＲｃ入力チャネルがただ１つのゲイン値を用いてＬ及びＲ出力チャネルに混合される）。更に、ゲインの範囲及び精度が限られたものに過ぎず、例えば、０ｄＢから−９ｄＢで合計８レベルである。各々の入力及び出力構成対についてのダウンミックス手順を明示的に記述することは労力を要するものであり、既存の標準規格に対する追加を意味し、これは遵守の遅れという犠牲を伴う。別の提案が先行技術文献［５］に記載されている。このアプローチは、柔軟性における向上である明示的なダウンミックス行列を用いているが、この方式においても、範囲及び精度が０ｄＢ〜−９ｄＢ、合計１６レベルと限られている。更に、各々のゲインが４ビットの固定の精度で符号化される。

従って、公知の先行技術に鑑み、ダウンミックス行列の効率的な符号化のための向上したアプローチであって、好適な表現領域及び量子化方式を選択する局面を含むだけでなく、量子化された値の可逆符号化をも含むものが必要とされている。

実施例によると、範囲及び精度が制作者の必要に応じて制作者によって特定される形で任意のダウンミックス行列の符号化を可能にすることによって、ダウンミックス行列の取り扱いにおいて無制限の柔軟さが達成される。また、本発明の実施例では、典型的な行列が少量のビットを用い、典型的な行列から逸脱するにつれて徐々に効率性が低下する極めて効率的な可逆符号化が可能となる。これは、行列が典型的な行列に類似すればするほど、本発明の実施例に記載された符号化は効率的になるということを意味する。

実施例によると、必要とされる精度は、制作者によって１ｄＢ、０．５ｄＢ又は０．２５ｄＢとして特定されて均一な量子化に用いられることとすることができる。なお、他の実施例によると、他の精度値を選択しても良い。これに対して、既存の方式では、０ｄＢ前後の値については１．５ｄＢ又は０．５ｄＢの精度しか可能ではなく、他の値についてはより低い精度を用いることになる。いくつかの値について粗い量子化を用いると、達成される最悪の場合の許容値に影響を及ぼし、復号された行列の解釈が困難になる。既存の技術では、いくつかの値についてはより低い精度を用い、これは均一な符号化を用いて必要ビット数を減少させる単純な手段である。しかし、以下に詳述する改善された符号化方式を用いることによって、精度を犠牲にすることなくほぼ同じ結果を達成することができる。

実施例によると、混合ゲインの値は、最大値、例えば＋２２ｄＢ、及び最小値、例えば−４７ｄＢ、の間で特定することができる。これらはまた、値マイナス無限を含むことができる。行列において用いられる有効値範囲は、ビットストリームにおいて最大ゲイン及び最小ゲインとして示されるため、所望の柔軟性を制限することなく、実際に用いられない値についてのビットを無駄にすることがない。

実施例によると、ダウンミックス行列が与えられるべき音声コンテンツの入力チャネルリスト、及び出力スピーカー構成を示す出力チャネルリスト、が利用可能であると想定する。これらのリストは、入力構成及び出力構成における各々のスピーカーについての幾何学的情報、例えば方位角及び仰角、を有する。任意には、スピーカーの慣習的な名称を有する場合もある。

図４は、２２．２入力構成から５．１出力構成へのマッピングのための当該技術において公知のダウンミックス行列の一例を示す。行列の右側の列３００において、２２．２構成によるそれぞれの入力チャネルは、それぞれのチャネルに関連付けられたスピーカー名によって示される。最も下の行３０２は、出力チャネル構成、５．１構成のそれぞれの出力チャネルを含む。ここでも、それぞれのチャネルは、関連付けられたスピーカー名によって示される。この行列は、各々がゲイン値（混合ゲインとも呼ぶ）を持つ複数の行列要素３０４を含む。混合ゲインは、それぞれの出力チャネル３０２に寄与する際に、所与の入力チャネル、例えば入力チャネル３００のうちの１つ、のレベルをどのように調節するかを示す。例えば、左上の行列要素は「１」の値を示しており、入力チャネル構成３００におけるセンターチャネルＣが、出力チャネル構成３０２のセンターチャネルＣに対して完全にマッチングしていることを意味している。同様に、２つの構成におけるそれぞれの左チャネル及び右チャネル（Ｌ／Ｒチャネル）は完全にマッピングされており、即ち、入力構成における左／右チャネルは、出力構成における左／右チャネルに完全に寄与する。他のチャネル、例えば入力構成におけるチャネルＬｃ及びＲｃは、出力構成３０２の左チャネル及び右チャネルに対して、０．７という低減したレベルでマッピングされる。図４から見て取れるように、成分を持たない行列要素がいくつかあり、これは、行列要素に関連付けられたそれぞれのチャネルが互いに対してマッピングされていないこと、又は、成分を持たない行列要素によって出力チャネルにリンクされた入力チャネルは、それぞれの出力チャネルに寄与しないことを意味する。例えば、左／右入力チャネルのいずれも、出力チャネルＬｓ／Ｒｓに対してマッピングされておらず、即ち、左入力チャネル及び右入力チャネルは、出力チャネルＬｓ／Ｒｓに寄与しない。行列において空白を与える代わりに、ゼロ・ゲインを示しても良い。

以下、ダウンミックス行列の効率的な可逆符号化を達成するための本発明の実施例に従って適用されるいくつかの技術について説明する。以下の実施例においては、図４に示すダウンミックス行列の符号化を参照するが、以下に記載の特徴は、もたらされ得る他のどのダウンミックス行列に適用しても良いことは明らかである。実施例によると、ダウンミックス行列を復号するためのアプローチが提供され、複数の入力チャネルのスピーカー対の対称性と、複数の出力チャネルのスピーカー対の対称性とを活用することによってダウンミックス行列を符号化する。ダウンミックスの復号は、デコーダへの送信に続いて行われ、例えば符号化された音声コンテンツ及び符号化された情報又はダウンミックス行列を表すデータを含むビットストリームを受信する音声デコーダにおいて行われて、元のダウンミックス行列に対応するダウンミックス行列をデコーダで構築することが可能となる。ダウンミックス行列を復号することは、ダウンミックス行列を表す符号化情報を受け取ることと、符号化情報を復号してダウンミックス行列を得ることとを含む。他の実施例によると、ダウンミックス行列を符号化するためのアプローチであって、複数の入力チャネルのスピーカー対の対称性と、複数の出力チャネルのスピーカー対の対称性とを活用することを含むものが提供される。

本発明の実施例についての以下の説明においては、ダウンミックス行列の符号化の文脈でいくつかの局面を説明するが、当業者にとっては、これらの局面が、ダウンミックス行列を復号するための対応するアプローチの説明をも表すことは明らかである。同様に、ダウンミックス行列の復号の文脈で説明する局面は、ダウンミックス行列を符号化するための対応するアプローチの説明をも表す。

実施例によると、最初のステップは、行列におけるゼロ成分の数がかなりあることを利用することである。続くステップでは、実施例によると、ダウンミックス行列において典型的に存在するグローバル且つ細かいレベルの規則性を利用する。３番目のステップでは、ゼロでないゲイン値の典型的な分布を利用する。

最初の実施例によると、本発明のアプローチは、音声コンテンツの制作者によって与えられ得るダウンミックス行列から開始する。以下の説明においては、簡略化のため、考慮するダウンミックス行列は図４のものであると想定する。本発明のアプローチによると、図４のダウンミックス行列を変換することによって、元の行列と比較してより効率的に符号化され得るコンパクトなダウンミックス行列を生成する。

図５は、上述の変換ステップを概略的に表す。図５の上側においては、図４の元のダウンミックス行列３０６が示され、これは、以下に詳述する態様で、図５の下側に示すコンパクトダウンミックス行列３０８へと変換される。本発明のアプローチによると、「対称スピーカー対」の概念が用いられるが、これは、聴取者の位置に対して、１つのスピーカーが左側の半面にあり、もう１つが右側の半面にあることを意味する。この対称対構成は、同じ仰角を有し、かつ、絶対値は同じであるが正負符号が異なる方位角を有する２つのスピーカーに対応する。

実施例によると、それぞれ異なる種類のスピーカー群、即ち対称スピーカーＳ、センタースピーカーＣ及び非対称スピーカーＡが規定される。センタースピーカーとは、スピーカー位置の方位角の正負符号を変化させたときに位置が変化しないスピーカーである。非対称スピーカーとは、所与の構成において、他の又は対応する対称スピーカーを欠くスピーカーであり、或いは、稀な構成においては、他方側のスピーカーは異なる仰角又は方位角を有する場合もあり、この場合、対称対の代わりに２つの別個の非対称スピーカーが存在する。図５に示すダウンミックス行列３０６においては、入力チャネル構成３００は、図５の上側に示す９つの対称スピーカー対Ｓ_１〜Ｓ_９を含む。例えば、対称スピーカー対Ｓ_１は、２２．２入力チャネル構成３００のスピーカーＬｃ及びＲｃを含む。また、２２．２入力構成におけるＬＦＥスピーカーは、聴取者の位置に対して、同じ仰角と、絶対値が同じで異なる正負符号の方位角とを有するため、対称スピーカーである。２２．２入力チャネル構成３００は、更に、６つのセンタースピーカーＣ_１〜Ｃ_６、即ちスピーカーＣ、Ｃｓ、Ｃｖ、Ｔｓ、Ｃｖｒ及びＣｂを含む。入力チャネル構成において非対称チャネルは存在しない。入力チャネル構成とは別の出力チャネル構成３０２は、２つの対称スピーカー対Ｓ_１０，Ｓ_１１、１つのセンタースピーカーＣ_７及び１つの非対称スピーカーＡ_１のみを含む。

上述の実施例によると、ダウンミックス行列３０６は、対称スピーカー対を形成する入力スピーカー及び出力スピーカーをグループ付けすることによってコンパクト表現３０８に変換される。それぞれのスピーカーをグループ付けすることによって、元の入力構成３００におけるのと同じセンタースピーカーＣ_１〜Ｃ_６を含むコンパクト入力構成３１０が得られる。しかしながら、元の入力構成３００と比較すると、対称スピーカーＳ_１〜Ｓ_９をそれぞれグループ付けることで、それぞれの対が、図５の下側に示すようにただ１つの行を占めるようになる。同様に、元の出力チャネル構成３０２もまたコンパクト出力チャネル構成３１２に変換され、これもまた、元のセンタースピーカー及び非対称スピーカー、即ちセンタースピーカーＣ_７及び非対称スピーカーＡ_１、を含む。しかし、それぞれのスピーカー対Ｓ_１０，Ｓ_１１は、単一の行へと組み合わされている。従って、図５から見て取れるように、２４×６であった元のダウンミックス行列３０６の寸法は、１５×４のコンパクトダウンミックス行列３０８の寸法に減少される。

図５に関して説明した実施例においては、元のダウンミックス行列３０６において、それぞれの対称スピーカー対Ｓ_１〜Ｓ_１１に関連付けられた混合ゲイン（入力チャネルが出力チャネルにどれほど強く寄与するかを示す）は、入力チャネル及び出力チャネルにおける対応する対称スピーカー対について対称に配置されることが見て取れる。例えば、対Ｓ_１，Ｓ_１０を見ると、それぞれの左チャネル及び右チャネルをゲイン０．７で組み合わせる一方、左／右チャネルの組み合わせをゲイン０で組み合わせる。従って、コンパクトダウンミックス行列３０８に示す態様でそれぞれのチャネルをグループ付けすると、コンパクトダウンミックス行列要素３１４は、元の行列３０６に関して説明したそれぞれの混合ゲインを含み得る。従って、上述の実施例によると、対称スピーカー対をグループ付けすることによって元のダウンミックス行列のサイズを減少させ、こうして「コンパクト」表現３０８は、元のダウンミックス行列よりも効率的に符号化することができる。

次に、図６に関し、本発明の更なる実施例について説明する。図６もまた、図５に関して示して説明した変換後の入力チャネル構成３１０及び出力チャネル構成３１２を有するコンパクトダウンミックス行列３０８を示す。図６の実施例において、図５に示したものとは異なり、コンパクトダウンミックス行列の行列成分３１４は、ゲイン値を表すのではなく、いわゆる「有意性値」を表す。有意性値は、それぞれの行列要素３１４において、これと関連付けられたゲインのいずれかがゼロでないか否かを示す。これらの値「１」を示す行列要素３１４は、それぞれの要素にゲイン値が関連付けられることを示す一方、空白の行列要素は、この要素にゲインが関連付けられていない、又はゼロのゲインが関連付けられていることを示す。この実施例によると、実際のゲイン値を有意性値に代えることで、図５と比較してコンパクトダウンミックス行列の符号化を更に効率的にすることができるが、それは、図６の表現３０８が、例えばそれぞれの有意性値について１の値又は０の値を示す１成分当り１ビットを用いて、簡単に符号化され得るからである。これに加えて、有意性値の符号化の他に、行列要素に関連付けられたそれぞれのゲイン値を符号化することによって、受け取った情報の復号後、完全なダウンミックス行列が復元され得るようにすることが必要である。

別の実施例によると、図６に示すコンパクトな形式におけるダウンミックス行列の表現は、ラン長方式を用いて符号化され得る。このようなラン長方式においては、行列要素３１４は、行１から始まり行１５で終わるように各行を連結することによって１次元ベクトルへと変換される。次に、この１次元ベクトルを、ラン長を含むリスト、例えば１で終わる連続するゼロ、へと変換する。図６の実施例においては、これによって以下のリストが得られる。

ここで、（１）は、ビットベクトルが０で終わる場合の仮想の終端を表す。上に示すラン長は、適切な符号化方式、例えば可変長プレフィックス符号を各々の数に割り当てる限定的ゴロム・ライス符号化、を用いて符号化することによって全体ビット長を最小化することができる。ゴロム・ライス符号化アプローチは、以下のように、負でない整数パラメータｐ≧０を用いて負でない整数ｎ≧０を符号化するために用いられる。最初に、数
ｈ＝ｎ／２^ｐ
は、単項符号化を用いて符号化され、ｈ個の１のビットの後に終端のゼロ・ビットが続く。次に、ｐビットを用いて数ｌ＝ｎ−ｈ・２^ｐを均一に符号化する。

限定的ゴロム・ライス符号化は、ｎ＜Ｎであることが予め分かっている場合に用いられる些細な変種である。これは、ｈの可能な最大値、即ち、
ｈｍａｘ＝（Ｎ−１）／２^ｐ
を符号化する際に終端のゼロ・ビットを含まない。より正確には、ｈ＝ｈ_ｍａｘを符号化するためには、終端のゼロ・ビットのないｈ個の１のビットのみを用いる。終端のゼロ・ビットは、デコーダがこの状態を黙示的に検出できるため、必要ではない。

上述のように、それぞれの要素３１４と関連付けられたゲインもまた符号化されて送信される必要があり、これを行うための実施例について以下に詳述する。ゲインの符号化を詳述する前に、図６に示すコンパクトダウンミックス行列の構造を符号化するための更なる実施例について説明する。

図７は、典型的なコンパクト行列が音声エンコーダ及び音声デコーダの両方で利用可能なテンプレート行列に、ほぼ類似するように、典型的なコンパクト行列がいくつかの意味のある構造を有しているという事実を利用することによって、コンパクトダウンミックス行列の構造を符号化するための更なる実施例を説明するためのものである。図７は、図６でも示した有意性値を有するコンパクトダウンミックス行列３０８を示す。これに加えて、図７は、同じ入力チャネル構成３１０’及び出力チャネル構成３１２’を有する可能なテンプレート行列３１６の一例を示す。テンプレート行列は、コンパクトダウンミックス行列と同様、それぞれのテンプレート行列要素３１４’における有意性値を含む。有意性値は、コンパクトダウンミックス行列におけるのと基本的に同じ態様で要素３１４’間に分配されるが、上述のようにコンパクトダウンミックス行列と「類似」しているに過ぎないテンプレート行列は、要素３１４’のいくつかにおいて異なっている。テンプレート行列３１６とコンパクトダウンミックス行列３０８との相違点は、コンパクトダウンミックス行列３０８において、行列要素３１８，３２０はゲイン値を含まないのに対し、テンプレート行列３１６は、対応する行列要素３１８’，３２０’において有意性値を含むことである。従って、テンプレート行列３１６は、強調された成分３１８’，３２０’に関して、符号化される必要があるコンパクト行列と異なっている。コンパクトダウンミックス行列の更に効率的な符号化を達成するために、図６と比較して、２つの行列３０８，３１６における対応する行列要素３１４，３１４’を論理的に組み合わせ、上述と類似の態様で符号化され得る１次元ベクトルを、図６に関して説明したのと類似の態様で得る。行列要素３１４，３１４’の各々には、ＸＯＲ演算を実行することができ、より具体的には、コンパクトテンプレートを用いてコンパクト行列に要素単位の論理ＸＯＲ演算を適用して１次元ベクトルを得て、これを以下のラン長を含むリストに変換する。

次に、このリストを、例えば限定的ゴロム・ライス符号化を用いて符号化することができる。図６に関して説明した実施例と比較して、このリストは、より効率的に符号化することができることが分かる。コンパクト行列がテンプレート行列と同一である最善の場合、ベクトル全体はゼロのみから構成され、１つのラン長の数を符号化するだけで良い。

図７に関して説明したテンプレート行列の使用に関し、エンコーダ及びデコーダの両方は、予め規定された組のこのようなコンパクトテンプレートを有している必要があり、これは入力スピーカー及び出力スピーカーの組によって一意に決定されるが、これはスピーカーのリストによって決定される入力構成又は出力構成とは対照的である。これは、入力スピーカー及び出力スピーカーの順番は、テンプレート行列を決定する上で重要ではなく、所与のコンパクト行列の順番に一致するように使用前に順序を変えることができることを意味する。

以下、上述のように、元のダウンミックス行列において与えられる混合ゲインであって、もはやコンパクトダウンミックス行列に存在せず、符号化及び送信される必要があるものの符号化についての実施例を説明する。

図８は、混合ゲインを符号化するための実施例を説明するものである。この実施例は、入力スピーカー群及び出力スピーカー群、即ち群Ｓ（対称、Ｌ及びＲ）、Ｃ（センター）及びＡ（非対称）、のそれぞれ異なる組合せに従って、元のダウンミックス行列における１つ以上のゼロでない成分に対応する部分行列の特性を利用する。図８は、入力スピーカー及び出力スピーカー、即ち対称スピーカーＬ及びＲ、センタースピーカーＣ及び非対称スピーカーＡ、のそれぞれ異なる組合せに従って、図４に示すダウンミックス行列から導き出され得る可能な部分行列を説明するものである。図８では、ａ、ｂ、ｃ及びｄの文字は、任意のゲイン値を表す。

図８（ａ）は、図４の行列から導き出され得る４つの可能な部分行列を示す。最初のものは、２つのセンターチャネル、例えば入力構成３００におけるスピーカーＣ及び出力構成３０２におけるスピーカーＣ、のマッピングを規定する部分行列であり、ゲイン値「ａ」は、行列要素［１，１］（図４の左上要素）に示すゲイン値である。図８（ａ）の２番目の部分行列は、例えば、２つの対称の入力チャネル、例えば入力チャネルＬｃ及びＲｃを、出力チャネル構成におけるセンタースピーカー、例えばスピーカーＣに対してマッピングすることを表す。ゲイン値「ａ」及び「ｂ」は、行列要素［１，２］及び［１，３］に示すゲイン値である。図８（ａ）の３番目の部分行列は、センタースピーカーＣ、例えば図４の入力構成３００におけるスピーカーＣｖｒ、を２つの対称チャネル、例えば出力構成３０２におけるチャネルＬｓ及びＲｓに対してマッピングすることを表す。ゲイン値「ａ」及び「ｂ」は、行列要素［４，２１］及び［５，２１］に示すゲイン値である。図８（ａ）の４番目の部分行列は、２つの対称のチャネルがマッピングされる、例えば入力構成３００におけるチャネルＬ，Ｒが出力構成３０２におけるチャネルＬ，Ｒに対してマッピングされる場合を表す。ゲイン値「ａ」〜「ｄ」は、行列要素［２，４］［２，５］、［３，４］、［３，５］に示すゲイン値である。

図８（ｂ）は、非対称のスピーカーをマッピングする際の部分行列を示す。最初の表現は、２つの非対象のスピーカーをマッピングすることによって得られる部分行列である（図４にはこのような部分行列についての例はない）。図８（ｂ）の２番目の部分行列は、２つの対称の入力チャネルを非対称の出力チャネルに対してマッピングすることを表し、これは、図４の実施例においては、例えば、２つの対称入力チャネルＬＦＥ及びＬＦＥ２を出力チャネルＬＦＥに対してマッピングすることである。ゲイン値「ａ」及び「ｂ」は、行列要素［６，１１］及び［６，１２］に示すゲイン値である。図８（ｂ）の３番目の部分行列は、入力非対称スピーカーが、出力スピーカーの対称対にマッチングされる場合を表す。この例の場合、非対称の入力スピーカーは存在しない。

図８（ｃ）は、センタースピーカーを非対称スピーカーに対してマッピングするための２つの部分行列を示す。最初の部分行列は、入力センタースピーカーを非対称出力スピーカーに対してマッピングし（図４にはこのような部分行列についての例はない）、２番目の部分行列は、非対称入力スピーカーをセンター出力スピーカーに対してマッピングする。

この実施例によると、各々の出力スピーカー群について、対応する列が、全ての成分について、対称性及び分離性の特性を満たすか否かを調べ、この情報を、２ビットを用いて付随情報として送信する。

対称性の特性について図８（ｄ），８（ｅ）に関して説明する。対称性の特性とは、Ｌスピーカー及びＲスピーカーを含むＳ群が、同じゲインで、センタースピーカー又は非対称スピーカーへ、又はここから混合すること、或いはＳ群が別のＳ群へ、又はここから等しく混合されることを意味する。Ｓ群を混合する上述の２つの可能性を図８（ｄ）に示し、２つの部分行列は、図８（ａ）に関して上述した３番目及び４番目の部分行列に対応する。上述の対称性の特性を適用する、即ち混合が同じゲインを用いると、図８（ｅ）に示す最初の部分行列が得られ、ここでは、入力センタースピーカーＣが同じゲイン値を用いて対称スピーカー群Ｓに対してマッピングされる（例えば、図４における入力スピーカーＣｖｒを出力スピーカーＬｓ及びＲｓに対してマッピングする場合を参照）。これは反対の場合にも当てはまり、例えば、入力スピーカーＬｃ、Ｒｃを出力チャネルのセンタースピーカーＣに対してマッピングする場合を検討すると、同じ対称性の特性が見つかる。対称性の特性からは、更に、図８（ｅ）に示す２番目の部分行列も得られ、これに従うと、対称スピーカー間で混合することは、左スピーカーのマッピングと右スピーカーのマッピングとが同じゲイン因数を用い、左スピーカーを右スピーカーに対してマッピングして右スピーカーを左スピーカーに対してマッピングすることが、同じゲイン値を用いて行われることと同じ意味である。これは図４において、例えば、ゲイン値「ａ」＝１及びゲイン値「ｂ」＝０を用いて入力チャネルＬ，Ｒを出力チャネルＬ，Ｒに対してマッピングする場合に関して示される。

分離性の特性とは、対称群が別の対称群に又はこれから混合される際、左側からの全ての信号を左に、右側からの全ての信号を右に保持することを意味する。これは図８（ｆ）に示す部分行列に当てはまり、この部分行列は、図８（ａ）に関して上述の４番目の部分行列に対応する。上述の分離性の特性を適用すると、図８（ｇ）に示す部分行列が得られ、これに従うと、左の入力チャネルは左の出力チャネルにのみマッピングされ、右の入力チャネルは右の出力チャネルにのみマッピングされ、ゼロのゲイン因数のため「チャネル間」マッピングは存在しない。

大多数の公知のダウンミックス行列において遭遇する上述の２つの特性を用いることで、符号化される必要があるゲインの実際の数をさらに大幅に減少させることができ、更に、分離性の特性を満足させる場合、多数のゼロ・ゲインについて必要となる符号化が直接なくされる。例えば、有意性値を含む図６のコンパクト行列を検討し、上述の特性を元のダウンミックス行列に適用すると、例えば図５の下側に示す態様で、それぞれの有意性値について単一のゲイン値を規定するだけで良いことが分かるが、それは、分離性及び対称性の特性のため、それぞれの有意性値に関連付けられたそれぞれのゲイン値が、復号後に元のダウンミックス行列間でどのように分配される必要があるかが分かっているからである。従って、図６に示す行列に関して図８の上述の実施例を適用する場合、デコーダが元のダウンミックス行列を復元できるためには、符号化された有意性値とともに符号化されて送信される必要のある１９個のゲイン値を与えるだけで良い。

以下、例えば音声コンテンツの制作者によって元のダウンミックス行列における元のゲイン値を規定するために用いられ得るゲイン表を動的に作成するための実施例について説明する。この実施例によると、ゲイン表は、特定された精度を用いて、最小ゲイン値（ｍｉｎＧａｉｎ）と最大ゲイン値（ｍａｘＧａｉｎ）との間で動的に作成される。好ましくは、この表は、最も頻繁に用いられる値、及び、より「丸め誤差の少ない」値が、他の値、即ちそれほど頻繁に用いられない値又はそれほど丸め誤差の少なくない値、よりも表又はリストの開始近くに配置されるように作成される。実施例によると、ｍａｘＧａｉｎ、ｍｉｎＧａｉｎ及び精度レベルを用いた可能な値のリストは、以下のように作成することができる。

‐０ｄＢからｍｉｎＧａｉｎまで降順に、３ｄＢの整数倍数を加算する。

‐３ｄＢからｍａｘＧａｉｎまで昇順に、３ｄＢの整数倍数を加算する。

‐０ｄＢからｍｉｎＧａｉｎまで降順に、１ｄＢの残りの整数倍数を加算する。

‐１ｄＢからｍａｘＧａｉｎまで昇順に、１ｄＢの残りの整数倍数を加算する。

精度レベルが１ｄＢであればここで停止する。

‐０ｄＢからｍｉｎＧａｉｎまで降順に、０．５ｄＢの残りの整数倍数を加算する。

‐０．５ｄＢからｍａｘＧａｉｎまで昇順に、０．５ｄＢの残りの整数倍数を加算する。

精度レベルが０．５ｄＢであればここで停止する。

‐０ｄＢからｍｉｎＧａｉｎまで降順に、０．２５ｄＢの残りの整数倍数を加算する。

‐０．２５ｄＢからｍａｘＧａｉｎまで昇順に、０．２５ｄＢの残りの整数倍数を加算する。

例えば、ｍａｘＧａｉｎが２ｄＢであり、ｍｉｎＧａｉｎが−６ｄＢであり、精度が０．５ｄＢである時、以下のリストが作成される。
0, -3, -6, -1, -2, -4, -5, 1, 2, -0.5, -1.5, -2.5, -3.5, -4.5, -5.5, 0.5, 1.5

上述の実施例に関し、本発明は、上述の値に限定されるものではなく、３ｄＢの整数倍数を用いて０ｄＢから開始する代わりに、状況に応じて他の値を選択しても良く、他の精度レベル値を選択しても良い。

一般的に、ゲイン値のリストは、以下のように作成することができる。

‐最小ゲイン（これを含む）と開始ゲイン値（これを含む）との間で降順に、最初のゲイン値の整数倍数を加算する。

‐開始ゲイン値（これを含む）と最大ゲイン（これを含む）との間で昇順に、最初のゲイン値の残りの整数倍数を加算する。

‐最小ゲイン（これを含む）と開始ゲイン値（これを含む）との間で降順に、第１の精度レベルの残りの整数倍数を加算する。

‐開始ゲイン値（これを含む）と最大ゲイン（これを含む）との間で昇順に、第１の精度レベルの残りの整数倍数を加算する。

‐精度レベルが第１の精度レベルであれば、ここで停止する。

‐最小ゲイン（これを含む）と開始ゲイン値（これを含む）との間で降順に、第２の精度レベルの残りの整数倍数を加算する。

‐開始ゲイン値（これを含む）と最大ゲイン（これを含む）との間で昇順に、第２の精度レベルの残りの整数倍数を加算する。

‐精度レベルが第２の精度レベルであれば、ここで停止する。

‐最小ゲイン（これを含む）と開始ゲイン値（これを含む）との間で降順に、第３の精度レベルの残りの整数倍数を加算する。

‐開始ゲイン値（これを含む）と最大ゲイン（これを含む）との間で昇順に、第３の精度レベルの残りの整数倍数を加算する。

上述の実施例においては、開始ゲイン値がゼロの場合、昇順に残りの値を加算する部分であって、関連付けられた多重度条件を満足するものは、最初に、１番目のゲイン値又は１番目、２番目若しくは第３の精度レベルを加算する。しかしながら、一般的な場合、昇順に残りの値を加算する部分は、最初に、開始ゲイン値（これを含む）と最大ゲイン（これを含む）との間隔において、関連付けられた多重度条件を満足する最小値を加算する。これに対応して、降順に残りの値を加算する部分は、最初に、最小ゲイン（これを含む）と開始ゲイン値（これを含む）との間隔において、関連付けられた多重度条件を満足する最大値を加算する。

上述のものと類似するが開始ゲイン値＝１ｄＢ（１番目のゲイン値＝３ｄＢ、ｍａｘＧａｉｎ＝２ｄＢ、ｍｉｎＧａｉｎ＝−６ｄＢ及び精度レベル＝０．５ｄＢ）の例を検討すると、以下が得られる。

降順：０，−３，−６
昇順：［空白］
降順：１，−２，−４，−５
昇順：２
降順：０．５，−０．５，−１．５，−２．５，−３．５，−４．５，−５．５
昇順：１．５
ゲイン値を符号化する場合、好ましくは、表の中でゲインを見つけて、その表内の位置を出力する。所望のゲインが常に見つかるが、それは、全てのゲインが、例えば１ｄＢ、０．５ｄＢ又は０．２５ｄＢといった特定された精度の最も近い整数倍数へ予め量子化されているからである。好ましい実施例によると、ゲイン値の位置には、表内の位置を示すインデックスが関連付けられ、ゲインのインデックスは、例えば限定的ゴロム・ライス符号化アプローチを用いて符号化され得る。その結果、大きなインデックスよりも小さなビット数を用いるための小さなインデックスが得られ、このようにして、頻繁に用いられる値、又は典型的な値、例えば０ｄＢ、−３ｄＢ又は−６ｄＢは、最も小さいビット数を用いることになり、より「丸め誤差の少ない」値、例えば−４ｄＢは、それほど丸め誤差の少なくない数（例えば−４．５ｄＢ）よりも小さなビット数を用いることになる。従って、上述の実施例を用いることによって、音声コンテンツの制作者が所望のゲインリストを生成できるだけでなく、これらのゲインが極めて効率的に符号化され得ることによって、更に別の実施例に従って上述のアプローチ全てを適用した場合、極めて効率的なダウンミックス行列の符号化が達成され得る。

上述の機能は、図１に関して説明した音声エンコーダの一部とすることができるが、これに代えて、ダウンミックス行列の符号化されたバージョンを音声エンコーダに入力してビットストリーム中で受信機又はデコーダへ送信させる別個のエンコーダ装置によってもたらされても良い。

符号化されたコンパクトダウンミックス行列を受信側で受信した後、実施例においては、復号するための方法であって、符号化されたコンパクトダウンミックス行列を復号して、グループ付けられたスピーカーを個々のスピーカーへとグループ解除（分離）することによって元のダウンミックス行列をもたらす方法が提供される。行列の符号化が有意性値及びゲイン値を符号化することを含む場合、復号ステップ中に、これらを復号することによって、有意性値と所望の入力・出力構成とに基づいてダウンミックス行列が復元されて、それぞれの復号されたゲインが、復元されたダウンミックス行列のそれぞれの行列要素に関連付けられ得るようにする。これは別個のデコーダによって実行することができ、このデコーダは、完成されたダウンミックス行列を、これをフォーマット変換部で用いることのできる音声デコーダ、例えば図２，３，４に関して上述した音声デコーダ、に入力する。

従って、上述の本発明のアプローチは、特定の入力チャネル構成を有する音声コンテンツを、異なる出力チャネル構成を有する受信システムに呈示するためのシステム及び方法を提供し、ダウンミックスについての追加の情報が、エンコーダ側からデコーダ側へ符号化ビットストリームとともに送信され、本発明のアプローチによると、ダウンミックス行列の極めて効率的な符号化のため、オーバーヘッドが明らかに低減する。

以下において、効率的な静的ダウンミックス行列符号化を実現する更なる実施例について説明する。より具体的には、任意で行われるＥＱ符号化による静的ダウンミックス行列のための実施例について説明する。上述のように、多チャネル音声に関する１つの問題は、そのリアルタイム伝送に対応する一方で、既存の利用可能な消費者の物理的スピーカー設備全てとの互換性を維持することである。１つの解決策は、元の制作フォーマットにおける音声コンテンツとともに、必要に応じて独立性の低いチャネルを有する他のフォーマットを生成するためのダウンミックス付随情報を提供することである。ｉｎｐｕｔＣｏｕｎｔ個の入力チャネル及びｏｕｔｐｕｔＣｏｕｎｔ個の出力チャネルを想定すると、ダウンミックス手順は、ｉｎｐｕｔＣｏｕｎｔ×ｏｕｔｐｕｔＣｏｕｎｔのサイズのダウンミックス行列によって特定される。この特定の手順は受動的なダウンミックスを表し、これは、実際の音声コンテンツに依存する適応信号処理が入力信号又はダウンミックス出力信号に適用されないことを意味する。本発明のアプローチは、以下に説明する実施例によると、ダウンミックス行列の効率的な符号化のための完全な方式を記述するものであり、これは、好適な表現領域及び量子化方式を選択することについての局面だけでなく、量子化された値の可逆符号化についての局面を含む。各々の行列要素は、所与の入力チャネルが所与の出力チャネルに寄与する程度を調節する混合ゲインを表す。以下に説明する実施例は、制作者のニーズに従って特定され得る範囲及び精度で、任意のダウンミックス行列の符号化を可能にすることにより、制約されない柔軟性を達成することを目指す。また、典型的な行列が少量のビットを用い、典型的な行列から逸脱すれば徐々に効率性が低下する、効率的な可逆符号化が望ましい。これは、行列が典型的なものに類似しているほど、その符号化が効率的となることを意味する。実施例によると、必要とされる精度は、均一な量子化に用いられるものとして、制作者によって１、０．５又は０．２５ｄＢと特定され得る。混合ゲインの値は、＋２２ｄｂの最大値と−４７ｄＢの最小値（これらを含む）との間で特定することができ、値−∞（線形領域で０）も含む。ダウンミックス行列で用いられる効果的な値の範囲は、ビットストリームにおいて最大ゲイン値ｍａｘＧａｉｎ及び最小ゲイン値ｍｉｎＧａｉｎとして示されるため、柔軟性を制限することなく、実際に用いられない値についてのビットを無駄にすることがない。

入力チャネルリスト及び出力チャネルリストであって、方位角及び仰角といった各々のスピーカーについての幾何学的情報、並びに任意にはスピーカーの慣習的な名称、例えば先行技術文献［６］又は［７］によるものをもたらすものが利用可能であると想定すると、実施例によるダウンミックス行列を符号化するためのアルゴリズムは、以下の表１に示すようなものとすることができる。

表１−ＤｏｗｎｍｉｘＭａｔｒｉｘのシンタックス

実施例によるゲイン値を復号するためのアルゴリズムは、以下の表２に示すようなものとすることができる。

表２−ＤｅｃｏｄｅＧａｉｎＶａｌｕｅのシンタックス

実施例による読み出し範囲関数を規定するためのアルゴリズムは、以下の表３に示すようなものとすることができる。

表３−ＲｅａｄＲａｎｇｅのシンタックス

実施例によるイコライザ構成を規定するためのアルゴリズムは、以下の表４に示すようなものとすることができる。

表４−ＥｑｕａｌｉｚｅｒＣｏｎｆｉｇのシンタックス

実施例によるダウンミックス行列の各要素は、以下の表５に示すようなものとすることができる。

表５−ＤｏｗｎｍｉｘＭａｔｒｉｘの各要素
フィールド：
paramConfig,
inputConfig,
outputConfig
記述・値：
各々のスピーカーについての情報を特定するチャネル構成ベクトル。各々の成分ｐａｒａｍＣｏｎｆｉｇ［ｉ］は、以下のメンバーを有する構造である。
‐ＡｚｉｍｕｔｈＡｎｇｌｅ、スピーカー方位角の絶対値
‐ＡｚｉｍｕｔｈＤｉｒｅｃｔｉｏｎ、方位方向、０（左）又は１（右）
‐ＥｌｅｖａｔｉｏｎＡｎｇｌｅ、スピーカー仰角の絶対値
‐ＥｌｅｖａｔｉｏｎＤｉｒｅｃｔｉｏｎ、仰角方向、０（上方向）又は１（下方向）
‐ａｌｒｅａｄｙＵｓｅｄ、スピーカーが既に群の一部であることを示す。
‐ｉｓＬＦＥ、スピーカーがＬＦＥスピーカーであるか否かを示す。

フィールド：
paramCount,
inputCount,
outputCount
記述・値：
対応するチャネル構成ベクトルにおけるスピーカー数

フィールド：
compactParamConfig,
compactInputConfig,
compactOutputConfig
記述・値：
各々のスピーカー群についての情報を特定するコンパクトチャネル構成ベクトル。各々の成分ｃｏｍｐａｃｔＰａｒａｍＣｏｎｆｉｇ［ｉ］は、以下のメンバーを有する構造である。
‐ｐａｉｒＴｙｐｅ、スピーカー群の種類。ＳＹＭＭＥＴＲＩＣ（２つのスピーカーの対称対）、ＣＥＮＴＥＲ、又はＡＳＹＭＭＥＴＲＩＣのいずれかであり得る。
‐ｉｓＬＦＥ、スピーカー群がＬＦＥスピーカーから構成されるか否かを示す。
‐ｏｒｉｇｉｎａｌＰｏｓｉｔｉｏｎ、群内の最初のスピーカー又は唯一のスピーカーの元のチャネル構成における位置
‐ｓｙｍｍｅｔｒｉｃＰａｉｒ．ｏｒｉｇｉｎａｌＰｏｓｉｔｉｏｎ、ＳＹＭＭＥＴＲＩＣ群のみについて、群内の２番目のスピーカーの元のチャネル構成における位置

フィールド：
compactParamCount,
compactInputCount,
compactOutputCount
記述・値：
対応するコンパクトチャネル構成ベクトルにおけるスピーカー群の数

フィールド：
equalizerPresent
記述・値：
入力チャネルに適用されることになるイコライザ情報が存在するか否かを示すブーリアン

フィールド：
precisionLevel
記述・値：
ゲインの均一な量子化に用いられる精度。０＝１ｄＢ、１＝０．５ｄＢ、２＝０．２５ｄＢ、３は予備。

フィールド：
maxGain
記述・値：
ｄＢで表現される行列内の実際の最大ゲイン。０〜２２、線形１…１２．５８９で可能な値。

フィールド：
minGain
記述・値：
ｄＢで表現される行列内の実際の最小ゲイン。−１〜−４７、線形０．８９１…０．００４で可能な値。

フィールド：
isAllSeparable
記述・値：
出力スピーカー群全てが分離性の特性を満たすか否かを示すブーリアン

フィールド：
isSeparable[i]
記述・値：
インデックスiを有する出力スピーカー群が分離性の特性を満たすか否かを示すブーリアン

フィールド：
isAllSymmetric
記述・値：
出力スピーカー群全てが対称性の特性を満たすか否かを示すブーリアン

フィールド：
isSymmetric[i]
記述・値：
インデックスiを有する出力スピーカー群が対称性の特性を満たすか否かを示すブーリアン

フィールド：
mixLFEOnlyToLFE
記述・値：
ＬＦＥスピーカーがＬＦＥスピーカーのみに混合されると同時に非ＬＦＥスピーカーが非ＬＦＥスピーカーのみに混合されるか否かを示すブーリアン

フィールド：
rawCodingCompactMatrix
記述・値：
ｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘが、符号化された未加工（１成分当り１ビットを使用）か、又はラン長の符号化とそれに続く限定的ゴロム・ライスとを用いて符号化されているかを示すブーリアン

フィールド：
compactDownmixMatrix[i][j]
記述・値：
入力スピーカー群i及び出力スピーカー群ｊに対応するｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘ内の成分であって、関連付けられたゲインのいずれかが非ゼロか否かを示す。
０＝全てのゲインがゼロ、１＝少なくとも１つのゲインが非ゼロ

フィールド：
useCompactTemplate
記述・値：
ラン長符号化の効率性を向上させるために、予め規定されたコンパクトテンプレート行列を用いて要素単位のＸＯＲをｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘに適用するか否かを示すブーリアン。

フィールド：
runLGRParam
記述・値：
線形化されたｆｌａｔＣｏｍｐａｃｔＭａｔｒｉｘにおけるゼロ・ラン長を符号化するために用いられる限定的ゴロム・ライスパラメータ

フィールド：
flatCompactMatrix
記述・値：
既に適用された、予め規定されたコンパクトテンプレート行列を有するｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘの線形化バージョン。ｍｉｘＬＦＥＯｎｌｙＴｏＬＦＥが動作している場合、（非ＬＦＥ及びＦＬＥ間の混合により）ゼロであると分かっている成分、又はＬＦＥからＬＦＥへの混合に用いられるものを含まない。

フィールド：
compactTemplate
記述・値：
予め規定されたコンパクトテンプレート行列。「典型的な」成分を有し、ｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘへと要素単位でＸＯＲ演算され、ほとんど全てがゼロの値の成分を作成することにより符号化効率を向上させる。

フィールド：
zeroRunLength
記述・値：
常に１が続くゼロ・ランの長さ。ｆｌａｔＣｏｍｐａｃｔＭａｔｒｉｘにおけるもの。パラメータｒｕｎＬＧＲＰａｒａｍを用いて、限定的ゴロム・ライス符号化によって符号化される。

フィールド：
fullForAsymmetricInputs
記述・値：
各々全ての非対象の入力スピーカー群についての対称性の特性を無視するか否かを示すブーリアン。動作している場合、各々全ての非対称入力スピーカー群は、ｉｓＳｙｍｍｅｔｒｉｃ［ｉ］に関わらず、インデックスiを有する各々の対称出力スピーカー群について復号された２つのゲイン値を有する。

フィールド：
gainTable
記述・値：
ｐｒｅｃｉｓｉｏｎＬｅｖｅｌの精度によってｍｉｎＧａｉｎとｍａｘＧａｉｎとの間の全ての可能なゲインのリストを含む、動的に生成されたゲイン表

フィールド：
rawCodingNonzeros
記述・値：
非ゼロのゲイン値が符号化された未加工のものか（均一な符号化、ＲｅａｄＲａｎｇｅ関数を用いる）、又はそれらのｇａｉｎＴａｂｌｅリストにおけるインデックスが限定的ゴロム・ライス符号化を用いて符号化されたものかを示すブーリアン

フィールド：
gainLGRParam
記述・値：
非ゼロのゲインインデックスを符号化するために用いられる限定的ゴロム・ライスパラメータ。ｇａｉｎＴａｂｌｅリストにおける各々のゲインを探索することによって計算される。

ゴロム・ライス符号化は、以下のように、所与の負でない整数パラメータｐ≧０を用いて、任意の負でない整数ｎ≧０を符号化するために用いられる。最初に、数
ｈ＝ｎ／２^ｐ
を、単項符号化を用いて符号化し、ｈ個の１のビットの後に終端のゼロ・ビットが続く。次に、ｐビットを用いて数ｌ＝ｎ−ｈ・２^ｐを均一に符号化する。

限定的ゴロム・ライス符号化は、所与の整数Ｎ≧１について、ｎ＜Ｎであることが予め分かっている場合に用いられる些細な変種である。これは、ｈの可能な最大値、即ち、
ｈ_ｍａｘ＝（Ｎ−１）／２^ｐ
を符号化する際に終端のゼロ・ビットを含まない。より正確には、ｈ＝ｈ_ｍａｘを符号化するためには、ｈ個の１のビットのみを書くが、終端のゼロ・ビットは書かない。終端のゼロ・ビットは、デコーダがこの状態を黙示的に検出できるため、必要ではない。

以下に記載の関数ＣｏｎｖｅｒｔＴｏＣｏｍｐａｃｔＣｏｎｆｉｇ（ｐａｒａｍＣｏｎｆｉｇ，ｐａｒａｍＣｏｕｎｔ）は、ｐａｒａｍＣｏｕｎｔスピーカーからなる所与のｐａｒａｍＣｏｎｆｉｇ構成を、ｃｏｍｐａｃｔＰａｒａｍＣｏｕｎｔスピーカー群からなるコンパクトなｃｏｍｐａｃｔＰａｒａｍＣｏｎｆｉｇ構成へと変換するために用いられる。ｃｏｍｐａｃｔＰａｒａｍＣｏｎｆｉｇ［ｉ］．ｐａｉｒＴｙｐｅフィールドは、群が１対の対称スピーカーを表す場合はＳＹＭＭＥＴＲＩＣ（Ｓ）、群がセンタースピーカーを表す場合はＣＥＮＴＥＲ（Ｃ）、又は群が対称対を有さないスピーカーを表す場合はＡＳＹＭＭＥＴＲＩＣ（Ａ）であり得る。
ConvertToCompactConfig(paramConfig, paramCount)
{
for (i = 0; i < paramCount; ++i) {
paramConfig[i].alreadyUsed = 0;
}

idx = 0;
for (i = 0; i < paramCount; ++i) {
if (paramConfig[i].alreadyUsed) continue;
compactParamConfig[idx].isLFE = paramConfig[i].isLFE;

if ((paramConfig[i].AzimuthAngle == 0) ||
(paramConfig[i].AzimuthAngle == 180°) {
compactParamConfig[idx].pairType = CENTER;
compactParamConfig[idx].originalPosition = i;
} else {
j = SearchForSymmetricSpeaker(paramConfig, paramCount, i);
if (j != -1) {
compactParamConfig[idx].pairType = SYMMETRIC;
if (paramConfig.AzimuthDirection == 0) {
compactParamConfig[idx].originalPosition = i;
compactParamConfig[idx].symmetricPair.originalPosition = j;
} else {
compactParamConfig[idx].originalPosition = j;
compactParamConfig[idx].symmetricPair.originalPosition = i;
}
paramConfig[j].alreadyUsed = 1;
} else {
compactParamConfig[idx].pairType = ASYMMETRIC;
compactParamConfig[idx].originalPosition = i;
}
}
idx++;
}

compactParamCount = idx;
}
関数ＦｉｎｄＣｏｍｐａｃｔＴｅｍｐｌａｔｅ（ｉｎｐｕｔＣｏｎｆｉｇ，ｉｎｐｕｔＣｏｕｎｔ，ｏｕｔｐｕｔＣｏｎｆｉｇ，ｏｕｔｐｕｔＣｏｕｎｔ）は、ｉｎｐｕｔＣｏｎｆｉｇ及びｉｎｐｕｔＣｏｕｎｔによって表される入力チャネル構成と、ｏｕｔｐｕｔＣｏｎｆｉｇ及びｏｕｔｐｕｔＣｏｕｎｔによって表される出力チャネル構成とをマッチングするコンパクトテンプレート行列を見つけるために用いられる。

コンパクトテンプレート行列は、エンコーダ及びデコーダの両方で利用可能なコンパクトテンプレート行列の予め定められたリストにおいて、実際のスピーカーの順番に関わらず（これは重要ではない）、ｉｎｐｕｔＣｏｎｆｉｇと同じ組の入力スピーカーと、ｏｕｔｐｕｔＣｏｎｆｉｇと同じ組の出力スピーカーとを有するものを探索することによって見つけられる。見つかったコンパクトテンプレート行列に戻る前に、この関数は、その行及び列の順番を変更することによって、所与の入力構成から導き出されたスピーカー群の順番と、所与の出力構成から導き出されたスピーカー群の順番とを一致させる必要がある場合がある。

一致したコンパクトテンプレート行列が見つからない場合、この関数は、正しい数の行（入力スピーカー群の計算された数）及び列（出力スピーカー群の計算された数）を有する行列（全ての成分に１の値を有する）を返すことになる。

関数ＳｅａｒｃｈＦｏｒＳｙｍｍｅｔｒｉｃＳｐｅａｋｅｒ（ｐａｒａｍＣｏｎｆｉｇ，ｐａｒａｍＣｏｕｎｔ，ｉは、スピーカーｐａｒａｍＣｏｎｆｉｇ［ｉ］に対応する対称スピーカーについてのｐａｒａｍＣｏｎｆｉｇ及びｐａｒａｍＣｏｕｎｔによって表されるチャネル構成を探索するために用いられる。この対称スピーカーｐａｒａｍＣｏｎｆｉｇ［ｊ］は、スピーカーｐａｒａｍＣｏｎｆｉｇ［ｉ］の後に位置付けられ、従ってｊはi＋１からｐａｒａｍＣｏｎｆｉｇ−１（これらを含む）の範囲内にあり得る。これに加えて、既にスピーカー群の一部であってはならず、これはｐａｒａｍＣｏｎｆｉｇ［ｊ］．ａｌｒｅａｄｙＵｓｅｄが偽でなければならないことを意味する。

関数ｒｅａｄＲａｎｇｅ（）は、合計ａｌｐｈａｂｅｔＳｉｚｅ個の可能な値を有し得る０…ａｌｐｈａｂｅｔＳｉｚｅ−１（これらを含む）の範囲内の均一に分布した整数を読み出すために用いられる。これは、未使用の値を利用することなくｃｅｉｌ（ｌｏｇ２（ａｌｐｈａｂｅｔＳｉｚｅ））ビットを読み出すことによって簡単に行うことができる。例えば、ａｌｐｈａｂｅｔＳｉｚｅが３である場合、この関数は、整数０については１ビット、整数１及び２については２ビットを用いる。

関数ｇｅｎｅｒａｔｅＧａｉｎＴａｂｌｅ（ｍａｘＧａｉｎ，ｍｉｎＧａｉｎ，ｐｒｅｃｉｓｉｏｎＬｅｖｅｌ）は、精度ｐｒｅｃｉｓｉｏｎＬｅｖｅｌによってｍｉｎＧａｉｎ及びｍａｘＧａｉｎ間の可能な全ての可能なゲインのリストを含むゲイン表ｇａｉｎＴａｂｌｅを動的に生成するために用いられる。値の順番は、最も頻繁に用いられる値及びより「丸め誤差の少ない」値が典型的にリストの先頭に近くなるように選択される。全ての可能なゲイン値のリストを有するゲイン表は、以下のように生成される。

‐ｐｒｅｃｉｓｉｏｎＬｅｖｅｌが０（１ｄＢに対応する）であれば、ここで停止する。

‐ｐｒｅｃｉｓｉｏｎＬｅｖｅｌが１（０．５ｄＢに対応する）であれば、ここで停止する。

‐０．２５からｍａｘＧａｉｎまで昇順に、０．２５ｄＢの残りの整数倍数を加算する。

例えば、ｍａｘＧａｉｎが２ｄＢ、ｍｉｎＧａｉｎが−６ｄＢ、且つｐｒｅｃｉｓｉｏｎＬｅｖｅｌが０．５ｄＢであれば、以下のリストを作成する。即ち、０，−３，−６，−１，−２，−４，−５，１，２，−０．５，−１．５，−２．５，−３．５，−４．５，−５．５，０．５，１．５となる。

実施例によるイコライザ構成についての各要素は、以下の表６に示すようなものとすることができる。

表６−ＥｑｕａｌｉｚｅｒＣｏｎｆｉｇの各要素
フィールド：
numEqualizers
記述・値：
存在するそれぞれ異なる等化フィルタの数

フィールド：
eqPrecisionLevel
記述・値：
ゲインの均一な量子化に用いられる精度。０＝１ｄＢ，１＝０．５ｄＢ，２＝０．２５ｄＢ，３＝０．１ｄＢ

フィールド：
eqExtendedRange
記述・値：
ゲインについての拡張された範囲を用いるか否かを示すブーリアン。動作している場合は、利用可能な範囲は２倍にされる。

フィールド：
numSections
記述・値：
等化フィルタのセクションの数。各セクションはピークフィルタである。

フィールド：
centerFreqLd2
記述・値：
ピークフィルタについての中央周波数の最初の２つの１０進数。最大範囲は１０…９９である。

フィールド：
centerFreqP10
記述・値：
ｃｅｎｔｅｒＦｒｅｑＬｄ２に付加されるゼロの数。最大範囲は０…３である。

フィールド：
qFactorIndex
記述・値：
ピークフィルタについての品質因数インデックス

フィールド：
qFactorExtra
記述・値：
１．０よりも大きい品質因数を復号するための余分なビット

フィールド：
centerGainIndex
記述・値：
ピークフィルタについての中央周波数でのゲイン

フィールド：
scalingGainIndex
記述・値：
等化フィルタについてのスケーリングゲイン

フィールド：
hasEqualizer[i]
記述・値：
インデックスiを有する入力チャネルにイコライザが関連付けられているか否かを示すブーリアン

フィールド：
eqalizerIndex[i]
記述・値：
インデックスiを有する入力チャネルに関連付けられたイコライザのインデックス

以下、実施例による復号プロセスの局面について説明する。まず、ダウンミックス行列の復号から説明する。

シンタックス要素ＤｏｗｎｍｉｘＭａｔｒｉｘ（）は、ダウンミックス行列情報を含む。復号では、まず、動作していればシンタックス要素ＥｑｕａｌｉｚｅｒＣｏｎｆｉｇ（）によって表されるイコライザ情報を読み出す。次に、フィールドｐｒｅｃｉｓｉｏｎＬｅｖｅｌ、ｍａｘＧａｉｎ及びｍｉｎＧａｉｎを読み出す。入力構成及び出力構成を、関数ＣｏｎｖｅｒｔＴｏＣｏｍｐａｃｔＣｏｎｆｉｇ（）を用いてコンパクト構成に変換する。次に、分離性及び対称性の特性が各々の出力スピーカー群について満足されているか否かを示すフラグを読み出す。

次に、ａ）１成分当り１ビットを未加工使用し、又は、ｂ）ラン長の限定的ゴロム・ライス符号化のいずれかを用いて、有意性行列ｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘを読み出し、次に、ｆｌａｔＣｏｍｐａｃｔＭａｔｒｉｘからｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘに復号ビットをコピーし、ｃｏｍｐａｃｔＴｅｍｐｌａｔｅ行列を適用する。

最後に、ゼロでないゲインを読み出す。ｃｏｍｐａｃｔＤｏｗｎｍｉｘＭａｔｒｉｘについての各々のゼロでない成分について、対応する入力群のフィールドｐａｉｒＴｙｐｅと、対応する出力群のフィールドｐａｉｒＴｙｐｅとに応じて、最大２×２のサイズの部分行列を復元する必要がある。分離性及び対称性に関連した特性を用いて、関数ＤｅｃｏｄｅＧａｉｎＶａｌｕｅ（）を用いて、或る数のゲイン値を読み出す。関数ＲｅａｄＲａｎｇｅ（）を用いて、又は、全ての可能なゲイン値を含むｇａｉｎＴａｂｌｅ表におけるゲインのインデックスの限定的ゴロム・ライス符号化を用いて、ゲイン値を均一に符号化することができる。

次に、イコライザ構成の復号の局面について説明する。シンタックス要素ＥｑｕａｌｉｚｅｒＣｏｎｆｉｇ（）は、入力チャネルに適用されるイコライザ情報を含む。まず、ｎｕｍＥｑｕａｌｉｚｅｒｓ等化フィルタの数を復号してから、ｅｑｌｎｄｅｘ［i］を用いて特定の入力チャネルについて選択する。フィールドｅｑＰｒｅｃｉｓｉｏｎＬｅｖｅｌ及びｅｑＥｘｔｅｎｄｅｄＲａｎｇｅは、量子化精度と、スケーリングゲイン及びピークフィルタゲインの利用可能な範囲とを示す。

各々の等化フィルタは、ピークフィルタにおける或る数のｎｕｍＳｅｃｔｉｏｎｓ及び１つのｓｃａｌｉｎｇＧａｉｎからなる直列カスケードである。各々のピークフィルタは、そのｃｅｎｔｅｒＦｒｅｑ、ｑｕａｌｉｔｙＦａｃｔｏｒ及びｃｅｎｔｅｒＧａｉｎによって完全に規定される。

所与の等化フィルタに属するピークフィルタのｃｅｎｔｅｒＦｒｅｑパラメータは、非降順で与えられる必要がある。パラメータは１０…２４０００Ｈｚ（これを含む）に限られ、

として算出される。

ピークフィルタのｑｕａｌｉｔｙＦａｃｔｏｒパラメータは、０．０５の精度によって０．０５〜１．０（これらを含む）間の値、及び、０．１の精度によって１．１〜１１．３（これらを含む）の値を表すことができ、

として算出される。

所与のｅｑＰｒｅｃｉｓｉｏｎＬｅｖｅｌに対応するｄＢでの精度を与えるベクトルｅｑＰｒｅｃｉｓｉｏｎｓを導入し、更に、所与のｅｑＥｘｔｅｎｄｅｄＲａｎｇｅ及びｅｑＰｒｅｃｉｓｉｏｎＬｅｖｅｌに対応するゲインについてのｄＢで最小値及び最大値を与えるｅｑＭｉｎＲａｎｇｅｓ行列及びｅｑＭａｘＲａｎｇｅｓ行列を導入する。
eqPrecisions[4] = {1.0, 0.5, 0.25, 0.1}
eqMinRanges[2][4] = {{-8.0, -8.0, -8.0, -6.4}, {-16.0, -16.0, -16.0, -12.8}}
eqMaxRanges[2][4] = {{7.0, 7.5, 7.75, 6.3}, {15.0, 15.5, 15.75, 12.7}}
パラメータｓｃａｌｉｎｇＧａｉｎは、精度レベルｍｉｎ（ｅｑＰｒｅｃｉｓｉｏｎＬｅｖｅｌ＋１，３）を用い、これは、既に最後のものでなければ次善の精度レベルである。フィールドｃｅｎｔｅｒＧａｉｎＩｎｄｅｘ及びｓｃａｌｉｎｇＧａｉｎＩｎｄｅｘからゲインパラメータｃｅｎｔｅｒＧａｉｎ及びｓｃａｌｉｎｇＧａｉｎへのマッピングは、

として計算される。

装置の文脈でいくつかの局面を記載したが、これらの局面は対応の方法の記載をも表すものであり、ブロック又は装置は、方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップの文脈で記載した局面は、対応の装置の対応のブロック若しくは項目又は特徴の記載をも表す。方法ステップのうちのいくつか又はその全ては、ハードウェア装置、例えばマイクロプロセッサ、プログラム可能コンピュータ又は電子回路によって（又はこれを用いて）実行され得る。いくつかの実施例においては、最も重要な方法ステップのうちの１つ以上は、このような装置によって実行され得る。

特定の実現要件に応じて、本発明の実施例はハードウェア又はソフトウェアによって実現され得る。その実現は、デジタル記憶媒体といった非一時的記憶媒体、例えばフロッピーディスク、ハードディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ又はフラッシュメモリであって、電子的に読み出し可能な制御信号を格納しており、プログラム可能なコンピュータシステムと協働する（又は協働可能である）ことによりそれぞれの方法が実行されるようにするものを用いて実行され得る。従って、デジタル記憶媒体は、コンピュータ読み取り可能であり得る。

本発明のいくつかの実施例は、プログラム可能なコンピュータシステムと協働可能であることによって本願明細書に記載の方法の１つが実行されるようにする、電子的に読み出し可能な制御信号を有するデータキャリアを含む。

一般的には、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品であって、このコンピュータプログラム製品がコンピュータにおいて実行されるときに上記プログラムコードが上記方法の１つを実行するように動作するものとして実現され得る。プログラムコードは、例えば、機械読み取り可能キャリアに格納され得る。

他の実施例は、機械読み取り可能キャリアに格納された、本願明細書に記載の方法の１つを実行するためのコンピュータプログラムを含む。

従って、換言すると、本発明の方法の一実施例は、コンピュータプログラムであって、このコンピュータプログラムがコンピュータにおいて実行されるときに、本願明細書に記載の方法の１つを実行するためのプログラムコードを有するものである。

従って、本発明の方法の更なる実施例は、データキャリア（又はデジタル記憶媒体若しくはコンピュータ読み取り可能媒体）であって、そこに記録された、本願明細書に記載の方法の１つを実行するためのコンピュータプログラムを含むものである。データキャリア、デジタル記憶媒体又は記録された媒体は、典型的にはタンジブル且つ／又は非一時的である。

従って、本発明の方法の更なる実施例は、本願明細書に記載の方法の１つを実行するためのコンピュータプログラムを表すデータストリーム又は信号シーケンスである。データストリーム又は信号シーケンスは、例えば、インターネットを介したデータ通信接続を介して転送されるように構成され得る。

更なる実施例は、本願明細書に記載の方法の１つを実行するように構成又はプログラムされた処理手段、例えばコンピュータ又はプログラム可能論理装置を含む。

更なる実施例は、本願明細書に記載の方法の１つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。

本発明による更なる実施例は、本願明細書に記載された方法のうちの１つを実行するためのコンピュータプログラムを受信機に（例えば電子的または光学的に）転送するように構成された装置又はシステムを含む。受信機は、例えば、コンピュータ、移動装置、又はメモリ装置等であり得る。当該装置又はシステムは、例えば、当該コンピュータプログラムを受信機に転送するためのファイルサーバを含み得る。

いくつかの実施例においては、プログラム可能論理装置（例えば、フィールド・プログラマブル・ゲートアレイ）を用いて、本願明細書に記載の方法におけるいくつか又は全ての機能を実行しても良い。いくつかの実施例においては、フィールド・プログラマブル・ゲートアレイは、マイクロプロセッサと協働して、本願明細書に記載の方法の１つを実行しても良い。一般的に、当該方法は、どのようなハードウェア装置によって実行されても良い。

上述の各実施例は、単に本発明の原理を例示するものである。本願明細書に記載の構成及び詳細を変更及び変形したものが当業者には明らかであることが理解される。従って、本願明細書における各実施例の記載及び説明として提示された特定の詳細によってではなく、添付の特許請求の範囲によってのみ限定されることが意図される。
参考文献
［１］Information technology - Coding of audio-visual objects - Part 3: Audio, AMENDMENT 4: New levels for AAC profiles, ISO/IEC 14496-3:2009/DAM 4, 2013
［２］ITU-R BS.775-3, “Multichannel stereophonic sound system with and without accompanying picture,” Rec., International Telecommunications Union, Geneva, Switzerland, 2012
［３］K. Hamasaki, T. Nishiguchi, R. Okumura, Y. Nakayama and A. Ando, "A 22.2 Multichannel Sound System for Ultrahigh-definition TV (UHDTV)," SMPTE Motion Imaging J., pp. 40-49, 2008
［４］ITU-R Report BS.2159-4, “Multichannel sound technology in home and broadcasting applications”, 2012
［５］Enhanced audio support and other improvements, ISO/IEC 14496-12:2012 PDAM 3, 2013
［６］International Standard ISO/IEC 23003-3:2012, Information technology - MPEG audio technologies - Part 3: Unified Speech and Audio Coding, 2012
［７］International Standard ISO/IEC 23001-8:2013, Information technology - MPEG systems technologies - Part 8: Coding-independent code points, 2013

Claims

音声コンテンツについての複数の入力チャネル（３００）を複数の出力チャネル（３０２）に対してマッピングするためのダウンミックス行列（３０６）を復号するための方法であって、前記入力チャネル（３００）及び前記出力チャネル（３０２）は、聴取者の位置に対して所定の位置にあるそれぞれのスピーカーに関連付けられ、前記ダウンミックス行列（３０６）は、前記複数の入力チャネル（３００）のスピーカー対（Ｓ_１〜Ｓ_９）の対称性と、前記複数の出力チャネル（３０２）のスピーカー対（Ｓ_１０〜Ｓ_１１）の対称性とを活用することによって符号化され、前記方法は、
前記符号化されたダウンミックス行列（３０６）を表す符号化情報をエンコーダから受信するステップと、
前記復号されたダウンミックス行列（３０６）を得るための前記符号化情報を復号するステップと、を備え、
前記ダウンミックス行列（３０６）における入力チャネル（３００）及び出力チャネル（３０２）のそれぞれの対（Ｓ_１〜Ｓ_１１）には、所与の入力チャネル（３００）が所与の出力チャネル（３０２）に寄与するレベルを適合させるためのそれぞれの混合ゲインが関連付けられ、
前記方法は、更に、
前記ダウンミックス行列（３０６）を表す情報から、符号化された有意性値を復号するステップを備え、それぞれの有意性値は、前記入力チャネル（３００）の対称スピーカー群及び前記出力チャネル（３０２）の対称スピーカー群の対（Ｓ_１〜Ｓ_１１）に割り当てられ、前記有意性値は、前記入力チャネル（３００）のうちの１つ以上についての混合ゲインがゼロか否かを示し、前記方法は、更に、
前記ダウンミックス行列（３０６）を表す情報から、符号化された混合ゲインを復号するステップを備える、
方法。
前記有意性値は、ゼロの混合ゲインを示す第１の値と、ゼロでない混合ゲインを示す第２の値とを含み、
前記有意性値を符号化するステップは、予め規定された順番で前記有意性値を連結する１次元ベクトルであって、ラン長符号化された前記１次元ベクトルをデコードするステップを含む、
請求項1に記載の方法。
前記有意性値をデコードするステップは、テンプレート有意性値が関連付けられた、前記入力チャネル（３００）のスピーカー群及び前記出力チャネル（３０２）のスピーカー群の同じ対を有するテンプレートに基づく、
請求項１に記載の方法。
前記有意性値及び前記テンプレート有意性値を論理的に組み合わせ、有意性値とテンプレート有意性値とが同一であることを第１の値で示すとともに有意性値とテンプレート有意性値とが異なることを第２の値で示す、１次元ベクトルであって、ラン長符号化された前記１次元ベクトルをデコードするステップを備える、
請求項３に記載の方法。
前記ラン長符号化された前記１次元ベクトルをデコードするステップは、ラン長を含むリストを前記１次元ベクトルに変換するステップを含み、ラン長は、前記第２の値によって終結される連続する第１の値の数である、
請求項２又は請求項４に記載の方法。
前記ラン長は、ゴロム・ライス符号化又は限定的ゴロム・ライス符号化を用いて符号化される、
請求項２、請求項４又は請求項５に記載の方法。
前記ダウンミックス行列（３０６）を復号することは、
前記ダウンミックス行列（３０６）において、出力チャネル（３０２）の各群について、対称性の特性及び分離性の特性が満足されるか否かを示すダウンミックス行列情報を表す情報から、１群の出力チャネル（３０２）が単一の入力チャネル（３００）からの同じゲインと混合されること、又は１群の出力チャネル（３０２）が１群の入力チャネル（３００）から等しく混合されること、を示す対称性の特性と、それぞれの左側又は右側で全ての信号を保持しながら、１群の出力チャネル（３０２）が１群の入力チャネル（３００）から混合されることを示す分離性の特性と、を復号するステップを備える、
請求項１から請求項６のいずれかに記載の方法。
前記対称性の特性及び前記分離性の特性を満足させる出力チャネル（３０２）の群について、単一の混合ゲインが与えられる、
請求項７に記載の方法。
前記混合ゲインを保持するリストを提供するステップを備え、各々の混合ゲインが前記リスト中のインデックスに関連付けられ、前記方法は、更に、
前記ダウンミックス行列（３０６）を表す情報から前記リスト中のインデックスを復号するステップと、
前記リストにある復号されたインデックスに従って前記リストから前記混合ゲインを選択するステップと、を備える、
請求項１から請求項８のいずれかに記載の方法。
前記インデックスは、ゴロム・ライス符号化又は限定的ゴロム・ライス符号化を用いて符号化される、
請求項９に記載の方法。
前記リストを提供するステップは、
前記ダウンミックス行列（３０６）を表す情報から、最小ゲイン値、最大ゲイン値及び所望の精度を復号するステップと、
前記最小ゲイン値及び前記最大ゲイン値間の複数のゲイン値を含むリストを作成するステップと、を備え、前記ゲイン値は、前記所望の精度を有するように提供され、前記ゲイン値が典型的に使用される頻度が高いほど、前記ゲイン値は前記リストの先頭に近くなり、前記リストの先頭は最も小さいインデックスを有する、
請求項９又は請求項１０に記載の方法。
前記ゲイン値のリストは、以下のように作成され、即ち、
‐前記最小ゲイン（これを含む）と開始ゲイン値（これを含む）との間で降順に、最初のゲイン値である第１のゲイン値の整数倍数を加算し、
‐前記開始ゲイン値（これを含む）と前記最大ゲイン（これを含む）との間で昇順に、前記第１のゲイン値の残りの整数倍数を加算し、
‐前記最小ゲイン（これを含む）と前記開始ゲイン値（これを含む）との間で降順に、第１の精度レベルの残りの整数倍数を加算し、
‐前記開始ゲイン値（これを含む）と前記最大ゲイン（これを含む）との間で昇順に、前記第１の精度レベルの残りの整数倍数を加算し、
‐精度レベルが前記第１の精度レベルであれば、ここで停止し、
‐前記最小ゲイン（これを含む）と前記開始ゲイン値（これを含む）との間で降順に、第２の精度レベルの残りの整数倍数を加算し、
‐前記開始ゲイン値（これを含む）と前記最大ゲイン（これを含む）との間で昇順に、前記第２の精度レベルの残りの整数倍数を加算し、
‐精度レベルが前記第２の精度レベルであれば、ここで停止し、
‐前記最小ゲイン（これを含む）と前記開始ゲイン値（これを含む）との間で降順に、第３の精度レベルの残りの整数倍数を加算し、
‐前記開始ゲイン値（これを含む）と前記最大ゲイン（これを含む）との間で昇順に、前記第３の精度レベルの残りの整数倍数を加算する、
請求項１１に記載の方法。
前記開始ゲイン値＝０ｄＢであり、前記第１のゲイン値＝３ｄＢであり、前記第１の精度レベル＝１ｄＢであり、前記第２の精度レベル＝０．５ｄＢであり、前記第３の精度レベル＝０．２５ｄＢである、
請求項１２に記載の方法。
対称スピーカー対（Ｓ_１〜Ｓ_９）に関連付けられたダウンミックス行列（３０６）にある入力チャネル（３００）と、対称スピーカー対（Ｓ_１０〜Ｓ_１１）に関連付けられたダウンミックス行列（３０６）にある出力チャネル（３０２）とが、共通の列又は行にグループ付けられている、コンパクト行列をデコードするステップを含み、
前記コンパクト行列をデコードするステップは、
前記符号化された有意性値と、前記符号化された混合ゲインを受信するステップと、
前記符号化された有意性値をデコードし、前記デコードされたコンパクトダウンミックス行列（３０８）を生成し、前記混合ゲインをデコードするステップと、
前記デコードされた混合ゲインをゲインがゼロではないことを示す、対応する有意性値に割り当てるステップと、
前記デコードされたダウンミックス行列（３０６）を取得するためにグループ化された前記入力チャネル（３００）と前記出力チャネル（３０２）とをグループ解除するステップと、
を含む、
請求項１に記載の方法。
音声コンテンツについての複数の入力チャネル（３００）を複数の出力チャネル（３０２）に対してマッピングするためのダウンミックス行列（３０６）を符号化するための方法であって、前記入力チャネル及び前記出力チャネル（３００、３０２）は、聴取者の位置に対して所定の位置にあるそれぞれのスピーカーに関連付けられ、
前記ダウンミックス行列を符号化するステップは、前記ダウンミックス行列（３０６）は、前記複数の入力チャネル（３００）のスピーカー対（Ｓ_１〜Ｓ_９）の対称性と、前記複数の出力チャネル（３０２）のスピーカー対（Ｓ_１０〜Ｓ_１１）の対称性とを活用するステップを備え、
前記ダウンミックス行列（３０６）の入力チャネル及び出力チャネル（３００、３０２）のそれぞれの対（Ｓ_１〜Ｓ_１１）は、所与の入力チャネル（３００）が所与の出力チャネル（３０２）に寄与するレベルを適用するために、それぞれの混合ゲインを関連付け、
それぞれの有意性値は、前記入力チャネル（３００）の対称スピーカー群と、前記出力チャネル（３０２）の対称スピーカー群との対（Ｓ_１〜Ｓ_１１）に割り当てられており、前記有意性値は、１以上の前記入力チャネル（３００）の混合ゲインがゼロであるか否かを示すものであり、
前記方法は、さらに、
前記有意性値を符号化するステップと、
前記混合ゲインを符号化するステップと、
を備える、
方法。
前記有意性値は、ゼロの混合ゲインを示す第１の値と、ゼロでない混合ゲインを示す第２の値とを含み、前記有意性値を符号化するステップは、
予め規定された順番で前記有意性値を連結することで１次元ベクトルを形成するステップと、
ラン長方式を用いて前記１次元ベクトルを符号化するステップと、
を含む、
請求項１５に記載の方法。
前記有意性値を符号化するステップは、
テンプレート有意性値が関連付けられた、前記入力チャネル（３００）のスピーカー群及び前記出力チャネル（３０２）のスピーカー群の同じ対を有するテンプレートに基づき、それらにテンプレート有意性値を関連付ける、
請求項１５に記載の方法。
有意性値とテンプレート有意性値とが同一であることを第１の値で示すとともに有意性値とテンプレート有意性値とが異なることを第２の値で示す１次元ベクトルを生成するために、前記有意性値及び前記テンプレート有意性値を論理的に組み合わせるステップと、
ラン長方式によって前記１次元ベクトルを符号化するステップと、
を備える、
請求項１７に記載の方法。
前記１次元ベクトルを符号化するステップは、
前記１次元ベクトルを、ラン長を含むリストに変換するステップを含み、
ラン長は、前記第２の値によって終結される連続する第１の値の数である、
請求項１６又は請求項１８に記載の方法。
前記ラン長は、ゴロム・ライス符号化又は限定的ゴロム・ライス符号化を用いて符号化される、
請求項１６、請求項１８又は請求項１９に記載の方法。
前記ダウンミックス行列（３０６）を符号化するステップは、
対称スピーカー対（Ｓ_１〜Ｓ_９）に関連付けられたダウンミックス行列（３０６）にある入力チャネル（３００）と、対称スピーカー対（Ｓ_１０〜Ｓ_１１）に関連付けられたダウンミックス行列（３０６）にある出力チャネル（３０２）とを、共通の列又は行にグループ付けすることによって、前記ダウンミックス行列をコンパクトダウンミックス行列（３０８）に変換するステップと、
前記コンパクトダウンミックス行列（３０８）を符号化するステップと、
を含む、
請求項１５から請求項２０のいずれかに記載の方法。
スピーカーの所定の位置は、前記聴取者の位置に対して前記スピーカー位置の方位角及び仰角に応じて規定され、
対称スピーカー対（Ｓ_１〜Ｓ_１１）は、同じ仰角を有し、かつ、絶対値は同じであるが正負符号が異なる方位角を有するスピーカーによって構成されている、
請求項１から請求項２１のいずれかに記載の方法。
前記入力チャネル及び前記出力チャネル（３０２）は、更に、１つ以上のセンタースピーカー及び１つ以上の非対称スピーカーに関連付けられたチャネルを含み、
非対称スピーカーは、前記入力チャネル及び前記出力チャネル（３０２）によって規定された構成において別の対称スピーカーを有さない、
請求項１から請求項２２のいずれかに記載の方法。
複数の入力チャネル（３００）を有する音声コンテンツを、前記入力チャネル（３００）とは異なる複数の出力チャネル（３０２）を有するシステムに呈示するための方法であって、
前記方法は、
前記入力チャネル（３００）を前記出力チャネル（３０２）に対してマッピングするために、前記音声コンテンツ及びダウンミックス行列（３０６）を提供するステップと、
前記音声コンテンツを符号化するステップと、
請求項１５の記載に基づく前記ダウンミックス行列（３０６）を符号化するステップと、
前記符号化された音声コンテンツ及び前記符号化されたダウンミックス行列（３０６）を前記システムに送信するステップと、
前記音声コンテンツを復号するステップと、
請求項１の記載に基づく前記ダウンミックス行列（３０６）を復号するステップと、
前記復号されたダウンミックス行列（３０６）を用いて前記音声コンテンツの入力チャネル（３００）を前記システムの出力チャネル（３０２）に対してマッピングするステップと、
を備え、
前記ダウンミックス行列（３０６）は、請求項１から請求項１９のいずれかに記載の方法に従って符号化又は復号される、
方法。
前記ダウンミックス行列（３０６）はユーザによって特定される、
請求項２４に記載の方法。
更に、前記入力チャネル（３００）又はダウンミックス行列要素（３０４）に関連付けられたイコライザ・パラメータを送信するステップを備える、
請求項２４又は請求項２５に記載の方法。
請求項１から請求項２６のいずれかに記載の方法をコンピュータに実行させるためのプログラム。
音声コンテンツについての複数の入力チャネル（３００）を複数の出力チャネル（３０２）に対してマッピングするためのダウンミックス行列（３０６）を符号化するためのエンコーダであって、前記入力チャネル及び前記出力チャネル（３０２）は、聴取者の位置に対して所定の位置にあるそれぞれのスピーカーに関連付けられ、
前記エンコーダは、
請求項１５の記載に基づく前記ダウンミックス行列（３０６）を符号化するように構成されたプロセッサを備える、
エンコーダ。
音声コンテンツについての複数の入力チャネル（３００）を複数の出力チャネル（３０２）に対してマッピングするためのダウンミックス行列（３０６）を復号するためのデコーダであって、前記入力チャネル及び前記出力チャネル（３０２）は、聴取者の位置に対して所定の位置にあるそれぞれのスピーカーに関連付けられ、前記ダウンミックス行列（３０６）は、前記複数の入力チャネル（３００）のスピーカー対（Ｓ_１〜Ｓ_９）の対称性と、前記複数の出力チャネル（３０２）のスピーカー対（Ｓ_１０〜Ｓ_１１）の対称性とを活用することによって符号化され、
前記デコーダは、
請求項１の記載に従い動作するように構成されたプロセッサを備える、
デコーダ。
音声信号を符号化するための音声エンコーダであって、請求項２８のエンコーダを備える音声エンコーダ。
符号化された音声信号を復号するための音声デコーダであって、
前記音声デコーダは、請求項２９に記載のデコーダを含む、
音声デコーダ。
前記復号されたダウンミックス行列（３０６）を受信するためのデコーダに結合されて、前記受信された復号ダウンミックス行列（３０６）に従って前記復号音声信号のフォーマットを変換するように動作する、フォーマット変換部を備える、
請求項３１に記載の音声デコーダ。