JP2024509100A

JP2024509100A - オーディオオブジェクト処理

Info

Publication number: JP2024509100A
Application number: JP2023551713A
Authority: JP
Inventors: ヨナスサムエルソン，レイフ; プルンハーゲン，ヘイコ; ヴィレモウス，ラーシュ
Original assignee: ドルビー・インターナショナル・アーベー
Priority date: 2021-02-25
Filing date: 2022-02-09
Publication date: 2024-02-29
Also published as: WO2022179848A2; CN116917986A; WO2022179848A3; EP4298629A2

Abstract

オブジェクト再構成情報を修正するための方法であって、Ｎ個の空間オーディオオブジェクトのセットを取得するステップであって、各空間オーディオオブジェクトは、オーディオ信号および空間メタデータを含む、ステップと、Ｎ個の空間オーディオオブジェクトを表すオーディオプレゼンテーションを取得するステップと、オーディオプレゼンテーションからＮ個の空間オーディオオブジェクトを再構成するように構成されたオブジェクト再構成情報を取得するステップと、再構成情報をオーディオプレゼンテーションに適用してＮ個の再構成された空間オーディオオブジェクトのセットを形成するステップと、第１のレンダリング構成を使用して、Ｎ個の空間オーディオオブジェクトをレンダリングして第１のレンダリングされたプレゼンテーションを取得し、Ｎ個の再構成された空間オーディオオブジェクトをレンダリングして第２のレンダリングされたプレゼンテーションを取得するステップと、第１のレンダリングされたプレゼンテーションと第２のレンダリングされたプレゼンテーションとの間の差に基づいて再構成情報を修正し、それによって、修正された再構成情報を形成するステップとを含む方法。

Description

［関連出願の相互参照］
本出願は、以下の優先権出願の優先権を主張する：２０２１年２月２５日に出願された米国仮出願第６３／１５３，７１９号（参照：Ｄ２１０１１ＵＳＰ１）（参照により本明細書に組み込まれる）。

［技術分野］
本開示は、オーディオオブジェクト処理に関し、特にオーディオオブジェクトの符号化および復号に関する。

没入型オーディオコンテンツのオブジェクトベース表現は、直感的なコンテンツ制作と、適切なレンダリングシステムを使用した幅広い再生構成にわたる最適な再生とを組み合わせた強力な手法である。オブジェクトベースのオーディオは、例えば、Dolby Atmosシステムの重要な要素である。オーディオオブジェクトは、実際のオーディオ信号と、オブジェクトの位置などの関連メタデータとを含む。オブジェクトベースのオーディオをコンシューマエンターテインメントデバイスに配信するためには、ブロードキャスト、ストリーミング、ダウンロード、または同様の送信シナリオを可能にする効率的な表現が必要とされる。この目的のために、空間コーディングおよびオブジェクト符号化のようなオブジェクトの様々な処理が行われる。

１つの具体的な符号化手法は、H. Purnhagen, T. Hirvonen, L. Villemoes, J. Samuelsson, J. Klejsa, “Immersive Audio Delivery Using Joint Object Coding”, in AES 140th Convention, Paris, FR, May 2016で議論されているようなジョイントオブジェクトコーディング（ＪＯＣ）手法である。この例は、“Backwards-compatible object audio carriage using Enhanced AC-3”, ETSI TS 103 420 V1.1.1 (2016-07)におけるDolby Digital Plus（ＤＤ＋）ＪＯＣシステムである。J. Breebaart, G. Cengarle, L. Lu, T. Mateos, H. Purnhagen, N. Tsingos, “Spatial Coding of Complex Object-Based Program Material,” J. Audio Eng. Soc., vol. 67, no. 7/8, pp. 486-497, July 2019で議論されているように、送信される必要があるオブジェクト数を減らすためにプリプロセッサとしてジョイントオブジェクトコーディングを空間コーディングと併用することができる。

ＪＯＣエンコーダでは、オブジェクトは、ダウンミックス信号、例えば、５．１サラウンド表現にレンダリングされ、ＪＯＣパラメータは、ＪＯＣデコーダがダウンミックス信号からオブジェクトを再構成することを可能にするように計算される。ＪＯＣエンコーダは、ダウンミックス信号、ＪＯＣパラメータ、およびオブジェクトメタデータをＪＯＣデコーダに送信する。典型的には、オブジェクトベースのコンテンツは、ダウンミックス信号の数よりも多い数のオブジェクトを含み、よって、より効率的な送信を可能にする。さらに、ダウンミックス信号自体は、ＤＤ＋のような知覚オーディオコーディングシステムを使用して効率的に送信可能である。典型的には、ＪＯＣパラメータは、オブジェクトがダウンミックス信号の線形結合としてどのように再構成されるかを制御し、ＪＯＣパラメータは、時間および周波数変動し、時間／周波数（Ｔ／Ｆ）タイルごとに送信される。所与のＴ／Ｆタイル内の所与のオブジェクトに関するＪＯＣパラメータを計算するための一般的な初期手法は、最小平均二乗誤差（ＭＭＳＥ）の意味で最良の近似を達成することである。しかしながら、正確な再構成が可能でない場合、近似誤差は、再構成されたオブジェクトがより低いレベル（エネルギーまたは分散として測定される）を有することを意味する。知覚的により適切な近似を達成するために、再構成されたオブジェクトを、それが元のオブジェクトと同じレベル（すなわち、エネルギー）を有するようにブースト（すなわち、ゲイン）することが有利であり、このブーストは、ＪＯＣパラメータを適宜変更することによって達成され得る。

しかしながら、この手法では、再構成されたオブジェクトの完全な共分散行列が元のオブジェクトの共分散行列に一致することが保証されない。共分散行列の対角要素（すなわち、オブジェクトエネルギー）が正しく復元されることだけが保証される。多くの場合、再構成されたオブジェクト間の相関の増加を観察することができ、この結果、再構成されたオブジェクトが、例えば、７．１．４ラウドスピーカーシステムによる再生のためにレンダリングされるときに、レベルビルドアップ効果を生む。このビルドアップは、元のオブジェクトのレンダリングと比較したときに観察することができ、例えば、その影響を受けたコンテンツ内のオブジェクトの知覚されるラウドネスの増加として現れることがある。

本発明の目的は、オーディオオブジェクトの処理を改善することであり、それには、オブジェクト符号化におけるレベル損失およびレベルビルドアップのようなレベルエラーを回避することが含まれる。

本発明の第１の態様によれば、この目的および他の目的は、オブジェクト再構成情報を修正するための方法によって達成され、本方法は、Ｎ個の空間オーディオオブジェクトのセットを取得するステップであって、各空間オーディオオブジェクトは、オーディオ信号および空間メタデータを含む、ステップと、Ｎ個の空間オーディオオブジェクトを表すオーディオプレゼンテーションを取得するステップと、オーディオプレゼンテーションからＮ個の空間オーディオオブジェクトを再構成するように構成されたオブジェクト再構成情報を取得するステップと、再構成情報をオーディオプレゼンテーションに適用してＮ個の再構成された空間オーディオオブジェクトのセットを形成するステップと、第１のレンダリング構成を使用して、Ｎ個の空間オーディオオブジェクトをレンダリングして第１のレンダリングされたプレゼンテーションを取得し、Ｎ個の再構成された空間オーディオオブジェクトをレンダリングして第２のレンダリングされたプレゼンテーションを取得するステップと、第１のレンダリングされたプレゼンテーションと第２のレンダリングされたプレゼンテーションとの間の差に基づいて再構成情報を修正し、それによって、修正された再構成情報を形成するステップとを含む。

元のオブジェクトおよび処理されたオブジェクトのレンダリングされたプレゼンテーションをそれぞれ分析（比較）することによって、再構成情報を修正し、それによって、再構成されたオブジェクトのレンダリングを元のオブジェクトのレンダリングにさらに良好に対応させることができる。

いくつかの実施形態では、第１の態様による方法は、オーディオオブジェクト符号化に使用される。この場合、オーディオプレゼンテーションは、符号化されたオーディオ信号のセットに符号化されるＭ個のオーディオ信号のセットであり、符号化されたオーディオ信号および修正された再構成情報は、送信のためにビットストリームに組み合わされる。より具体的な例では、Ｍ個のオーディオ信号は、Ｎ個の空間オーディオオブジェクトのオーディオ信号のダウンミックスを表し、オブジェクト再構成情報は、Ｍ個のオーディオ信号からＮ個の空間オーディオオブジェクトを再構成するように構成された再構成パラメータのセットであり、修正された再構成情報は、修正された再構成パラメータのセットである。

これらの実施形態では、復号プロセスは、不変のままであってもよいが、ビットストリームで伝達される修正された再構成情報を使用することとなる。これは、例えば、修正されていない再構成パラメータがデコーダ側で使用された場合に発生するレベルエラーを軽減する。

本方法はさらに、第２のレンダリング構成を使用して、Ｎ個の空間オーディオオブジェクトをレンダリングして第３のレンダリングされたプレゼンテーションを生成し、Ｎ個の再構成された空間オーディオオブジェクトをレンダリングして第４のレンダリングされたプレゼンテーションを生成するステップと、第２のレンダリング構成に関連付けられたオブジェクト固有の修正ゲインの第２のセットを決定するステップと、符号化ビットストリーム中に、１）オブジェクト固有の修正ゲインの第１のセットおよび第２のセットの両方、および２）オブジェクト固有の修正ゲインの第１のセットと第２のセットとの比のうちの１つを含めるステップとを含み得る。

この手法では、符号化ビットストリームは、受信側のデコーダが、複数のレンダリング構成のうちの１つ、例えば、５．１．２または７．１．４に関連付けられた修正された再構成されたオブジェクトを取得することを可能にする情報を含む。

本発明の第２の態様によれば、この目的および他の目的は、ビットストリーム内の空間オーディオオブジェクトを復号するための方法によって達成され、本方法は、ビットストリームを復号して、Ｍ個のオーディオチャネルのセットと、Ｍ個のオーディオ信号からＮ個の空間オーディオオブジェクトのセットを再構成するよう構成された再構成パラメータのセットであって、再構成パラメータは、第１のレンダリング構成に関連付けられている、再構成パラメータのセットと、第２のレンダリング構成に関連付けられた修正ゲインとを取得するステップを含む。本方法はさらに、再生レンダリング構成を決定するステップと、再生レンダリング構成を決定したことに応答して、修正ゲインを再構成パラメータに適用して代替再構成パラメータを取得するステップと、代替再構成パラメータをＭ個のオーディオ信号に適用してＮ個の再構成された空間オーディオオブジェクトのセットを取得するステップとを含む。

例えば、再生レンダリング構成が第２のレンダリング構成に対応すると決定された場合、代替再構成パラメータが第２のレンダリング構成に関連付けられるように修正ゲインを適用することができる。

一例では、修正ゲインは、第１のレンダリング構成に関連付けられたオブジェクト固有の修正ゲインの第１のセットと、第２のレンダリング構成に関連付けられたオブジェクト固有の修正ゲインの第２のセットとを含み、修正ゲインを再構成パラメータに適用するステップは、修正ゲインの第１のセットを適用して第１のレンダリング構成との再構成パラメータの関連付けを除去するステップと、修正ゲインの第２のセットを適用して再構成パラメータを第２のレンダリング構成に関連付けるステップを含む。

別の例では、修正ゲインは、第１のレンダリング構成に関連付けられた第１のオブジェクト固有の修正ゲインｈ（ｎ）と第２のレンダリング構成に関連付けられた第２のオブジェクト固有の修正ゲインｈ₂（ｎ）との比ｈ（ｎ）／ｈ₂（ｎ）のセットを含む。

本発明のさらなる態様は、エンコーダに関連し、このエンコーダは、Ｎ個の空間オーディオオブジェクトのセットを受信し、Ｎ個の空間オーディオオブジェクトを表すＭ個のオーディオ信号のセットを生成するように構成されたダウンミックスレンダラと、Ｍ個のオーディオ信号からＮ個の空間オーディオオブジェクトを再構成するように構成されたオブジェクト再構成情報を取得するためのオブジェクトエンコーダと、再構成情報をＭ個のオーディオ信号に適用してＮ個の再構成された空間オーディオオブジェクトのセットを形成するためのオブジェクトデコーダと、第１のレンダリング構成を使用して、Ｎ個の空間オーディオオブジェクトをレンダリングして第１のレンダリングされたプレゼンテーションを取得し、Ｎ個の再構成された空間オーディオオブジェクトをレンダリングして第２のレンダリングされたプレゼンテーションを取得するように構成されたレンダラと、第１のレンダリングされたプレゼンテーションと第２のレンダリングされたプレゼンテーションとの間の差に基づいて再構成情報を修正し、それによって、修正された再構成情報を形成するためのモディファイアと、Ｍ個のオーディオ信号を符号化して、符号化されたオーディオ信号のセットにするように構成されたエンコーダと、符号化されたオーディオ信号および修正された再構成情報を、送信のためにビットストリームに組み合わせるためのマルチプレクサとを含む。

本発明のさらに別の態様は、デコーダに関し、このデコーダは、Ｍ個のオーディオチャネルのセットと、Ｍ個のオーディオ信号からＮ個の空間オーディオオブジェクトのセットを再構成するよう構成された再構成パラメータｃ_mod（ｎ，ｍ）のセットであって、再構成パラメータは、第１のレンダリング構成に関連付けられている、再構成パラメータのセットと、第２のレンダリング構成に関連付けられた修正ゲインとを含むビットストリームを復号するためのデコーダを含む。デコーダは、決定された再生レンダリング構成に応答して、修正ゲインを再構成パラメータｃ_mod（ｎ，ｍ）に適用して代替再構成パラメータｃ_mod2（ｎ，ｍ）を取得するように構成された代替ユニットと、代替再構成パラメータｃ_mod2（ｎ，ｍ）をＭ個のオーディオ信号に適用してＮ個の再構成された空間オーディオオブジェクトのセットを取得するためのオブジェクトデコーダとを含む。

さらなる態様は、コンピュータプロセッサ上で実行されたときに第１および第２の態様による方法を実行するように構成されたコンピュータプログラムコード部分を含むコンピュータプログラム製品を含む。

本発明は、本発明の現在好ましい実施形態を示す添付の図面を参照してより詳細に説明される。
本発明の第１の実装形態を示す。本発明のさらなる実装形態を含む符号化システムを示す。本発明のさらなる実装形態を含む復号システムを示す。本発明の一実装形態による符号化プロセスのフローチャートである。本発明の一実装形態による復号プロセスのフローチャートである。本発明のさらに別の実装形態を含む符号化システムを示す。本発明のさらに別の実装形態を含む復号システムを示す。本発明のさらに別の実装形態を含む符号化システムを示す。本発明のさらに別の実装形態を含む復号システムを示す。

以下の説明では明示的に言及されていないが、当業者は、すべての信号が典型的には時間（フレーム）および周波数（帯域）に分割され、したがって、処理が時間－周波数タイルで行われることを理解するであろう。表記を容易にするために、時間および周波数依存性は、説明から除外されている。

さらに、以下の開示では、「オブジェクト」、「オーディオオブジェクト」または「空間オーディオオブジェクト」は、オーディオ信号と、空間レンダリング情報を含む関連メタデータとを含むものとして理解されるべきである。
概要
前付け

レンダリング構成は、例えばオブジェクト位置のような空間オーディオオブジェクトについてのメタデータが与えられたときに、オブジェクト信号Ｓ（ｎ）がレンダリング信号Ｌ（ｋ）にどれだけ寄与するかを記述するレンダリングゲインｇ（ｋ，ｎ）を得るルールのセットである。レンダリング信号Ｌ（ｋ），ｋ＝１，...，Ｋのセットは、オブジェクトＳ（ｎ），ｎ＝１，...，Ｎのセットのレンダリングされた表現（rendered representation）と呼ばれるか、または簡潔に、オブジェクトのセットのレンディションと呼ばれる。元のオブジェクトＳ（ｎ）、ｎ＝１，...，Ｎのセットのレンディションは、元のレンディション（original rendition）と呼ばれ、処理されたオブジェクトのセットのレンディションは、処理されたレンディション（processed rendition）と呼ばれる。同様に、修正された（レベルアラインされた）オブジェクトのセットのレンディションは、修正されたレンディション（modified rendition）と呼ばれる。

元のレンディションＬ（ｋ），ｋ＝１，...，Ｋを計算することは、次式に基づいて表すことができる。

これは、

と書くことができ、またはより簡潔に、次のように書くことができる：

同様に、処理されたオブジェクトＳ_P（ｎ）が与えられると、処理されたレンディションＬ_P（ｋ），ｋ＝１，...，Ｋを計算することは、

のように表すことができ、またはより簡潔に、次のように表すことができる：

レベルアライメント

レベルアライメントの目標は、元のオブジェクトおよび処理されたオブジェクトが与えられたときに、修正された処理されたオブジェクトから計算されたレンダリングされた表現（修正されたレンディション）が、元のオブジェクトからのレンダリングされた表現（元のレンディション）のレベルにできるだけ近いレンダリング信号レベルを示すように、修正されたオブジェクトを計算することである。

オブジェクトの特性をできるだけ維持しながらレベルアライメントを可能にするために、修正ゲインｈ（ｎ）がオブジェクトに適用される。修正されたオブジェクトＳ_M（ｎ）は、

と、関連する修正されたレンディション

とに基づいて計算することができる。

以下では、修正ゲインｈ（ｎ）を計算する方法が提示される。信号のエネルギーおよび信号間の相互相関は、これらの方法の一部として計算される。オブジェクトのエネルギーは、

に基づいて計算することができ、ここで、ｔは、時間－周波数タイル内のすべての複素数値信号サンプルにわたるインデックスであり、バーは複素共役を示す。同様に、２つのオブジェクト間の複素数値相互相関は、

に基づいて計算することができ、レンダリングされた信号のエネルギー||Ｌ（ｋ）²||についても同様である。
ＭＭＳＥ法

まず、Ｍ平均二乗誤差

を最小化するＭＳＥ法を提示する。ＭＳＥを最小にするゲインｈ（ｎ）は、

を満たし、これは、計算的に効率的な数値的方法で容易に解くことができる、Ｎ個の未知数ｈ（ｎ），ｎ＝１，...，Ｎを有するＮ個の連立一次方程式である。ＭＭＳＥ手法の特徴は、修正されたレンディションの総エネルギーが元のレンディションの総エネルギーを超えることができないことである。一方で、特に、処理されたオブジェクトが元のオブジェクトと著しく異なる場合には、エネルギーの大幅な損失が生じる可能性がある。さらに、これは、処理されたレンディションのエネルギーが元のレンディションのエネルギーにすでに等しい場合でも起こり得る。

後者の現象を回避する修正されたＭＭＳＥ法は、予測ターゲットＬ（ｋ）をｆ（ｋ）Ｌ_P（ｋ）に置き換えることで得られ、ここで、ｆ（ｋ）は、所望の出力レベルを得ることを目的としたレンダリング信号アライメントゲインである。
ゲイン分配法

別の方法では、元のレンディションの信号エネルギー||Ｌ（ｋ）||²および処理されたレンディションの信号エネルギー||Ｌ_P（ｋ）||²がそれぞれ計算され、レンダリング信号アライメントゲインｆ（ｋ）が、次式に基づいて計算される。

レンダリング信号アライメントゲインから、オブジェクト修正ゲインは、次式に基づいて計算することができる。

言い換えると、修正ゲインｈ（ｎ）は、アライメントゲインｆ（ｋ）の加重和として計算され、ここで、任意の所与のｎに対するすべてのｋにわたる重みの和は１である。これは、修正ゲインを取得するための重み（重みはレンダリングゲインから決定される）に従ったアライメントゲインの分配として説明することができる。処理されたオブジェクトが無相関である場合、これらのゲインは、前のセクションで説明した修正されたＭＭＳＥ法によって得られたものと全く同じである。

修正ゲインを計算するための代替例は、次式である：

レンダリング信号ｋの偏差、すなわちｆ（ｋ）≠１は、そのレンダリング信号に対するオブジェクトの寄与に比例してオブジェクトに影響を与えることが分かる。さらに、これらの式のはいずれも、オブジェクトが２つ以上のレンダリング信号にレンダリングされない場合、すなわち、レンダリングゲインｇ（ｋ，ｎ），ｋ＝１，...，Ｋのうちの多くても１つが各ｎ＝１，...，Ｎについて非ゼロであるとき、所望の効果||Ｌ_p（ｋ）||²＝||Ｌ_p（ｋ）||²を達成する。これは、

が、オブジェクト番号ｎがレンダリング信号ｋに属するための指標関数になるからである。これらすべてのオブジェクトは、共通のゲインｆ（ｋ）によって修正される。一般的なケースでは、レンダリング信号アライメントゲインの分配は、その作用において局所化される。例えば、レンダリング信号のサブセットのみを調整する必要がある場合、このサブセットに存在しないオブジェクトは変更されない。

修正ゲインを、例えば、

によって制限し、制限されたゲインを処理されたオブジェクトに適用することが有利である。０．５１を下回らず、１．００を上回らないように修正ゲインを制限することは、修正ゲインがエンコーダにおいてＪＯＣパラメータに適用され、次に、修正されたＪＯＣパラメータが再量子化されなければならない場合に有利であり得る。
ポストゲイン調整

修正されたレンディションのエネルギー||Ｌ_M（ｋ）||²が監視され、それらがエネルギー||Ｌ（ｋ）||²に十分に近くない場合、修正されたレンディションの総エネルギーが元のレンディションの総エネルギーに等しくなるように、すべてのオブジェクトについて同じである全体的なゲインｇ_overallが適用され得る、第２の処理ステップに利点があり得る。具体的には、

である場合、全体的なゲイン

が、修正されたオブジェクトに適用され、以下を得る：

同様に、

である場合、ゲイン

が、修正されたオブジェクトに適用される。

多くの場合、しきい値は、元のレンダリング信号のエネルギー||Ｌ（ｋ）||²の関数であり、例えば、以下である。

修正されたレンディションのエネルギーの上記の監視およびしきい値の計算において、処理されたレンディションのエネルギー||Ｌp（ｋ）||²を、元のレンディションのエネルギー||Ｌ（ｋ）||²の代わりに使用することができる。それは無意味に見えるかもしれないが、ゲイン分配法は、オブジェクトのいくつかのセットについて、処理されたレンダリング信号エネルギーよりも、元のレンダリング信号エネルギーから乖離した修正されたレンダリング信号エネルギーを得ることができる。
再帰的ゲイン分配

いくつかの使用事例では、上記の処理を再帰的に行うことが有益であり得る。修正されたレンディションのエネルギー||Ｌ_M（ｋ）||²は、これらの量が以下に基づいて計算される再帰的プロセスでフィードバックされ得る。

次の反復で、これらの量が計算される。

オブジェクト符号化／復号の詳細

オーディオオブジェクトがビットストリームに含まれるように符号化される状況では、エンコーダにおいて修正ゲインが計算され、再生レンダリングが行われるデコーダ側に伝達され得る

一例では、元のオブジェクトは、ダウンミックス信号Ｙ（ｍ）のセットおよび再構成パラメータ

のセットによって表され、これらのパラメータは、ビットストリームでデコーダに送信される。デコーダでは、処理された、または（ソースコーディング用語を使用して）再構成されたオブジェクトが

ここで、Ｙ（ｍ），ｍ＝１，…，Ｍは、再構成パラメータとともにビットストリームにおいて送信されるダウンミックス信号である。元のオブジェクトのこの表現には固有の制限があるため、再生レンダリングは、高すぎるまたは低すぎるレベルを示すことがある。修正ゲインｈ（ｎ）を処理されたオブジェクトに適用することによって、そのようなレベル偏差が低減される。修正ゲインは、

に基づいて再構成パラメータを修正し、ｃ（ｎ，ｍ）の代わりに修正された再構成パラメータｃ_M（ｎ，ｍ）を送信することによって、処理されたオブジェクトに間接的に適用される。次いで、復号は以下を得る。

公称レンダリング構成と再生レンダリング構成との間の不一致

レベル分析およびレベル修正で使用されるいわゆる公称レンダリング構成が再生レンダリング構成と異なる場合があり得る。例えば、デコーダ側の再生レンダリング構成は、符号化の時点では知られていないことがある。

多くの実際的なケースでは、実際に関連するレンダリング構成（例えば、５．１．２、５．１．４、７．１．４、９．１．６）について、本明細書で提示される方法は、レンダリング構成の違いに対してロバストである。７．１．４の公称レンダリング構成を用いて修正ゲインを計算することで、５．１．２、５．１．４および９．１．６のレンダリング構成に対してもロバストなレベル調整を提供する。

いくつかの公称レンダリング構成について修正ゲインを計算することが有益であり得る。

一例として、Ｊ＝４の場合、これらのレンダリング構成は、例えば、５．１．２、５．１．４、７．１．４、９．１．６とすることができ、ｈ₁（ｎ），ｎ＝１，...，Ｎは、５．１．２のレンダリング構成に関連付けられた修正ゲインであり、ｈ₂（ｎ），ｎ＝１，...，Ｎは、５．１．４に関連付けられた修正ゲインであり、以下同様である。修正ゲインｈ（ｎ），ｎ＝１，...，Ｎの共通のセットは、これらのゲインのセットを組み合わせることによって計算することができる。この組み合わせは、例えば、加重和のように計算することができる。

公称レンダリング構成と再生レンダリング構成との間に不一致があり、平均化方法が機能しない場合、修正ゲインは、処理されたオブジェクトまたは再構成パラメータとともに記憶／送信され得る。再生レンダリング構成が記憶された公称構成のいずれかと一致する場合、対応する修正ゲインを「ジャストインタイム」で適用することができる。依然として不一致がある場合、「最も近い」公称構成を使用することもできるし、公称構成の平均化を使用することもできる。
実用的な実装形態

図１は、Ｎ＊個の元のオブジェクトＳ（ｎ＊）のセットを入力としてとり、Ｎ個の処理された（例えば、空間的に符号化または復号され、再構成された）オブジェクトＳ_P（ｎ）のセットを出力として生成するオブジェクトプロセッサ１０１を含むオーディオシステム１００を示す。

オブジェクトメタデータ（別個には示されていない）を使用して、Ｎ＊個の元のオブジェクトＳ（ｎ＊）およびＮ個の処理されたオブジェクトＳ_P（ｎ）は２つのレンダラ１０２、１０３によって公称再生構成（例えば７．１．４）にレンダリングされることができ、その結果、それぞれレンダリングされた表現Ｌ（ｋ）およびＬ_P（ｋ）が得られる。レベルアナライザ１０４において両方のレンダリングされた表現のレベルを分析および比較することにより、処理されたオブジェクトＳ_P（ｎ）を入力として受け取り、修正されたオブジェクトＳ_M（ｎ）を出力として生成するオブジェクトモディファイア１０５を制御するための情報を引き出すことが可能である。レンダラ１０６は、修正されたオブジェクトをレンダリングして、レンダリングされたプレゼンテーションＬ_M（ｋ）を提供する。オブジェクト修正の目標は、修正されたオブジェクトＳ_M（ｎ）のレンダリングされた表現Ｌ_M（ｋ）を元のオブジェクトＳ（ｎ）のレンダリングされた表現Ｌ（ｋ）に近づけて、オブジェクトプロセッサ１０１によって導入され、処理されたオブジェクトＳ_P（ｎ）のレンダリングされた表現Ｌ_P（ｋ）について観察されるレベルエラーなどのあらゆるエラーを軽減することである。

オブジェクトプロセッサが空間コーダである場合、処理されたオブジェクトは、より少なくなる（Ｎ＊＞Ｎ）。典型的な空間コーディングプロセスでは、１２８個のオーディオオブジェクトが２０個のオーディオオブジェクトにクラスタリングされる（Ｎ＊＝１２８，Ｎ＝２０）。

図１のオブジェクトプロセッサ１０１は、コーデックプロセスにおいて生じるエンコーダとデコーダとの組み合わせであってもよい。この場合、Ｎ＊＝Ｎである。図２ａ～図２ｂは、本発明の原理が例示的な符号化および復号（コーデック）プロセス２００においてどのように実装され得るかを示す。コーデックは、例えば、Joint Object Coding (JOC)を有するDolby Digital Plus (DD+)コーデックに基づき得る。それはまた、アドバンストジョイントオブジェクトコーディング（Ａ－ＪＯＣ）をもつＡＣ－４コーデックに基づいていてもよく、その場合、ダウンミックス信号の非相関されたバージョンからの寄与も考慮に入れられる。Ａ－ＪＯＣエンコーダは、代替的に、ダウンミックスレンダラの代わりに空間コーダによって生成されたダウンミックスを使用してもよい。

エンコーダ側２０１（図２ａ）は、ダウンミックスレンダラ２０２と、ダウンミックスエンコーダ２０３と、オブジェクトエンコーダ２０４と、マルチプレクサ２０５とを含む。一例では、ブロック２０２、２０３、２０４、２０５は、ＤＤ＋ＪＯＣエンコーダ内の対応するブロックと実質的に同等である。

図示された例では、エンコーダ２０１は、オブジェクトデコーダ２０６（例えば、ＪＯＣデコーダ）と、２つのレンダラ２０７、２０８とをさらに有する。オブジェクトデコーダは、処理されたオブジェクトＳ_P（ｎ）を生成するために、オブジェクトエンコーダ２０４からのオブジェクト再構成パラメータｃ（ｎ，ｍ）を使用して、ダウンミックスレンダラ２０２からのダウンミックスＹ（ｍ）を復号するよう構成される。レンダラ２０７、２０８は、それぞれ、元のオブジェクトＳ（ｎ）および処理されたオブジェクトＳ_P（ｎ）を受信し、選択された再生レンダリング構成、例えば、７．１．４構成を使用して、第１のレンダリングされたプレゼンテーションＬ（ｋ）および第２のおよびレンダリングされたプレゼンテーションＬ_P（ｋ）を提供するためにオブジェクトメタデータ（別個に図示せず）を使用するように構成される。選択されたレンダリング構成は、「公称」レンダリング構成と呼ばれる。レベルアナライザ２０９は、各レンダラ２０７、２０８からレンダリングされたプレゼンテーションＬ（ｋ）およびＬ_P（ｋ）を受信し、２つのレンダリングされたプレゼンテーション間の差を表すパラメータｈ（ｎ）のセット（各オブジェクトに対して１つのパラメータ）を提供するように構成される。パラメータモディファイア２１０は、パラメータｈ（ｎ）を受信し、再構成パラメータｃ（ｎ，ｍ）の修正を実行するように構成される。修正された再構成パラメータは、ｃ_mod（ｎ，ｍ）と呼ばれる。

デコーダ側２１１（図２ｂ）は、デマルチプレクサ２１２と、ダウンミックスデコーダ２１３と、オブジェクトデコーダ２１４とを含む。一例では、ブロック２１２、２１３、２１４は、ＤＤ＋ＪＯＣデコーダ内の対応するブロックと実質的に同等である。デコーダ側２１１からの出力は、再生レンダラ２２１に提供される。

使用中、図３を参照すると、元のオブジェクトＳ（ｎ）のセットが、まず、ダウンミックスレンダラ２０２においてレンダリングされて、ダウンミックス信号Ｙ（ｍ）が生成される（ステップＳ１）。典型的なエンコーダでは、ダウンミックスのために５．１構成が使用され、ダウンミックスレンダリングはオブジェクトメタデータ（図示せず）を使用する。元のオブジェクトＳ（ｎ）およびダウンミックス信号Ｙ（ｍ）の両方は、再構成パラメータｃ（ｎ，ｍ）を計算するためにオブジェクトエンコーダ２０４によって使用される（ステップＳ２）。ダウンミックス信号はまた、ダウンミックスエンコーダ２０３によって符号化される（ステップＳ３）。

ステップＳ３と並行して、オブジェクトデコーダ２０６は、ダウンミックス信号Ｙ（ｍ）を入力としてとり、処理された（すなわち、再構成された）オブジェクトＳ_P（ｎ）を生成する（ステップＳ４）。次いで、元のオブジェクトＳ（ｎ）および処理されたオブジェクトＳ_P（ｎ）の両方がレンダリングされ（ステップＳ５）、第１のレンダリングされた表現Ｌ（ｋ）および第２のレンダリングされた表現Ｌ_P（ｋ）がそれぞれ得られる。次いで、両方のレンダリングされた表現が分析されて（ステップＳ６）、オブジェクト修正ゲインと呼ばれるパラメータｈ（ｎ）のセットが計算される。ステップＳ７において、パラメータモディファイア２１０は、オブジェクト修正ゲインｈ（ｎ）を再構成パラメータｃ（ｎ，ｍ）に適用して、修正された再構成パラメータｃ_mod（ｎ，ｍ）を生成する。

ステップＳ８において、符号化されたダウンミックスは、マルチプレクサにおいて、修正された再構成パラメータｃ_mod（ｎ，ｍ）およびオブジェクトメタデータ（図示せず）と組み合わされて、最終的なビットストリームが形成される。その後、このビットストリームがデコーダ２１１に送信される（ステップＳ９）。

デコーダ側では、ビットストリームがデマルチプレクサ２１２によって逆多重化され（ステップＳ１１）、ダウンミックスデコーダ２１３によって復号されて、ダウンミックス信号Ｙ（ｍ）が取得される（ステップＳ１２）。これらのダウンミックス信号Ｙ（ｍ）は、修正された再構成パラメータｃ_mod（ｎ，ｍ）を使用して、オブジェクトデコーダ２１４によって処理されて、修正されたオブジェクトＳ_M（ｎ）が生成される（ステップＳ１３）。

最後に、修正されたオブジェクトＳ_M（ｎ）は、ビットストリームで伝達されるオブジェクトメタデータ（図示せず）を使用する再生レンダラ２２１において、所望の再生構成（例えば、７．１．４ラウドスピーカ再生）のための表現Ｌ_M（ｋ）にレンダリングされる（ステップＳ１４）。

図４ａ～図４ｂを参照すると、符号化側（図４ａ）はまた、Ｎ＊個のオーディオオブジェクトの元のセットの低減（クラスタリング）を実行するように構成された空間コーダ２３１を含む。典型的な例では、１２８個の元のオーディオオブジェクトが、オブジェクトエンコーダプロセスに提供される前に２０個のオブジェクトに空間的にコーディングされる。図示されるケースでは、図２ａ～図２ｂにおけるプロセスの代替として、第１のレンディションＬ（ｋ）を取得するために、元のオーディオオブジェクトＳ（ｎ＊）（例えば、１２８個のオブジェクト）がレンダラ２０７によって使用される。

図５ａ～図５ｂは、本発明のさらに別の実装形態を示しており、ここでは、オブジェクト固有の修正ゲインの複数のセットｈ₁（ｎ），ｈ₂（ｎ）が決定され、これらの修正ゲインの複数のセットに基づく変更パラメータのセットがデコーダ側に利用可能にされる。図示された例では、オブジェクト固有の修正ゲインの２つのセットのみが存在するが、当然ながら、任意の数が存在してもよい。

この実装形態では、エンコーダ側３０１（図５ａ）のレンダラ３０７、３０８は、複数のレンダリング構成に関連付けられた複数のレンディションを実行するように構成される。図示されたケースでは、２つのレンディションが提供される。これらは、例えば、７．１．４構成および９．１．６構成に関連付けられ得る。レベルアナライザ３０９は、レンディションの各対に対してレベル分析を行い、その結果、オブジェクト固有の修正ゲインの２つのセットｈ₁（ｎ）およびｈ₂（ｎ）が得られる。ゲインセットのうちの１つは、再構成パラメータｃ（ｎ，ｍ）を修正するためにパラメータモディファイアによって使用される。符号化されたダウンミックスＹ（ｍ）および修正された再構成パラメータに加えて、ここでは、マルチプレクサ２０５には、修正ゲインの２つのセットｈ₁（ｎ）およびｈ₂（ｎ）に基づく変更パラメータものセットも提供されるので、これらの変更パラメータもビットストリームに含められる。

デコーダ３１１（図５ｂ）は、図２ｂおよび図４ｂのデコーダ２１１と同様の要素を含む。これらの要素には、図５ｂにおいて同一の参照番号（２１２、２１３、２１４、２２１）が与えられている。デコーダ３１１はまた、修正された再構成パラメータの代替セットを取得するために、変更パラメータを元の再構成パラメータに適用するように構成された代替ブロック３１２を含む。修正された再構成パラメータのこの代替セットは、第２のレンダリング構成に対応し得る。代替ブロック３１２の動作はオプションであり、適切なロジックによって制御される。例えば、代替ブロック３１２の起動は、再生レンダラ２２１の構成の決定に基づくことができる。

図５ｂに示される第１の例では、変更パラメータは、オブジェクト固有の修正ゲインの２つのセットｈ₁（ｎ）およびｈ₂（ｎ）を含む。この場合、代替ブロック３１２は、以下の２つのユニットを含む：
１）再構成パラメータをそれらの元の「修正されていない」状態に戻すためにゲインの第１のセットｈ₁（ｎ）（の逆）を適用するように構成されたアンドゥユニット３１３、および
２）ここでは第２のレンダリング構成に対応する修正された再構成パラメータの代替セットを取得するために、「修正されていない」再構成パラメータにゲインの第２のセットｈ₂（ｎ）を適用するよう構成されたゲイン適用ユニット３１４。

図５Ｂの実装形態が３つの異なるオブジェクト復号オプションを提供することは明らかである。
１）修正された再構成パラメータｃ_mod（ｎ，ｍ）を使用して、第１のレンダリング構成による改善されたレンダリングのために修正された再構成されたオブジェクトを提供する、
２）代替の修正された再構成パラメータを使用して、第２のレンダリング構成による改善されたレンダリングのために修正された再構成されたオブジェクトを提供する、
３）「修正されていない」再構成パラメータを使用して、修正なしに再構成されたオブジェクトを提供する。

別の例では、変更パラメータは、オブジェクト固有の修正ゲインの第２のセットｈ₂（ｎ）と第１のセットｈ₁（ｎ）との比ｈ₂（ｎ）／ｈ₁（ｎ）を含む。この場合、デコーダ側で、これらの比は、第１のレンダリング構成に対応する修正された再構成パラメータに適用されて、第２のレンダリング構成に対応する代替の修正された再構成パラメータへの変換を達成し得る。

この場合、次の２つの代替的な復号オプションがデコーダ側で利用可能である：
１）修正された再構成パラメータｃ_mod（ｎ，ｍ）を使用して、第１のレンダリング構成による改善されたレンダリングのために修正された再構成されたオブジェクトを提供する、
２）代替の修正された再構成パラメータを使用して、第２のレンダリング構成による改善されたレンダリングのために修正された再構成されたオブジェクトを提供する。

しかしながら、この特定の例の特別な場合は、修正ゲインの第２のセットｈ₂（ｎ）がユニティゲイン、すなわち、修正なしの再構成パラメータ、に対応するよう設定されることができることである。言い換えると、ビットストリーム中の変更パラメータは、１／ｈ₁（ｎ）となる。デコーダ側では、これらのゲインを適用することで、修正ゲインｈ₁（ｎ）が打ち消され、したがって、元の「修正されていない」再構成パラメータを提供する。

本明細書で説明した方法およびシステムは、ソフトウェア、ファームウェアおよび／またはハードウェアとして実装され得るい。特定の構成要素は、デジタルシグナルプロセッサまたはマイクロプロセッサ上で実行されるソフトウェアとして実装され得る。他の構成要素は、ハードウェアとして、および／または特定用途向け集積回路として実装され得る。説明される方法およびシステムにおいて遭遇する信号は、ランダムアクセスメモリまたは光学記憶媒体などの媒体上に記憶され得る。それらは、無線ネットワーク、衛星ネットワーク、ワイヤレスネットワークまたはワイヤラインネットワーク、例えばインターネットなどのネットワークを介して転送され得る。本明細書で説明した方法およびシステムを利用する典型的なデバイスは、オーディオ信号を記憶および／またはレンダリングするために使用されるポータブル電子デバイスまたは他の消費者機器である。

特に明記しない限り、以下の説明から明らかなように、本開示の全体を通して、「処理する」、「計算する」、「算出する」、「決定する」、「分析する」などの用語を利用した説明は、電子的な量などの物理的な量として表されるデータを、物理量として同様に表される他のデータに操作および／または変換する、コンピュータハードウェアもしくはコンピューティングシステム、または同様の電子コンピューティングデバイスのアクションおよび／またはプロセスを指すことが理解される。

本発明の例示的な実施形態の上記の説明において、本発明の様々な特徴は、開示を合理化し、様々な発明の態様のうちの１つまたは複数の態様の理解を助ける目的で、単一の実施形態、図、またはその説明へと一緒にグループ化されることがあることを理解されたい。しかしながら、この開示の方法は、特許請求される発明が各請求項に明示的に記載されるよりも多くの特徴を必要とするという意図を反映するものとして解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、発明の態様は、単一の前述の開示された実施形態のすべての特徴よりも少ない特徴にある。したがって、発明を実施するための形態に続く特許請求の範囲は、この発明を実施するための形態に明示的に組み込まれ、各請求項は、本発明の別個の実施形態として独立している。さらに、本明細書で説明されるいくつかの実施形態は、他の実施形態に含まれるいくつかの特徴は含むが、他の特徴は含まず、当業者によって理解されるように、異なる実施形態の特徴の組み合わせは、本発明の範囲内にあり、異なる実施形態を形成することを意味する。例えば、以下の特許請求の範囲では、特許請求される実施形態のいずれも、任意の組み合わせで使用することができる。

さらに、実施形態のうちのいくつかは、コンピュータシステムのプロセッサによって、または機能を実行する他の手段によって実装され得る方法または方法の要素の組合せとして本明細書で説明される。したがって、そのような方法または方法の要素を実行するために必要な命令を有するプロセッサは、方法または方法の要素を実行するための手段を形成する。方法がいくつかの要素、例えば、いくつかのステップを含むとき、特に明記されない限り、そのような要素の順序は示されないことに留意されたい。さらに、装置の実施形態の本明細書で説明される要素は、本発明を実施する目的で要素によって実行される機能を実行するための手段の一例である。本明細書に提供される説明では、多数の具体的な詳細が記載されている。しかしながら、本発明の実施形態は、これらの具体的な詳細なしに実施され得ることが理解される。他の事例では、この説明の理解を曖昧にしないために、周知の方法、構造および技法は詳細には示されていない。

したがって、本発明の特定の実施形態を説明してきたが、当業者であれば、本発明の趣旨から逸脱することなく、他のおよびさらなる修正がそれに対して行われ得ることを認識し、すべてのそのような変更および修正を本発明の範囲内に含まれるものとして主張することが意図される。例えば、他のオブジェクト符号化／復号技法が実装され得る。

本発明は、以下に列挙される例示的な実施形態（ＥＥＥ）を含む。

ＥＥＥ１．元のレンディションおよび処理されたレンディションのレベルをアラインする方法であって、
元のオブジェクトのセットを受信するステップと、
処理されたオブジェクトのセットを受信するステップと、
レンダリング構成を受信するステップであって、レンダリング構成は、元のオブジェクトのセットから元のレンダリング信号のセットへのマッピングを記述し、レンダリング構成はまた、処理されたオブジェクトのセットから処理されたレンダリング信号のセットへのマッピングを記述する、ステップと、
処理されたオーディオオブジェクトのセットを修正することによって、処理されたレンダリング信号のセットのレベルを元のレンダリング信号のセットのレベルにアラインするステップと
を含む方法。

ＥＥＥ２．元のレンダリング信号のセットのレベルを計算するステップと、
処理されたレンダリング信号のセットのレベルを計算するステップと
をさらに含む、ＥＥＥ１に記載の方法。

ＥＥＥ３．元のオブジェクトのセットを元のレンダリング信号のセットにレンダリングするステップと、
処理されたオブジェクトのセットを処理されたレンダリング信号のセットにレンダリングするステップと、
元のレンダリング信号のセットのレベルを測定するステップと、
処理されたレンダリング信号のセットのレベルを測定するステップと
をさらに含む、ＥＥＥ１に記載の方法。

ＥＥＥ４．レベルをアラインすることは、
各オブジェクトについて、オブジェクト修正ゲインを計算し、オブジェクト修正ゲインを該オブジェクトに適用するステップ
を含む、ＥＥＥ１に記載の方法。

ＥＥＥ５．レンダリング信号のレベルをアラインする方法であって、
元のオブジェクトのセットを受信するステップと、
処理されたオブジェクトのセットを受信するステップと、
レンダリング構成を受信するステップであって、レンダリング構成は、元のオブジェクトのセットから元のレンダリング信号のセットへのマッピングを記述し、レンダリング構成はまた、処理されたオブジェクトのセットから処理されたレンダリング信号のセットへのマッピングを記述する、ステップと、
最適なオブジェクト修正ゲインのセットを計算するステップと
を含む方法。

ＥＥＥ６．レンダリング信号のレベルをアラインする方法であって、
元のオブジェクトのセットを受信するステップと、
処理されたオブジェクトのセットを受信するステップと、
レンダリング構成を受信するステップであって、レンダリング構成は、元のオブジェクトのセットから元のレンダリング信号のセットへのマッピングを記述し、レンダリング構成はさらに、処理されたオブジェクトのセットから処理されたレンダリング信号のセットへのマッピングを記述する、ステップと、
元のレンダリング信号のセットのレベルを計算するステップと、
処理されたレンダリング信号のセットのレベルを計算するステップと、
レンダリング信号修正ゲインのセットを計算するステップと、
オブジェクト修正ゲインのセットへのレンダリング信号アライメントゲインのセットの分配と
を含む方法。

ＥＥＥ７．オブジェクト修正ゲインのセットへのレンダリング信号アライメントゲインのセットのマッピングは：
レンダリング信号アライメントゲインの加重和として各オブジェクト修正ゲインを計算するステップ
を含む、ＥＥＥ６に記載の方法。

ＥＥＥ８．加重和における重さは、レンダリングゲインの関数である、ＥＥＥ７に記載の方法。

ＥＥＥ９．修正ゲインを、処理されたオブジェクトに適用して、修正されたオブジェクトを得る、ＥＥＥ６に記載の方法。

ＥＥＥ１０．修正されたオブジェクトを修正されたレンダリング信号のセットにレンダリングするステップと、
修正されたレンダリング信号の総修正レベルを計算するステップと、
基準レンダリング信号のセットの総基準レベルを計算するステップと、
総修正レベルおよび総基準レベルから総修正ゲインを計算するステップと
をさらに含む、ＥＥＥ９に記載の方法。

ＥＥＥ１１．処理されたオブジェクトを修正されたオブジェクトで置き換え、手順を繰り返すステップと
をさらに含む、ＥＥＥ９に記載の方法。

ＥＥＥ１２．オブジェクト修正ゲインは、オーディオオブジェクト再構成パラメータの少なくとも１つのセット、例えば、ＪＯＣパラメータのセットに適用される、ＥＥＥ４から１１のいずれかに記載の方法。

ＥＥＥ１３．オブジェクト修正ゲインがエンコーダにおいて計算され、
オブジェクト修正ゲインを、エンコーダにおいて、オーディオオブジェクト再構成パラメータの少なくとも１つのセット、例えば、ＪＯＣパラメータのセットに適用して、修正されたＪＯＣパラメータを得、
修正されたオーディオオブジェクト再構成パラメータは、エンコーダビットストリームにおけるオーディオオブジェクト再構成パラメータの少なくとも１つのセットを置き換える、
ＥＥＥ４から１１のいずれかに記載の方法。

ＥＥＥ１４．オブジェクト修正ゲインの複数のセットが、複数のレンダリング構成について計算され、
オブジェクト修正ゲインの複数のセットを組み合わせることによって、総オブジェクト修正ゲインのセットが計算される、
ＥＥＥ４から１３のいずれかに記載の方法。

ＥＥＥ１５．組み合わせが、オブジェクト修正ゲインのセットの加重平均によって行われる、ＥＥＥ１４に記載の方法。

ＥＥＥ１６．オブジェクト修正ゲインの複数のセットが、複数のレンダリング構成について計算され、
オブジェクト修正ゲインの複数のセットが、処理されたオブジェクトとともに記憶され、
オブジェクト修正ゲインの最良一致セットが、再生レンダリングの前に適用される、
ＥＥＥ４から１５のいずれかに記載の方法。

ＥＥＥ１７．符号化されたオーディオビットストリームを復号するための方法であって、
複数の復号されたオーディオ信号を取得するために、符号化されたオーディオビットストリームを復号するステップであって、複数の復号されたオーディオ信号は、複数のオーディオオブジェクト信号のマルチチャネルダウンミックスを含む、ステップと、
符号化されたオーディオビットストリームからオーディオオブジェクト再構成パラメータの複数のセットを抽出するステップであって、オーディオオブジェクト再構成パラメータの各セットは、異なるチャネル構成に対応する、ステップと、
再生レンダリング構成を決定するステップと、
決定された再生レンダリング構成に基づいて、オーディオオブジェクト再構成パラメータの複数のセットからオーディオオブジェクト再構成パラメータのセットを決定するステップと、
複数のオーディオオブジェクト信号の再構成を取得するために、決定されたオーディオオブジェクト再構成パラメータのセットを複数の復号されたオーディオ信号に適用するステップと
を含む方法。

ＥＥＥ１８．決定されたオーディオオブジェクト再構成パラメータのセットは、決定された再生レンダリング構成に対応するオーディオオブジェクト再構成パラメータのセットである、ＥＥＥ１７に記載の方法。

ＥＥＥ１９．オーディオオブジェクト再構成パラメータのセットのいずれもが、決定された再生レンダリング構成に一致するチャネル構成に対応しない場合、決定されたオーディオオブジェクト再構成パラメータのセットは、決定された再生レンダリング構成に最も近いチャネル構成に対応する、ＥＥＥ１７に記載の方法。

ＥＥＥ２０．オーディオオブジェクト再構成パラメータのセットのいずれもが、決定された再生レンダリング構成に一致しない場合、決定されたオーディオオブジェクト再構成パラメータのセットは、オーディオオブジェクト再構成パラメータのセットの平均に対応する、ＥＥＥ１７に記載の方法。

ＥＥＥ２１．平均は加重平均である、ＥＥＥ２０に記載の方法。

ＥＥＥ２２．符号化ビットストリームからオブジェクトメタデータを抽出するステップと、オブジェクトメタデータに応答して、複数のオーディオオブジェクト信号の再構成を、決定された再生レンダリング構成にレンダリングするステップとをさらに含む、ＥＥＥ１７から２１のいずれか１つに記載の方法。

ＥＥＥ２３．符号化されたオーディオビットストリームを復号するための方法であって、
複数の復号されたオーディオ信号を取得するために、符号化されたオーディオビットストリームを復号するステップであって、複数の復号されたオーディオ信号は、複数のオーディオオブジェクト信号のマルチチャネルダウンミックスを含む、ステップと、
符号化されたオーディオビットストリームからオーディオオブジェクト再構成パラメータのセットを抽出するステップと、
複数のオーディオオブジェクト信号の再構成を取得するために、複数の復号されたオーディオ信号にオーディオオブジェクト再構成パラメータのセットを適用するステップと
を含み、
複数の再構成パラメータは、ＥＥＥ１３の方法にしたがって計算されたものである、
方法。

ＥＥＥ２４．符号化ビットストリームからオブジェクトメタデータを抽出するステップと、オブジェクトメタデータに応答して、複数のオーディオオブジェクト信号の再構成を再生レンダリング構成にレンダリングするステップとをさらに含む、ＥＥＥ２３に記載の方法。

Claims

オブジェクト再構成情報を修正するための方法であって、
Ｎ個の空間オーディオオブジェクトのセットを取得するステップであって、各空間オーディオオブジェクトは、オーディオ信号および空間メタデータを含む、ステップと、
前記Ｎ個の空間オーディオオブジェクトを表すオーディオプレゼンテーションを取得するステップと、
前記オーディオプレゼンテーションから前記Ｎ個の空間オーディオオブジェクトを再構成するように構成されたオブジェクト再構成情報を取得するステップと、
前記再構成情報を前記オーディオプレゼンテーションに適用してＮ個の再構成された空間オーディオオブジェクトのセットを形成するステップと、
第１のレンダリング構成を使用して、前記Ｎ個の空間オーディオオブジェクトをレンダリングして第１のレンダリングされたプレゼンテーションを取得し、前記Ｎ個の再構成された空間オーディオオブジェクトをレンダリングして第２のレンダリングされたプレゼンテーションを取得するステップと、
前記第１のレンダリングされたプレゼンテーションと前記第２のレンダリングされたプレゼンテーションとの間の差に基づいて前記再構成情報を修正し、それによって、修正された再構成情報を形成するステップと
を含む方法。
前記Ｎ個の空間オーディオオブジェクトのセットは、Ｌ個の空間オーディオオブジェクトのセットを空間的にコーディングすることによって取得されており、ここで、Ｌ＞Ｎであり、前記第１のレンダリングされたプレゼンテーションは、前記Ｌ個の空間オーディオオブジェクトをレンダリングすることによって取得される、請求項１に記載の方法。
前記オーディオプレゼンテーションは、Ｍ個のオーディオ信号のセットであり、前記方法は、
前記Ｍ個のオーディオ信号を符号化して、符号化されたオーディオ信号のセットにするステップと、
前記符号化されたオーディオ信号および前記修正された再構成情報を、送信のためにビットストリームに組み合わせるステップと
をさらに含む、請求項１または２に記載の方法。
前記Ｍ個のオーディオ信号は、前記Ｎ個の空間オーディオオブジェクトの前記オーディオ信号のダウンミックスを表し、前記オブジェクト再構成情報は、前記Ｍ個のオーディオ信号から前記Ｎ個の空間オーディオオブジェクトを再構成するように構成された再構成パラメータｃ（ｎ，ｍ）のセットであり、前記修正された再構成情報は、修正された再構成パラメータｃ_mod（ｎ，ｍ）のセットである、請求項３に記載の方法。
前記修正するステップは、前記第１のレンダリング構成に関連付けられたオブジェクト固有の修正ゲインｈ₁（ｎ）のセットを決定するステップを含み、前記オブジェクト固有の修正ゲインｈ₁（ｎ）は、前記オブジェクト再構成パラメータｃ（ｎ，ｍ）のセットに適用される、請求項４記載の方法。
前記オブジェクト固有の修正ゲインｈ₁（ｎ）は、
前記第１のレンダリングされたプレゼンテーションの第１のレベルを決定することと、
前記第２のレンダリングされたプレゼンテーションの第２のレベルを決定することと、
前記第１のレベルと前記第２のレベルとの間の差に基づいてレベルアライメントゲインのセットを計算することと、
前記レベルアライメントゲインの線形結合として前記オブジェクト固有の修正ゲインｈ₁（ｎ）を形成することと
によって決定される、請求項５に記載の方法。
各オブジェクト固有の修正ゲインｈ₁（ｎ）を前記レベルアライメントゲインの加重和として計算するステップをさらに含み、前記加重和における重みは、任意選択で、前記第１のレンダリングされたプレゼンテーションおよび前記第２のレンダリングされたプレゼンテーションを生成するために使用されるレンダリングゲインの関数である、請求項６に記載の方法。
第２のレンダリング構成を使用して、前記Ｎ個の空間オーディオオブジェクトをレンダリングして第３のレンダリングされたプレゼンテーションを生成し、前記Ｎ個の再構成された空間オーディオオブジェクトをレンダリングして第４のレンダリングされたプレゼンテーションを生成するステップと、
前記第２のレンダリング構成に関連付けられたオブジェクト固有の修正ゲインの第２のセットｈ₂（ｎ）を決定するステップと、
前記符号化ビットストリーム中に、
１）前記オブジェクト固有の修正ゲインの第１のセットｈ₁（ｎ）および第２のセットｈ₂（ｎ）の両方、および
２）前記オブジェクト固有の修正ゲインの第２のセットと第１のセットとの比ｈ₂（ｎ）／ｈ₁（ｎ）
のうちの１つを含めるステップと
をさらに含む、請求項５から７のいずれか一項に記載の方法。
ビットストリーム内の空間オーディオオブジェクトを復号するための復号方法であって、
前記ビットストリームを復号して、
Ｍ個のオーディオチャネルのセットと、
前記Ｍ個のオーディオ信号からＮ個の空間オーディオオブジェクトのセットを再構成するよう構成された再構成パラメータｃ_mod（ｎ，ｍ）のセットであって、前記再構成パラメータは、第１のレンダリング構成に関連付けられている、再構成パラメータのセットと、
第２のレンダリング構成に関連付けられた変更パラメータと
を取得するステップと、
再生レンダリング構成を決定するステップと、
前記再生レンダリング構成を決定したことに応答して、前記変更パラメータを前記再構成パラメータｃ_mod（ｎ，ｍ）に適用して代替再構成パラメータｃ_mod2（ｎ，ｍ）を取得するステップと、
前記代替再構成パラメータｃ_mod2（ｎ，ｍ）を前記Ｍ個のオーディオ信号に適用してＮ個の再構成された空間オーディオオブジェクトのセットを取得するステップと
を含む復号方法。
前記再生レンダリング構成は、前記第２のレンダリング構成に対応するように決定され、前記代替再構成パラメータｃ_mod2（ｎ，ｍ）が前記第２のレンダリング構成に関連付けられるように前記変更パラメータが適用される、請求項９に記載の復号方法。
前記代替再構成パラメータｃ_mod2（ｎ，ｍ）が、前記再構成パラメータｃ_mod（ｎ，ｍ）のセットと、前記変更パラメータの適用後の前記再構成パラメータｃ_mod（ｎ，ｍ）のセットとの加重平均に対応するように、前記変更パラメータが部分的に適用される、請求項９に記載の復号方法。
前記変更パラメータは、前記第２のレンダリング構成に関連付けられた第２のオブジェクト固有の修正ゲインｈ₂（ｎ）と前記第１のレンダリング構成に関連付けられた第１のオブジェクト固有の修正ゲインｈ₁（ｎ）との比ｈ₂（ｎ）／ｈ₁（ｎ）のセットを含む、請求項９から１１のいずれか一項に記載の復号方法。
前記変更パラメータは、前記第１のレンダリング構成に関連付けられたオブジェクト固有の修正ゲインの第１のセットｈ₁（ｎ）と、前記第２のレンダリング構成に関連付けられたオブジェクト固有の修正ゲインの第２のセットｈ₂（ｎ）とを含み、
前記変更パラメータを前記再構成パラメータに適用する前記ステップは、
前記修正ゲインの第１のセットを適用して前記第１のレンダリング構成との前記再構成パラメータの関連付けを除去するステップと、
前記修正ゲインの第２のセットを適用して前記再構成パラメータを前記第２のレンダリング構成に関連付けるステップと
とを含む、
請求項９から１１のいずれか一項に記載の復号方法。
エンコーダであって、
Ｎ個の空間オーディオオブジェクトのセットを受信し、前記Ｎ個の空間オーディオオブジェクトを表すＭ個のオーディオ信号のセットを生成するように構成されたダウンミックスレンダラと、
前記Ｍ個のオーディオ信号から前記Ｎ個の空間オーディオオブジェクトを再構成するように構成されたオブジェクト再構成情報を取得するためのオブジェクトエンコーダと、
前記再構成情報を前記Ｍ個のオーディオ信号に適用してＮ個の再構成された空間オーディオオブジェクトのセットを形成するためのオブジェクトデコーダと、
第１のレンダリング構成を使用して、前記Ｎ個の空間オーディオオブジェクトをレンダリングして第１のレンダリングされたプレゼンテーションを取得し、前記Ｎ個の再構成された空間オーディオオブジェクトをレンダリングして第２のレンダリングされたプレゼンテーションを取得するように構成されたレンダラと、
前記第１のレンダリングされたプレゼンテーションと前記第２のレンダリングされたプレゼンテーションとの間の差に基づいて前記再構成情報を修正し、それによって、修正された再構成情報を形成するステップするためのモディファイアと、
前記Ｍ個のオーディオ信号を符号化して、符号化されたオーディオ信号のセットにするように構成されたエンコーダと、
前記符号化されたオーディオ信号および前記修正された再構成情報を、送信のためにビットストリームに組み合わせるためのマルチプレクサと
を含むエンコーダ。
デコーダであって、
Ｍ個のオーディオチャネルのセット
前記Ｍ個のオーディオ信号からＮ個の空間オーディオオブジェクトのセットを再構成するよう構成された再構成パラメータｃ_mod（ｎ，ｍ）のセットであって、前記再構成パラメータは、第１のレンダリング構成に関連付けられている、再構成パラメータのセットと、
第２のレンダリング構成に関連付けられた修正ゲインと
を含むビットストリームを復号するためのデコーダと、
決定された再生レンダリング構成に応答して、前記修正ゲインを前記再構成パラメータｃ_mod（ｎ，ｍ）に適用して代替再構成パラメータｃ_mod2（ｎ，ｍ）を取得するように構成された代替ユニットと、
前記代替再構成パラメータｃ_mod2（ｎ，ｍ）を前記Ｍ個のオーディオ信号に適用してＮ個の再構成された空間オーディオオブジェクトのセットを取得するためのオブジェクトデコーダと
を含むデコーダ。
コンピュータプロセッサ上で実行されたときに、請求項１から８のいずれか一項に記載の方法を実行するように構成されたコンピュータプログラムコード部分を含むコンピュータプログラム製品。
コンピュータプロセッサ上で実行されたときに、請求項９から１３のいずれか一項に記載の方法を実行するように構成されたコンピュータプログラムコード部分を含むコンピュータプログラム製品。