JP2018522286A

JP2018522286A - エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御

Info

Publication number: JP2018522286A
Application number: JP2018504936A
Authority: JP
Inventors: フランクバウムガルテ
Original assignee: Apple Inc
Current assignee: Apple Inc
Priority date: 2015-07-31
Filing date: 2016-07-25
Publication date: 2018-08-09
Anticipated expiration: 2036-07-25
Also published as: JP6778781B2; US10276173B2; EP3329487A1; US20170032793A1; CN107851440B; KR20180019715A; KR102122137B1; EP3329487B1; ES2777600T3; CN107851440A; US9837086B2; WO2017023601A1; US20180218742A1; JP6574046B2; JP2019148807A

Abstract

オーディオエンコーダは、多数のオーディオチャネル又はオーディオオブジェクトを有するデジタルオーディオ録音をエンコードする。ダイナミックレンジ制御（ＤＲＣ）プロセッサは、多数のＤＲＣ特性のうちの選択された１つをオーディオチャネル又はオーディオオブジェクトのうちの１つ以上の群に適用することにより、エンコーダＤＲＣゲイン値のシーケンスを生成する。エンコーダＤＲＣゲイン値は、エンコードされたデジタルオーディオ録音からデコードする際にオーディオチャネル又はオーディオオブジェクトの群を調整するために、適用されることになる。ビットストリームマルチプレクサは、ａ）エンコードされたデジタルオーディオ録音を、ｂ）エンコーダＤＲＣゲイン値のシーケンス、選択されたＤＲＣ特性のインジケーション、及びエンコードされたデジタルオーディオ録音に関連付けられたメタデータとしての代替ＤＲＣ特性のインジケーションと混合する。エンコードされたオーディオ録音をデコードして、それにＤＲＣ調整を実行するためのシステムを含む他の実施形態もまた説明する。【選択図】図１

Description

本出願は、米国仮特許出願第６２／１９９，８１９号（２０１５年７月３１日出願）の先の出願日の利益を主張する。
本発明の実施形態は、概して、様々な種類の家庭用エンドユーザ向け電子デバイスにおける再生の品質を向上するための、オーディオ信号のエンコード及びデコード、並びにデコードされた信号の再生中のエンコードされた信号に関連付けられたメタデータの使用に関する。他の実施形態についてもまた説明する。

デジタルオーディオコンテンツは、例えば、音楽及び動画ファイルを含めた多くの事例に登場する。多くの事例では、オーディオ信号は、データ転送速度低減又は形式変換の目的でエンコードされて、メディアファイル又はストリーミングの伝送又は配信が、より実用的で、より狭い帯域幅を消費し、かつ／又はより速くなり、それにより、多数の他の伝送を同時に行うことができるようになる。メディアファイル又はストリーミングは、異なる種類のエンドユーザデバイスにおいて受信することができ、エンコードされたオーディオ信号は、内蔵スピーカ又は取り外し可能なスピーカのいずれかを介して消費者に提示される前に、デコードされる。これは、インターネットを介してデジタルメディアを入手することに対する消費者の欲求を刺激するのに役立った。デジタルオーディオコンテンツ（プログラム）の創作者及び配給業者は、オーディオコンテンツをエンコード及びデコードするために使用することができる、自由に使用できるいくつかの手法を有する。これらの手法としては、ＡｄｖａｎｃｅｄＴｅｌｅｖｉｓｉｏｎＳｙｓｔｅｍｓＣｏｍｍｉｔｔｅｅ，Ｉｎｃ．により２００５年６月１４日に発行されたＤｉｇｉｔａｌＡｕｄｉｏＣｏｍｐｒｅｓｓｉｏｎＳｔａｎｄａｒｄ（ＡＣ−３，Ｅ−ＡＣ−３），ＲｅｖｉｓｉｏｎＢ，ＤｏｃｕｍｅｎｔＡ／５２Ｂ（「ＡＴＳＣＳｔａｎｄａｒｄ」）、ＩＳＯ／ＩＥＣ１３８１８−７のＭＰＥＧ−２ＴｒａｎｓｐｏｒｔＳｔｒｅａｍに基づくＥｕｒｏｐｅａｎＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＳｔａｎｄａｒｄｓＩｎｓｔｉｔｕｔｅ，ＥＴＳＩＴＳ１０１１５４ＤｉｇｉｔａｌＶｉｄｅｏＢｒｏａｄｃａｓｔｉｎｇ（ＤＶＢ）、ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）（「ＭＰＥＧ−２ＡＡＣＳｔａｎｄａｒｄ」）、及びＩｎｔｅｒｎａｔｉｏｎａｌＳｔａｎｄａｒｄｓＯｒｇａｎｉｚａｔｉｏｎ（ＩＳＯ）により発行されたＩＳＯ／ＩＥＣ１４４９６−３（「ＭＰＥＧ−４Ａｕｄｉｏ」）が挙げられる。

オーディオコンテンツは、デコードして、その後、最初にマスタリングされたのとは異なって処理（レンダリング）することができる。例えば、マスタリング技術者は、再生すると拍手が背後から聞こえてきて聴取者がコンサートの聴衆の中に、すなわち、バンド又はオーケストラの前に座っているかのように（聴取者に）聞こえるように、オーケストラ又はコンサートを録音することができる。マスタリング技術者は、代わりに、例えば、再生すると聴取者が舞台上にいるかのようにコンサートを聞く（聴取者は楽器を「聴取者の周囲で」かつ拍手を「前で」聞くであろう）ように、（同じコンサートの）異なるレンダリングをすることができる。これは、再生室内の聴取者に対する異なる視点の生成、又は異なる「聴取位置」若しくは異なる再生室に対するオーディオコンテンツのレンダリングとも呼ばれる。

オーディオコンテンツはまた、異なる音響環境、例えば、ヘッドセット、スマートフォンのスピーカフォン、又はタブレットコンピュータ、ラップトップコンピュータ、若しくはデスクトップコンピュータの内蔵スピーカを介した再生に対してレンダリングすることができる。特に、オブジェクトベースのオーディオ再生技術が現在利用可能であり、例えば、話している単一の個人、爆発、拍手、又は背景音のデジタルオーディオ録音である個々のデジタルオーディオオブジェクトを、所与の音響環境において任意の１つ以上のスピーカチャネルを介して異なって再生することができる。

コンテキストオーディオ再生におけるダイナミックレンジは、デジタルオーディオコンテンツから計算された最大のサウンドと最小のサウンド（音量レベル）との間の比を指す。音量レベルは、どのようにサウンドが人間によって知覚される（又は聞こえる）かを推定する任意の好適な数学モデルを使用して計算することができる。ダイナミックレンジ制御（Dynamic range control）（ＤＲＣ）は、再生中にオーディオコンテンツの音量の大きい部分及び音量の小さい部分がどのように聞こえるかを変化させるように、ダイナミックレンジを制御する、例えば、圧縮する又は拡張するための手法を指す。オーディオ技術者は、特定の音響環境に対して又は特定の聴取者視点に対して特定のオーディオ録音を最適化するために、ＤＲＣをデジタルオーディオ信号に適用する。例えば、現代のポピュラー音楽の作品は、より大きな音量レベルで再生する（クリッピングすることなく）ことができるように、そのダイナミックレンジを圧縮させていることがあり、一方で、クラシック音楽の作品は、多くの場合、より大きなダイナミックレンジで録音される。

本発明の実施形態は、エンコードされたデジタルオーディオコンテンツ（又はオーディオ録音）ファイルのメタデータの一部であるＤＲＣゲイン値を生成する、生成又は配信システム（例えば、サーバシステム）である。例えば、ＤＲＣゲイン値は、正（増幅）又は負（減衰）とすることができ、再生中に録音の音量の大きい部分及び／又は音量の小さい部分を調整するために、再生中に（例えば、オーディオ録音がエンコードされたファイルからデコーダにより抽出された後で）オーディオ録音に適用されることになる。ＤＲＣ調整は、例えば、デジタルオーディオ信号のすべてのフレームで更新することができる。ＤＲＣ調整は、特定の種類のオーディオ録音を特定の再生音響環境又は聴取視点により良好に適合させるのに役立つことができる。これにより、ＤＲＣ調整されたオーディオコンテンツの再生が可能になり、ＤＲＣ調整は、エンコード段階で指定されている。例えば、オーディオコンテンツファイルは、例えばＭＰＥＧ動画ファイルなどの動画ファイル、例えばＡＡＣファイルなどのオーディオのみのファイル、又は任意の好適なマルチメディア形式を有するファイルとすることができる。

一実施形態では、ダイナミックレンジ制御（ＤＲＣ）プロセッサは、多数のＤＲＣ特性のうちの選択された１つをオーディオチャネル又はオーディオオブジェクトのうちの１つ以上の群に適用することにより、エンコーダＤＲＣゲイン値のシーケンスを生成する。エンコーダＤＲＣゲイン値は、エンコードされたデジタルオーディオ録音からデコードする際にオーディオチャネル又はオーディオオブジェクトの群を調整するために、デコードシステムによって適用されることになる。ビットストリームマルチプレクサは、ａ）エンコードされたデジタルオーディオ録音を、ｂ）エンコーダＤＲＣゲイン値のシーケンス、選択されたＤＲＣ特性のインジケーション、及びエンコードされたデジタルオーディオ録音に関連付けられたメタデータとして複数のＤＲＣ特性から選択された代替ＤＲＣ特性のインジケーションと混合する。これにより、エンコードシステムが、代替のＤＲＣ（再生中にデコードされた録音に適用することができる）を要求する又はデコーダオプションとして可能にするのいずれかができるようになる。

上述の構成により、エンコーダが、代替ＤＲＣ特性を適用しなければならない（やはりエンコードシステムで選択された「既定の」ＤＲＣ特性の代わりに）シナリオを特定することに加えて、代替ＤＲＣ特性を適用したことの効果に関する音量情報を提供することができる。代替のＤＲＣのゲイン値は、メタデータで受信される単一のＤＲＣゲインシーケンスに基づいてデコードシステムによって導出することができるため、著しいビットレートの節約が実現される。これにより、エンコードシステムがそれぞれの圧縮シナリオに対して別個のＤＲＣゲインシーケンスを送信する必要を回避する。ＤＲＣゲインシーケンスは、特にフレームごとに変化する場合に、メタデータの最もビットレートを消費する部分であると考えられ得る。

別の実施形態では、メタデータは、生成又は配信システム（エンコードシステム）によりエンコーダＤＲＣゲイン値の２つ以上のシーケンスが含まれ得る形式を有するとして定義される。加えて、メタデータは、エンコードシステムからデコードシステムへの命令を内部に含むことができるように定義され、メタデータは、エンコーダＤＲＣゲイン値のシーケンス（メタデータ内に存在する）のうちの任意の１つをＤＲＣに適用してデコードされたデジタルオーディオ録音の任意のサブバンドを調整することができることをエンコードシステムが指定することができる命令を含むことができる。例えば、メタデータは、エンコーダＤＲＣゲイン値のシーケンス（メタデータ内にある）のそれぞれが、デコードされたデジタルオーディオ録音の異なるサブバンドに適用されるものであることを指定することができる。換言すれば、メタデータは、メタデータ内に含むことができる２つ以上のＤＲＣゲインシーケンスの、サブバンドごとにデコードシステムによって圧縮が実行されるサブバンドのうちの任意に選択されたサブバンドへの任意の割り当てを可能にすることができる。再度、例えば、複数のサブバンドを圧縮するためにデコードシステムにより同じＤＲＣゲインシーケンスを使用することができるため、ビットレートの節約が実現される。

更に別の実施形態では、単一のＤＲＣゲインシーケンスを２つ以上のサブバンドに任意に割り当てる能力に加えて、メタデータはまた、第１のサブバンドが１つの倍率に従ってＤＲＣゲインシーケンスのうちの１つをスケール変更することにより調整され、別の倍率に従ってＤＲＣゲインシーケンスをスケール変更して異なるサブバンドに適用するように、生成又は配信システムがメタデータ内で指定することができるフォーマッティングをサポートする。この結果として、デコードシステムは、メタデータ内の命令に従って、すべてメタデータ内で指定されたように、第１の倍率によりＤＲＣゲインシーケンスのうちの指定された１つをスケール変更し（そのスケール変更されたシーケンスを第１のサブバンドに適用する前に）、第２の倍率により指定されたＤＲＣゲインシーケンスをスケール変更する（そのスケール変更されたシーケンスを異なるサブバンドに適用する前に）。

上記概要は、本発明のすべての態様の網羅的なリストを含んでいない。本発明は、上でまとめた種々の態様のすべての適切な組合せによって実施できるすべてのシステム及び方法、並びに以下の「発明を実施するための形態」で開示されるもの、特に本出願と共に提出された請求項に指摘されるものを含むと考えられる。このような組合せは、上記概要には具体的に記載していない特定の利点を有する。

本発明の実施形態は、限定としてではなく例として、添付の図面の図に示されており、図中、同じ参照符号は同様の要素を示している。本開示における本発明の「ある」実施形態又は「一」実施形態に対する言及は、必ずしも同じ実施形態に対するものではなく、それらは、少なくとも１つの実施形態を意味することに留意されたい。また、簡潔さ及び図の総数を低減するために、所与の図を使用して、本発明の１つより多くの実施形態の特徴を例示する場合があり、図に示すすべての要素が所与の実施形態に対して必要ではないことがある。
デジタルオーディオエンコードシステムの態様を例示するために使用されるブロック図である。いくつかの例示的なダイナミックレンジ制御（ＤＲＣ）特性を示す。デジタルオーディオデコードシステム、特にデコードされたオーディオ信号の再生中にデータ処理が実行されるデジタルオーディオデコードシステムの態様を例示するために使用されるブロック図である。例示的なマルチバンドの周波数ドメインＤＲＣ適用ブロックの態様を説明するブロック図である。オーディオデコーダの一部として時間ドメインで実行されるマルチバンドＤＲＣの実施例を例示するために使用される。ＤＲＣに関連するメタデータ内のいくつかの例示的なフィールドを示す。

本明細書で、エンコードされたデジタルオーディオ録音を生成するためのシステム、及び再生中にデコードされた録音を調整するためにＤＲＣを適用するためのデコーダシステムの関連する構成要素の実施例を含む、本発明の各種実施形態が説明され図に例示される。メタデータに関する、その形式及びデコーダシステムにおけるその使用を含む多数の詳細の存在を留意されたい。それらの一部は、本発明の特定の実施形態を実施するときに必要ではない場合がある。これらの詳細の多くは、以下の請求項において使用される言い回しの実施例であると考えられる。

いくつかの例では、本説明の理解を不明瞭にすることがないように、周知の回路、構造、及び技術は、詳細には示していない。例えば、特定の詳細は、本明細書で、ＭＰＥＧ標準によるビットレート低減のためのエンコードの文脈で説明される。しかし、ＤＲＣゲイン値及び関連情報をエンコードされたオーディオコンテンツファイルのメタデータに埋め込むための手法はまた、ＡｐｐｌｅＬｏｓｓｌｅｓｓＡｕｄｉｏＣｏｄｅｃ（ＡＬＡＣ）などの無損失データ圧縮を含むオーディオコーディング及びデコードの他の形態にも適用可能である。

図１は、デジタルオーディオエンコードシステムの態様を例示するために使用されるブロック図である。図１の元のオーディオ録音又はオーディオ信号は、音楽作品又は音響映像作品、例えば、多数のオーディオチャネルを有する動画のサウンドトラックなどのサウンドプログラムコンテンツ片のビットストリーム又はファイル（これらの用語は、本明細書で区別なく使用される）の形態とすることができる。オーディオチャネルの代わりに又はそれに加えて、録音は、多数のオーディオオブジェクト、例えば、個々の楽器、ボーカル、音響効果のサウンドプログラムコンテンツを含むことができる。エンコーダ段階の処理は、例えば、演奏又は動画の製作者などのサウンドプログラムコンテンツの製作者又は配給業者のコンピュータ（又はコンピュータネットワーク）によって実行することができる。デコード段階の処理（以下の図３を参照）は、例えば、消費者のコンピュータ（又はコンピュータネットワーク）、例えば、ホームオーディオシステム、スピーカドック、車両内のオーディオシステムによって実行することができる。このブロック図を使用して、デジタルオーディオエンコーダ装置だけでなく、オーディオ信号をエンコードするための方法も説明する。

エンコードシステムは、多数の元のオーディオチャネル又はオーディオオブジェクト（本明細書の図で、信号フローを表す線を横切るフォワードスラッシュにより示される）を有するデジタルオーディオ録音（又は本明細書でデジタルオーディオ信号とも呼ばれる）を異なるデジタル形式にエンコードする、エンコーダ２を有する。新しい形式は、エンコードされたファイルの記憶（例えば、コンパクトディスク又はデジタルビデオディスクなどのポータブルデータ記憶デバイス上への）のため、又はビットストリームを消費者のコンピュータに送信する（例えば、インターネットを介して）ために、より好適なものとすることができる。エンコーダ２はまた、例えば、ＭＰＥＧ標準、又はＡｐｐｌｅＬｏｓｓｌｅｓｓＡｕｄｉｏＣｏｄｅｃ（ＡＬＡＣ）などの無損失データ圧縮に従って、元のオーディオチャネル又はオーディオオブジェクトに損失又は無損失ビットレート低減（データ圧縮）を実行することができる。

エンコード段階の処理はまた、エンコードされたデジタルオーディオ録音をエンコードされたデジタルオーディオ録音に関連付けられたメタデータとしてのＤＲＣゲイン値の１つ以上のシーケンスと混合する又は組み立てる、マルチプレクサ（ｍｕｘ）８を有することができる。組合せの結果は、エンコードされた録音及びその関連付けられたメタデータを含むビットストリーム又はエンコードされたファイル（以降、一般的に「ビットストリーム」と呼ばれる）とすることができる。メタデータは、ビットストリーム内のエンコードされた録音に埋め込むことができる、又は、別個のファイル若しくは補助データチャネル７（エンコードされた録音が関連付けられる）と本明細書で一般的に呼ばれるサイドチャネル内に提供することができることに留意されたい。エンコードされたデジタルオーディオ録音に関連付けられたメタデータは、ＩＳＯ／ＩＥＣ２３００３−４：２０１５−ＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ−ＭＰＥＧオーディオ技術−Ｐａｒｔ４：ＤｙｎａｍｉｃＲａｎｇｅＣｏｎｔｒｏｌ（「ＭＰＥＧ−ＤＤＲＣ」）の多数の拡張フィールド内で搬送することができる。

エンコード段階はまた、エンコーダＤＲＣゲイン値のシーケンスを生成するＤＲＣプロセッサ４を有する。既定のＤＲＣゲインシーケンスは、多数のＤＲＣ特性又はプロファイル（ＤＲＣプロセッサ４に記憶することができる、少なくとも２つ又はＮ個が存在する）のうちの選択された１つを、デジタルオーディオ信号の一部であるオーディオチャネル又はオーディオオブジェクトのうちの１つ以上の群に適用することにより生成される。これを繰り返して、結果として、オーディオチャネル又はオブジェクトの複数の群に対応する複数のＤＲＣゲインシーケンスを生成することができる。ＤＲＣ特性又はプロファイルは、ＤＲＣプロセッサ４の一部としての、かつまたデコードシステム内のＤＲＣ＿１プロセッサ１２（図３を参照）の一部としてのメモリに記憶することができる。ＤＲＣ特性の例を図２に示し、ｘ軸に沿った入力レベルは、短期音量値（本明細書でＤＲＣ入力レベルとも呼ばれる）を指し、ＤＲＣゲイン値の範囲は、ｙ軸に沿って示される。

既定のＤＲＣ特性は、ユーザ入力（例えば、グラフィカルユーザインタフェース）を介してユーザによって選択することができる。ユーザは、例えば、再生装置（図示せず）を介してチャネル又はオブジェクトを聴取することを含めて関連するチャネル又はオブジェクト内のコンテンツの種類を評価して、経験に基づいてコンテンツの種類、及び音響設定又は特定の再生デバイスシナリオ（例えば、ヘッドセット対ラップトップコンピュータ又はデスクトップコンピュータの内蔵スピーカ対独立型のラウドスピーカ）でどのようにチャネル又はオブジェクトがそのダイナミックレンジを変更した（既定の特性に従って）ときに聞こえるかを選択する、ミキシング技術者又はサウンド技術者であってよい。これは、例えば、公共の映画館のオーディオシステムより小さなダイナミックレンジを有することがあるオーディオシステムを介して再生される動画のサウンドトラックを変更するために行うことができる。

所与のＤＲＣ入力レベルに対して、この特性は、正（拡張効果）又は負（圧縮効果）であり、かつＤＲＣ適用ブロック３（図１を参照）により入力オーディオ信号に適用される、対応するゲイン値を与える。換言すれば、ＤＲＣブロック３は、入力オーディオ信号から任意の必要とされる入力レベルを計算し、入力レベルを特性に適用することにより出力ゲインを得て、出力ゲインを入力オーディオ信号に適用して、ダイナミックレンジ調整を実行するように、選択されたＤＲＣ特性を備えて構成されるといわれる。図２のグラフのゲイン値は、本明細書でＤＲＣゲイン値とも呼ばれ、この特定の実施例では、対数形式（ｄＢ）で示されている。特性（ＤＲＣ入力レベル）に適用される入力オーディオ信号のレベルは、例えば、５ミリ秒未満のオーダー、例えば、１ミリ秒未満の、本明細書でフレームとも呼ばれる入力オーディオ信号の所定の時間間隔にわたって計算することができる。したがって、ＤＲＣゲインシーケンスは、そのようなフレームごとの更新されたＤＲＣゲイン値を提供することができる。エンコードされているデジタルオーディオ信号は、オーディオ信号のフレーム又はチャンクが逐次利用可能になる、パルスコード変調（pulse code modulated）（ＰＣＭ）形式、又はパケットベース形式のいずれかとすることができ、それぞれのフレーム又はチャンクは、シーケンス内のいくつかのＤＲＣゲイン値がそれぞれのオーディオフレーム又はチャンクに適用されるように、例えば、２０〜１００ミリ秒とすることができることに留意されたい。これらの数値は、当然ながら、本明細書で適用される概念が、ＤＲＣゲインシーケンス内のそれぞれのゲイン値に対して、又はオーディオ信号をデジタル的に処理するために定義されたフレーム長さに限定されないことを理解されるべきであるように、単に例である。

入力オーディオ信号を選択された既定のＤＲＣ特性に適用することにより生成されたゲイン値（エンコードシステム内のＤＲＣプロセッサ４により）は、エンコードされたデジタルオーディオ録音からオーディオオブジェクトをデコードする際に（デコードシステム内で）、１つ以上のチャネル又はオーディオオブジェクトの群を調整するために適用されなければならない。それは、図３で以下に更に説明するような再生中の処理の一部とすることができる。この目的を実現するために、エンコード段階はまた、エンコードされたデジタルオーディオ録音に関連付けられたメタデータとしてエンコーダＤＲＣゲイン値のシーケンスをデコードシステムに提供するための、なんらかの手段を有する。これは、例えば、マルチプレクサ８自体として、又は補助データチャネル７と組合せて上述した。

一実施形態では、メタデータはまた、既定のＤＲＣ特性のインジケーション、並びに利用可能なＤＲＣ特性０、１、．．．Ｎから選択された代替ＤＲＣ特性のインジケーションを含む。以下に説明するように、これにより、デコードシステムで適用されるダイナミックレンジ制御の圧縮強度をエンコード段階でユーザ入力により要求されたように変更することができる。これを行なうことができる技術は、追加のＤＲＣゲインシーケンス（単一の既定のＤＲＣゲインシーケンスを上回る）を担うメタデータを必要とすることなく、新しいダイナミックレンジ制御オプションがデコードシステムに与えられて、ビットレート効率がよい。したがって、相対的に一般的な変更は、メタデータ内に指定された代替ＤＲＣ特性の知識を使用して既定のＤＲＣゲインシーケンスのゲインマッピングを実行するためのデコードシステムに利用可能である。メタデータは、ここで、例えば、デコードシステムが代替ＤＲＣ特性（既定のＤＲＣ特性ではなく）に従ってダイナミックレンジ制御を適用することになる特定のシナリオ又は条件を特定することに加えて、代替ＤＲＣ特性を示すことができる追加のフィールドを定義することにより拡張される。既定のＤＲＣゲインシーケンスのこのゲインマッピングは、図３に関連して以下に説明する。

また図１を参照して、一実施形態では、音量パラメータ、又は本明細書で音量情報とも呼ばれるものは、ＤＲＣプロセッサ４により、具体的には音量測定ブロック６（音量計算機）により計算することができ、これらはまた、メタデータ内に含めることができる。これらの音量パラメータは、デジタルオーディオ録音の代替のＤＲＣ調整されたバージョンの音量の測定値を与え、この測定値は、デコードシステムが既定のＤＲＣと代替のＤＲＣとの間でのようなＤＲＣを適用するか否かの選択を与えられた場合に評価するのに有用である。オーディオ測定ブロック６への入力は、ＤＲＣ適用ブロック３により提供される入力オーディオ信号の代替のＤＲＣ調整されたバージョンを受信し、ＤＲＣ適用ブロック３は、代替ＤＲＣ特性（ユーザ入力により選択されていることがある）に従って構成されている。

既定の又は代替のＤＲＣ特性の「インジケーション」（メタデータ内の）を提供するために、いくつかの手法のうちのいずれか１つを取ることができる。図１に示すように、ここの特定の実施例は、入力レベル又は音量対出力ＤＲＣゲインの所定の曲線又はグラフに対するリファレンス又はポインタであるインデックスを使用する。曲線又はグラフは、ＤＲＣ＿１プロセッサ４のメモリ内のＤＲＣ特性０、１、．．．Ｎとしてデコードシステムに記憶することができる。デコードシステムは、次に、メタデータ内で受信したインデックスにより指定されていたＤＲＣ特性を取得することになる。あるいは、メタデータは、デコードシステムにより既定の数学関数に挿入されるとＤＲＣゲイン曲線に対して特定の音量を与える多数の定数又はパラメータ又は係数を含むことにより、ＤＲＣ特性を示すことができる。別の実施形態では、ＤＲＣ特性のインジケーションは、入力レベル又は音量値及びＤＲＣゲイン曲線を定義する対応するＤＲＣゲイン値のすべてのルックアップテーブルとすることができる。最後に、ＤＲＣ特性のインジケーションは、デコードシステムが不特定の入力音量レベル（メタデータ内で指定されていない）に対してＤＲＣゲイン曲線又は特定のＤＲＣゲイン値を補間する、低減した数の音量値及び対応するＤＲＣゲイン値とすることができる。ビットレート効率のために、ＤＲＣ特性のインジケーションは、単に、ＤＲＣゲイン曲線又はグラフ（デコードシステムに記憶されている）に対する所定の音量のインデックスであるべきである。

どのようにメタデータをエンコードシステム内に読み込むことができるかを説明してきたが、ここで、再生のための処理中のメタデータの使用を、図３の実施例を使用して説明する。図３は、デコードシステム、特にデコードされたオーディオ信号の再生中にデータ処理が実行されるデコードシステムの態様を例示するために使用されるブロック図である。これは、デジタルオーディオ録音がエンコードされている（図１を参照）ビットストリームを受信する、デコードされたデジタルオーディオ録音を生成するためのシステムである。
図３に示す構成要素に関する本明細書で説明するデジタル信号処理動作は、専用のハードウェア（回路）により実装することができる、又は、ハードウェア回路、及び１つ以上のプロセッサ（一般的に本明細書で「プロセッサ」と呼ばれる）によって実行されると本明細書で説明する動作を実行する命令をメモリが内部に記憶している１つ以上のプログラムされたプロセッサの組合せにより実装することができる。具体的には、デマルチプレクサ（ｄｅｍｕｘ）１３は、エンコードされたオーディオビットストリームを受信して、エンコードされたマルチチャネル又はマルチオブジェクトのオーディオを抽出し、これは、デコーダ１０に供給され、抽出されたメタデータは、ＤＲＣ＿１プロセッサ１２に提供される。一実施形態では、メタデータは、図１で上述した既定のＤＲＣゲイン値とすることができるエンコーダＤＲＣゲイン値（図３に示すようなＤＲＣゲイン）のシーケンスを含む。メタデータはまた、エンコーダシステムにより既定のＤＲＣゲイン値のシーケンスを導出するために使用された（元のデジタルオーディオ録音を選択された又は既定のＤＲＣ特性に適用するときに）、選択されたＤＲＣ特性（既定のＤＲＣ特性）のインジケーションを含む。加えて、代替ＤＲＣ特性のインジケーションも、メタデータ内で受信される。メタデータの一部又はすべては、エンコードされたオーディオビットストリームとは別個のチャネル、例えば、補助データチャネル７（図１を参照）内とすることができることを理解されたい。

デコーダ１０は、デジタルオーディオ録音をデコード（例えば、図１のエンコーダ２によって実行された動作をアンドゥ又はその動作の逆を実行）し、次に、デコードされた録音の再生が、既定のＤＲＣゲイン値をデコードされたオーディオ信号又はＤＲＣゲインの再マッピングされたセットのいずれかを適用してダイナミックレンジ−調整された（ＤＲＣ調整された）オーディオ録音を生成する乗算器ブロック１１で開始されて実行される。ＤＲＣ調整されたオーディオ信号は、次に、アナログ形態に変換される（デジタル／アナログ変換器、ＤＡＣ１８により）前に、更なるオーディオ処理１６（例えば、ダウンミックス）を受けることができ、その後、電気音響トランスデューサ１９のスピーカドライバ入力に供給することができる。

図３で再マッピングされたＤＲＣゲインとも呼ばれるＤＲＣゲイン値の代替のシーケンスは、以下の処理を実行するＤＲＣ＿１プロセッサ１２によって計算することができる。最初に、メタデータ内で受信した既定のＤＲＣ特性のインジケーションを使用して、既定のＤＲＣ特性の逆数が生成される。例えば、メタデータは、既定のＤＲＣ特性のインデックスを含むことができる。このインデックスを使用して、図示するようなＤＲＣ＿１プロセッサ１２に記憶することができる既定のＤＲＣ特性（ＤＲＣ特性０、１、．．．Ｎのうちの１つとしての）を検索することができる。逆数は、例えば、ＤＲＣフレームごとに、ＤＲＣ特性を表す数学関数（ＤＲＣゲイン曲線）の入力及び出力変数を反転させ、メタデータ内で受信したエンコードされたＤＲＣゲイン値のシーケンスを数学関数の「出力」に（又は数学関数の計算される逆数への入力として）適用して、音量値の対応するシーケンスを生成することにより、得ることができる。

プロセスは、メタデータ内で受信したインジケーションを使用して代替ＤＲＣ特性を入手して継続する。例えば、ＤＲＣ特性３は、既定とすることができ、代替ＤＲＣ特性は、ＤＲＣ特性５であると示される。既定の特性、ＤＲＣ特性３の逆数を使用して計算された音量値のシーケンスは、今度は入力として代替の特性、ＤＲＣ特性５に適用されて、図３で再マッピングされたＤＲＣゲイン又は「代替のＤＲＣゲイン」と呼ばれるＤＲＣゲイン値のシーケンスを生成する。再マッピングされたＤＲＣゲインは、次に、乗算器ブロック１１によりデコードされたデジタルオーディオ録音（デコーダ１０の出力から来る）に適用されて、デコードされたオーディオ録音の代替のＤＲＣ調整されたバージョンを生成する。

したがって、図３のデコードシステムは、メタデータ内で受信した既定のＤＲＣゲイン値（デコーダ１０の出力に）を適用する、又は代替ＤＲＣ特性のインジケーション（インジケーションは、メタデータ内で受信された）に基づいた上述した手順を使用して再マッピングされたゲインを生成（して次に適用）する、のいずれかのオプションを有する。一実施形態では、それら２つのダイナミックレンジ制御調整の間の選択は、メタデータ内で受信した命令に従うことができる。あるいは、選択は、ユーザ入力及び／又は再生用に使用されているトランスデューサ１９のダイナミックレンジの所定の知識に基づいて、デコードシステムにより単独で行うことができる。より一般的には、更なるオーディオ処理１６中に適用されるあらゆるゲインを含めた再生システムの感度、及びデジタル／アナログ変換器（ＤＡＣ）１８の感度もまた、既定のＤＲＣ又は代替のＤＲＣの間で決定する際に考慮することができる。

更なる実施形態もまた、図３に示し、別個の又は独立したダイナミックレンジ制御調整が実行されていることがある他のオーディオ源（別個のＤＲＣ適用ブロック３により示すような）からのオーディオ信号を混合するように機能するミキサ１４が存在してもよい。

上述したように図１及び図３は、既定及び代替のＤＲＣ特性の両方のインデックスを（代替のＤＲＣに関する任意選択の音量パラメータと共に）メタデータ内に埋め込むことにより、メタデータを使用する、より有用なＤＲＣゲインマッピング機能が実装された本発明の実施形態を示す。図１及び図３はまた、メタデータ内に指定された（エンコードシステムによって）ようにデコードされたオーディオ信号にマルチバンドＤＲＣを実行することができる（デコーダ１０の特定の内部要素による乗算器ブロック１１により）本発明の他の実施形態を示す。第１に、既定のＤＲＣゲイン値の個々のサブバンドごとのスケール変更を指定する（エンコードシステムにより、かつメタデータ内の命令を介して）ことにより、既定のＤＲＣゲイン値を変更する能力が存在する。同じ既定のＤＲＣゲインシーケンスを、デコードシステムによりここで再使用して、複数のサブバンドに適用することができる。したがって、図１に戻って、ＤＲＣプロセッサ４は、今度は、既定のＤＲＣゲインシーケンスに加えて、サブバンド定義、及びＤＲＣゲインシーケンスのサブバンドへの割り当てを生成する。サブバンド定義は、例えば、オーディオスペクトル全体の中の少なくとも２つのサブバンドに対するいくつかのクロスオーバー周波数を定義する、完全に既存のものとすることができる。加えて、メタデータは、ここで、メタデータ内にあるエンコーダＤＲＣゲイン値の複数のシーケンス（例えば、既定のＤＲＣゲインシーケンス）のうちの１つがダイナミックレンジに適用され、（エンコーダ２によって生成されたエンコードされたデジタルオーディオ録音から）デコードされるオーディオチャネル又はオーディオオブジェクトの２つ以上のサブバンドを調整するものであることを指定する。メタデータは、１）ＤＲＣゲイン値のシーケンスのうちの指定された１つをスケール変更するために、スケール変更されたシーケンスをデコードされたオーディオチャネル又はオーディオオブジェクトの第１のサブバンドに適用する前に適用されるものである第１のスケーリング値、及び２）エンコーダＤＲＣゲイン値のシーケンスのうちの指定された１つをスケール変更するために、スケール変更されたシーケンスをデコードされたオーディオチャネル又はオーディオオブジェクトの第２のサブバンドに適用する前に適用されるものである第２の異なるスケーリング値を更に指定することができる。図６で分かるように、マルチバンドＤＲＣに関するメタデータ内のいくつかの例示的なフィールドが示されている。具体的には、クロスオーバー周波数インデックスと呼ばれるデータ構造は、２つ以上のサブバンドのクロスオーバー周波数を定義することができる。クロスオーバー周波数は、サブバンドの数を示すデータ構造バンド数と共に示されている。更なるデータ構造、マルチバンドＤＲＣスケーリング（ｐ、バンド１、バンド２、．．．、スカラー１、スカラー２、．．．）は、複数の（Ｋ≧２）ＤＲＣゲインシーケンスのうちのどれ（ｐ＝１、２、．．．Ｋ）が定義された（デコードシステムに既知である）サブバンド（バンド１、バンド２、．．．）のうちの２つ以上を調整するために適用されるものであるか、及びスケール変更されたＤＲＣシーケンスを２つ以上のサブバンドにそれぞれ適用する前に同じＤＲＣゲインシーケンスｐに適用されるものである異なるスケーリング値（スカラー１、スカラー２、．．．）（減衰又は増幅スケーリング）を指定する。

図６の実施例はまた、メタデータが、１つ以上のＤＲＣゲインシーケンス（又はエンコーダＤＲＣゲイン値のシーケンス）を有するデータ構造であるエンコードされたＤＲＣゲインセットを含み、複数のゲインセットがメタデータ内に存在し得る（ゲインセット数データ構造に示すように）実施形態を示す。

一実施形態では、メタデータは、ＤＲＣゲインシーケンス（メタデータ内の）のうちの１つがオーディオチャネル又はオーディオオブジェクト（エンコードされたデジタルオーディオ録音からデコードされた）のサブバンドのうちの指定された２つ以上を調整するために適用されることを指定する。あるいは、メタデータは、エンコーダＤＲＣゲイン値のシーケンスがデコードされたオーディオチャネル又はオブジェクトのすべてのサブバンドに適用されることを指定することができる。いくつかの実施形態では、デコードシステム内のプロセッサが、マルチバンドＤＲＣをデコードされたオーディオ録音に実行するときにデコードされたオーディオ録音のオーディオチャネル又はオーディオオブジェクトのグループ分けをなんら実行しないように、メタデータは、チャネル又はオブジェクトのグループ分けをなんら参照しない。例えば、デコードされる２つのオーディオチャネルのみが存在する場合があり、異なるサブバンドに対して異なるスケーリング値がメタデータ内に指定されない限り、同じサブバンドＤＲＣをチャネルの両方に適用しなければならない。

ＤＲＣゲイン値のデコードされたオーディオ信号への適用（デコードシステム内のプログラムされたプロセッサ又はプログラムされたプロセッサ及び配線によるロジックの組合せによる）は、周波数ドメイン又は時間ドメインとすることができる。図４は、マルチバンドクロスオーバーフィルタ１７が入力としてデコードされた単一のオーディオチャネル又はオブジェクトを受信する周波数ドメインの実装形態の実施例を示す。フィルタ１７は、その入力信号を２つ以上の構成帯域に分割する。フィルタ１７は、メタデータ内に指定されたように帯域又はクロスオーバー周波数を定義するようにプログラムすることができる。結果として得られるサブバンド信号ａ、ｂ、．．．ｎは、次に、それぞれに関連付けられたＤＲＣゲインに従ってサブバンド信号の減衰又は増幅のいずれかをするように機能する多数の乗算器１１ａ、１１ｂ、．．．１１ｎにそれぞれ並列に供給される。このＤＲＣゲインは、メタデータ内に指定された（エンコードシステムによって選択された）既定値、又は「変更された」値のいずれかとすることができる。変更されたＤＲＣゲイン値は、メタデータ内に指定されたようにスケール変更された既定のＤＲＣゲインとすることができる、又は上述した手順のように代替ＤＲＣ特性により既定のＤＲＣゲインをマッピングした結果とすることができる。乗算器１１ａ、１１ｂ、．．．の出力は、次に、加算ユニット２０によって合計され、ＤＲＣ調整された単一のオーディオチャネル又はオブジェクトを与え、これは、次にミキサ１４に供給される。

図５は、ＤＲＣゲイン値の適用の時間ドメインの実装形態の実施例を示す。この手法は、デコーダ１０（図３を参照）がすでにサブバンド形態のデコードされたオーディオチャネル又はオブジェクトを有する（エンコードシステムもまた、これらの帯域の定義の知識を有し、ゆえにそれらをメタデータ内に指定することができる）場合に、特に望ましいことがある。デコーダ１０はまた、デコードされたオーディオ信号のサブバンド形態を単一のパルスコード変調されたビットストリーム又は時間サンプルシーケンスに混合するために使用される、合成フィルタバンクを有することができる。このフィルタバンクは、そのｎ個のスカラー入力にｎ個のＤＲＣゲイン（対数又はデジベル形態とは対照的に線形形態の）を提供することにより、ＤＲＣ調整用に２つの目的を兼ねている。合成フィルタバンクは、サブバンド信号を単一の時間ドメインシーケンスに混合する前に、そのｎ個のスカラー入力のゲイン値をｎ個のサブバンド信号にそれぞれ適用する。周波数ドメインの解決策におけるように、ＤＲＣゲインは、エンコードシステムによって選択されたメタデータ内の既定値、又は上述した変更された値のいずれかとすることができる。

本明細書で説明した実施形態は、大まかな発明を例示するものにすぎず、限定するものではないこと、また、他の種々の変更が当業者によって想起され得るので、本発明は、図示及び記述した特定の構成及び配置には限定されないことが理解されるべきである。例えば、エンコード及びデコード段階のそれぞれは、一実施形態では、例えば、インターネットを介して通信しているオーディオコンテンツ製作者の機械及びオーディオコンテンツ消費者の機械で別々に動作するとして説明することができるが、エンコード及びデコードはまた、同じ機械の中で実行することができる（例えば、トランスコーディングプロセスの一部として）。したがって、本説明は、例示するものであり、限定するものではないと考えられるべきである。

Claims

複数のオーディオチャネル又はオーディオオブジェクトを有するエンコードされたデジタルオーディオ録音を生成するためのシステムであって、
複数のオーディオチャネル又はオーディオオブジェクトを有するデジタルオーディオ録音をエンコードするオーディオエンコーダと、
複数のＤＲＣ特性のうちの選択された１つを前記複数のオーディオチャネル又はオーディオオブジェクトのうちの１つ以上の群に適用することにより、前記エンコードされたデジタルオーディオ録音からオーディオチャネル又はオーディオオブジェクトの前記群をデコードする際にオーディオチャネル又はオーディオオブジェクトの前記群を調整するために適用されるものであるエンコーダＤＲＣゲイン値のシーケンスを生成するダイナミックレンジ制御（ＤＲＣ）プロセッサと、
ｉ）エンコーダＤＲＣゲイン値の前記シーケンス、ｉｉ）前記選択されたＤＲＣ特性のインジケーション、及びｉｉｉ）前記複数のＤＲＣ特性から選択された代替ＤＲＣ特性のインジケーションを前記エンコードされたデジタルオーディオ録音に関連付けられたメタデータとして提供するための手段と、
を備えるシステム。
前記メタデータは、デコードシステムが前記選択されたＤＲＣ特性ではなく前記代替ＤＲＣ特性に従ってＤＲＣを適用することになるシナリオ又は条件を指定する、請求項１に記載のシステム。
前記エンコードされたデジタルオーディオ録音に関連付けられた前記メタデータは、ＭＰＥＧ−ＤＤＲＣの複数の拡張フィールド内で搬送される、請求項１に記載のシステム。
前記ＤＲＣプロセッサは、前記デジタルオーディオ録音を入力として受信し、前記入力を前記代替ＤＲＣ特性に従って構成されたＤＲＣ適用ブロックに適用して、前記デジタルオーディオ録音の代替のＤＲＣ調整されたバージョンを生成するものであり、
前記システムは、前記デジタルオーディオ録音の前記代替のＤＲＣ調整されたバージョンの音量の測定値を与える音量情報を計算する音量計算機を更に備え、
前記エンコードされたデジタルオーディオ録音に関連付けられたメタデータとして提供するための前記手段は、前記メタデータの一部として前記代替のＤＲＣ調整されたバージョンに対する前記音量情報を含む、請求項１に記載のシステム。
前記メタデータ内で、前記代替ＤＲＣ特性の前記インジケーションは、
ａ）デコードシステムに記憶された所定の音量対ＤＲＣゲインの曲線又はグラフに対するインデックス又はリファレンス、
ｂ）前記デコードシステムによって既定の数学関数に挿入されると音量対ＤＲＣゲインの曲線を定義する複数の定数又はパラメータ、
ｃ）音量及び対応するＤＲＣゲイン値のルックアップテーブル、又は
ｄ）前記デコードシステムが入力音量レベルに対するＤＲＣゲイン値を補間する複数の音量及び対応するＤＲＣゲイン値、
のうちの１つを含む、請求項１に記載のシステム。
前記ＤＲＣプロセッサは、エンコーダＤＲＣゲイン値の複数のシーケンスを有するエンコーダＤＲＣゲインセットを生成するものであり、
前記エンコードされたデジタルオーディオ録音に関連付けられたメタデータとして提供するための前記手段は、前記メタデータの一部として前記エンコーダＤＲＣゲインセットをも含み、
前記メタデータは、エンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの１つが前記エンコードされたデジタルオーディオ録音からデコードされたオーディオチャネル又はオーディオオブジェクトの複数のサブバンドを調整するために適用されることを指定する、請求項１に記載のシステム。
前記メタデータは、エンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの前記１つが前記デコードされたデジタルオーディオ録音のすべてのサブバンドに適用されることを指定する、請求項６に記載のシステム。
前記メタデータは、１）前記デコードされたデジタルオーディオ録音の第１のサブバンドがエンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの１つによってＤＲＣ調整されること、及び２）第２のサブバンドがエンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの別の１つによってＤＲＣ調整されることを指定する、請求項６に記載のシステム。
前記メタデータは、１）ＤＲＣゲイン値の前記複数のシーケンスのうちの前記指定された１つをスケール変更するために、前記スケール変更されたシーケンスを前記デコードされたオーディオチャネル又はオーディオオブジェクトの第１のサブバンドに適用する前に適用されるものである第１のスケーリング値、及び２）エンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの前記指定された１つをスケール変更するために、前記スケール変更されたシーケンスを前記デコードされたオーディオチャネル又はオーディオオブジェクトの第２のサブバンドに適用する前に適用されるものである第２の異なるスケーリング値を指定する、請求項６に記載のシステム。
デコードされたデジタルオーディオ録音を生成するためのシステムであって、
プロセッサと、
命令を内部に記憶させたメモリと、
を備え、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、
デジタルオーディオ録音がエンコードされたビットストリーム、並びに、選択されたＤＲＣ特性のインジケーションと、前記デジタルオーディオ録音を前記選択されたＤＲＣ特性、及び代替ＤＲＣ特性のインジケーションに適用することに基づいて導出されたエンコーダＤＲＣゲイン値のシーケンスとを含む、前記デジタルオーディオ録音に関連付けられたメタデータを受信させ、
前記デジタルオーディオ録音をデコードさせ、
ａ）前記メタデータ内で受信した前記選択されたＤＲＣ特性の前記インジケーションを使用して前記選択されたＤＲＣ特性の逆数を生成し、入力として前記メタデータ内で受信したエンコーダＤＲＣゲイン値の前記シーケンスを前記逆数に適用して、音量値のシーケンスを生成すること、
ｂ）前記メタデータ内で受信した前記代替ＤＲＣ特性の前記インジケーションを使用して前記代替ＤＲＣ特性を入手し、音量値の前記シーケンスを入力として前記代替ＤＲＣ特性に適用して、ＤＲＣゲイン値の代替のシーケンスを生成すること、及び、
ｃ）ＤＲＣゲイン値の前記代替のシーケンスを前記デコードされたデジタルオーディオ録音に適用して、前記デジタルオーディオ録音の代替のＤＲＣ調整されたバージョンを生成すること、
により、再生用の代替のＤＲＣ調整されたオーディオ録音を生成することにより、前記デコードされた録音の再生を実行させる、
システム。
前記メタデータは、エンコーダＤＲＣゲイン値の複数のシーケンスを有するエンコーダＤＲＣゲインセットを含み、
前記メタデータは、エンコードシステムがエンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの任意の１つを前記デコードされたデジタルオーディオ録音の任意のサブバンドに適用することができることを指定することができる命令を含む、請求項１０に記載のシステム。
前記メタデータは、エンコーダＤＲＣゲイン値の複数のシーケンスを有するエンコーダＤＲＣゲインセットを含み、
前記メタデータは、マルチバンドＤＲＣを実行するときに、エンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの指定された１つを前記デコードされたデジタルオーディオ録音の複数のサブバンドに適用する前記プロセッサへの命令を含む、請求項１０に記載のシステム。
前記メタデータは、１）スケール変更されたシーケンスを前記デコードされたデジタルオーディオ録音の第１のサブバンドに適用する前に、前記メタデータ内で指定されたように第１のスケーリング値によりＤＲＣゲイン値の前記複数のシーケンスのうちの前記指定された１つをスケール変更し、２）スケール変更されたシーケンスを前記デコードされたデジタルオーディオ録音の第２のサブバンドに適用する前に、前記メタデータ内で指定されたように第２の異なるスケーリング値によりＤＲＣゲイン値の前記複数のシーケンスのうちの前記指定された１つをスケール変更する、前記プロセッサへの命令を有する、請求項１０に記載のシステム。
デコードされたデジタルオーディオ録音を生成するためのシステムであって、
プロセッサと、
命令を内部に記憶させたメモリと、
を備え、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、
エンコーダＤＲＣゲイン値の複数のシーケンスを有するエンコーダＤＲＣゲインセットを含むメタデータに関連付けられたデジタルオーディオ録音がエンコードされたビットストリームを受信させ、
前記デジタルオーディオ録音をデコードさせ、
前記デコードされたデジタルオーディオ録音にマルチバンドＤＲＣを実行させ、
前記メタデータは、前記メタデータ内にあるエンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの指定された１つを前記デコードされたデジタルオーディオ録音の複数の異なるサブバンドに適用する命令を含み、前記サブバンドもまた、前記メタデータ内で指定された、システム。
前記プロセッサは、マルチバンドＤＲＣを前記デコードされたオーディオ録音に実行する際に前記デコードされたオーディオ録音のオーディオチャネル又はオーディオオブジェクトのグループ分けをなんら実行しない、請求項１４に記載のシステム。
前記メタデータは、エンコーダＤＲＣゲイン値の前記複数のシーケンスのうちの前記１つが前記デコードされたデジタルオーディオ録音の前記サブバンドのすべてに適用されることを指定する、請求項１４に記載のシステム。
前記メタデータは、１）スケール変更されたシーケンスを第１のサブバンドに適用する前に、第１のスケーリング値によりＤＲＣゲイン値の前記複数のシーケンスのうちの前記指定された１つをスケール変更し、２）スケール変更されたシーケンスを第２のサブバンドに適用する前に、第２のスケーリング値によりＤＲＣゲイン値の前記複数のシーケンスのうちの前記指定された１つをスケール変更する、前記プロセッサへの命令を含み、前記第１及び第２のスケーリング値、並びに前記第１及び第２のサブバンドは、前記メタデータ内で指定された、請求項１４に記載のシステム。
エンコードされたデジタルオーディオ録音を生成するための方法であって、
複数のオーディオチャネル又はオーディオオブジェクトを有するデジタルオーディオ録音をエンコードすることと、
複数のＤＲＣ特性のうちの選択された１つを前記オーディオチャネル又はオーディオオブジェクトのうちの１つ以上の群に適用することにより、前記エンコードされたデジタルオーディオ録音からオーディオチャネル又はオーディオオブジェクトの前記群をデコードする際にオーディオチャネル又はオーディオオブジェクトの前記群を調整するために適用されるものであるエンコーダＤＲＣゲイン値のシーケンスを生成することと、
（ｉ）エンコーダＤＲＣゲイン値の前記シーケンス、（ｉｉ）前記選択されたＤＲＣ特性のインジケーション、及び（ｉｉｉ）前記複数のＤＲＣ特性から選択された代替ＤＲＣ特性のインジケーションを前記エンコードされたデジタルオーディオ録音に関連付けられたメタデータとして提供することと、
を含む方法。
前記代替ＤＲＣ特性に従って前記デジタルオーディオ録音の代替のＤＲＣ調整されたバージョンを生成することと、
前記デジタルオーディオ録音の前記代替のＤＲＣ調整されたバージョンの音量の測定値を与える音量情報を計算することと、
前記エンコードされたデジタルオーディオ録音に関連付けられた前記メタデータの一部として前記代替のＤＲＣ調整されたバージョンに対する前記音量情報を提供することと、
を更に含む、請求項１８に記載の方法。
前記エンコードされたデジタルオーディオ録音に関連付けられた前記メタデータの一部として、エンコーダＤＲＣゲイン値の同じシーケンスが前記エンコードされたデジタルオーディオ録音からデコードされたオーディオチャネル又はオーディオオブジェクトの複数のサブバンドを調整するためにデコードシステムによって適用される命令を提供することを更に含む、請求項１８又は１９に記載の方法。
前記エンコードされたデジタルオーディオ録音に関連付けられた前記メタデータの一部として、１）第１のスケーリング値、及びエンコーダＤＲＣゲイン値の前記シーケンスのうちの指定された１つをスケール変更するために、前記スケール変更されたシーケンスを前記デコードされたオーディオチャネル又はオーディオオブジェクトの第１のサブバンドに適用する前に前記第１のスケーリング値を適用する命令、並びに２）第２の異なるスケーリング値、及びエンコーダＤＲＣゲイン値の前記シーケンスのうちの指定された１つをスケール変更するために、前記スケール変更されたシーケンスを前記デコードされたオーディオチャネル又はオーディオオブジェクトの第２のサブバンドに適用する前に前記第２のスケーリング値を適用する命令を提供することを更に含む、請求項２０に記載の方法。