JP6750061B2

JP6750061B2 - エンコードされたオーディオメタデータベースのイコライゼーション

Info

Publication number: JP6750061B2
Application number: JP2019046732A
Authority: JP
Inventors: フランクバウムガルテ
Original assignee: Apple Inc
Current assignee: Apple Inc
Priority date: 2015-07-31
Filing date: 2019-03-14
Publication date: 2020-09-02
Anticipated expiration: 2036-06-13
Also published as: JP2019091095A; KR102178231B1; JP6499374B2; CN111477253B; WO2017023423A1; CN107851449B; US20180218746A1; EP4290888A3; KR20180020295A; US9934790B2; EP4290888A2; CN111477253A; CN107851449A; JP2018528459A; US20170032801A1; KR102124547B1; US11501789B2; EP3329489A1; EP3329489B1; US20200342886A1

Description

本発明の実施形態は概して、オーディオ信号のエンコーディング及びデコーディングと、様々なタイプの家庭用エレクトロニクスエンドユーザデバイスにおける再生の質を向上させるために、デコーディングされた信号の再生中における、エンコードされた信号に関連付けられたメタデータの使用とに関する。他の実施形態についても記述する。

（関連出願の相互参照）
本特許出願は、２０１５年７月３１日に出願した仮出願第６２／１９９，６３４号の先の出願日の利益を主張する。

デジタルオーディオコンテンツは、例えば音楽及び映画ファイルを含む様々な状況で見られる。ほとんどの場合、オーディオ信号は、エンコードされ、このエンコーディングは、必ずしもデータ速度の低下を目的とする必要はなく、得られるメディアファイル又はストリームの記憶又は伝送を可能にし、それによって、多数の配信又は伝送が（必要に応じて）同時に生じることを可能にするためのフォーマット変換を単に目的とし得る。メディアファイル又はストリームは、異なるタイプのエンドユーザデバイスにおいて受信することができ、エンコードされたオーディオ信号は、内蔵式スピーカ又は取外し可能なスピーカのいずれかを介して消費者に提示される前に、デコーディングされる。これは、インターネットを介してデジタルメディアを取得する消費者の欲求を刺激するのに役立った。デジタルオーディオコンテンツ（プログラム）の制作者及び販売業者は、オーディオコンテンツのエンコーディング及びデコーディングのために使用され得る、自由に使用することができるいくつかの業界標準を有する。これらには、ＡｄｖａｎｃｅｄＴｅｌｅｖｉｓｉｏｎＳｙｓｔｅｍｓＣｏｍｍｉｔｔｅｅ，Ｉｎｃ．によって２００５年６月１４日に公開されたデジタルオーディオ圧縮標準（ＡＣ−３、Ｅ−ＡＣ−３）、Ｂ版、文書Ａ／５２Ｂ（「ＡＴＳＣ標準」）、ＩＳＯ／ＩＥＣ１３８１８−７内のＭＰＥＧ−２トランスポートストリームに基づく欧州電気通信標準化機構（European Telecommunication Standards Institute、ＥＴＳＩ）ＴＳ１０１１５４デジタルビデオブロードキャスティング（Digital Video Broadcasting、ＤＶＢ）、アドバンストオーディオコーディング（Advanced Audio Coding、ＡＡＣ）（「ＭＰＥＧ−２ＡＡＣ標準」）、及び、国際標準化機構（International Standards Organization、ＩＳＯ）によって公開されたＩＳＯ／ＩＥＣ１４４９６−３（「ＭＰＥＧ−４オーディオ」）が挙げられる。

オーディオコンテンツは、デコーディングされ、次いで、それが最初にマスタリングされたのとは異なって処理され得る（レンダリングされ得る）。例えば、マスタリングエンジニアは、再生時に、拍手が後ろから聞こえ、リスナーがコンサートの聴衆の中に、すなわちバンド又はオーケストラの前に、座っているかのようにそれが（リスナーに）聞こえるように、オーケストラ又はコンサートを録音することができる。マスタリングエンジニアは、別法として、例えば再生時にリスナーが、彼がステージ上にいるかのようにコンサートを聞く（彼が「彼の周りで」楽器を聞き、「正面に」拍手を聞く）ように、（同コンサートの）異なるレンダリングを行うことができる。これはまた、再生室におけるリスナーの異なる視点の作成、又は異なる「傾聴場所」又は異なる再生室向けのオーディオコンテンツのレンダリングとも呼ばれる。

オーディオコンテンツはまた、異なる音響環境、例えば、ヘッドセット、スマートフォンスピーカフォン、又は、タブレットコンピュータ、ラップトップコンピュータ若しくはデスクトップコンピュータの内蔵式スピーカを介する再生向けにレンダリングされ得る。具体的には、例えば１人の話し声、爆発音、拍手、又は背景サウンドの、デジタル録音である、個々のデジタルオーディオオブジェクトが、所与の音響環境において任意の１つ又はそれ以上のスピーカチャネルを介して異なって再生され得る、オブジェクトベースのオーディオ再生技法が現在使用可能である。

しかしながら、（ある特定のオーディオコンテンツの）前にミキシングされた録音が、次いで、異なる音響環境にレンダリングされる、又は異なるリスナー視点からレンダリングされるとき、リスナーに聞こえるものとしての音のバランスは影響を受ける。そのような音のアンバランスを緩和するために、マスタリングエンジニアは、特定の音響環境向けに又は特定のリスナー視点向けにオーディオ信号を最適化するために、イコライゼーション（equalization、ＥＱ）又はスペクトル成形をデジタルオーディオ信号に適用する。例えば、大きい映画館における再生向けの動画ファイルのレンダリングは、得られるサウンドが再生中に明るくなり過ぎるのを防ぐために（動画ファイルのデジタルオーディオトラックに）適用される、ある特定のＥＱを必要とし得る。しかしながら、ホームシアターシステムを介する再生向けの、例えばＤＶＤファイル又はインターネットストリーミング映画ファイルとしての、ファイルのレンダリングは、部屋のサイズがより小さいこと（及び他の要因）を理由として、異なるＥＱを必要とする。

オーディオのミキシング及びマスタリング又は製作において、所望のレベル（例えば、ラウドネス）及び音のバランスを達成するために、２つの基本ツール、動的範囲制御又は圧縮（dynamic range control or compression、ＤＲＣ）及びイコライゼーション（ＥＱ）を適用することが一般的である。しかしながら、消費者中心の再生シナリオは、製作中に未知である。本発明の実施形態は、エンコードされた、デジタルオーディオコンテンツ（又は録音）ファイルのメタデータの部分であるＥＱ値を生成する製作又は流通システム（例えば、サーバーシステム）である。ＥＱ値は、再生中に、デコーディングされた元の録音に適用される線形フィルタリング（スペクトル成形）を定義することができる。ＥＱのこの適用は、いかなるダウンミックスとも無関係であるように定義することができる。
スペクトル成形は、録音が、エンコードされたコンテンツファイルからデコーダによって抽出された後に、適用され、これは、指定されたダウンミックスが形成される前に、ダウンミックスが実行された後に、又は、ダウンミックスの前と後の両方に起こり得る。メタデータベースのＥＱ値によって定義された線形フィルタリングは、特定の再生音響環境又は傾聴視点によりよく適合するために、特定の周波数帯域のエネルギーを強めて又は弱めて、録音内の周波数構成要素のバランスを調節するように設計される。したがって、これは、スペクトル的に調節された又は線形フィルタリングされたオーディオコンテンツの再生を可能にし、このフィルタリングは、エンコーディングステージで指定され、特定の音響的環境（例えば、公共の映画館より小さいリビングルーム）における又は特定のサウンドレンダリングシステム（例えば、特定のオーディオアンプゲイン及びスピーカ感度を有する）のための再生サウンドを改善することが意図されている。オーディオコンテンツファイルは、例えば、動画ファイル、例えばＭＰＥＧ映画ファイル、オーディオのみのファイル、例えばＡＡＣファイル、又は、任意の適切なマルチメディアフォーマットを有するファイルでもよい。例えば、エンコードされたデジタル録音に関連付けられたメタデータは、ＭＰＥＧ−ＤＤＲＣのいくつかの拡張フィールドにおいて運ばれ得る。メタデータベースの手法は、異なる再生シナリオのための基本バージョンの複数のレンダリングされたバージョン（メタデータにおけるＥＱシーケンスによってサポートされるような）を配信する能力とともに、単一の基本バージョンの録音のみが必要とされることを理由として、統一されたサウンドプログラムコンテンツ流通フォーマットを可能にする。

様々なフォーマットが、オーディオコンテンツファイルのメタデータ内においてＥＱ値を記憶する又は運ぶために可能である。例えば、メタデータは、ＥＱ値の１つ又はそれ以上のシーケンスを含むように定義され得る。ＥＱシーケンスの例示的部分については、以下の表を参照されたい。シーケンスの各要素は、特定のデコーディングされたチャネル又はオブジェクトで実行されるスペクトル成形（フィルタリング）動作のいくつかの態様を定義する値を含み得る。ＥＱ値は、エンコードされたデジタルオーディオコンテンツの特定のレンダリングのために選択されている。ＥＱ値のシーケンスは、（デコーディングされた録音内の）１つのサウンドプログラムコンテンツ全体に適用されるイコライゼーションフィルタリングを定義することができる。所与のファイルのメタデータ内の各ＥＱシーケンス（ファイル内の同オーディオコンテンツを参照する）は、１つ又はそれ以上のチャネル又はオブジェクトのそれぞれのグループをフィルタリングするための命令を含み得る。（１つ又はそれ以上のＥＱシーケンスの）ＥＱセットは、ヘッドセットを介して歌の再生中に適用されるＥＱフィルタリングを定義することができ、一方、別のＥＱセットは、スピーカドックを介して同歌の再生のために適用されるＥＱフィルタリングを定義することができる。したがって、所与のＥＱシーケンスにおいて定義されるフィルタリングは、元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上のＥＱグループに関連付けられ、そのＥＱグループのチャネル又はオブジェクトにも適用されるいかなるダウンミックスと無関係であり得る。

ＥＱ値（又はＥＱ命令又はペイロード）は、周波数（又は副帯域）領域において適用されるフィルタリングを定義することができる。例えば、ＥＱペイロードは、グラフィックイコライザ設定、例えば高音、中音、及び低音、と類似する、２つ又はそれ以上の定義済みの周波数帯域のゲイン値を有し得る。その場合、ＥＱフィルタリング動作は、デコーディングされたオーディオコンテンツの周波数領域表現にゲイン値をかけ得る。ＥＱペイロードは、別法として、又は追加で、時間領域において適用されるフィルタリングを定義し得る。例えば、ＥＱペイロードは、デジタルフィルタのタップ係数を含み得る。その場合、デコーディングされたオーディオコンテンツが、ＥＱペイロードに従って、フィルタを介して、再生中に通過する、適応可能な又は可変のデジタルフィルタが、合成され得る（デコーダステージにおいて）。その場合、ＥＱフィルタリング動作は、オーディオコンテンツの時間領域表現を合成されたデジタルフィルタを介して渡すことでもよく、後者は再生中に更新される。

上記で示唆されるように、ＥＱフィルタリングの適用は、例えばオーディオコンテンツのフレームごとに再生中に変化し得る。しかしながら、ＥＱはまた、より高いレイヤで変化するように設計され得る。例えば、オーディオオブジェクトがシーンに現れるとき、オーディオチャネルを選択するために適用されるＥＱは、オーディオオブジェクトのサウンドをよりよく受け入れるために、変化する必要があり得る。したがって、シーケンスフォーマットは、メタデータに組み込まれたＥＱ値が、エンコードされたオーディオコンテンツと同期して、時間とともに変化することを可能にし得る。例えば新しいＥＱがフェードインし、古いＥＱがフェードアウトすること、又は、ＥＱのスイッチを突然入れること若しくは切ること（再生中に）を可能にし得る（ＥＱメタデータについての）技法もまた本明細書に記載される。

上記概要は、本発明の全ての態様の網羅的なリストを含んでいない。本発明は、上でまとめた種々の態様の全ての適切な組合せによって実施できる全てのシステム及び方法、並びに以下の詳細な説明で開示されるもの、特に本出願によって提出される請求項において指摘されるものを含むと考えられる。このような組合せは、上記概要には具体的に記載していない特定の利点を有する。

本発明の実施形態は、限定としてではなく例として、添付の図面の図に示されており、図中、同じ参照符号は類似の要素を示している。本開示における本発明の「ある」実施形態又は「一」実施形態に対する言及は、必ずしも同じ実施形態に対するものではなく、それらは、少なくとも１つの実施形態を意味することに留意されたい。また、簡潔にするために及び図の総数を減らすために、所与の図が、本発明の複数の実施形態の特徴を説明するために使用されることがあり、図中の全ての要素が所与の実施形態のために必要とされる訳ではないことがある。

エンコードステージ処理を実行する例示的コンピュータシステム及びデコードステージ処理を実行するコンピュータシステムを構成する構成要素を示すブロック図である。ＥＱ、ＤＲＣ及びダウンミックス能力を有するデコードステージ処理の一例を示す。ＥＱフィルタブロックの例示的デジタルフィルタカスケード構造である。

いくつかの実施形態について、添付の図面を参照しながら記述する。多数の詳細について記載するが、本発明の一部の実施形態は、これらの詳細なしに実施され得ることが理解される。他の場合には、本説明の理解を妨げないように、よく知られている回路、構造、及び技法については詳細に示していない。

図１は、デジタル録音の、エンコードステージ処理を実行するコンピュータシステム、及びデコードステージ処理を実行するコンピュータシステムを構成する構成要素の一例を示す。図１は、ＥＱ、動的範囲制御（ＤＲＣ）、及びダウンミックスブロックを含む、例示的処理チェーン（デコード又は再生ステージでの）を示すが、これらの全てが本発明の所与の実施形態において又は再生デバイスの所与のインスタンスにおいて存在する必要はないことを理解されたい。また、特定のオーディオコンテンツファイルのメタデータは、再生するためのＥＱを指定し得るが、ＤＲＣ及びダウンミックスは指定しないことがある。

図１の元の録音は、いくつかのオーディオチャネルを有する音楽作品又はオーディオビジュアル作品、例えば映画、などの１つのサウンドプログラムコンテンツのビットストリーム又はファイル（これらの用語は、本明細書において互換的に使用される）の形でもよく、別法として、又はオーディオチャネルに加えて、この記録は、いくつかのオーディオオブジェクト、例えば、個々の楽器、ボーカル、サウンドエフェクトのサウンドプログラムコンテンツを含み得る。エンコードステージ処理は、例えば、演奏又は映画のプロデューサなど、サウンドプログラムコンテンツプロデューサ又は販売業者のコンピュータ（又はコンピュータネットワーク）によって実行され得、デコードステージ処理は、例えば、消費者のコンピュータ（又はコンピュータネットワーク）によって実行され得る。

エンコードステージ処理を開始すると、エンコーダ２が、いくつかの元のオーディオチャネル又はオーディオオブジェクトを有するデジタル録音を異なるデジタルフォーマットにエンコードする。新しいフォーマットは、（例えば、コンパクトディスク又はデジタルビデオディスクなど、携帯用データ記憶デバイス上の）エンコードされたファイルの記憶のために、又は家庭用コンピュータにビットストリームを通信する（例えば、インターネットを介して）ためにより適し得る。エンコーダ２はまた、例えばＭＰＥＧ標準に従って、元のオーディオチャネル又はオーディオオブジェクトでの、不可逆又は可逆ビット速度低減（データ圧縮）、又はアップルロスレスオーディオコーデック（Apple Lossless Audio Codec、ＡＬＡＣ）などの可逆データ圧縮を実行することができる。

イコライゼーション（ＥＱ）値ジェネレータ３は、ＥＱ値のシーケンスを生成し、これらは、エンコードされたデジタル録音をデコーディングするときに、図示されているようなデコードステージ処理において適用されるＥＱフィルタリングを定義する。ＥＱ値は、（デコーディングされた記録の）デジタルオーディオ信号に適用され得る固定の、時不変系の、線形フィルタリングプロセスを定義することができ、あるいは、それらは、ＥＱ値ごとに、例えばデジタルオーディオフレームごとに、変化し得るスペクトル形状を有する、可変の線形フィルタリングを定義することができる（デジタルオーディオ信号は、フレーム又は時間チャンクにおいて処理され得る）。ＥＱフィルタリングは、ダウンミックスの前に（例えば、デコーディングされたオーディオチャネルのうちの３つ以上が、次いで、ステレオに結合されるときに）、ダウンミックスの後に、あるいはダウンミックスの前と後の両方に適用され得る。ＥＱフィルタリングはまた、記録のデコーディングされた、オーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上の定義済みのグループにのみ適用可能なものとして指定することができる。この態様について詳しくは以下に提供される。以下の表１及び２は、ＥＱ値シーケンスの部分を示す例である。

一実施形態では、ＥＱ値ジェネレータ３は、人間のユーザ、例えば、ミキシングエンジニア、によって操作可能であり、いくつかのグラフィックイコライザ設定に構成可能な、グラフィックイコライザを含む。元のオーディオチャネルは、グラフィックイコライザに入力され、グラフィックイコライザは、次いで、特定のグラフィックイコライザ設定に従ってデジタル録音の少なくとも一部をフィルタリングする。これらフィルタリングされたオーディオ信号は、次いで、ユーザが特定のグラフィックイコライザ設定のサウンド（オーディオチャネル又はオブジェクトの所与のグループの所与の部分又はセグメントの）を評価することを可能にするために、再生システム（オーディオパワーアンプ及びスピーカシステム（図示せず）を有する）に送られ得る。ＥＱ値ジェネレータ３は、所与の入力記録について、ＥＱ命令又は値を生成するデジタルフィルタシンセサイザを有し得る。このサウンドプログラムコンテンツの異なるチャネル又はオブジェクト（所与のグループに割り当てられるものとしての）は、それぞれのＥＱシーケンスのＥＱ値を割り当てられ得る。

一実施形態では、ＥＱシーケンスのＥＱ命令又は値は、所望の伝達関数（所与の入力記録の望ましいグラフィックイコライザ設定であることが発見されたものに基づく）を有する直線状のデジタルフィルタを定義する。これは、時間領域スペクトル成形又は線形フィルタリングとも呼ばれる。別の実施形態では、線形フィルタリングは、通知されたＥＱグループ（元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上の）に適用される副帯域領域フィルタリングを定義する、いくつかの周波数帯域の、周波数帯域ごとに１つの、イコライザゲインレベルを使用する周波数領域において定義される。

エンコードステージ処理はまた、エンコードされたデジタル録音を、メタデータとしてエンコードされたデジタル録音に関連付けられるＥＱ値の１つ又はそれ以上のシーケンス（ＥＱ値ジェネレータ４によって生成された）と結合させるビットストリームマルチプレクサ４を有してもよい。この組合せの結果は、エンコードされた記録及びそれの関連付けられたメタデータを含むビットストリーム又はエンコードされたファイル（ここからは「ビットストリーム６」と概して呼ばれる）でもよい。メタデータは、ビットストリーム６内のエンコードされた記録に組み込まれ得る、あるいは、それは、（エンコードされた記録が関連付けられた）別個のファイル又はサイドチャネルにおいて提供され得ることに留意されたい。

図１を更に参照すると、デコードステージ処理は、以下の構成要素を有してもよく、それらの構成要素の全ては、例えば、コンピュータ、例えば、ラップトップコンピュータ、スマートフォン又はタブレットコンピュータなどの家庭用電子デバイス、のプログラムされたプロセッサとして実装され得る。ビットストリーム６は、例えばローカルに接続されたデバイス（例えば、ＣＤ若しくはＤＶＤドライブ、スマートフォン）から読み取ること又はインターネットを介するリモートメディアサーバーからのストリーミングによって、ビットストリームデマルチプレクサ８によって受信される。ビットストリーム６は、ｂ）エンコードされたデジタル録音に関連付けられたメタデータの部分としてのＥＱ値のシーケンスと結合された、ａ）エンコードされたデジタル録音を含む。ＥＱシーケンスは、ＥＱフィルタリングが適用される元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上のグループである、ＥＱグループを識別し、ＥＱグループは、例えば、単一のグループ内になるようにある特定のチャネル又はオブジェクトを選択するミキシングエンジニアによって、エンコーディングステージにおいてＥＱ値ジェネレータ３を使用し、定義され得る。

デマルチプレクサ８は、マルチプレクサ４の逆の能力を有してもよく、エンコードされたオーディオ又はサウンドプログラムコンテンツを抽出し、それをデコーダ９に提供することができる。後者は、エンコーダ２の逆の能力を有してもよく、したがって、エンコードされた録音から、元のオーディオチャネル又はオーディオオブジェクトをデコーディングする。デマルチプレクサ８はまた、メタデータから、ＥＱ値のシーケンス（関連付けられたＥＱグループ定義を含む）を抽出することができる。この情報は、ＥＱグループ化装置１０に渡され、それぞれ、Ｋグループに割り当てられた、２つ又はそれ以上のＥＱフィルタ１１＿１、１１＿２、．．．１１＿Ｋを構成する。本明細書で、グループは、１つ又はそれ以上のオーディオチャネル又はオーディオオブジェクトを指し、図示されるように、各グループについて提供される別個のＥＱ値のシーケンスが存在し得る。所与のグループに割り当てられたＥＱ値は、（デコーディングされたオーディオチャネル又はオブジェクトの）そのグループ内の各チャネル又はオブジェクトで動作するＥＱフィルタ１１を定義する。一実施形態では、デコードステージＥＱフィルタリングプロセスが、有効にされたとき、指定されたグループは、ダウンミックスプロセッサ１６もまた有効にされるかどうかとは無関係に、フィルタリングされる（各グループのメタデータにおいて指定されたＥＱ値に従って）。

更に図１を参照すると、ダウンミックスプロセッサ１６は、任意選択的に、例えばメタデータからやはり抽出されるダウンミックスグループ化定義に従って、３つ又はそれ以上の（Ｐ＞２）入力、ＥＱフィルタリングされたチャネル又はオブジェクトを２つ又はそれ以上の（Ｑ＜Ｐ）出力チャネルに結合させる（例えば、５．１サラウンドを２つのチャネルステレオに変換して）ために、デコードステージにおいて有効にされ得る。ダウンミックスプロセッサ１６からの出力チャネルは、次いで、レンダリングシステム（例えば、家庭用電子デバイスのオーディオパワーアンプ及びスピーカ（図示せず））によってサウンドに変換される。一実施形態では、メタデータにおいて指定されたＥＱフィルタリングは、ダウンミックスプロセッサ１６が存在するかどうかにかかわらず実行される。メタデータが、ダウンミックスプロセスを指定するとき、それはまた、ダウンミックス動作の前にＥＱを適用する（デコーディングステージにおいて）ためのダウンミックス前ＥＱ値と、ダウンミックス動作後にＥＱを適用するためのダウンミックス後ＥＱ値もまた含み得る。例が、図２に関して以下に示される。

デコードステージ処理における別の任意選択機能は、ダウンミックスの前の、ＥＱフィルタリングされたチャネル又はオブジェクトからの選択へのＤＲＣの適用である。これを目的として、いくつかのＤＲＣブロック１４＿１、１４＿２、．．．１４＿Ｌが、提供され得、各ＤＲＣブロック１４＿ｉは、それのグループに割り当てられた１つ又はそれ以上のチャネル又はオブジェクトに動的範囲圧縮を実行し、（１つ又はそれ以上のチャネル又はオブジェクトごとの）最大Ｌグループが存在し得る。（ＤＲＣが適用される）デコーディングされたチャネル又はオブジェクトのこのグループ化は、（上記のＥＱメタデータに加えた）メタデータに含まれるＤＲＣグループ定義に従って構成されたＤＲＣグループ化装置１３によって実行される。したがって、メタデータは、（チャネル又はオブジェクトの）ＤＲＣグループと、そのグループのチャネルに適用される、再生中に時間とともに変化し得る所望の圧縮曲線を定義する閾値及び比率値など、ＤＲＣ設定のそれぞれのセット（ＤＲＣシーケンス）とを識別する。したがって、同ＤＲＣシーケンスは、所与のＤＲＣグループ内の全てのチャネル又はオブジェクトに適用される。メタデータは、ＥＱのグループ化とは無関係のＤＲＣのグループ化を指定し得る。

図２は、ＥＱ、ＤＲＣ及びダウンミックス能力を有するデコードステージ処理のより網羅的例を示す。全てのデコーディングされたチャネル又はオブジェクトは、ＥＱグループ化装置１０に使用可能にされる。抽出されたメタデータは、再生中にそれらにイコライゼーションを適用することを目的として、これらデコーディングされたチャネル又はオブジェクトのいくつかのグループへのグループ化を指定する。このグループ化は、メタデータ内の所与のＥＱ値シーケンスが、ダウンミックス前ＥＱフィルタ１１＿３を構成することによって、関連付けられたＥＱグループ、例えばグループ３内の全てのチャネル又はオブジェクトに適用されることを意味する。言い換えれば、ＥＱグループ定義が、ビットストリームデマルチプレクサ８（図２を参照）によってＥＱグループ化装置１０に提供され、後者は、応答して、デコーディングされたチャネル又はオブジェクトを指定された２つ又はそれ以上の（Ｋ）グループにグループ化する。これらのＫグループの各々は、次いで、このグループに関連付けられたＥＱ値シーケンスにおいて定義されたように構成されたそれぞれの、ダウンミックス前ＥＱフィルタ１１によってフィルタリングされる。ＥＱフィルタ１１の基本構造の一例は、図３において以下に示される。

一実施形態では、メタデータは、複数の「ＥＱセット」を指定し得る。ＥＱセットは、元のオーディオチャネル又はオブジェクトのグループ化と、それらのグループ化されたチャネル又はオブジェクトに適用されるＥＱフィルタリングとのための命令を含む、あるいはそれを定義する。言い換えれば、各ＥＱセットは、元のオーディオチャネル又はオブジェクトのそれぞれのグループ化に関連付けられ、そこに定義されたＥＱフィルタリングは、異なる再生シナリオの間に適用され得る。例えば、大きい部屋におけるラウドスピーカを介するデコーディングされた録音の再生向けの１つのＥＱセット、小さいお屋における記録の再生向けの別のＥＱセットが存在してもよく、一方で、別のＥＱセットは、ヘッドセットを介するデコーディングされた録音の再生向けであってもよい。

更に図２を参照すると、メタデータが、ＤＲＣグループ定義及びＤＲＣ設定（ＤＲＣグループごとの）もまた含む場合、次いで、メタデータからのＤＲＣグループ定義をＤＲＣグループ化装置１３に提供し、そしてまたメタデータからのＤＲＣ設定に従ってＬダウンミックス前ＤＲＣブロック１４を構成するという決定が、エンコードステージ処理において行われ得る。デコーディングされたオーディオチャネル又はオブジェクトが、ダウンミックス前ＥＱフィルタによってフィルタリングされた後は、それらは、再グループ化され得、次いで、チャネル／オブジェクトグループ化解除装置１２によってグループ化を解除され、次いで、ダウンミックスプロセッサ１６に入力として提供される前に、ダウンミックス前ＤＲＣブロック１４によって動的範囲圧縮され得る。

上記で指摘されたように、メタデータはまた、デコーディングされた録音にダウンミックス後の、直線状のスペクトル成形（イコライゼーション、又はＥＱフィルタリング）を実行するために、必要とされるＥＱシーケンス及びＥＱグループ化定義を含み得る。その場合、チャネル／オブジェクト再グループ化装置１７は、ダウンミックスプロセッサ１６の出力オーディオチャネル又はオブジェクトをＭグループに（メタデータにおいて指定されたように）再グループ化するデコードステージにおいて用意され得る。また、ＭダウンミックスＥＱフィルタ１８が、構成される（それらのそれぞれのＥＱシーケンスに従って）。再グループ化されたオーディオチャネル又はオブジェクトは、次いで、ダウンミックスＥＱフィルタ１８を通過する。更なる態様として、ダウンミックス後ＤＲＣ動作もまた、メタデータにおいて指定され得、それは、ダウンミックス後ＥＱフィルタ１８の出力でチャネル又はオブジェクトを再グループ化するチャネル／オブジェクト再グループ化装置１９によって、ダウンミックス後の、ＥＱフィルタリングされたオーディオチャネル又はオブジェクトを圧縮するために、メタデータに含まれるダウンミックス後ＥＱグループ化定義に従って、メタデータにおいてダウンミックス後ＥＱシーケンスによって指定されたように構成されたダウンミックス後ＤＲＣブロック２０によって、実装され得る。最後に、チャネル／オブジェクトグループ化解除装置２２は、ダウンミックス後ＤＲＣブロック２０からの出力信号を再生システム内にあるいくつかのオーディオパワーアンプを駆動するために必要とされる配列に再シャッフルする。

メタデータを使用してデコードステージにＥＱ命令を配信するための上記の手法は、具体的に、フィーチャ映画（動画フィルム）を配給する又は生成するときに有効である。通常は、オーディオビジュアル作品の劇場マスタが、公共の映画館などの大きい部屋における再生向けに最適化されたサウンドトラックを有して、先ず生成される。具体的には、劇場マスタオーディオ又はサウンドトラックは、大きい動的範囲を有する。家庭用ミックス（例えば、ＤＶＤリリースのための）が、次いで、中音域はフラットなままで高音及び低音が弱められるようにサウンドトラックを修正するために、より小さい部屋のために選択された通常のＸ曲線（目標レベル対周波数）に基づいてサウンドトラックにイコライゼーションを適用することによって、作成される。また、劇場マスタは、より小さい部屋のために選択されたより少ない動的範囲を有するように家庭用ミックス向けに修正される。したがって、家庭用ミックスを生成するためにオーディオサウンドトラックの劇場用ミックスに適用される信号処理は、通常は、動的範囲圧縮（dynamic range compression、ＤＲＣ）並びにイコライゼーション（ＥＱ）を含む。

本発明の実施形態によれば、再生側（デコードステージ）で劇場用ミックスから家庭用ミックスを生成することを目的として、情報が、再生デバイスで実行されるために、動的範囲圧縮及び直線状のイコライゼーションフィルタリングを実行するための必要とされる動作を記載するフィーチャ映画のオーディオサウンドトラックのメタデータ内に組み込まれる。この手法の利点は、それが、単一の基本バージョンのサウンドトラックを含み、したがってビット速度効率がよいが、異なる再生シナリオのためのサウンドトラックの複数の異なるレンダリングされたバージョンを配信することもできる、統一された流通フォーマットを可能にすることである。

サウンドトラックに適用されるイコライゼーションは、改善された音のバランスを達成するために、再生環境におけるスピーカの特定の構成を考慮すべきである。特定のスピーカレイアウトに依存する固定のイコライゼーション曲線を採用するのではなくて、メタデータは、フィーチャ映画の配信の、場合によって変化し得るＥＱシーケンスを含み得る。例えば、ＥＱシーケンスは、動画フィルムのプロデューサ又は販売業者によって、消費者のリビングルームにおける特定のスピーカレイアウトに特有のものに適合させられ得る。ＥＱシーケンスはまた、サウンドトラックにおける特定のコンテンツ又はサウンド事象に適合させられ得る。

上記の手法はまた、オブジェクトベースのオーディオ（サウンドトラック又は録音が、オーディオチャネル及び／又はオーディオオブジェクトを含む）に適用可能である。オブジェクトベースのオーディオは、レンダリングされたオーディオオブジェクトの場所が制御されることを可能にすることによって、音響シーンの創作における柔軟性を実現する。改善された音のバランスを達成するために、各オーディオオブジェクトに適用されるイコライゼーションフィルタリングは、それのレンダリング場所、例えばどのスピーカがオーディオオブジェクトを変換するか、に応じて決まるべきである。したがって、メタデータにおいて指定されたＥＱシーケンスは、このオブジェクトベースのオーディオ特性を考慮して選択され得る。ＥＱシーケンスの複数のＥＱセットは、同じベースオーディオオブジェクトにやはり基づいて、異なるミックス又はレンダリングの配信を可能にするために、メタデータに含まれ得る。ＥＱシーケンスのセットは、例えば、リスナーの異なる仮想の場所での再生向けに定義され得る（例えば、あるセットのＥＱシーケンスは、仮想リスナーが、聴衆の一員であり音楽隊が演奏しているステージの「前に」座っていると見なされるとき向けに設計され得、一方、別のＥＱシーケンスは、仮想リスナーがステージ上にいるレンダリング向けに設計され得る）。

本発明の実施形態は、録音のプロデューサ又は販売業者によって制御されるように一貫したイコライゼーションを提供する（例えば、フィーチャ映画の一部として）ための手法であり、そこで、「オーディオシーン」は、メタデータにおいて指定されるように、異なるオーディオシーンのオーディオ品質を改善するために、デコーディングされた基本バージョンに適用されるイコライゼーションを使用し、録音のエンコードされた、基本バージョンの修正されていないシーンとは異なってレンダリングされ得る。この特定の解決法が有益である例は、エンコードされた録音（例えば劇場マスタ）がサラウンドコンテンツを有するが、ステレオラウドスピーカシステムによって再生デバイスにおいて再生成されない場合を含む。他の場合には、上記のイコライゼーション技法はまた、再生シーンが、高められたソースからのサウンドをそれが再生成することを可能にするハイスピーカ（height speaker）を有さない場合に有用である。

上記に紹介された図２の総合的な例において見られるように、システムの一実施形態は、図示されるようにダウンミックス前及びダウンミックス後の両方を含むデコーダ処理又はデコーダステージ内のいくつかのステージで直線状のスペクトル成形フィルタリング（ＥＱ）を適用する任意選択を用意する。メタデータが、デコーディングされた録音に、ＥＱ及びＤＲＣの両方が適用されると指定した場合、次いで、ＥＱが、ＤＲＣの適用の前に適用される。これはまた、図２に示され、ダウンミックス前ＥＱフィルタ１１は、これらの信号が再グループ化され（再グループ化装置１３によって）次いでダウンミックス前ＤＲＣブロック１４によって（そして、ＥＱフィルタ１８が、デコーディングされたオーディオチャネル又はオブジェクトをそれらがダウンミックス後ＤＲＣブロック２０によって圧縮される前に処理する、ダウンミックス後ステージにおいて同様に）処理される前に、デコーディングされたオーディオチャネル又はオブジェクトを処理する（スペクトル的に成形する）。上記のように、オーディオチャネル又はオブジェクトのそれらにＥＱを適用することを目的とするグループ化は、動的範囲圧縮の適用のためのグループ化（メタデータにおいて指定される）とは無関係であり得ることに留意されたい。

ＥＱ値シーケンス（メタデータ内の）における、各ＥＱフィルタのパラメータ化とも呼ばれる、ＥＱフィルタ１１、１８を定義するための様々な手法が取られ得る。例えば、デジタルフィルタの構造は、フィルタの周波数応答を定義するパラメータに加えて、メタデータにおいて指定され得る。例えば、各フィルタ１１、１８は、並列に接続されてフィルタブロックを形成し得る、例えば有限インパルス応答、ＦＩＲ、及び／又は無限インパルス応答、ＩＩＲを含む、個々のフィルタ要素から構成され得、次いで、そのようなフィルタブロックのうちのいくつかが、カスケード表示される。そのような構造の一例は、ＥＱフィルタ１１又は１８内にあるＢ（２つ又はそれ以上の）フィルタブロックのカスケードを示す、図３に示される。これはまた、デジタルフィルタカスケードとも呼ばれ、フィルタブロック０、１、．．．Ｂ−１をカスケード表示することによって形成される。各フィルタ要素が、同じ、単一の、デコーディングされたチャネル又はオブジェクトを入力として受信するように、各フィルタブロックは、図示されているように並列に接続された２つ又はそれ以上のＦＩＲ要素、ＩＩＲ要素、又は両方の組合せを有する。この場合、スペクトル的に成形されることが望まれるオーディオスペクトルのＪ周波数帯域に対応する、Ｊフィルタ要素が存在する。図３に示される配列は、所与のグループの各単一の、デコーディングされたチャネル又はオブジェクトについて複製され得る。一実施形態では、図３に示すような各フィルタカスケードは、同じ構成（特定のＥＱグループについて定義されるのと）を有し、ＥＱグループ内に含まれる各デコーディングされたチャネル又はオブジェクトについて複製される。全てのチャネル又はオブジェクトのフィルタ要素（ここでは、フィルタカスケード）のセットは、ここでは、ＥＱフィルタセットと呼ばれ、上記で示唆されるように、メタデータは、複数のＥＱフィルタセットを指定することができ、これらの複数のＥＱフィルタセットの各々は、異なる再生シナリオ（同ベース録音の）向けに設計又は意図されている。

所与のＥＱグループ内の全てのチャネル又はオブジェクトは、所与のグループ内の各チャネル又はオブジェクトの同じ、直線状のフィルタカスケード（例えば、図３に示されるような）の別個のインスタンスを有するフィルタ構造を介して並行して渡される。言い換えれば、所与のＥＱグループ内の全てのチャネル又はオブジェクトは、同じ方法でフィルタリングされる。カスケード内のフィルタ要素の構成又は定義は、特定のＥＱグループに適用されるフィルタリングを定義する、ＥＱ値シーケンスによってメタデータにおいて指定される。

メタデータは、ＩＩＲフィルタのみがフィルタカスケードにおいて使用されると指定することができ、あるいは、メタデータは、ＩＩＲ及びＦＩＲフィルタの組合せを指定することができる。フィルタカスケードの定義は、デコーディングされた、元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上の通知されたＥＱグループの時間領域フィルタリングのためのデコードステージにおいて構築又は合成される、各フィルタブロックのポール及びゼロを含み得る。ポール及びゼロの場所は、ｚ面（半径及び角度）内でもよく、ＩＩＲフィルタパラメータと見なされ得る。別法として、ＥＱシーケンスは、元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上の通知されたＥＱグループの時間領域フィルタリングのためにも、フィルタ要素のデジタルフィルタ係数を指定することによってフィルタカスケードを定義することができる。更に図３を参照すると、互いに並列である（そして、フィルタブロックを構成する）各々のフィルタ要素の出力では、図示されるように、出力がフィルタカスケードの次のブロックのための単一の入力信号に結合される前に、それぞれの、スカラゲインが、適用され得る。

メタデータはまた、出力が、同フィルタカスケードの次のブロックのために単一の入力信号に結合される前に、フィルタブロック内の全ての並列接続されたフィルタ要素（並行して同入力チャネル又はオブジェクトを処理している）の出力の間の位相整合を得るために、位相位置調整フィルタが必要とされるかどうかを指定することができる。図３では、そのような位相位置調整フィルタは、「ブロックのための位相位置調整」のラベルを付けられ、所与のフィルタブロック内の各フィルタ要素の出力に適用される（必要に応じて）。位相位置調整は、同フィルタブロック内で、いくつかのフィルタ要素（いくつかの周波数ビンにおける）の出力を結合させるときに望ましくない位相効果を避けるのを助けるように設計される。位相位置調整フィルタは、その位相応答が全てのそれらの出力に亘って位相整合を得るように設計された、全てのパスフィルタとして定義され得る（メタデータにおいて）。

図３に示されるように、位相位置調整はまた、異なるチャネル又はオブジェクト間として実行され得る。言い換えれば、そのような位相位置調整は、あるＥＱグループのＥＱフィルタリングされたチャネル又はオブジェクトと、別のＥＱグループのＥＱフィルタリングされたチャネル又はオブジェクトとの間で実行される。これは、異なるチャネルグループを結合させる（例えば、ダウンミックスプロセッサ１６によって）ときに、又はＥＱフィルタリングされたチャネル又はオブジェクトをサウンドに変換するときに、望ましくない効果を避けるためである。図３では、例えば、ＥＱフィルタ１１＿１からの出力チャネル又はオブジェクトが、ＥＱフィルタ１１＿２のそれらと位相整合されるように、そのような位相位置調整フィルタは、「カスケードを横断する位相位置調整」として通知され、カスケードの最後のフィルタブロック（フィルタブロックＢ−１）の出力に適用される。更に具体的には、これは、全てのＥＱフィルタリングされたチャネルグループを横断する位相整合を得るために行われるべきである（ここで、ＥＱフィルタ１１＿１、１１＿２、．．．１１＿Ｋからの出力チャネル又はオブジェクトは、全て位相整合される）。位相位置調整フィルタは、場合によっては存在しなくてもよいことに留意されたい。そのようなものとして、一実施形態では、メタデータは、位相位置調整フィルタが存在する（そしてまた、メタデータにおいて指定される）、ＥＱフィルタセットのための、それらのＩＩＲフィルタのみを指定する。位相位置調整フィルタは、時間領域デジタルフィルタとして合成され得る（デコードステージにおいて）。

以下の表は、ＥＱ値の例示的エンコーディング及び記述を示す、ＥＱシーケンスの一部の例示的定義（メタデータにおける）である。

上記で説明されたように、ＥＱシーケンスは、指定されたＥＱグループ（デコーディングされたＥＱグループ）のデコーディングされたオーディオチャネル又はオブジェクトに適用されるスペクトル成形（ＥＱフィルタリング）を定義する、ＥＱ値を含む。一実施形態では、ダウンミックスもまたメタデータにおいて指定される（そして、デコーディングされたＥＱグループに適用される）かどうかにかかわらず、このエンコーディングステージ又は製作側定義のＥＱフィルタリングが、デコーディングされた元のオーディオチャネル又はオブジェクトのゲインを５００Ｈｚ未満に下げるために、デコードステージプロセッサによって適用される。例えば、デコードステージプロセッサは、再生デバイスの特別な「深夜」動作モードに関連付けられたものとしてＥＱシーケンスを解釈し得る。この動作モードは、再生中に隣接する部屋で休んでいるかもしれない他者の迷惑になる低周波数騒音の可能性を低減するために、例えば再生デバイスのユーザによって手動で又は夜分に自動的に有効にされるようにセットされて（現在の時刻に基づいて）、有効にされ得る。特別なモードが有効にされた場合、次いで、デコードステージプロセッサは、ダウンミックスプロセッサ１６の存在にかかわらず、ＥＱシーケンスによって定義されるようにＥＱフィルタリングを適用する。これは、ゲインを落とし過ぎないように録音の内容もまた考慮することによって、低周波数帯域におけるゲインをどの程度落とすかを録音の製作側が決定することを可能にし、それによって、ダウンミックスが再生のために実行されるかどうかにかかわらずより優れたユーザ体験を実現する。

別の実施形態では、メタデータは更に、元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上のＥＱグループのＥＱフィルタリングされたバージョンのラウドネス情報を指定し、このラウドネス情報は、エンコーディングステージにおいて推定され得る。

上記の実施形態は、大まかな発明を例示するものにすぎず、限定するものではないこと、また、他の種々の変更が当業者に想起され得るので、本発明は、図示及び記述した特定の構成及び配置には限定されないことが理解されるべきである。例えば、エンコーディング及びデコーディングステージの各々は、別々に、例えばオーディオコンテンツプロデューサマシンにおけるエンコーディングステージ及びオーディオコンテンツ購入者マシンにおけるデコードステージ、動作するものとして一実施形態では説明され得るが、これらは、インターネットを介して互いに通信し得、エンコーディング及びデコーディングもまた、同じマシン内で実行され得る（例えば、トランスコーディングプロセスの一部）。したがって、本説明は、例示的であり、限定ではないものとして見なされるべきである。

Claims

プログラムされたプロセッサによって実行される、デジタル録音のデコーディング側処理のための方法であって、
ビットストリームを受信することであって、前記ビットストリームにおいて、複数の元のオーディオチャネル又はオーディオオブジェクトを有するエンコードされたデジタル録音が、前記エンコードされたデジタル録音に関連付けられたメタデータとして、デコーディング側のプログラムされたプロセッサによって適用されるＥＱフィルタリングを定義するイコライゼーション（ＥＱ）値のシーケンスと結合されており、前記ＥＱ値のシーケンスが、元のオーディオチャネル又はオーディオオブジェクトのグループ化に適用されるＥＱフィルタリングを定義するＥＱセットのＥＱセット識別子を含む、ことと、
前記エンコードされたデジタル録音から、前記複数の元のオーディオチャネル又はオーディオオブジェクトをデコーディングすることと、
前記デコーディングされた元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上を、前記ＥＱセットにおいて指定されたようにグループ化することと、前記メタデータ内の前記ＥＱフィルタリングを定義する前記ＥＱセットに従って、前記グループ化された元のオーディオチャネル又はオーディオオブジェクトをフィルタリングすることと
を含む、方法。
前記ＥＱ値のシーケンスが、前記ＥＱセット識別子に関連してデコーダによって実行されるダウンミックスを定義するダウンミックス識別子を更に含み、前記メタデータ内のＥＱフィルタリングを定義する前記ＥＱセットが、前記メタデータ内の前記ダウンミックス識別子によって定義されるダウンミックスと無関係である、請求項１に記載の方法。
前記ＥＱ値のシーケンスが、前記ＥＱセット識別子によって識別されるイコライゼーションに関連してＤＲＣを実行する際にデコーダによって使用されるパラメータを有するＤＲＣセットを識別するＤＲＣセット識別子を更に含む、請求項１に記載の方法。
前記ＥＱ値のシーケンスが、前記ＥＱセット識別子に関連してデコーダによって実行される複数のダウンミックスを定義する複数のダウンミックス識別子を更に含む、請求項１に記載の方法。
前記ＥＱ値のシーケンスが、前記ＥＱセット識別子に関連してデコーダによって実行される複数のＤＲＣセットを定義する複数のＤＲＣセット識別子を更に含む、請求項１に記載の方法。
前記ＥＱ値のシーケンスが、前記ＥＱセットにおいて定義された前記ＥＱフィルタリングの目的を定義するＥＱセット目的を更に含む、請求項１に記載の方法。
前記ＥＱセット目的が、デフォルトＥＱ、大きい部屋、狭い空間、平均的な部屋、自動車室内、ヘッドホン、及び深夜から成る群から選択される、請求項６に記載の方法。
前記ＥＱ値のシーケンスが、前記ＥＱセットを第２のＥＱセットと結合して適用すべきかどうかの通知を更に含む、請求項１に記載の方法。
前記ＥＱ値のシーケンスが、前記メタデータにおいてフィルタカスケードが定義されているかどうかについての通知を更に含む、請求項１に記載の方法。
前記ＥＱ値のシーケンスが、前記フィルタカスケードのためのフィルタカスケードゲイン値が存在するかどうかについての通知を更に含む、請求項９に記載の方法。
前記ＥＱ値のシーケンスが、フィルタカスケードゲイン値を更に含む、請求項１に記載の方法。
前記ＥＱ値のシーケンスが、フィルタカスケードに存在するいくつかのフィルタブロック、及びメタデータ内のＥＱ係数を参照するフィルタブロックインデックスを更に含む、請求項１１に記載の方法。
前記ＥＱ値のシーケンスが、サブバンドゲイン値が存在するかどうかの通知、及びメタデータ内のサブバンドゲインベクトルへのインデックスを更に含む、請求項１１に記載の方法。
前記ＥＱ値のシーケンスが、ＥＱチャネルグループが位相位置調整されているかどうかの通知を更に含む、請求項１に記載の方法。
オーディオデコーディング側システムであって、
プロセッサと、
デジタル録音を処理するための命令を記憶したメモリと、
を備え、前記プロセッサは、前記命令を実行した時に、
ビットストリームを受信することであって、前記ビットストリームにおいて、複数の元のオーディオチャネル又はオーディオオブジェクトを有するエンコードされたデジタル録音が、前記エンコードされたデジタル録音に関連付けられたメタデータとして、前記プロセッサによって適用されるＥＱフィルタリングを定義するイコライゼーション（ＥＱ）値のシーケンスと結合されており、前記ＥＱ値のシーケンスが、元のオーディオチャネル又はオーディオオブジェクトのグループ化に適用されるＥＱフィルタリングを定義するＥＱセットのＥＱセット識別子を含む、ことと、
前記エンコードされたデジタル録音から、前記複数の元のオーディオチャネル又はオーディオオブジェクトをデコーディングすることと、
前記デコーディングされた元のオーディオチャネル又はオーディオオブジェクトのうちの１つ又はそれ以上を、前記ＥＱセットにおいて指定されたようにグループ化することと、前記メタデータ内の前記ＥＱフィルタリングを定義する前記ＥＱセットに従って、前記グループ化されたチャネル又はオーディオオブジェクトをフィルタリングすることと、
を行う、システム。
前記ＥＱ値のシーケンスが、前記ＥＱセット識別子に関連してデコーダによって実行されるダウンミックスを定義するダウンミックス識別子を更に含み、前記メタデータ内のＥＱフィルタリングを定義する前記ＥＱセットが、前記メタデータ内の前記ダウンミックス識別子によって定義されるダウンミックスと無関係である、請求項１５に記載のシステム。
前記ＥＱ値のシーケンスが、前記ＥＱセット識別子によって識別されるイコライゼーションに関連してＤＲＣを実行する際にデコーダによって使用されるパラメータを有するＤＲＣセットを識別するＤＲＣセット識別子を更に含む、請求項１５に記載のシステム。
前記ＥＱ値のシーケンスが、前記ＥＱセットにおいて定義された前記ＥＱフィルタリングの目的を定義するＥＱセット目的を更に含む、請求項１５に記載のシステム。
前記ＥＱセット目的が、デフォルトＥＱ、大きい部屋、狭い空間、平均的な部屋、自動車室内、ヘッドホン、及び深夜から成る群から選択される、請求項１８に記載のシステム。
前記ＥＱ値のシーケンスが、前記メタデータにおいてフィルタカスケードが定義されているか旨の通知を更に含む、請求項１５に記載のシステム。