JP2021060589A

JP2021060589A - 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置

Info

Publication number: JP2021060589A
Application number: JP2020200948A
Authority: JP
Inventors: リードミラー，ジェフリー; Riedmiller Jeffrey; イーローエデン，カール; J Roeden Karl; クヨーリング，クリストファー; Kjoerling Kristofer; プルンハーゲン，ヘイコ; Heiko Purnhagen; メルコーテ，ヴィナイ; Melkote Vinay; セルストロム，レイフ; Sehlstrom Leif
Original assignee: Dolby International AB; Dolby Laboratories Licensing Corp
Current assignee: Dolby International AB; Dolby Laboratories Licensing Corp
Priority date: 2012-05-18
Filing date: 2020-12-03
Publication date: 2021-04-15
Anticipated expiration: 2033-05-02
Also published as: US20170309286A1; JP6853408B1; CN107591158B; US9721578B2; CN104303229A; CN112185398A; US9881629B2; JP2017215593A; JP2019197216A; US20180322890A1; US10217474B2; CN104303229B; HK1249654A1; JP2015517688A; JP6767545B2; EP3547312A1; CN107591158A; CN112185399A; JP2021099525A; US10074379B2

Abstract

【課題】オーディオ信号のダイナミックレンジを調整する方法とデバイスを提供する。【解決手段】入力オーディオ信号のダイナミックレンジ制御（ＤＲＣ）の方法であって、復号システム５１は、入力オーディオ信号、エンコーダ生成ラウドネスメタデータ及びエンコーダ生成ＤＲＣメタデータを含むビットストリームＰを受信する。エンコーダ生成ラウドネスメタデータは、入力オーディオ信号のラウドネスレベルを含み、エンコーダ生成ＤＲＣメタデータは、第１及び第２のＤＲＣゲインセットを含む複数のＤＲＣゲインセットを含み、ユーザ入力又は再生機器の特性のうち１つ以上に基づいて、第１のＤＲＣゲインセット又は第２のＤＲＣゲインセットのうち１つを適用すべき特定のＤＲＣゲインセットとして決定し、入力オーディオ信号のラウドネスレベル及び目標出力レベルに応じて決まったゲインとともに入力オーディオ信号に適用する全体的ゲインの一部として適用する。【選択図】図２

Description

ここに開示される発明は、概してオーディオビジュアルメディア配信に関する。具体的に、復号中に、高いビットレートモードと低いビットレートモードの両方と、シームレスモード移行とを可能にする適応的配信フォーマットに関する。本発明は、さらに、配信フォーマットにより信号を符号化及び復号する方法とデバイスに関する。

パラメトリックステレオ及びマルチチャネルコーディング法は、スケーラブルであり、リスニングクオリティの点で効率的であることが知られている。これにより、これらの方法は低ビットレートアプリケーションで特に魅力的である。しかし、ビットレートの限界が一時的なもの（例えば、ネットワークジッター、付加変動など）によるものである場合、利用できるネットワーク資源の全利益は、通常の状態では比較的高いビットレートを用い、ネットワークの機能が不十分な時に低ビットレートを用いる適応的配信フォーマットの利用により得られる。

既存の適応的配信フォーマット及び関連（デ）コーディング手法は、その帯域幅効率、計算効率、エラー復元力、アルゴリズム的遅延の観点から改善され、さらに、オーディオビジュアルメディア配信においては、復号されるメディアを楽しんでいる人に対してビットレート切り替えイベントがどのくらい気づきやすいかについて改善されている。レガシーデコーダが新しい専用機器と並行して使われ続けることが予想されることにより、後方互換性を維持しなければならない限りにおいて、かかる潜在的な改善には限界がある。

オーディオビジュアル信号の再生中により一貫性のあるダイナミックレンジを確保するダイナミックレンジ制御（ＤＲＣ）法が、本技術分野において周知である。概観のため、非特許文献１とそれで引用されている参照文献を参照されたい。かかる手法により、レシーバは、オーディオビジュアル信号のダイナミックレンジを、比較的高度化されていない再生機器に適するように合わせ、信号自体は、より洗練された機器の利益のため、フルダイナミックレンジでブロードキャストされる。ＤＲＣの単純なインプリメンテーションは、０から１までの区間のゲインファクタをエンコードするメタデータフィールドを用いる。デコーダは適用するか否かを選択できる。

既知のＤＲＣ手法を用いて、符号化されたオーディオビジュアル信号は、再生ダイナミックレンジをユーザの好みに合うように圧縮またはブーストし、または利用可能な再生機器にダイナミックレンジをマニュアルで合わせる能力をユーザに提供するメタデータと共に送信できる。しかし、既知のＤＲＣ手法は、適応的ビットレートコーディング手法と互換性がなく、２つのビットレート間での切り替えには時としてダイナミックレンジの不一致が伴い、特にレガシー機器ではそうである。本発明はこの問題を解決する。
［関連出願への相互参照］
この出願は、２０１２年５月１８日出願の米国仮特許出願第６１／６４９，０３６号、２０１２年７月２５日出願の米国仮特許出願第６１／６６４，５０７号、及び２０１２年１０月１２日出願の米国仮特許出願第６１／７１３，００５号の優先権を主張するものであり、上記文献はそれぞれ全体をここに参照援用する。

Ｔ．ＣａｒｒｏｌｌａｎｄＪ．Ｒｉｅｄｍｉｌｌｅｒ， "ＡｕｄｉｏｆｏｒＤｉｇｉｔａｌＴｅｌｅｖｉｓｉｏｎ"，ｐｕｂｌｉｓｈｅｄａｓｃｈａｐｔｅｒ５．１８ｏｆＥ．Ａ．Ｗｉｌｌｉａｍｓｅｔａｌ．（ｅｄｓ．），ＮＡＢＥｎｇｉｎｅｅｒｉｎｇＨａｎｄｂｏｏｋ，１０ｔｈｅｄ．（２００７），ＡｃａｄｅｍｉｃＰｒｅｓｓ

添付した図面を参照して本発明の実施形態を説明する。
本発明の一実施形態によるオーディオ符号化システムを示すブロック図である。本発明の一実施形態によるオーディオ復号システムを示すブロック図である。本発明の一実施形態によるオーディオ符号化システムを示すブロック図である。本発明の一実施形態によるオーディオ復号システムを示すブロック図である。オーディオ符号化システムにおけるパラメトリック分析段階の一部を示す図である。本発明の一実施形態によるオーディオ復号システムを示すブロック図である。本発明の一実施形態によるオーディオ符号化システムを示すブロック図である。同じ長さの時間ブロックを参照する前処理及び後処理ＤＲＣパラメータに基づく補償された後処理ＤＲＣパラメータの計算を示す図である。違う長さの時間ブロックを参照する前処理及び後処理ＤＲＣパラメータに基づく補償された後処理ＤＲＣパラメータの計算を示す図である。本発明の一実施形態によるオーディオ符号化システムを示すブロック図である。オーディオ復号システムにおけるパラメトリック合成段階の一部を示す図である。オーディオ復号システムにおけるパラメトリック合成段階の一部を示す図である。本発明の一実施形態によるオーディオ復号システムを示すブロック図である。すべての図面は概略図であり、本発明を説明するために必要な部分のみを示し、他の部分は省略してあるか、または示唆のみしている。特に断らなければ、異なる図面であっても、同じ参照数字は同じ部分を示す。

Ｉ．概要
ここで、「オーディオ信号」とは、純粋なオーディオ信号、またはオーディオビジュアル信号やマルチメディア信号のオーディオ部分である。

本発明の一実施形態により、帯域幅を節約する方法でオーディオビジュアルメディアの配信を可能にする方法とデバイスを提案する。特に、一実施形態により、オーディオビジュアルメディア配信用のコーディングフォーマットであってレガシー受信器及びもっと最近の機器が一貫した会話レベルを有するオーディオ部分を出力できるものを提案する。特に、一実施形態により、適応的ビットレートを有するコーディングフォーマットを提案する。ここで、２つのビットレート間の切り替えには会話レベルの急激な変化を伴う必要がない。そうでなければ、これは再生時にオーディオ信号または信号のオーディオ部分における知覚可能なアーティファクトとなってしまう。

本発明の一実施形態により、独立請求項に記載した特徴を有する符号化方法、符号化器、復号方法、復号器、コンピュータプログラム製品、及びメディアコーディングフォーマットを提供する。

本発明の一実施形態により、ビットストリームＰに基づきｎチャンネルオーディオ信号Ｘを再構成する復号システムを提供する。復号システムは、少なくともパラメトリックコーディングモードで動作可能であり、次を含む：
・前記ビットストリームを受け取り、符号化コア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）と一以上のマルチチャンネルコーディングパラメータ（これは集合的にαと表す）；
・前記符号化されたコア信号を受け取り、ｍチャンネルコア信号を出力する、ここで１≦ｍ＜ｎであるコア信号デコーダ；
・前記コア信号とマルチチャンネルコーディングパラメータとを受け取り、前記マルチチャンネルコーディングパラメータに依存するゲインを用いて前記コア信号のチャンネルの線形結合を形成することにより、前記ｎチャンネル信号を出力するパラメトリック合成ステージ。

この第１の実施形態では、前記ビットストリームはさらに一以上の前処理ＤＲＣパラメータＤＲＣ２を含み、これは前記ビットストリームを生成したエンコーダで行われたダイナミックレンジ制限を定量的に特徴付けるものである。前記復号システムは、前記前処理ＤＲＣパラメータに基づき、前記エンコーダ側ダイナミックレンジ制限をキャンセルするように動作可能である。好ましくは、前記信号は時間ブロックにパーティションされ、前処理ＤＲＣパラメータＤＲＣ２は信号の一時間ブロックの分解能で確定される。そうであるから、パラメータＤＲＣ２の各値は少なくとも一時間ブロックに適用され、各時間ブロックをその時間ブロックに特有の値と関連づけることが可能である。本発明の範囲から逸脱することなく、パラメータＤＲＣ２の値は、連続した複数のブロックにわたり一定であってもよい。例えば、パラメータＤＲＣ２の値は、各時間フレームで１回だけ更新され、それゆえ、パラメータＤＲＣ２が一定である複数の時間ブロックを含む。

第１の実施形態により利点は、前処理ＤＲＣパラメータＤＲＣ２が、復号システムに、エンコーダが、理由はどうであれ、ダイナミックレンジ制限（または圧縮）をした時間において、オーディオ信号をその元のダイナミックレンジに回復するオプションを提供する。回復は、ダイナミックレンジ制限のキャンセルすることになり、すなわち、ダイナミックレンジを拡大（またはブースティング）することになる。エンコーダにおいてダイナミックレンジを制限する理由の１つは、クリッピングの回避である。回復がされるか否かは、例えば、マニュアル入力されたユーザ入力、自動的に検出された再生機器の特性、外部情報源から得た目標ＤＲＣレベル、またはその他の要因に依存する。目標ＤＲＣレベルは、復号システムに適用される、（後処理ＤＲＣパラメータＤＲＣ１により定量化された）元の後処理ダイナミックレンジ制御の一部を表す。それは、適用されるＤＲＣの大きさを、ＤＲＣ１からｆ×ＤＲＣ１（対数単位）に修正するパラメータｆ∈［０，１］により表される。

単純なインプリメンテーションでは、ＤＲＣ２パラメータは、すでに信号が受けた相対的振幅減少を定量化する正のｄＢ値として、対数形式で表されたブロードスペクトル（すなわちブロードバンド）ゲイン計数の形式で符号化される。よって、ＤＲＣ２＝ｘ＞０とすると、エンコーダ側における相対的振幅変化は

であり、キャンセレーションには、信号をデコーダ側において１０^{＋ｘ／２０}＞１だけスケーリングすることを含む。

実際のキャンセルは、目標ＤＲＣレベルと入力ＤＲＣレベル（またはデコーダ入力ＤＲＣレベル）に応じて、すなわちダイナミックレンジ圧縮やダイナミックレンジブースティングがない再構成後にｎチャンネルオーディオ信号が有するであろうＤＲＣレベルに、完全にまたは部分的に行われる。入力ＤＲＣレベルは、元のダイナミックレンジを、前処理ＤＲＣパラメータＤＲＣ２に対応する大きさだけ減宿されたものである。目標ＤＲＣレベルは、元のダイナミックレンジをパラメータｆと後処理ＤＲＣパラメータＤＲＣ１の積、すなわちｆ×ＤＲＣ１（対数単位）に対応する大きさだけ減宿したものであってもよい。前述の単純なインプリメンテーションにおいて、ｆ×ＤＲＣ１＜ＤＲＣ２という条件は、部分的な、すなわちＤＲＣ２ではなくＤＲＣ２−×ＤＲＣ１に対応する大きさだけのキャンセルを示す。例えば、目標ＤＲＣレベルが入力ＤＲＣレベル（例えば、ビットストリームを生成するエンコーダにより元々符号化されたオーディオ信号のダイナミックレンジ）に対応する場合、これはｆ＝０と表せるが、そのときは、ＤＲＣ２の大きさだけ完全なキャンセルが必要である。０＜ｆ＜１かつｆ×ＤＲＣ１＜ＤＲＣ２の場合のように、目標ＤＲＣレベルが入力ＤＲＣレベルより小さいとき、ダイナミックレンジ制限を部分的にキャンセルすれば十分である。目標ＤＲＣレベルが入力ＤＲＣレベルより大きいとき、すなわちｆ×ＤＲＣ１＞ＤＲＣ２であるとき、指定されたＤＲＣレベルはデコーダでさらなるダイナミックレンジ圧縮、すなわちｆ×ＤＲＣ１−ＤＲＣ２に対応する大きさだけダイナミックレンジ圧縮を行うことにより達成できる。この場合、最初に前処理ＤＲＣをキャンセルする必要はない。最後に、目標ＤＲＣレベルが、ｆ＝１で表されるように、ＤＲＣ１により定量化されたフルＤＲＣである場合、エンコーダ側ダイナミックレンジ制限の部分的キャンセレーションまたはさらなる圧縮を行うかは、ＤＲＣ１＜ＤＲＣ２であるかＤＲＣ１＞ＤＲＣ２であるかに依存する。

第２の実施形態において、ビットストリームに基づいてｎチャンネルオーディオ信号Ｘの再構成をする方法が提供される。本方法によると、符号化コア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）と、一以上のマルチチャンネルコーディングパラメータαと、前処理ＤＲＣパラメータＤＲＣ２とのそれぞれを含むビットストリームの受信により次の動作がトリガーされる：
・前記符号化コア信号をｍチャンネルコア信号に復号する、１＜ｍ＜ｎであるステップと、
・パラメトリック合成を行い、前記コア信号と前記マルチチャンネルコーディングパラメータとに基づき前記ｎチャンネル信号を再構成するステップ。

第２の実施形態では、復号は、パラメータＤＲＣ２に基づくエンコーダ側ダイナミックレンジ制限のキャンセルを含む。

第１と第２の実施形態は、機能的に同様であり、概して同じ利点を共有している。

第１の実施形態のさらなる展開において、復号システムは、さらに、ビットストリームの一部として、システムがパラメトリックコーディングモードであるうちに、一以上の補償された後処理ＤＲＣパラメータＤＲＣ３を受け取る。これはデコーダにより適用されるＤＲＣを定量化したものである。ＤＲＣの適用は、マニュアルユーザ入力、自動的に検知された再生機器の特性などによる。そのため、デコーダにより適用されるＤＲＣは、完全に、部分的に作用され、または全く作用されない。一般的に言って、前処理ＤＲＣパラメータＤＲＣ２は、入力ＤＲＣレベルに対してダイナミックレンジをブーストするのに有用であり、一方、補償された後処理ＤＲＣパラメータＤＲＣ３は、レンジ圧縮も含め、ダイナミックレンジに入力ＤＲＣレベルから調整をするのに有用である。ＤＲＣ３パラメータは、正または負のｄＢ値として対数形式で表し得る。よって、ＤＲＣ３＝ｙ＞０、デコーダ側にける相対的振幅変更は

に比例する。これは（０，１）におけるスカラーである。逆に、ＤＲＣ３が負値である場合、デコーダ側でアップスケーリングがなされる。

上記のさらに別の発展において、復号システムは、パラメータＤＲＣ２に基づきエンコーダ側ダイナミックレンジ圧縮をキャンセルするように動作可能なＤＲＣプロセッサを含む。任意的には、ＤＲＣプロセッサは、上記のパラメータｆにより表される、エンコーダ側で適用されたダイナミックレンジ圧縮の一部をキャンセルするように動作可能である。

さらに別の展開では、復号システムは、さらに、ＤＲＣプロセッサとコア信号デコーダとを制御し、目標ＤＲＣレベルを達成するＤＲＣプリプロセッサを含む。それゆえ、ＤＲＣプリプロセッサは、目標ＤＲＣレベル（例えば、ｆ×ＤＲＣ１）が入力ＤＲＣレベルより大きいか小さいか、決定する。入力ＤＲＣレベルは、元に符号化され、前処理ＤＲＣパラメータＤＲＣ２により定量化されたエンコーダ側ＤＲＣにより減宿されたオーディオ信号のダイナミックレンジである。この決定の結果に基づいて、復号されたオーディオ信号をブーストする必要があれば、ＤＲＣプリプロセッサは、（ｉ）ＤＲＣプロセッサに、エンコーダ側ダイナミックレンジ制限を部分的にまたは完全にキャンセルするように指示する。復号されたオーディオ信号を圧縮する必要がある場合（例えば、ｆ×ＤＲＣ１＞ＤＲＣ２）、ＤＲＣプリプロセッサは、ＤＲＣプロセッサに、（ｉｉ）パラメータＤＲＣ３により定量化された、適用されるデコーダ側ＤＲＣを部分的にまたは完全に行うように指示する。目標ＤＲＣレベルが入力ＤＲＣレベルから大きく違わないとき

ＤＲＣプリプロセッサは何もする必要はない。通常動作において、両動作（ｉ）と（ｉｉ）は同じ時間ブロックに対して行われない。

一実施形態では、復号システムは、さらに、離散復号モードにおいて、符号化ｎチャンネル信号Ｘ^〜（訳注：「〜」は「Ｘ」の上にある）を含むビットストリームに基づきオーディオ信号を再構成する。よって、この実施形態は、デュアルモードまたはマルチプルモード復号システムとなる。適応的コーディングの観点から、離散コーディングモードは、高ビットレートモードを表し、一方、パラメトリックコーディングモードは、一般的に低ビットレートモードに対応する。

一実施形態では、復号システムは、デュアルモードタイプであり、すなわち、パラメトリックコーディングモードまたは離散コーディングモードで動作する。復号システムは、これらのモードの各々においてデコーダ側ＤＲＣを適用することが可能である。離散コーディングモードでは、復号システムは、後処理ＤＲＣパラメータＤＲＣ１を、ＤＲＣのガイドとして用いる。しかし、パラメトリックコーディングモードでは、ｎチャンネルオーディオ信号は、少なくとも幾つかの時間ブロックでは、エンコーダ側のダイナミックレンジ制限に関して潜在的に求められたコア信号に基づき生成される。すでに行われたダイナミックレンジ変更（すなわち、幾つかの時間ブロックにおけるダイナミックレンジ制限）に対応する（ａｃｃｏｕｎｔｆｏｒ）ため、復号システムは、補償された後処理ＤＲＣパラメータＤＲＣ３をＤＲＣに対するガイドとして用いる。両パラメータＤＲＣ１とＤＲＣ３はビットストリームから導かれるが、システムの通常動作時には、両方ではなくどちらかのパラメータタイプだけが時間ブロックで導ける。両パラメータＤＲＣ１とＤＲＣ３を含むと、パラメータＤＲＣ２がある時には、冗長な情報を送信することになる。この実施形態の復号システムは、パラメータＤＲＣ２を用いて、パラメータＤＲＣ１をパラメータＤＲＣ３のスケールに合わせること、またはパラメータＤＲＣ３を、ＤＲＣ１のスケールに合わせる。例えば、復号システムは、パラメータＤＲＣ２とＤＲＣ３を受け取り、それに基づき、デコーダシステムにより適用される回復された後処理ＤＲＣパラメータを出力するＤＲＣダウン補償器を含む。回復された後処理ＤＲＣパラメータは、後処理ＤＲＣパラメータＤＲＣ１と（同じスケールで）比較される。言い換えると、前記回復されたＤＲＣパラメータにより表されるデコーダ側ＤＲＣは、前記コア信号のエンコーダ側ダイナミックレンジ制限と、前記補償された後処理ＤＲＣパラメータにより表されるデコーダ側ＤＲＣとの結合と数量的に等価である。上記の単純なインプリメンテーションにおいて、各ＤＲＣパラメータ間の関係は次の通りである：回復されたＤＲＣパラメータがＤＲＣ２＋ＤＲＣ３として得られ、これはＤＲＣ１に等しい。

本発明の第２の態様において、一実施形態は、時間ブロックにパーティションされたｎチャンネルオーディオ信号ＸをビットストリームＰとして符号化する符号化システムが提供される。該符号化システムは、
・前記ｎチャンネル信号を受け取り、それに基づいて、前記符号化システムのパラメトリックコーディングモードで、ｍチャンネルコア信号Ｙと一以上のマルチチャンネルコーディングパラメータαとを出力する、１＜ｍ＜ｎである、パラメトリック分析ステージと、
・前記コア信号を受け取り、符号化コア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）を出力するコア信号エンコーダ。

符号化システムにおいて、前記パラメトリック分析ステージは、時間セグメントベースの適応的ダイナミックレンジ制限を行い、適用される前記ダイナミックレンジ制限を数量化する前処理ＤＲＣパラメータＤＲＣ２を出力する。時間セグメントは一時間ブロックまたは連続した複数の時間ブロック（例えば、６つの時間ブロックを含む時間フレーム）であり得る。符号化システムは、前処理ＤＲＣパラメータＤＲＣ２を、ビットストリームと共に（必ずしも必要ではないが好ましくはその一部として）送信するように構成されている。前処理ＤＲＣパラメータＤＲＣ２を送信することにより、符号化システムは、復号システムに、ビットストリームを受信して、パラメトリック分析ステージがコア信号に課したダイナミックレンジ制限をキャンセルできるようにする。時間ブロックベースでダイナミックレンジ制限が行われると、パラメータＤＲＣ２は時間ブロックの解像度を有する。あるいは、ダイナミックレンジ制限をフレームベースで行うと、パラメータＤＲＣ２は一フレームの解像度を有する。言い換えると、各時間ブロックは、パラメータＤＲＣ２の値と関連づけられ、または前に確定された値を参照するが、しかしこの値はフレームベースまたはブロックベースで更新できる。さらに、パラメトリック分析ステージにおけるダイナミックレンジ制限は、（例えば、コア信号にダイナミックレンジ制限を適用することにより）コア信号に直接的に、または（例えば、コア信号が求められる信号にダイナミックレンジ制限を適用することにより）間接的に、行われる。

前述の実施形態のさらなる展開において、符号化システムは、パラメトリックコーディングモードと離散コーディングモードで動作できる。デコーダ側でＤＲＣをイネーブルするため、エンコーダは、適用するデコーダ側ＤＲＣを定量化した一以上の前処理を求めるように構成されている。パラメータＤＲＣ１は離散コーディングモードで動作する。しかし、パラメトリックコーディングモードでは、パラメータＤＲＣ１は、パラメトリック分析ステージですでに行われたダイナミックレンジ制限を考慮するため、補償される。この圧縮プロセスの出力は、補償された後処理ＤＲＣパラメータＤＲＣ３を含む。本補償プロセスのガイド原理は、後処理ＤＲＣパラメータにより表されるデコーダ側ＤＲＣが、（パラメータＤＲＣ２により定量化される）パラメトリック分析ステージと、（補償された後処理ＤＲＣパラメータＤＲＣ３により定量化される）デコーダ側ＤＲＣとにより適用されるダイナミックレンジ制限の組み合わせと定量的に等価であることである。好ましくは、３つのパラメータタイプは、例えば対応する線形または対数単位を用いて、すべて互換性のあるスケールで表される。上記の単純なインプリメンテーションにおいて、各ＤＲＣパラメータ間の関係は（依然として対数スケールで）次の通りである：補償された後処理ＤＲＣパラメータがＤＲＣ１−ＤＲＣ２として求められる。

第２の態様のさらに別の一実施形態では、符号化方法は、次のステップを含む：
・時間ブロックにパーティションされたｎチャンネルオーディオ信号Ｘを受け取るステップ；
・ｍチャンネルコア信号Ｙと一以上のマルチチャンネルコーディングパラメータαとを生成し、一方、時間ブロックベースでダイナミックレンジ制限を行い、適用されたダイナミックレンジ制限を定量化した一以上の前処理ＤＲＣパラメータＤＲＣ２を生成するステップ；
・コア信号と、マルチチャンネルコーディングパラメータと、前処理ＤＲＣパラメータＤＲＣ２とを含むビットストリームＰを出力するステップ。

さらに別の実施形態では、上記の実施形態による復号方法または符号化方法を実行するコンピュータ実行可能命令を有するコンピュータ読み取り可能媒体を含むコンピュータプログラム製品を提供する。コンピュータプログラム製品は汎用コンピュータで実行できる。汎用コンピュータは必ずしも専用ハードウェアコンポーネントを含まない。

さらに別の実施形態では、本発明は、オーディオ信号の記憶または送信用のデータ構造を提供する。この構造は、ｍチャンネルコア信号Ｙと、一以上のミキシングパラメータαと、エンコーダ側ダイナミックレンジ制限を定量化した一以上の前処理ＤＲＣパラメータＤＲＣ２とを含む。この構造は、ダウンミックス信号チャンネルのｎチャンネル線形結合（及び場合によっては、非相関信号のチャンネルの線形結合）により（前記一以上のミキシングパラメータは、少なくともその線形結合のゲインを制御する）、及びエンコーダ側ダイナミックレンジ制限をキャンセルすることにより、復号をすることができる。具体的に、本発明は、上記データ構造により構成された情報を記憶するコンピュータ読み取り可能媒体を提供する。上記データ構造では、前処理ＤＲＣパラメータＤＲＣ２は、指数を表す３ビットフィールド及び仮数を表す４ビットフィールドとして符号化される。復号時、指数と仮数は結合され、ゲイン値に対応するスカラー値になる。あるいは、前処理ＤＲＣパラメータＤＲＣ２は、指数を表す２ビットフィールドと仮数を表す５ビットフィールドとして符号化される。

さらに別の実施形態は従属項に規定した。特筆しておくが、本発明は、相互に異なる請求項に記載されていたとしても、特徴のすべての組み合わせに関する。
ＩＩ．実施形態：符号化側
図１ａは、一般化したブロック図形式で、一実施形態によるデュアルモード符号化システム１を示す。ｎチャンネルオーディオ信号Ｘを、上部（これは符号化システム１の少なくとも一離散的コーディングモードでアクティブである）及び下部（これはシステム１の少なくともパラメトリックコーディングモードでアクティブである）の各々に供給する。

上部は、一般的に、離散モードＤＲＣアナライザ１０が符号化器１１と並列に配置され、両者は入力としてオーディオ信号Ｘを受ける。この信号に基づき、エンコーダ１１は符号化ｎチャンネル信号Ｘ〜（訳注：「〜」は「Ｘ」の上にある）を出力する。これに対し、ＤＲＣアナライザ１０は、適用される復号器側ＤＲＣを定量化する一以上の後処理ＤＲＣパラメータＤＲＣ１を出力する。両ユニット１０、１１からの並列出力は、離散モードマルチプレクサ１２により集められる。離散モードマルチプレクサ１２はビットストリームＰを出力する。

符号化システム１の下部は、パラメトリック分析ステージ２２がパラメトリックモードＤＲＣアナライザ２１と並列して配置され、パラメトリック分析ステージ２２としてｎチャンネルオーディオ信号Ｘを受け取る。パラメトリック分析ステージ２２は、ｎチャンネルオーディオ信号Ｘに基づき、一以上のマルチチャンネルコーディングパラメータ（集合的にαと記す）と、ｍチャンネル（１≦ｍ＜ｎ）コア信号Ｙとを出力する。ｍチャンネルコア信号Ｙは、次にコア信号符号化器２３により処理される。コア信号符号化器２３は、ｍチャンネルコア信号Ｙに基づき、符号化コア信号Ｙ〜（訳注：「〜」は「Ｙ」の上にある）を出力する。「ｇ↓」との表記で示したように、パラメトリック分析ステージ２２は、必要に応じて、時間ブロックにおける動的範囲制限を行う。動的範囲制限をいつ適用するか制御する可能性のある条件は、「ノンクリップ（ｎｏｎ−ｃｌｉｐ）条件」または「インレンジ（ｉｎ−ｒａｎｇｅ）条件」であり、これらはコア信号の振幅が大きい時間セグメントにおいて、信号が確定された範囲内に入るように信号が処理される。この条件は一時間ブロックまたは複数の時間ブロックよりなる一時間フレームに基づき実施される。好ましくは、この条件は、ピーク値のみを切り捨てたり同様のアプローチを用いるのではなく、ブロードスペクトル・ゲイン低減を用いることにより、実施される。本技術分野においてそれ自体周知であるように、ある複数の時間ブロックのみで制限が必要な場合、その制限を徐々にかけて及び／または無くしていくなどのように、一時的なダイナミックレンジ制限操作を気づきにくいようにレンダリングする手法がある。特に、システム１はＤＲＣパラメータをスムース化するように構成されたフィードバックループ（図示せず）を含んでいてもよい。例えば、出力する現在のパラメータ値は、前のセグメントのパラメータ値の一部０＜ａ＜１と、現在のセグメントの「ノンクリップ条件」の実施の結果であるパラメータ値の一部（１−ａ）との和として得られる。処理後ＤＲＣパラメータＤＲＣ１と、処理前ＤＲＣパラメータＤＲＣ２とは、もちろん、独立にスムース化され、異なる定数ａが使われる。

図５は、パラメトリック分析ステージ２２の可能性のあるインプリメンテーションを示し、これはプリプロセッサ５２７とパラメトリック分析プロセッサ５２８とを含む。プリプロセッサ５２７は、ｎチャンネル信号Ｘに動的レンジ制限を行う役割を有し、それによりダイナミックレンジ制限ｎチャンネル信号Ｘｃを出力する。信号Ｘｃはパラメトリック分析プロセッサ５２８に供給される。プリプロセッサ５２７は、さらに、処理前ＤＲＣパラメータＤＲＣ２のブロックまたはフレームの値を出力する。パラメータＤＲＣ２は、マルチチャンネルコーディングパラメータαとパラメトリック分析プロセッサ５２８からのｍチャンネルコア信号Ｙとともに、パラメトリック分析ステージ２２からの出力に含まれる。

再び図１ａを参照して、離散モードＤＲＣアナライザ１０は、用いられる復号器側を定業かする一以上の後処理ＤＲＣパラメータＤＲＣ１を出力する点で、パラメトリックモードＤＲＣアナライザ２１と同様に機能する。しかし、パラメトリックモードＤＲＣアナライザ２１により供給されるパラメータＤＲＣ１は、パラメトリックコーディングモードのビットストリームには含まれないが、パラメトリック分析ステージ２２により行われるダイナミックレンジ制限が考慮されるように補償を受ける。この目的のため、ＤＲＣアップ補償器２４は後処理ＤＲＣパラメータＤＲＣ１と前処理ＤＲＣパラメータＤＲＣ２とを受け取る。各時間ブロックについて、ＤＲＣアップ補償器２４は、一以上の補償後後処理ＤＲＣパラメータＤＲＣ３の値を求める。これは、補償された後処理ＤＲＣパラメータＤＲＣ３と前処理ＤＲＣパラメータＤＲＣ２を組み合わせたアクション（ｃｏｍｂｉｎｅｄａｃｔｉｏｎ）が後処理ＤＲＣパラメータＤＲＣ１により定量化されたＤＲＣと定量的に等しいようになっている。言い方を変えると、ＤＲＣアップ補償器２４は、ＤＲＣアナライザ２１により出力される後処理ＤＲＣパラメータを、すでにパラメトリック分析ステージ２２により行われている分だけ（もしあれば）、低減するように構成されている。ビットストリームに含まれるべきものは、補償された後処理ＤＲＣパラメータＤＲＣ３である。引き続きシステム１の下部を参照して、パラメータモードマルチプレクサ２５は、補償された後処理ＤＲＣパラメータＤＲＣ３、前処理ＤＲＣパラメータＤＲＣ２、マルチチャンネルコーディングパラメータα及び符号化コア信号Ｙ〜（訳注：「〜」は「Ｙ」の上にある、以下同様）を集めて、それらに基づきビットストリームＰを形成する。可能性のあるインプリメンテーションにおいて、補償された後処理ＤＲＣパラメータＤＲＣ３と前処理ＤＲＣパラメータＤＲＣ２は、復号器側で振幅のアップスケーリングまたはダウンスケーリングに影響するｄＢ値として、対数形式で符号かされる。補償された後処理ＤＲＣパラメータＤＲＣ３の符号は任意の符号を有する。しかし、前処理ＤＲＣパラメータＤＲＣ２は、「ノンクリップ条件」等の実施の結果であり、いつでも非負ｄＢにより表される。

符号化システム１の上部と下部の両方に共通して、セレクタ２６（ハードウェアまたはソフトウェアでインプリメントされた任意の信号選択手段を記号化している）は、実際のコーディングモードに応じて、符号化システム１の上部または下部からのビットストリームが符号化システム１からの最終的出力を構成するか、判断する。同様に、システム１の入力側には、オーディオ信号Ｘをシステム１の上部または下部のどちらかに向けるスイッチ（図１ａには図示せず）が設けられている。入力側スイッチは出力側スイッチ２６と対応して起動され得る。

図１ａ及び以下に説明する図を参照して、ビットストリームＰはドルビーデジタルプラス（ＤＤ＋またはＥ−ＡＣ−３、エンハンストＡＣ−３）に即したフォーマットで符号化できる。ビットストリームは少なくともメタデータフィールドｄｙｎｒｎｇ及びｃｏｍｐｒを含む。ＤＤ＋の一仕様によれば、ｄｙｎｒｎｇは一時間ブロックの分解能を有し、他方ｃｏｍｐｒは一フレームの分解能を有する。一フレームは４ないし６の時間ブロックを有する。これらのメタデータフィールドの重要性に関して、上で定義した後処理ＤＲＣパラメータＤＲＣ１は、例えば、「強い圧縮（ｈｅａｖｙｃｏｍｐｒｅｓｓｉｏｎ）」が起動されているかに応じて、モノフォニックダウンミックスがあるピークレベルを超えないことを保証する方法で機能するｄｙｎｒｎｇまたはｃｏｍｐｒのどちらかに対応する。通常の環境では、ｄｙｎｒｎｇとｃｏｍｐｒフィールドの両方とも送信され、どちらを使うか決定するのは復号器の問題である。よって、後処理ＤＲＣパラメータＤＲＣ１は、ブロックの分解能かフレームの分解能かのいずれかを有するが、フォーマットのレガシー部分で送信でき、レガシーな復号器により理解される。しかし、前処理ＤＲＣパラメータＤＲＣ２は、ＤＤ＋フォーマット中に対応するものが無く、好ましくは新しいメタデータフィールドに符号化される。前処理ＤＲＣパラメータＤＲＣ２は、信号が５．１フォーマット（ｎ＝６）からステレオフォーマット（ｍ＝２）にダウンミックスされたとき、信号がクリップされないことを保証するｄｙｎｒｎｇ及び／またはｃｏｍｐｒの部分に関することが思い起こされる。保証された後処理ＤＲＣパラメータＤＲＣ３は、前処理ＤＲＣパラメータＤＲＣ２により定量化されたクリップ防止を推論することによりｄｙｎｒｎｇまたはｃｏｍｐｒ値を補償した後の結果である；それゆえＤＤ＋ビットストリーム中のｄｙｎｒｎｇまたはｃｏｍｐｒフィールドで送信される。

前処理ＤＲＣパラメータＤＲＣ２の新しいメタデータフィールドは７ビット（ｘｘｙｙｙｙｙ）あり、ｘの位置にあるビットは［０，３］の整数を表し、ｙの位置にあるビットは［０，３１］の整数を表す。前処理ＤＲＣパラメータＤＲＣ２はゲインファクタ

として得られる。

さらに別のＤＤ＋フォーマットのメタデータパラメータはｄｉａｌｎｏｒｍである。これはコンテンツの（場合によっては時間平均した）ラウドネスレベルである。実施形態では、ターゲット出力参照レベルＬＴは、場合によってはユーザにより制御される、復号器構成における設定である。ターゲット出力参照レベルＬＴを実現するため、復号システムは、差異ｄｉａｌｎｏｒｍ−ＬＴにより定量化される静的な減衰を適用する。適用する総減衰を求めるため、復号システムは、この差異を、（補償されていない）後処理ＤＲＣパラメータＤＲＣ１により、または補償された後処理ＤＲＣパラメータＤＲＣ３により、または後処理ＤＲＣパラメータの一部ｆ×ＤＲＣ１として表されるターゲットＤＲＣにより、規定される追加的減衰だけ増加させる。これにより、それぞれｄｉａｌｎｏｒｍ−_Ｔ＋ＤＲＣ１またはｄｉａｌｎｏｒｍ−Ｌ_Ｔ＋ＤＲＣ３またはｄｉａｌｎｏｒｍ−_Ｔ＋ｆ×ＤＲＣ１が得られる。これらの３つの線形結合の一つが正符号であれば、総減衰の非ゼロ量を復号システムに適用し、負符号であれば、信号は効果的にブーストされる。

図７は、さらに別の一実施形態による、図１ａに示した符号化システム１と同様に機能する符号化システム７０１を示す。同様の参照記号を用い、信号に関する表記は図１ａと一貫しているので、符号化システム７０１の動作原理の詳細な説明は必要ないと思われる。しかし、重要な差異の１つは、１つのＤＲＣアナライザ７２１が、図１ａの離散モードＤＲＣアナライザ１０とパラメトリックモードＤＲＣアナライザ２１の両方のタスクを満たすことである。この目的のため、ＤＲＣアナライザ７２１は、符号化システム７０１により符号化されるｎチャンネルオーディオ信号Ｘを受け取る。ＤＲＣアナライザ７２１は、ｎチャンネルオーディオ信号Ｘに基づき生成される後処理ＤＲＣパラメータＤＲＣ１を、離散モードマルチプレクサ７１２とＤＲＣアップ補償器７２４との両方に供給する。ＤＲＣアップ補償器７２４は、図１ａの符号化システム１のＤＲＣアップ補償器２４と機能的に等価である。

図３は、符号化システム３０１を示す。これは後処理ＤＲＣパラメータを出力として生成しないという限りにおいて、図１ａに示したものより比較的単純である。それため、符号化システム３０１により生成されるビットストリームＰを受信する復号器は、必ずしもダイナミックレンジ圧縮を行えなくてもよい。しかし、かかる復号器は、符号化システム３０１により適用されたダイナミックレンジ制限をキャンセルすることができる。典型的には、これは、ｎチャンネルオーディオ信号Ｘが比較的高い振幅ピークを含む時間ブロックのダイナミックレンジを大きくすることである。

図３において、符号化システム３０１の上部は、符号化システム３０１の少なくとも離散コーディングモードにおいてアクティブであり、システム３０１により符号化されるｎチャンネル信号Ｘに基づき符号化されたｎチャンネル信号Ｘ^〜（訳注：「〜」は「Ｘ」の上にある）を提供するように構成された符号化器３１１以外を含む必要はない。下部は、離散コーディングモードに対応し、図１ａに示した符号化システムのアナログ部分より少ないコンポーネントしか含まず、すなわちｎチャンネルオーディオ信号Ｘに基づき、前処理ＤＲＣパラメータＤＲＣ２、マルチチャンネルコーディングパラメータα及びｍチャンネルコア信号Ｙを出力するパラメータ分析ステージ３２２しか含まない。コア信号Ｙがコア信号エンコーダ３２３（コア信号Ｙを符号化コア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）に変換する）で処理された後、パラメトリック分析ステージ３２２からの出力セットはパラメトリックモードマルチプレクサ３２５により合成されビットストリームＰになる。符号化システム３０１の上部及び下部の両方の下流に配置されたセレクタ３２６は、符号化システム３０１の現在のコーディングモードに応じて、上部と下部のどちらかにより生成されたビットストリームを出力する役割を果たす。

図１０に示す符号化システム１００１ではさらなる単純化を示す。この符号化システム１００１は、さらに符号化操作を行わなくても記憶や伝送に適するフォーマットであるｎチャンネルオーディオ信号Ｘを処理するように構成されている。それゆえ、離散コーディングモードでは、図１０に示したセレクタ１０２６の位置により示されるように、オーディオ信号Ｘは別段の処理をされずに符号化システム１００１から出力される。パラメトリックコーディングモードでは、パラメトリック分析ステージ１０２２がｎチャンネルオーディオ信号Ｘを分析して、前処理ＤＲＣパラメータＤＲＣ２、マルチチャンネルコーディングパラメータα及びｍチャンネルコア信号Ｙを出力する。上記の通り、パラメトリック分析ステージ１０２２は、ｎチャンネルオーディオ信号が伝送や記憶に適したフォーマットである場合にも、そのｎチャンネルオーディオ信号に作用するように構成されている。図１０の符号化システム１００１では、コア信号Ｙは、伝送または記憶ができるフォーマットであり、パラメトリックコーディングモードでは、この信号が、マルチチャンネルコーディングパラメータα及びパラメータＤＲＣ２とともに、パラメトリックモードマルチプレクサ１０２５により合成され、ビットストリームとなり、符号化システム１００１から出力される。

図１ｂは、一実施形態によるシングルモード符号化システムを示す。ｎチャンネルオーディオ信号ＸはＤＲＣアナライザ２１とパラメトリック分析ステージ２２と（両者は並列に配置されている）に提供される。パラメトリック分析ステージ２２は、ｎチャンネルオーディオ信号Ｘに基づき、一以上のマルチチャンネルコーディングパラメータ（集合的にαと記す）と、ｍチャンネル（１≦ｍ＜ｎ）コア信号Ｙとを出力する。ｍチャンネルコア信号Ｙは、次にコア信号符号化器２３により処理される。コア信号符号化器２３は、ｍチャンネルコア信号Ｙに基づき、符号化コア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）を出力する。パラメトリック分析ステージ２２は、ダイナミックレンジ制限を、これが必要な時間ブロックに作用させる。ＤＲＣアップ補償器２４は、後処理ＤＲＣパラメータＤＲＣ１と前処理ＤＲＣパラメータＤＲＣ２とを受け取る。各時間ブロックについて（この例では、後処理ＤＲＣパラメータＤＲＣ１の値が生成される分解能が１つの時間ブロックである）、ＤＲＣアップ補償器２４は、一以上の補償された後処理ＤＲＣパラメータＤＲＣ３の値を求める。これは、補償された後処理ＤＲＣパラメータＤＲＣ３と前処理ＤＲＣパラメータＤＲＣ２の合成動作が、後処理ＤＲＣパラメータＤＲＣ１により定量化されるＤＲＣと量的に等しくなるようなものである。

図８は、図１と図７のＤＲＣアップ補償器２４、７２４の可能性のある機能をより詳細に示している。各ＤＲＣアップ補償器２４、７２４は、前処理ＤＲＣパラメータＤＲＣ２と後処理ＤＲＣパラメータＤＲＣ１とに基づいて、補償された後処理ＤＲＣパラメータＤＲＣ３を生成するように構成されている。各バーは信号の時間フレームを示す。毎回、フレームは前処理ＤＲＣパラメータＤＲＣ２の値及び後処理ＤＲＣパラメータＤＲＣ１の値と関連づけられる。図８及び９では、これらは負の符号を有するｄＢＦＳ単位である。凡例が示すように、実線は後処理ＤＲＣパラメータＤＲＣ１を示し、その他の２つのＤＲＣパラメータ値婦は異なる網掛けパターンに対応している。補償された後処理ＤＲＣパラメータＤＲＣ３の各値は、前処理ＤＲＣパラメータＤＲＣ２と補償された後処理ＤＲＣパラメータＤＲＣ３との合成動作が、後処理ＤＲＣパラメータＤＲＣ１により表されるデコーダ側ＤＲＣに定量的に等しいとの条件に基づいて生成される。図８と図９は単純化されており、具体的なアプローチ（すなわち、上記のＣａｒｒｏｌｌ及びＲｉｅｄｍｉｌｌｅｒの論文）によるＤＲＣの効果はスカラー、すなわち線形量により忠実にしめされていない。図８と図９は、ＤＲＣパラメータがスカラーとして符号化された上記の単純化された実施形態の完全なピクチャを示しているだろう。

図８は、後処理ＤＲＣパラメータＤＲＣ１が、上記の通り、ＤＤ＋フォーマットのｃｏｍｐｒパラメータと同様に、各時間フレーム内で一定である状態を示す。必ずしもこういう場合だけではない。例えば、レガシータイプのＤＲＣアナライザは、一定数のｐ１時間ブロックを有するセグメントを分析するように構成されている。ここで、ｐ１は、一般的に番組（例えば、ラジオ番組の歌、トラック、エピソード）全体中にある時間ブロックの数より大幅に少ない４、６、８、１６、２４、３２、６４その他の整数に等しい。この数ｐ１は、前処理ＤＲＣパラメータの各アップデート間のフレームの数ｐ２とは一致してもしなくてもよい。図８は、ｐ１＝６かつｐ２＝６である具体的な場合を示す。好ましくは、後処理ＤＲＣパラメータＤＲＣ１が、オーディオ信号Ｘの少なくとも１秒に一回ずつ、より好ましくはオーディオ信号Ｘの１秒に数十ないし数百回ずつ、再評価されるのに十分なくらい小さい。

図９は、ＤＤ＋フォーマットのｄｙｎｒｎｇパラメータと同様に、ｐ１＝１の場合を示す。しかし、パラメトリック分析ステージ２２、７２２のダイナミックレンジ制限は一度にｐ２＝６つの時間ブロックに基づいて行われ、６時間ブロックごとに前処理ＤＲＣパラメータＤＲＣ２の新しい値が生成されるようになっている。細い各バーは一時間ブロックを表す。アップ補償器２４、７２４は、後処理ＤＲＣパラメータＤＲＣ１により表される復号器側ＤＲＣが、各時間ブロックにわたる各パラメータ分析ステージ２２、７２２により適用されるダイナミックレンジ制限と、補償された後処理ＤＲＣパラメータＤＲＣ３により数量化された復号器側ＤＲＣとの組み合わせに数量的に等しいように、補償された後処理ＤＲＣパラメータＤＲＣ３の各値を決定するように構成されている。
ＩＩＩ．実施形態：復号器側
図２ａは、ビットストリームＰに基づきｎチャンネルオーディオ信号を再構成するシングルモード復号システム５１を示す。ビットストリームＰは、符号化コア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）、マルチチャンネルコーディングパラメータα、前処理ＤＲＣパラメータＤＲＣ２、及び補償された後処理ＤＲＣパラメータＤＲＣ３を含み、これらの量は復号システム５１の入力に配置されたデマルチプレクサ７０により、ビットストリームから抽出される。コア信号復号器７１は、符号化コア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）を受信し、それに基づき、ｍチャンネルコア信号Ｙ（１≦ｍ≦ｎ）を出力する。復号に関して、コア信号復号器７１は、さらに、復号された後処理ＤＲＣパラメータＤＲＣ３により数量化されたＤＲＣを実行する。コア信号復号器７１は、補償された後処理ＤＲＣパラメータＤＲＣ３またはその一部分により表されるフルＤＲＣを生じさせるように動作する。この決定は、ユーザによりマニュアル制御されてもよいし、再生機器の特性の検出に基づいてもよい。コア信号デコーダ７１の下流には、ＤＲＣプロセッサ７４が配置され、ｇ↑との表示が示すように、前処理ＤＲＣパラメータＤＲＣ２で定量化されている、符号化器側で科されたダイナミックレンジ制限をキャンセルすることにより、コア信号のダイナミックレンジを回復する。ＤＲＣプロセッサ７４は、中間信号ＹＣを出力する。これは、ダイナミックレンジを除けばコア信号Ｙと同じであり、パラメトリック合成段階７２に入力される。パラメトリック合成ステージ７２は、中間信号ＹＣ中のｍチャンネルのｎチャンネル線形結合を形成し（適用されるゲインはマルチチャンネルコーディングパラメータαにより制御される）、再構成されたｎチャンネルオーディオ信号Ｘを出力する。パラメトリック合成ステージ７２の線形結合は、中間信号ＹＣまたはコア信号Ｙから得られる非相関信号（ｄｅｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌ）をさらに含む。非相関信号は、さらにアーティファクト減衰などの非線形処理をされる。非相関信号は、コア信号修正ユニットまたはデコリレータ（ｄｅｃｏｒｒｅｌａｔｏｒ）（図示せず）で生成され得る。概要を上記した単純な実施形態では、符号化器側で科されたダイナミックレンジ制限のＤＲＣプロセッサ７４におけるキャンセレーションは、信号を広いスペクトル範囲で、前処理ダイナミックレンジ制限を定量化するパラメータＤＲＣ２の逆数に対応する係数だけスケーリングするということになる。

図２ｂは、復号システム５１を示す。これは図２ａの復号システムより少し進化したものである。本復号システム５１には、ＤＲＣプリプロセッサ７７が設けられている。これはコア信号復号器７１とＤＲＣプロセッサ７４のＤＲＣ関係の動作をそれぞれ調整する。一方で、コア信号デコーダ７１は、信号のダイナミックレンジを、補償された後処理ＤＲＣパラメータＤＲＣ３により確定される限度まで圧縮し、またはダイナミックレンジを圧縮するように動作可能である。他方、ＤＲＣプロセッサ７４は、ダイナミックレンジを完全に符号化前のレベルまで、または部分的に、大きくするように動作可能である。この設定により、一般的には、コア信号デコーダ７１とＤＲＣプロセッサ７４の一方のみのＤＲＣ処理をアクティブにすることにより、ある目標ＤＲＣレベルを達成可能である。補償された後処理ＤＲＣパラメータＤＲＣ３がダイナミックレンジ圧縮を示す場合、両方のユニットを同時に動作させることは、ある程度の相互的反作用（ｍｕｔｕａｌｃｏｕｎｔｅｒ−ａｃｔｉｏｎ）（相互キャンセレーション）があることを示唆し、これは出力の品質に負のインパクトを与えるおそれがある。

ＤＲＣプリプロセッサ７７は、前処理ＤＲＣパラメータＤＲＣ２と、補償された後処理ＤＲＣパラメータＤＲＣ３との両方を受け取る。ＤＲＣプリプロセッサ７７は、さらに、所定のまたは可変の（例えば、ユーザ指定の）ＤＲＣ目標レベルにアクセスできる。これは、パラメータｆ（例えば、ｆ×ＤＲＣ１）と、ＤＲＣ２から得られる元のダイナミックレンジに対応する信号の入力ＤＲＣレベルにより表される。ＤＲＣプリプロセッサ７７は、２つのＤＲＣレベルの比較に基づいて、コア信号デコーダ７１におけるダイナミックレンジ圧縮により、またはＤＲＣプロセッサ７４におけるダイナミックレンジのブースティング（ｂｏｏｓｔｉｎｇ）により、ＤＲＣ目標レベルが達成できるか、決定する。この目的のため、ＤＲＣプリプロセッサ７７は、復号された制御信号ｋ_７１、ｋ_７４を出力する。これらはコア信号デコーダ７１とＤＲＣプロセッサ７４のそれぞれに供給される。

ＤＲＣプリプロセッサ７７からコア信号デコーダ７１とＤＲＣプロセッサ７４に供給される制御信号ｋ_７１、ｋ_７４の振る舞いをここで説明する。第１の制御信号ｋ_７１は、補償された後処理ＤＲＣパラメータＤＲＣ３により定量化されたデコーダ側ＤＲＣのどれだけがコア信号デコーダ７１により適用されるか制御する。前述の単純な実施形態では、結果である相対的ゲイン変化は、係数

により与えられ、最大値ｋ_７１＝１が最大ダイナミックレンジ圧縮に対応し、一方最小信号値はダイナミックレンジ圧縮が無いことに対応するようになっている。第２の制御信号ｋ７４は、ＤＲＣプロセッサ７４がエンコーダ側ダイナミックレンジ制限をキャンセルする程度を制御する。上記の単純な実施形態では、ＤＲＣ７４はゲインを係数

だけ変更する。ここで、最小値ｋ_７４＝０はキャンセレーションしないことに対応し、最大値は完全にキャンセレーションして、元のダイナミックレンジを１００％回復することに対応する。ＤＲＣプリプロセッサ７７は、量ＤＲＣ２により低減（または圧縮）された元のダイナミックレンジとして理解される入力ＤＲＣレベルに関してダイナミックレンジブーストまたはダイナミックレンジ圧縮に対応するかどうかに応じて、目標ＤＲＣレベルを実行するように構成されている。さらにまた、ＤＲＣプリプロセッサ７７は、前処理ＤＲＣパラメータＤＲＣ２の一部または補償された後処理ＤＲＣパラメータＤＲＣ３に対応する、目標ＤＲＣレベルを達成するために、最小値と最大値との間を補間するように構成されている。補間を用いて、補償されていない後処理ＤＲＣパラメータＤＲＣ１の一部として表された目標ＤＲＣレベルを達成することもできる。ＤＲＣ２とＤＲＣ３の各部分は、パラメータｆとＤＲＣ１とに基づいて計算できる。下記を参照されたい。前記の単純な実施形態の場合、ＤＲＣプリプロセッサ７７が、後処理ＤＲＣパラメータＤＲＣ１の一部（ｆｒａｃｔｉｏｎ）ｆとして、ある目標ＤＲＣレベルにどう反応するかをここで説明する。前の段落の説明を考慮して、ＤＲＣプリプロセッサ７７は、区間［０，１］の値を次式中のパラメータｋ_７１、ｋ_７４に割り当てる。

ｆ×ＤＲＣ１＝ｋ_７４×ＤＲＣ２＋ｋ_７１×ＤＲＣ３
ここで、ｆ∈［０，１］は予め決まっており、ＤＲＣ２＞０かつＤＲＣ１＝ＤＲＣ２＋ＤＲＣ３（対数スケール）である。上記から、ＤＲＣ１とＤＲＣ３は正でも負でもよいことがわかる。上記の通り、コア信号デコーダ７１の動作がレンジコンパクティング（ｒａｎｇｅｃｏｍｐａｃｔｉｎｇ）（ＤＲＣ３＝ｙ＞０）である場合、コア信号デコーダ７１とＤＲＣプロセッサ７４との両方を動作させることを回避することが望ましい。これは、ｋ_７１＝０またはｋ_７４＝０の場合に上記の方程式を解くことになる。

さらに可能性のある表現は、ラウドネス依存ゲイン係数であり、場合によっては対数スケールである。例えば、一組のゲイン係数がダイアローグレベル（ｄｉａｌｏｇｕｅｌｅｖｅｌ）とともに送信される。ダイアローグレベルよりうるさい時間セグメントには第１のゲイン係数が適用され、一方、静かな時間セグメントには第２のゲイン係数が適用される。これにより、ダイナミックレンジ圧縮と拡張が可能となる。第１と第２のゲイン係数は互いに従属した値を割り当てることができるからである。

図２ｃは、デュアルモード復号システム５１を示す。これは、パラメトリックにコード化されたか、または直接コード化されているオーディオ信号を含むビットストリームＰを受け取るように構成されている。復号システム５１のパラメトリックモードでは、パラメトリックモードデマルチプレクサ７０の下流上部はアクティブであり、図２ａに示したシステムの機能と同様に、チャンネルオーディオ信号Ｘを提供する。離散モードでは、ビットストリームＰが、符号化ｎチャンネル信号Ｘ^〜（訳注：「〜」は「Ｘ」の上にある）と一以上の後処理ＤＲＣパラメータＤＲＣ１を抽出する、離散モードデマルチプレクサ６０に供給される。復号システム５１の入力側及び出力側の（任意のハードウェアまたはソフトウェアで実施される信号選択手段を記号化した）セレクタ５２、８２は、現在のモードにより動作する。セレクタは共に動作して、両者が常に上側位置または下側位置にあるようにしてもよい。離散モードでは、符号化されたｎチャンネル信号Ｘ^〜（訳注：「〜」は「Ｘ」の上にある）がデコーダ６１により処理される。デコーダ６１は、後処理ＤＲＣパラメータＤＲＣ１によりＤＲＣを実行することができる。離散コーディングモードとパラメトリックコーディングモードとの間のダイアローグレベルの一貫性は、復号システム５１が、パラメトリックモードにおいて、（補償されていない）後処理ＤＲＣパラメータＤＲＣ１の替わりに補償された後処理ＤＲＣパラメータＤＲＣ３を用いるように構成されていることにより確保される。パラメータＤＲＣ１とＤＲＣ３との間の関係は前述した。

図４は、単純化された復号システム４５１を示す一般化ブロック図である。この単純化された復号システム４５１は後処理ＤＲＣを行う機能はない。しかし、図４の復号システム４５１は、前処理ＤＲＣパラメータＤＲＣ２により定量化された、エンコーダ側で適用されたダイナミックレンジ制限をキャンセルするように動作可能である。より正確には、パラメトリック合成ステージ４７２は、シンボルｇ↑が示すように、このダイナミックレンジ制限を完全にまたは部分的にキャンセルするように構成されている。

図１１と図１２は、図４に示すパラメトリック合成ステージ４７２の可能性のある２つのインプリメンテーションを示している。図１３に示したタイプの符号化システムでも、同様のインプリメンテーションも有用である。これについては後でさらに説明する。可能性のある第１のインプリメンテーションにおいて、図１１に示したように、プリコンディショナ１１７４は、ｍチャンネルコア信号Ｙに対してダイナミックレンジ制限キャンセレーションを行い、それによりｍチャンネル中間信号ＹＣが得られる。中間信号ＹＣはパラメトリック合成プロセッサ１１７５において処理される。これは中間信号ＹＣ中のチャンネルの線形結合を（及び、場合によっては追加的な非相関信号を）形成する。ここで、線形結合に適用されるゲインは、マルチチャンネルコーディングパラメータαにより制御可能である。これもパラメトリック合成プロセッサ１１７５に供給される。

図１２に示された第２のインプリメンテーションは、これの代替物を表している。第２のインプリメンテーションにおいて、パラメトリック合成は、処理ステップとして、ダイナミックレンジ制限キャンセレーションより前にある。この事実は、パラメトリック合成プロセッサ１２７５がポストコンディショナ１２７６の上流に配置されていることから明らかである。前処理ＤＲＣパラメータＤＲＣ２により定量化された、エンコーダ側ダイナミックレンジ制限のキャンセルの役割を果たすのはポストコンディショナ１２７６である。よって、パラメトリック合成プロセッサ１２７５からポストコンディショナ１２７６に供給される信号は、ダイナミックレンジが制限されたｎチャンネル信号ＸＣに関する。

図１３は、さらに別の実施形態による、復号システム１３５１を示す。デコーダ側ＤＲＣは、システム１３５１の離散モード部分とパラメトリックモード部分との両方の下流に配置されたＤＲＣプロセッサ１３８３により影響を受ける。図２ａ、２ｂ、２ｃ及び４を参照して説明した復号システムのように、本復号システム１３５１は、後処理ＤＲＣパラメータＤＲＣ２により定量化された、エンコーダ側に適用されたダイナミックレンジ制限をキャンセルすることもできる。ＤＲＣプロセッサ１３８３は、（補償されていない）後処理ＤＲＣパラメータＤＲＣ１が受信ビットストリームＰに含まれる離散コーディングモードと、補償された後処理ＤＲＣパラメータＤＲＣ３が受信されるパラメトリックコーディングモードとの両方で機能するものである。留意点として、復号システム１３５１は、後処理ＤＲＣがｎチャンネル出力信号に、すなわちパラメトリック合成ステージ１３７２の下流に作用する点で、図２ｂに示したシステム５１とは異なる。図２ｂのシステム５１において、対応する動作がコア信号デコーダ７１で起こる。

ＤＲＣプロセッサ１３８３は、ユーザ、メモリ、再生装置で実行されたハードウェア診断、またはその他の外部または内部データソースから目標ＤＲＣレベルを受け取る。例えば、目標ＤＲＣレベルｆは、ユーザが復号システム１３５１により作用されることを欲するフル後処理ＤＲＣの一部分を表す。図から分かるように、復号システム１３５１の構造は、パラメータｆの値を考慮するのにＤＲＣプロセッサ１３８３のみが必要であるという利点を有する。これにより部分的なＤＲＣのインプリメンテーションが便利になる。この目的のため、補償された後処理ＤＲＣパラメータＤＲＣ３を（補償されていない）後処理ＤＲＣパラメータＤＲＣ１のスケールに変換するように構成されている。実際、パラメトリック合成ステージ１３７２から出力されるｎチャンネルオーディオ信号Ｘ（訳注：「〜」は「Ｘ」の受けにある）は、エンコーダ側ダイナミックレンジ制限のキャンセレーションを行う。よって、補償された後処理ＤＲＣパラメータＤＲＣ３に基づくＤＲＣを適用することは、過小なレンジ圧縮を含んでいる。このシナリオを未然に防ぐため、ＤＲＣダウン補償器１３７３は、前処理ＤＲＣパラメータＤＲＣ２に基づき、補償された後処理ＤＲＣパラメータＤＲＣ３を回復し、それにより、パラメトリックコーディングモードでは、回復された後処理ＤＲＣパラメータが得られ、ＤＲＣプロセッサ１３８３に供給される。前述の通り、回復されたＤＲＣパラメータにより表されるデコーダ側ＤＲＣは、図８と図９により示唆されているように、すでにコア信号に課されているエンコーダ側ダイナミックレンジ制限と、補償された後処理ＤＲＣパラメータＤＲＣ３により表されるデコーダ側ＤＲＣとの組み合わせと数量的に等しい。

別の一実施形態では、復号システム１３５１は、離散モードデマルチプレクサ１３６０とデコーダ１３６１無しでインプリメントされる。図１３のＤＲＣパラメータセレクタ１３８１、１３８２は、ＤＲＣプロセッサ１３８３と、（回復された後処理ＤＲＣパラメータが受け取られる）ＤＲＣダウン補償器１３７３及び（ｎチャンネルオーディオ信号Ｘを供給する）パラメトリック合成ステージ１３７２のそれぞれとの間の接続により置き換えられる。この代替的実施形態は、シングルパラメトリック復号モードで動作するという点で、単純化されている。さらに、レガシータイプＤＲＣプロセッサ１３８３であって、必ずしも補償された後処理ＤＲＣパラメータを処理するように構成されていないものを使うことができるので、インプリメントが単純である。

図６は、受け取ったビットストリームＰをｍチャンネルオーディオ信号に復号するレガシー復号システム６５１を示す。パラメトリックコーディングモードでは、パラメータモードデマルチプレクサ６７０の下流にある上部は、アクティブであり、符号化されたｍチャンネルコア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）及び補償された後処理ＤＲＣパラメータＤＲＣ３を出力する。符号化されたｍチャンネルコア信号Ｙ^〜（訳注：「〜」は「Ｙ」の上にある）は、第１のデコーダ６７１により、ｍチャンネルコア信号Ｙに復号される。離散コーディングモードでは、出力されるオーディオ信号は、離散モードデマルチプレクサ６６０の下流に位置する下部により生成される。離散モードデマルチプレクサ６６０は、ビットストリームＰから、符号化されたｎチャンネル信号Ｘ^〜（訳注：「〜」は「Ｘ」の上にある）及び（補償されていない）後処理ＤＲＣパラメータＤＲＣ１を抽出する。符号化ｎチャンネル信号Ｘ^〜（訳注：「〜」は「Ｘ」の上にある）は、第２のデコーダ６６１により復号され、ダウンミックスステージ６６２において、ｍチャンネル信号Ｙにダウンミックスされる。この信号Ｙと、パラメトリックモードに関して述べた信号Ｙとは両方とも、両モードに共通のＤＲＣプロセッサ６８３に供給される。パラメトリックモードでは、ＤＲＣプロセッサ６８３の定量的特性は、補償された後処理ＤＲＣパラメータＤＲＣ３により制御される。一方、離散モードでは、これらの特性は（補償されていない）後処理ＤＲＣパラメータＤＲＣ１により制御される。このように、復号システム６５１から出力されるｍチャンネルオーディオ信号のダイアローグレベルの一貫性を維持できる。留意点として、本復号システム６５１はレガシータイプである。補償された後処理ＤＲＣパラメータと補償されていないものとを、同じでなければ、同様に扱うからである。

ＩＶ．図面中の参照記号

Ｖ．等価物、拡張、変更その他
本発明のさらなる実施形態は、上記の説明を読めば、当業者には明らかになるだろう。本明細書と図面は実施形態と実施例を開示しているが、本発明はこれらの具体的な例に制約されない。添付した特許請求の範囲で規定した本発明の範囲から逸脱することなく、多数の修正や変形をすることができる。請求項に現れる参照符号は、その範囲を限定するものと考えてはいけない。

ここに開示したシステムと方法は、ソフトウェア、ファームウェア、ハードウェアまたはこれらの組み合わせとして実施できる。ハードウェアインプリメンテーションでは、上記の説明で参照した機能ユニット間のタスクの分け方は、物理的ユニットへの分け方と必ずしも一致しない。

逆に、１つの物理的コンポーネントが複数の機能を有し、１つのタスクが複数の物理的コンポーネントにより協力して実行される。一部または全部のコンポーネントは、デジタルシグナルプロセッサやマイクロプロセッサにより実行されるソフトウェアとして実施でき、またはハードウェアまたは特定目的集積回路として実施できる。かかるソフトウェアは、コンピュータ読み取り可能媒体で配布可能である。コンピュータ読み取り可能媒体は、コンピュータ記憶媒体（すなわち非一時的媒体）と通信媒体（すなわち一時的媒体）とを含む。当業者には周知だが、コンピュータ記憶媒体という用語には、コンピュータ読み取り可能命令、データ構造、プログラムモジュールその他のデータなどの情報を記憶するための任意の方法や技術で実施された、揮発性および不揮発性、取り外し可能および取り外し不可能媒体を含む。コンピュータ記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリその他のメモリ技術、ＣＤ−ＲＯＭ、デジタルバーサタイルディスク（ＤＶＤ）その他の光ディスク記憶媒体、磁気カセット、磁気テープ、磁気ディスク記憶その他の磁気記憶デバイス、またはその他の、所望の情報の記憶に使える任意の媒体を含むが、これらに限定されない。さらに、当業者には周知であるように、通信媒体は、一般的に、コンピュータ読み取り可能命令、データ構造、プログラムモジュール、その他の搬送波その他の伝送メカニズムなどの変調データ信号中のデータを化体し、任意の情報配信媒体を含む。
実施形態について付記する。
（付記１）ビットストリームに基づきｎチャンネルオーディオ信号を再構成するように構成された復号システムであって、
前記ビットストリームを受け取り、それに基づいて、前記システムのパラメトリックコーディングモードにおいて、符号化されたコア信号とマルチチャンネルコーディングパラメータとを出力する、パラメトリックモードデマルチプレクサと、
前記符号化されたコア信号を受け取り、それに基づいて、ｍチャンネルコア信号を出力する、ここで１≦ｍ＜ｎであるコア信号復号器と、
前記コア信号と前記マルチチャンネルコーディングパラメータとを受け取り、それに基づき、前記ｎチャンネル信号を出力するパラメトリック合成ステージとを有し、
前記パラメータモードデマルチプレクサは、さらに、前記ビットストリームに基づいて、前記コア信号のエンコーダ側ダイナミックレンジ制限を定量化する前処理ダイナミックレンジ制御（ＤＲＣ）パラメータを出力するように構成され、
前記復号システムは、前記前処理ＤＲＣパラメータに基づき、前記エンコーダ側ダイナミックレンジ制限をキャンセルするように動作可能である、
復号システム。
（付記２）前記パラメトリックモードデマルチプレクサは、さらに、前記ビットストリームに基づき、前記システムの前記パラメトリックコーディングモードにおいて、適用されるデコーダ側ＤＲＣを定量化する補償された後処理ＤＲＣパラメータを出力するように構成され、
前記復号システムは、
１）前記パラメトリック合成ステージ内またはその下流、及び
２）前記コア信号デコーダ内、
のうち一方で、前記デコーダ側ＤＲＣを適用するように動作可能である、
付記１に記載の復号システム。
（付記３）さらに、前記エンコーダ側ダイナミックレンジ制限をまたはその一部をキャンセルし、補償されたコア信号を出力するように動作可能なＤＲＣプロセッサを有し、
前記コア信号デコーダは、前記デコーダ側ＤＲＣまたはその一部を適用するように動作可能である、
付記２に記載の復号システム。
（付記４）前記コア信号デコーダと前記ＤＲＣプロセッサに通信可能に結合したＤＲＣプリプロセッサをさらに有し、前記ＤＲＣプリプロセッサは、目標ＤＲＣレベルと、前記前処理ＤＲＣパラメータと、前記補償された後処理ＤＲＣパラメータとを受け取り、
−前記目標ＤＲＣレベルが前記コア信号のデコーダ入力ＤＲＣレベルに関するダイナミックレンジブーストに対応するとき、前記ＤＲＣプロセッサに、前記目標ＤＲＣレベルに基づいて、前記エンコーダ側ダイナミックレンジ制限またはその一部をキャンセルさせ、
−前記目標ＤＲＣレベルが前記コア信号の前記デコーダ入力ＤＲＣレベルに関するダイナミックレンジ圧縮に対応するとき、前記コア信号デコーダに、前記目標ＤＲＣレベルに基づいて、前記デコーダ側ＤＲＣまたはその一部を適用させ、
前記ＤＲＣプリプロセッサは、前記目標ＤＲＣレベルに応じて前記一部を決定する、
付記３に記載の復号システム。
（付記５）前記パラメトリックモードデマルチプレクサは、さらに、前記ビットストリームに基づき、前記システムの前記パラメトリックコーディングモードにおいて、補償された後処理ＤＲＣパラメータを出力するように構成され、
前記システムはさらに、
前記補償された後処理ＤＲＣパラメータと前記前処理ＤＲＣパラメータとを受け取り、それに基づいて、適用するデコーダ側ＤＲＣを定量化した回復された後処理ＤＲＣパラメータを出力するＤＲＣダウン補償器と、
前記システムのパラメトリックコーディングモードにおいて、前記回復された後処理ＤＲＣパラメータに応じて前記ｎチャンネルオーディオ信号にＤＲＣを適用するように構成されたＤＲＣプロセッサとを有し、
前記回復されたＤＲＣパラメータにより表されるデコーダ側ＤＲＣは、前記コア信号のエンコーダ側ダイナミックレンジ制限と、前記補償された後処理ＤＲＣパラメータにより表されるデコーダ側ＤＲＣとの結合と数量的に等価である、
付記１ないし４いずれか一項に記載の復号システム。
（付記６）前記ビットストリームを受け取り、それに基づいて、前記システムの離散コーディングモードにおいて、符号化ｎチャンネル信号と、適用されるデコーダ側ＤＲＣを数量化した後処理ＤＲＣパラメータとを出力する離散モードデマルチプレクサと、
前記ビットストリームに含まれる符号化ｎチャンネル信号を受け取り、それに基づいて、前記システムの離散コーディングモードにおいて、前記ｎチャンネルオーディオ信号を出力するデコーダとを有し、
前記ＤＲＣプロセッサは、さらに、前記システムの離散コーディングモードにおいて、前記後処理ＤＲＣパラメータに応じて、前記ｎチャンネルオーディオ信号にＤＲＣを適用するように構成されている、
付記５に記載の復号システム。
（付記７）前記パラメトリック合成ステージは、
前記コア信号と前記前処理ＤＲＣパラメータとを受け取り、前記エンコーダ側ダイナミックレンジ制限をキャンセルすることにより得られたダイナミックレンジ補償されたコア信号を出力するプリコンディショナと、
前記ダイナミックレンジ補償されたコア信号と前記マルチチャンネルコーディングパラメータとを受け取り、それに基づき、前記ｎチャンネル信号を出力するパラメトリック合成プロセッサとを有する、
付記５または６に記載の復号システム。
（付記８）前記パラメトリック合成ステージは、
前記コア信号と前記マルチチャンネルコーディングパラメータとを受け取り、それに基づき、中間信号を出力するパラメトリック合成プロセッサと、
前記中間信号と前記前処理ＤＲＣパラメータとを受け取り、前記エンコーダ側ダイナミックレンジ制限をキャンセルすることにより得られたｎチャンネル信号を出力するポストコンディショナとを有する、
付記５または６に記載の復号システム。
（付記９）前記パラメトリックモードデマルチプレクサは、前記前処理ＤＲＣパラメータの各値を、指数を表す２ビットフィールドと仮数を表す５ビットフィールドとして読むようにさらに構成されている、
付記１ないし４いずれか一項に記載の復号システム。
（付記１０）ビットストリームに基づいてｎチャンネルオーディオ信号を再構成する方法であって、
符号化コード信号と、マルチチャンネルコーディングパラメータと、前記コア信号のエンコーダ側ダイナミックレンジ制限を数量化する前処理ダイナミックレンジ制御（ＤＲＣ）パラメータとを含むビットストリームに応じて、
ａ−１）前記符号化コア信号をｍチャンネルコア信号に復号する、１＜ｍ＜ｎであるステップと、
ａ−２）パラメトリック合成を行い、前記コア信号と前記マルチチャンネルコーディングパラメータとに基づき前記ｎチャンネル信号を再構成するステップとを実行するステップを有し、
前記方法は、さらに、前記前処理ＤＲＣパラメータに基づき、前記エンコーダ側ダイナミックレンジ制限をキャンセルするステップを有する、
方法。
（付記１１）前記ビットストリームが、符号化コア信号と、マルチチャンネルコーディングパラメータと、前処理ＤＲＣパラメータとを含み、さらに適用されるデコーダ側ＤＲＣを数量化した補償された後処理ＤＲＣパラメータをさらに含む場合に応じて、
ステップａ−１と、ａ−２と、
ａ−３）前記前処理ＤＲＣパラメータに基づいて、前記エンコーダ側ダイナミックレンジ制限またはその一部をキャンセルするステップ、及び
ａ−４）前記補償された後処理ＤＲＣパラメータに応じて、前記デコーダ側ＤＲＣまたはその一部を適用するステップのうち少なくとも一方とを実行するステップと、
付記１０に記載の方法。
（付記１２）ステップａ−１及びａ−２を実行することにより前記場合に対応するステップと、
目標ＤＲＣレベルを受け取り、これをデコーダ入力ＤＲＣレベルと比較して、前記目標ＤＲＣレベルがダイナミックレンジブーストに対応するかダイナミックレンジ圧縮に対応するか決めるステップと、
前記比較に基づいて、
ａ−３）前記前処理ＤＲＣパラメータに基づいて、前記エンコーダ側ダイナミックレンジ制限またはその一部をキャンセルするステップ、及び
ａ−４）前記補償された後処理ＤＲＣパラメータに応じて、前記デコーダ側ＤＲＣまたはその一部を適用するステップのうち選択された一方を実行するステップと、
を有する、付記１１に記載の方法。
（付記１３）前記ビットストリームは、さらに、適用されるデコーダ側ＤＲＣを数量化した後処理ＤＲＣパラメータを含み、
前記方法は、さらに、前記後処理ＤＲＣパラメータにより前記ｎチャンネル信号にＤＲＣを適用するステップを有し、前記ビットストリームが前処理ＤＲＣパラメータを含み、前記ビットストリーム中の前記後処理ＤＲＣパラメータが補償された後処理ＤＲＣパラメータであるとき、前記補償された後処理ＤＲＣパラメータの替わりに、回復された後処理ＤＲＣパラメータを用い、
前記回復された後処理ＤＲＣパラメータは前記補償された後処理ＤＲＣパラメータと前記前処理ＤＲＣパラメータに基づき得られ、前記回復されたＤＲＣパラメータにより表されるデコーダ側ＤＲＣは、前記コア信号のエンコーダ側ダイナミックレンジ制限と、前記後処理ＤＲＣパラメータにより表されるデコーダ側ＤＲＣとの結合に数量的に等価である、
付記１０ないし１２いずれか一項に記載の方法。
（付記１４）前記ビットストリームが符号化ｎチャンネル信号を含むのに応じて、
ｂ）前記符号化ｎチャンネル信号を復号することにより、前記ｎチャンネル信号を再構成するステップをさらに有する、
付記１３に記載の方法。
（付記１５）時間ブロックにパーティションされたｎチャンネルオーディオ信号をビットストリームとして符号化するように構成された復号システムであって、
前記ｎチャンネル信号を受け取り、それに基づいて、前記符号化システムのパラメトリックコーディングモードで、ｍチャンネルコア信号とマルチチャンネルコーディングパラメータとを出力する、１＜ｍ＜ｎである、パラメトリック分析ステージと、
前記コア信号を受け取り、それに基づいて、符号化コア信号を出力するコア信号エンコーダとを有し、
前記パラメトリック分析ステージは、さらに、時間セグメントベースの適応的ダイナミックレンジ制限を行い、適用される前記ダイナミックレンジ制限を数量化する前処理ダイナミックレンジ制御（ＤＲＣ）パラメータを出力し、
前記システムは、さらに、前記システムのパラメトリックコーディングモードにおいて、前記システムから出力される、少なくとも前記符号化コア信号、前記マルチチャンネルコーディングパラメータ、及び前記前処理ＤＲＣパラメータを含むビットストリームを形成するように動作可能なパラメトリックモードマルチプレクサを有する、
復号システム。
（付記１６）前記ｎチャンネルオーディオ信号を受け取り、それに基づいて、適用されるデコーダ側ＤＲＣを数量化した後処理ＤＲＣパラメータを出力する少なくとも１つのＤＲＣアナライザと、
前記後処理ＤＲＣパラメータと前記前処理ＤＲＣパラメータを受け取り、それに基づいて、適用されるデコーダ側ＤＲＣを数量化した補償された後処理ＤＲＣパラメータを出力する、前記補償された後処理ＤＲＣパラメータは前記パラメトリックコーディングモードにおいて前記ビットストリームに含まれる、ＤＲＣアップ補償器とを有し、
前記後処理ＤＲＣパラメータにより表されるデコーダ側ＤＲＣは、前記パラメトリック分析ステージにより適用されるダイナミックレンジ制限と、前記補償された後処理ＤＲＣパラメータにより数量化されたデコーダ側ＤＲＣとの結合と数量的に等価である、
付記１５に記載の符号化システム。
（付記１７）前記少なくとも１つのＤＲＣアナライザは、第１の数ｐ_１＞１の時間ロックを含むシングルセグメントに基づいて、前記後処理ＤＲＣパラメータの値を計算するように構成され、
前記パラメトリック分析ステージは、第２の数ｐ_２＞１の時間ブロックを含むシングルセグメントに基づいて、前記前処理ＤＲＣパラメータの値を計算するように構成され、
前記第１の数は前記第２の数以下である、すなわちｐ_１＜ｐ_２である、
付記１６に記載の符号化システム。
（付記１８）前記ｎチャンネル信号を受け取り、それに基づいて、前記システムの離散コーディングモードにおいて前記システムから出力されるビットストリームの一部を形成する符号化ｎチャンネル信号を出力するエンコーダと、
前記システムの離散コーディングモードにおいて前記システムから出力されるビットストリームを形成するように動作可能な離散モードマルチプレクサとを有し、前記ビットストリームは少なくとも前記符号化ｎチャンネル信号と前記後処理ＤＲＣパラメータとを含む、
付記１６または１７に記載の符号化システム。
（付記１９）前記システムは、２つのＤＲＣアナライザを有し、これらは機能的に等価であり、すなわち離散モードＤＲＣアナライザとパラメトリックモードＤＲＣアナライザとである、
付記１５ないし１８いずれか一項に記載の符号化システム。
（付記２０）前記後処理ＤＲＣパラメータと前記符号化ｎチャンネル信号とを受け取り、離散コーディングモードにおいて前記システムから出力するビットストリームを形成するように動作可能な離散モードマルチプレクサをさらに有する、
付記１５ないし１９いずれか一項に記載の符号化システム。
（付記２１）前記パラメトリック分析ステージは、
前記ｎチャンネル信号を受け取り、ダイナミックレンジ制限されたｎチャンネル信号とＤＲＣパラメータとを出力するプリプロセッサと、
前記ダイナミックレンジ制限されたｎチャンネル信号を受け取り、それに基づき、前記ｍチャンネル信号とマルチチャンネルコーディングパラメータとを出力するパラメトリック分析プロセッサとを有する、
付記１５ないし２０いずれか一項に記載の符号化システム。
（付記２２）前記パラメトリックモードデマルチプレクサは、前記前処理ＤＲＣパラメータの各値を、指数を表す２ビットフィールドと仮数を表す５ビットフィールドとして含むように構成されている、
付記１５ないし２１いずれか一項に記載の符号化システム。
（付記２３）時間ブロックにパーティションされたｎチャンネルオーディオ信号を符号化する方法であって、
前記方法は、ｍチャンネルコア信号とマルチチャンネルコーディングパラメータとを生成する、１＜ｍ＜ｎであるステップを有し、
前記生成するステップは、時間ブロックベースでダイナミックレンジ制限を実行するステップと、前記適用されたダイナミックレンジ制限を数量化した前処理ダイナミックレンジ制御（ＤＲＣ）パラメータを生成するステップとを有し、
前記方法は、さらに、前記コア信号及び前記マルチチャンネルコーディングパラメータと同時に前記前処理ＤＲＣパラメータを送信するステップをさらに有する、
方法。
（付記２４）付記１０ないし１４及び２３いずれか一項に記載の方法を実行するコンピュータ実行可能命令を有するコンピュータ読み出し可能媒体を含むコンピュータプログラム製品。
（付記２５）ｎ＝６かつｍ＝２である、付記１ないし２４いずれか一項に記載のシステム、方法、またはコンピュータプログラム製品。

Claims

オーディオ信号処理装置によって実行される、オーディオ信号のダイナミックレンジを調整する方法であって、
符号化されたオーディオ信号、エンコーダ生成音量メタデータ、およびエンコーダ生成ダイナミックレンジ制御（ＤＲＣ）メタデータを含むビットストリームを受信することであって、前記エンコーダ生成音量メタデータは、前記オーディオ信号の音量レベルを含み、前記エンコーダ生成ＤＲＣメタデータは、複数のＤＲＣゲインセットを含み、前記複数のＤＲＣゲインセットは、前記オーディオ信号に適用され、前記オーディオ信号のダイナミックレンジを調節する総ＤＲＣゲインの第１部分を表すＤＲＣゲインの第１セットと、前記オーディオ信号に適用され、前記オーディオ信号のダイナミックレンジを調節する総ＤＲＣゲインの第２部分を表すＤＲＣゲインの第２セットとを含む、受信することと、
前記符号化されたオーディオ信号を復号して前記オーディオ信号を取得することと、
第１セットのＤＲＣゲインおよび第２セットのＤＲＣゲインをオーディオ信号に適用して、オーディオ信号に適用すべき総ＤＲＣゲインを適用することにより、オーディオ信号のダイナミックレンジを調整することと、
オーディオ信号の音量レベルおよび目標出力レベルとに応じて決定されたゲインを適用することにより、オーディオ信号の音量を調整することと
を含む方法。
オーディオ信号のダイナミックレンジを調整するオーディオ信号処理装置であって、
前記オーディオ信号処理装置は一以上のプロセッサを有し、前記一以上のプロセッサは、
符号化されたオーディオ信号、エンコーダ生成音量メタデータ、およびエンコーダ生成ダイナミックレンジ制御（ＤＲＣ）メタデータを含むビットストリームを受信し、前記エンコーダ生成音量メタデータは、前記オーディオ信号の音量レベルを含み、前記エンコーダ生成ＤＲＣメタデータは、複数のＤＲＣゲインセットを含み、前記複数のＤＲＣゲインセットは、前記オーディオ信号に適用され、前記オーディオ信号のダイナミックレンジを調節する総ＤＲＣゲインの第１部分を表すＤＲＣゲインの第１セットと、前記オーディオ信号に適用され、前記オーディオ信号のダイナミックレンジを調節する総ＤＲＣゲインの第２部分を表すＤＲＣゲインの第２セットとを含み、
前記符号化されたオーディオ信号を復号して前記オーディオ信号を取得し、
第１セットのＤＲＣゲインおよび第２セットのＤＲＣゲインをオーディオ信号に適用して、オーディオ信号に適用すべき総ＤＲＣゲインを適用することにより、オーディオ信号のダイナミックレンジを調整し、
オーディオ信号の音量レベルおよび目標出力レベルとに応じて決定されたゲインを適用することにより、オーディオ信号の音量を調整するする、
オーディオ信号処理装置。
オーディオ信号処理装置によって実行されると、前記オーディオ信号処理装置にオーディオ信号のダイナミックレンジを調整する方法を実行させる、ソフトウェア命令を有する非一時的コンピュータ可読記憶媒体であって、
前記方法は、
符号化されたオーディオ信号、エンコーダ生成音量メタデータ、およびエンコーダ生成ダイナミックレンジ制御（ＤＲＣ）メタデータを含むビットストリームを受信することであって、前記エンコーダ生成音量メタデータは、前記オーディオ信号の音量レベルを含み、前記エンコーダ生成ＤＲＣメタデータは、複数のＤＲＣゲインセットを含み、前記複数のＤＲＣゲインセットは、前記オーディオ信号に適用され、前記オーディオ信号のダイナミックレンジを調節する総ＤＲＣゲインの第１部分を表すＤＲＣゲインの第１セットと、前記オーディオ信号に適用され、前記オーディオ信号のダイナミックレンジを調節する総ＤＲＣゲインの第２部分を表すＤＲＣゲインの第２セットとを含む、受信することと、
前記符号化されたオーディオ信号を復号して前記オーディオ信号を取得することと、
第１セットのＤＲＣゲインおよび第２セットのＤＲＣゲインをオーディオ信号に適用して、オーディオ信号に適用すべき総ＤＲＣゲインを適用することにより、オーディオ信号のダイナミックレンジを調整することと、
オーディオ信号の音量レベルおよび目標出力レベルとに応じて決定されたゲインを適用することにより、オーディオ信号の音量を調整することとを含む、
非一時的コンピュータ可読記憶媒体。