JP2012507059A

JP2012507059A - 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護

Info

Publication number: JP2012507059A
Application number: JP2011534654A
Authority: JP
Inventors: アーシュイルドバッハ，ヴォルフギャング; グロエスケル，アレクサンドル
Original assignee: ドルビーインターナショナルアーベー
Priority date: 2008-10-29
Filing date: 2009-10-26
Publication date: 2012-03-22
Anticipated expiration: 2029-10-26
Also published as: EP2353161A1; BRPI0919880A2; CN102203854A; TW201042637A; CN102203854B; ES2963744T3; US8892450B2; TWI416505B; EP4293665A2; WO2010053728A1; EP3217395B1; US20110208528A1; RU2468451C1; BRPI0919880B1; EP3217395A1; EP2353161B1; JP5603339B2; EP4293665A3

Abstract

本出願は、受信されたオーディオメタデータが信号クリッピングに対して保証していない場合、オーディオ信号のクリッピングを防止する方法及び装置を開示する。本方法は、マルチチャネル信号をステレオ信号にダウンミキシングする場合のクリッピングの防止に使用されてもよい。本方法によって、受信されたオーディオメタデータに基づく第１のゲイン値（４）が、オーディオ信号のクリッピング保護に十分であるかが決定される。このオーディオメタデータは、第１のオーディオストリーム（１）に埋め込まれている。第１のゲイン値が、保護に十分でない場合、対応する第１のゲイン値（４）は、オーディオ信号のクリッピング保護に十分であるゲイン値に置き換えられる。望ましくは、この第１のオーディオストリーム（１）にダイナミックレンジ制御に関するメタデータが存在しない場合には、本方法は、信号クリッピングの保護に十分なゲイン値を付加してもよい。

Description

本特許出願は、デジタルオーディオストリームに埋め込まれた既存のオーディオメタデータを使用してオーディオ信号のクリッピングを保護することに関する。特に、応用例は、より少ないチャネルに多重チャネル・オーディオ信号をダウンミックスするときのクリッピングの保護に関する。

関連出願についてのクロス・リファレンス。本出願は、２００８年１０月２９日に出願した第６１／１０９，４３３号の優先権を主張し、個々に完全に引用し組み込まれたものとする。

例えばデジタル放送環境において、デジタルオーディオストリームにオーディオメタデータを埋め込むことが、共通のコンセプトとなっている。この種のメタデータは、「データに関するデータ」である。すなわちストリームのデジタルオーディオについてのデータである。メタデータは、オーディオを再生する方法について、オーディオ・デコーダに情報を提供することができる。１つのタイプのメタデータは、ゲインエンベロープを時間的に変化させることを示すダイナミック・レンジコントロール情報である。この種のダイナミック・レンジコントロールメタデータは、以下のような複数の目的に利用される。

（１）再生されたオーディオのダイナミックレンジをコントロールする。
デジタル伝送は高ダイナミックレンジを可能とする。しかし、聞いている状況はその恩恵を必ずしも受けない。高ダイナミックレンジは、静かなリビング室内条件においては望ましいものである。しかし、それは高いバックグラウンド・ノイズ・レベルが生じる環境、例えばカーラジオその他の条件では適切でない。多種多様なリスニング環境に対応するため、伝送の前にダイナミックレンジを減少させる代わりに、レシーバに対してダイナミックレンジを減少させるよう指示するメタデータを、デジタルオーディオストリームに挿入することができる。前者のアプローチは、フルダイナミックレンジのオーディオをレシーバが再生することができないため、好ましくない。これに対して、後者のアプローチは、リスニングの環境に応じて、リスナーに対してダイナミックレンジのコントロールを行うことを可能とする点で好ましい。この種のダイナミック・レンジコントロールメタデータは、リスナーの好みで利用でき、デコードされた信号の高品質のアーティステックなダイナミックレンジの圧縮データを作る。

（２）ダウンミックス・オペレーションの場合に、クリッピングするのを防止する。
多重チャネル信号（例えば５．１−チャンネル・オーディオ信号）がダウンミックスされる場合に、通常は２つのチャネルに、チャネル数が減少する。ステレオ・スピーカーを介して２つ以上のチャネル（例えば５．１−チャンネル・オーディオ信号は、５つの主チャネル、及び１つの低周波効果チャネル）を有する多重チャネル・オーディオ信号を再生する場合には、通常は、レシーバ・サイドは、ダウンミックス・オペレーションが実行される。ここで、多重チャネル信号は、２つのチャネルにミックスされる。ミキシング動作は、ダウンミックス・マトリックスに記述することができる。例えば、５つのチャンネル信号を２つのチャンネル（ステレオの）信号にダウンミックスする場合には、２つのロウ及び５つのカラムから成る２−５のマトリックスによって記述される（低周波効果チャネルは、通常はダウンミックスにおいては考慮されない）。５．１−チャンネル信号の５つの主チャネルを２つのチャネルにミックスするための異なるダウンミックス方式が知られている。この例としては、Ｌｏ／Ｒｏ（左だけ、右だけ）、又は、Ｌｔ／Ｒｔ（左トータル、右トータル）が挙げられる。ダウンミックス・ステップは、デジタル・ステレオ信号のオーバーロードの発生を引き起こす危険性の可能性がある。それによって、望まれていないクリッピングアーティファクトが生成されることになる。この種のクリッピングは、ダウンミックスされたデジタル信号が、最大（又は最小）の表現可能な値を超えた振幅が、最大（又は最小）の表現可能な値で制限される場合に起こり得る。例えば、単純な符号なし固定小数点２進数の表現の場合には、計算されたダウンミックスされた振幅が最大値のワード（すなわち、全てのビットが１である値）によって制限される場合にクリッピングが発生する。１６ビット符号付き表現の場合には、最大の値は、例えばワード「０１１１１１１１１１１１１１１１」に対応してもよい。

さまざまなダウンミックスの方式のダウンミックス・マトリックスがヘッドエンドで知られているため、発信者、又はコンテンツ生成サイドは、ダウンミックスされる場合に、クリッピングしてしまう信号に対しては、ダウンミックスされる前に信号を減衰させるようレシーバに命令するダイナミック・レンジコントロールメタデータが、クリッピングするのを防止するオーディオ・ストリームに加えられ得る。

（３）ブーストされた出力の場合にはクリッピングするのを防止する。
ダイナミックスが非常に限られたチャネルにおける（例えばセットトップボックスからアナログＲＦリンクを介してＴＶのＲＦ入力への）再送信に対して、通常は、このパスでより良好な信号対雑音比を達成するために、信号が１１ｄＢブーストされる。この種の応用例において、１１ｄＢ増幅される場合に、クリッピングが結果として発生してしまう信号に対して、ダイナミック・レンジコントロールメタデータは、オーディオ・ストリームに１１ｄＢの増幅を適用する前に信号の振幅を減少させるよう、レシーバに命令し、クリッピングするのを動的に防止する。

米国仮特許出願番号６１／１０１４９７号

"Transcoding of dynamic range control coefficients and other metadata into MPEG-4 HE AAC", Wolfgang Schildbach et al., Audio Engineering Society Convention Paper, presented at the 123<rd> Convention October 5-8, 2007, New York

オーディオ・ストリームを受信するデバイスの観点からすると、ダイナミック・レンジコントロールメタデータが以下のいずれの目的で機能するかが明確に分からない。すなわち、（１）ダイナミックレンジのコントロール、（２）ダウンミックスのクリッピング保護、又は（１）及び（２）の両方の目的である。メタデータは、多くの場合、この二つのタスクを達成する。しかし、これは常になされるわけではない。したがって、ある場合には、メタデータは、ダウンミックスのクリッピング防止のためでない場合がある。加えて、メタデータが上記（３）のＲＦモードに関連する場合、このメタデータは、（ダウンミキシングの場合であってもなくても）過剰の増幅の場合にクリッピングを防止するために利用されてもよい。

さらに、一部のオーディオ・エンコーディングフォーマットでは、メタデータが任意であるため、受信されたオーディオ・ストリームに、ダイナミック・レンジコントロールメタデータが全く含まれなくてもよい。ダイナミック・レンジコントロールメタデータが圧縮オーディオ・ストリームに含まれないか、又ダウンミックスのクリッピング保護が含まれない場合、マルチチャネル信号がより少ないチャネル数にダウンミックスされる場合、望ましくないクリッピングアーティファクトがデコードされた信号に発生しうる。

本発明によって、オーディオメタデータによるクリッピングの保護が保証されない場合に、オーディオ信号がクリッピングするのを防止する方法及び装置が開示される。

応用例の第１の態様は、オーディオ信号（例えばダウンミックスされたデジタルオーディオ信号）の信号クリッピングからの保護を提供する方法に関する。そして、これはデジタルオーディオ・データから得られる。この方法によれば、受信されたオーディオメタデータに基づく第１のゲイン値がオーディオ信号のクリッピングからの保護に充分かどうかが、決定される。オーディオメタデータは、第１のオーディオ・ストリームに埋め込まれる。例えば、圧縮オーディオ・ストリームに含まれる時変（time-varying）ゲインエンベロープ・メタデータがダウンミックス・クリッピングを防止するのに十分か否かが決定される。第１のゲイン値が保護に充分でない場合には、それぞれの第１のゲイン値はオーディオ信号のクリッピングからの保護に充分なゲイン値と置き換えられる。望ましくは、ダイナミック・レンジコントロールに関連するメタデータが第１のオーディオ・ストリームに存在しない場合には、本方法は信号クリッピングからの保護に充分なゲイン値を加えてもよい。例えば、時変ゲインエンベロープ・メタデータが充分なダウンミックスのクリッピングの保護を提供しない場合、又は全くない場合、時変ゲインエンベロープ・メタデータが、修正されるか、又は加えられる。これによって、充分なダウンミックスのクリッピングの保護を提供する。

本方法はクリッピングの保護を可能とする。そして、クリッピングを保護するに充分なゲイン値が受信されるかどうかに関わらず、特にダウンミックスの場合にはクリッピングを保護する。

本発明に従って、受信したオーディオゲインワード（提供される場合）が、できる限り正確なものとして適用されてもよいが、受信したゲインワードがクリッピングするのを防止する十分な減衰を提供しない場合には、例えばダウンミックスにおいて、これにオーバーライドされる。

ダイナミック・レンジコントロールデータが、上記（１）の目的として働き、アーティステックな態様を持つため、受信したメタデータがそれを提供しない場合に、受信デバイス（例えばセットトップボックス）がこれを導入する義務はない。上記（２）が、受信側（ｒｅｃｅｉｖｉｎｇｉｎｓｔａｎｃｅ）によって、提供でき、また提供されるべきである。これは、受信デバイスは、可能な限り上記（１）の下でダイナミック・レンジコントロールを目的とするダイナミック・レンジ・コントロールデータを温存し、これと同時に、クリッピングの保護を加えるということを意味する。

受信されたオーディオメタデータに基づく第１のゲイン値が信号クリッピングからの保護に充分かどうか決定するさまざまな方法が存在する。好適なアプローチによれば、第２のゲイン値は、デジタルオーディオ・データに基づいて計算される。ここで、第２のゲイン値は、オーディオ信号のクリッピングを保護するに充分なものである。第２のゲイン値は、結果としてクリッピングにならない最大許容ゲイン値であってもよい。

望ましくは、本方法は、受信されたオーディオメタデータに基づいて、第１のゲイン値を、計算された第２のゲイン値と比較することによって、第１のゲイン値が充分かどうか決定する。本方法は、オーディオ・データの部分に関連づけられた、それぞれの１つの第１の値を、オーディオ・データの同じ部分に関連づけられた第２のゲイン値と、比較してもよい。

これに関連して、ストリームのゲイン値に適合するクリッピング保護が、第１及び第２のゲイン値から生成されてもよい。望ましくは、この種のゲイン値は、比較のオペレーションに依存して、第１のゲイン値、及び計算された第２のゲイン値から選択される。第１のゲイン値の代わりに第２の計算されたゲイン値を選択することによって、第１のゲイン値は、選択された第２のゲイン値と置き換えられる。

望ましくは、一対の第１及び第２のゲイン値の最小値が、選択される。第１のゲイン値が、保護に充分な計算された第２のゲイン値より大きい場合、これは第１のゲイン値がクリッピングを保護するに充分でなく、かつ、したがってそれぞれの第２のゲイン値と置換されなければならないという危険があることを示す。この逆に、第１のゲイン値が保護に充分であるとして計算された第２のゲイン値より小さい場合、これは信号クリッピングの危険度がないことを示し、かつ第１のゲイン値が温存されなければならない。

第１及び第２のゲイン値からのゲイン値の選択は、以下のように行われてもよい。

第１のゲイン値、及び第２のゲイン値が、１に等しいか、これより小さいゲインを提供する場合には、両方の最小値が採用される。これは、第１のゲイン値がすでにクリッピングを保護することを保証する場合、又は、そうでない場合のいずれかにおいて、それが第２のゲイン値と置き換えられることを意味する。第２のゲイン値のゲインが１より大きい場合で、かつ、第１のゲイン値が１に等しいかより小さいゲインを提供する場合、信号は、増幅することができ、かつクリッピングしない。にもかかわらず、例えば、ダイナミックレンジを制限する目的を達成するために、受信したオーディオ・ストリームが、振幅を減少させることをリクエストする場合には、したがって、これは温存される。

第１のゲイン値が１より大きいゲインを提供し、かつ第２のゲイン値が１に等しいかより小さいゲインを提供する場合には、受信した第１のゲイン値はクリッピングの保護を妨害することとなる。したがって、第２のゲイン値が採用される。第１のゲイン値、及び第２のゲイン値が１より大きいゲインを提供する場合には、入力は増幅される。まだクリッピングが起こらない限り、この増幅は許容される。したがって、第１のゲイン値、及び第２のゲイン値で、より小さいものが使用される。第１のゲイン値が保護に充分であるかどうか、決定するための他のアプローチは、第１のゲイン値をオーディオ・データに適用して、その結果得られるデジタルオーディオ信号（例えばダウンミックスされた信号）がクリッピングするかどうかを判断することである。

第１のゲイン値が保護に充分でない場合には、最初のゲイン値として第１のゲイン値から始めて、クリッピングを保護するに充分であるゲイン値を反復的に決定してもよい。例えば、解像度に従う第１のゲイン値より小さい最も近いゲイン値であるゲイン値によってオーディオ信号がクリッピングするかどうか、判断してもよい（例えば第１のゲイン値が０．８であり、かつ、ゲイン値解像度が０．１である場合、最も近くで小さいゲイン値は０．７である）。信号がまだクリッピングする場合、オーディオ信号が次の、より小さいゲイン値（例えば０．６のゲイン値）によってクリッピングするかどうか、判断されてもよい。結果として信号クリッピングにならないゲイン値が分かるまで、これが繰り返される。

望ましくは、本方法は、トランスコーディング方法の一部として実行される。ここで、第１のオーディオ符号化フォーマット（例えばＡＡＣフォーマット又はＨｉｇｈＥｆｆｉｃｉｅｎｃｙＡＡＣ（ＨＥ−ＡＡＣ）フォーマット、別名ａａｃＰｌｕｓ）の第１のオーディオ・ストリームは、第２のオーディオ符号化フォーマット（例えばドルビーデジタル・フォーマット又はドルビーデジタルプラスフォーマット）に符号化された第２のオーディオ・ストリームにトランスコードされる。第２のオーディオ・ストリームは、クリッピングに充分な置き換えられたゲイン値を有し、あるいは、そこから得られるゲイン値を有する。

しばしばオーディオ・トランスコーディングが必要となる。その理由は、次のことにある。オーディオ・データを伝送するためのデジタル圧縮形式は伝送チェーンの最終的なオーディオ・デコーダ（例えばオーディオ・ビデオ・レシーバＡＶＲのデコーダまで）まで全部の伝送チェーンの全体にわたって保たれることができないからである。ブロードキャストの場合には、これは、例えば、無線ブロードキャスト（又はケーブルを介しての消費者に対するブロードキャスト）、及び受信デバイス（例えばセットトップボックス−ＳＴＢ）と伝送チェーンの最終的なデコーダ（例えばＡＶＲのデコーダ又はテレビのオーディオ・デコーダ）との間でのオーディオの伝送のために、異なる符号化体系が使用され得るという理由も存在する。例えば、オーディオ・データは、ＡＡＣフォーマット又はＨＥ−ＡＡＣフォーマットによって無線ブロードキャストされてもよい。そして、オーディオ・データは、ＳＴＢからＡＶＲまでは、ドルビーデジタル・フォーマット又は伝送のドルビーデジタルプラスフォーマットにトランスコードされてもよい。結論的には、例えば、あるフォーマットから別のフォーマットを得るために、ＳＴＢで、トランスコーディング・ステップが実行されてもよい。この種のトランスコーディング・ステップは、オーディオ・データ自体のトランスコーディングを有する。なお、理想的には、添付のメタデータ（特にダイナミック・レンジコントロールデータ）をトランスコーディングしてもよい。好適な実施の形態によれば、本方法は、第２のオーディオ・ストリームのトランスコードされたオーディオゲインメタデータを提供する。このゲインメタデータによって信号クリッピングからの充分な保護が行える。

本方法は、ある圧縮オーディオ・ストリーム・フォーマットから別のものに信号をトランスコーディングするいかなるデバイスにも対しても非常に役立つ。時変ゲインコントロールメタデータが、事前に分かっていなくても、あるいはもしあるとしても、最初のフォーマットがダウンミックスのクリッピング保護がある場合、役に立つ（例えば、ＡＡＣ／ＨＥ−ＡＡＣからドルビーデジタルへのトランスコーダ、ドルビーＥからＡＣ／ＨＥ−ＡＡＣへのトランスコーダ、又はドルビーデジタルからＡＡＣ／ＨＥ−ＡＡＣへのトランスコーダが挙げられる）。

望ましくは、第１のゲイン値が保護に充分であるかどうかを決定するために、デジタルオーディオ・データは少なくとも一つのダウンミックスの方式によりダウンミックスされる。例えば、Ｌｔ／Ｒｔダウンミックス方式に基づいて行われる。ダウンミキシングの結果は一つ以上の信号を与える。例えば、右チャンネルに関連する一つの信号と、左チャンネルに関連する一つの信号である。加えて、複数のダウンミキシングの方式が考慮されてもよい。そして、デジタルオーディオ・データは複数のダウンミキシングの方式によってダウンミックスされる。

望ましくは、オーディオ信号から得られる各種信号の実際のピーク値は、連続的に決定される。すなわち与えられた時間に、各種信号のうちどれが最も高い信号値を有するかが、決定される。ピーク値を計算するために、本方法は、与えられた時間に２つ以上の信号の絶対値の最大を決定してもよい。２つ以上の信号は、第１のダウンミキシングの方式によってダウンミックスした後に、一つ以上の信号（例えばダウンミックスされた右チャンネル信号のサンプルの絶対値、及びダウンミックスされた左チャンネル信号の同時のサンプルの絶対値）を含んでもよい。加えて、ピーク値の計算のために、また、本方法は、第２の（あるいは第３の）ダウンミキシングの方式によってダウンミックスした後に、一つ以上の信号の絶対値を考慮してもよい。さらに、ピーク値の決定は、ダウンミックスする前に、一つ以上のオーディオ信号の絶対値を考慮してもよい。例えば５．１−チャンネル信号の各々５つの主チャネルの絶対値を同時に考慮することができる。トランスコーディングの場合には、多重チャネル信号が独立のチャネルによって後で再生されるか、又は、ダウンミキシングの方式によってダウンミキシングが実行されるかどうか通常はわかっていない点に留意する必要がある。ピーク値は、これらの信号のサンプル値の同時の値に対応する。特定の時刻における全てのケースに対して、信号が持ち得る最大の振幅を表す。クリッピング保護アルゴリズムが考慮しなければならないのは、この最悪のケースである。

ダイナミック・レンジコントロールデータは、通常は、特定の粒度で時間的に変化するものであり、対応するオーディオエンコーディングフォーマット又はその整数部分のデータセグメント（例えばブロック）の長さに関連する。したがって、また、第２のゲイン値は、好ましくはデータセグメント毎に計算される。

したがって、ピーク値、又は連続的なピーク値のサンプリングレートは、好ましくは減少する（ダウンサンプリング）。これは、複数の連続的なピーク値、又は連続的にフィルタリングされたピーク値の最大を決定することによってなされてもよい。特に、本方法は、データ・セグメント（例えば１ブロック又は１フレーム）に関連する複数の連続的な（フィルタリングされた）ピーク値の最大を決定してもよい。トランスコーディングの場合には、本方法は、第２の（出力される）データストリームのデータセグメントに関連する複数の連続的な（フィルタリングされた）ピーク値の最も高いピーク値を決定してもよい。好ましくは、出力セグメントの信号サンプルに基づき、連続的なピーク値が、最大に関して考慮されるだけでなく、データセグメントのデコーディングに影響する付加的な（前後の）ピーク値が考慮されてもよい。すなわち、デコーディング・ウィンドウの始めと終わりでの信号サンプルに関するピーク値である。これらのピーク値は、また、データセグメントに関連する。最も高いピーク値を選択する代わりに、サンプリングレートを減少させるため、データセグメント毎に、異なる値を計算してもよい。

ピーク値以外のオーディオ・データから得られるサンプルが、ダウンサンプリングされてもよい点に留意する必要がある。例えば、オーディオ・データは単一チャネル（モノ）にダウンミックスされてもよい。そして、出力されるデータセグメント毎にダウンミックスされた連続的なサンプルの最大だけが決定される。異なる実施例において、出力されるデータセグメント（ダウンサンプリング）毎に、ダウンミックスされたチャネルの信号に対する最初の各々の最大が計算され、そして、これらの最大のピーク値が決定される。

決定された最大に基づいて、ゲイン値は、決定された最大をインバート（ｉｎｖｅｒｔ）することによって計算されてもよい。示される値として、１が最大の信号値である場合、決定された最大をインバートすることによって、ゲイン係数が得られる。ゲイン係数が（フィルタリングされた）ピーク値の最大に適用される場合、その結果得られる値（すなわち最大の信号値）は１に等しい。これは、このゲインが適用される各々のオーディオ・サンプルは、１以下に保たれるか、又は１に等しいことを意味する。したがってこのデータセグメントに対してクリッピングが回避される。１が最大信号レベルである場合には、１は０ｄＢＦＳ（フルスケールに対するデシベル）に対応する。通常、０ｄＢＦＳは、最大として可能なレベルに割り当てられる。

決定された最大を単にインバートする代わりに、ゲイン値は、最大の信号値（これは、０ｄＢＦＳに対応する）をデータセグメントに関連づけられた決定された最大によって除算することによって、計算してもよい。しかしながら、計算コストは、単純なインバージョンと比較して高くなる。

トランスコーディングの場合には、データセグメント（例えばブロック又はフレーム）長は、第１のオーディオ符号化フォーマット（入力ストリームのフォーマット）と、第２のオーディオ符号化フォーマット（出力ストリームのフォーマット）とで、しばしば異なる。例えば、ＡＡＣにおいて１ブロックは、通常は１２８のサンプルを含む（ＨＥ−ＡＡＣでは、ブロック毎に２５６サンプル）。これに対して、ドルビーデジタルでは、１ブロックは、通常は２５６のサンプルを含む。したがって、ＡＡＣからドルビーデジタルにトランスコーディングするとき、ブロック毎のサンプルの数は増加する。ＡＡＣでは、フレームが通常は１０２４のサンプルを有する（ＨＥ−ＡＡＣでは、フレーム毎に２０４８サンプル）。これに対して、ドルビーデジタルでは、フレームは、通常は１５３６のサンプル（６ブロック）を有する。したがって、ＡＡＣからドルビーデジタルにトランスコーディングするとき、同様にフレーム毎のサンプルの数は増加する。ダイナミック・レンジコントロール粒度は、主に、ブロック・サイズかフレームサイズである。例えば、ＨＥ−ＡＡＣストリームのＭＰＥＧのダイナミック・レンジコントロールメタデータ「ＤＲＣ」の、及びドルビーデジタルのゲインメタデータ「ｄｙｎｒｎｇ」の粒度は、ブロック・サイズである。これに対して、ドルビーデジタルのゲインメタデータ「ｃｏｍｐｒ」の、及びＨＥ−ＡＡＣストリームのＤＶＢ（デジタルビデオ放送）のゲインメタデータ「ｈｅａｖｙｃｏｍｐｒｅｓｓｉｏｎ」の粒度は、フレームサイズである。

加えて、サンプリングレートは入力ストリーム（例えば３２のＫＨｚ、又は４４．１のＫＨｚ）、及び出力ストリーム（例えば４８のＫＨｚ）で異なってもよい。すなわち、オーディオはリサンプリングされる。これは、また、受信したデータセグメント、及び出力されるデータセグメントの長さの関係を変更する。さらに、入力、及び出力データセグメントは整合（ａｌｉｇｎ）している必要はない。加えて、入力データ・セグメント（例えばブロック又はフレーム）において伝送されるメタデータは、ダイナミックレンジコントロールインパクト（すなわちゲイン値の適用が影響するストリームの範囲）の領域を持っている点に留意する必要がある。これは、正確にデータセグメントのように大きくはないが、比較的大きい。これは、使用されたトランスコードのオーバーラップした重畳（ｏｖｅｒｌａｐ−ａｄｄ）特徴によるものであり、かつ、ダイナミック・レンジコントロールがスペクトル領域においてしばしば適用されるという事実によるものである。出力されるオーディオ・ストリームのダイナミック・レンジコントロールデータに対しても。しばしば同じことが言える。したがって、入力ゲイン値が、所与の出力データセグメントに影響するかを判断するためには、入力及び出力データセグメントのオーバーラップを考慮するのではなく、入力及び出力インパクト長さのオーバーラップに注目する必要がある。この詳細は、後述する。

上で述べた理由によって、ダイナミック・レンジコントロールデータのトランスコーディングでは、出力のダイナミック・レンジコントロール値が、複数の入力のダイナミック・レンジコントロール値によって影響されるということを、考慮すべきである。この場合、データストリームをトランスコーディングする場合に、ダイナミック・レンジコントロールデータのリサンプリング（リフレーミング）が実行されてもよい。したがって、本方法は、第１のオーディオ・ストリームの受信されたオーディオメタデータから得られるゲイン値をリサンプリングするステップを有してもよい。第１のオーディオ・ストリームのデータセグメントが第２のオーディオ・ストリームのデータセグメントより短い時間をカバーする場合、ゲイン値は、ダウンサンプリングされる。

リサンプリングされたゲイン値は、複数の連続的なゲイン値の最小値を計算することによって決定されてもよい。換言すれば、多くの入力ダイナミック・レンジコントロールゲイン（これは、出力されるデータセグメントに関連する）から、最も小さいものが選択される。このことをする動機は、可能な限り受信した値（値が信号のクリッピングを発生させない場合）を温存（ｐｒｅｓｅｒｖｅ）するためである。しかしながら、ゲイン値がリサンプリングされなければならないので、しばしばこれは可能でないことがある。したがって、最も小さいゲイン値が選択される。そして、これによって信号の振幅を減少させることになる。しかしながら、この信号の振幅の減少は、より知覚しがたく、耳障りでもないと認識される。望ましくは、この種の最低値は、出力データセグメント毎に決定される。

ダイナミック・レンジコントロールに関連するゲインメタデータが第１のオーディオ・ストリームに存在しない場合には、本方法は好ましくは第２のオーディオ・ストリーム（出力されるストリーム）のクリッピングからの保護に充分なゲイン値を加える。ゲインの値が１を上回らないよう、好ましくはこれらのゲイン値が制限されなければならない。ゲイン値が１を上回るのを防止する理由は、信号がクリッピング境界に近くなるほどに不必要に増幅されないようにするためである。

したがって、それぞれの計算された第２のゲイン値が１を下回るゲインである場合には、加えられたそれぞれのゲイン値は計算された第２のゲイン値に対応する。それぞれの計算された第２のゲイン値が１を超える場合には、それぞれの加えられたゲイン値は１のゲインに設定される。

応用例の第２の態様は、デジタルオーディオ・データから得られるオーディオ信号の信号クリッピングからの保護を提供する装置に関する。装置は、上述の方法を実行するよう構成される。装置の特徴は、上述の方法の特徴に対応する。したがって、本装置は、受信されたオーディオメタデータに基づく第１のゲイン値がオーディオ信号のクリッピングからの保護に充分であるかどうかを決定する手段を有する。さらに、装置は、第１のゲイン値が充分でない場合には、第１のゲイン値を、オーディオ信号のクリッピングからの保護に充分なゲイン値と置き換えるための手段を有する。

望ましくは、決定する手段は、デジタルオーディオ・データに基づいて第２のゲイン値を計算する手段を有する。ここで、第２のゲイン値は、オーディオ信号のクリッピングを保護するに充分である。より好ましくは、決定する手段は、また、受信されたオーディオメタデータに基づいて、第１のゲイン値を、計算された第２のゲイン値と比較するための比較手段を有する。上記に関連して、ゲイン値は、第１のゲイン値、及び計算された第２のゲイン値から選択される。

応用例の第１の態様に関連する上述の記載は、また、応用例の第２の態様に適用できる。

応用例の第３の態様は、トランスコーダに関する。ここで、トランスコーダは、第１のオーディオ符号化フォーマットから、第２のオーディオ符号化フォーマットにオーディオ・ストリームをトランスコーディングするように構成される。このトランスコーダには、応用例の第２の態様の装置が含まれる。トランスコーダは第１のオーディオ・ストリームを受信する受信デバイスの一部であることが望ましい。ここで、第１のオーディオ・ストリームは、デジタル放送信号、例えばデジタルテレビジョン信号（例えばＤＶＢ−Ｔ、ＤＶＢ−Ｓ、ＤＶＢ−Ｃ）、又はデジタル無線信号（例えばＤＡＢ信号）のオーディオ・ストリーム）である。例えば、受信デバイスは、セットトップボックスである。オーディオ・ストリームは、また、インターネットを介してブロードキャストされてもよい（例えばインターネットＴＶ又はインターネット・ラジオ）。あるいは、第１のオーディオ・ストリームは、デジタル・データ蓄積媒体（例えばＤＶＤ、又はＢｌｕｒａｙディスクから読み込まれてもよい。

応用例の第１及び第２の態様に関連する上記の記載は、また、応用例の第３の態様に適用できる。

本発明については、添付の図面を用いて、例示として以下に説明する。

クリッピングの保護を提供するトランスコーダの実施例を例示する図である。メタデータをリフレームする好適なアプローチを例示する図である。受信されたオーディオ・データに基づいてピーク値を決定するための実施例を示す図である。受信したダイナミック・レンジコントロールデータを、クリッピングを保護するに充分な計算されたゲイン値にマージする実施例を示す図である。出力されるゲイン値の選択を示す図である。受信したダイナミック・レンジコントロールデータを、クリッピングを保護するに充分な計算されたゲイン値にマージするための別の実施例を示す図である。スムージングフィルタステージの実施例を示す図である。クリッピングの保護を提供するための他の実施例を示す図である。クリッピングの保護を提供するためのさらに別の実施例を示す図である。トランスコードされたオーディオ・ストリームを受信する受信デバイスを例示する図である。

ＡＡＣ／ＨＥ−ＡＡＣ、及びドルビーデジタル／ドルビーデジタルプラスは、メタデータのコンセプトをサポートする。より詳細にはデコーディングにオーディオ・データに任意に適用される時変（ｔｉｍｅｖａｒｙｉｎｇ）ゲインを有するゲインワードをサポートする。データを減少させるために、これらのゲインワードは、通常はデータセグメント毎に（例えばブロック、又はフレーム毎に）、一度送られるだけである。上述のオーディオ・フォーマットにおいて、これらのゲインワードは、任意である。すなわち、このデータを送信しないことが技術的に可能である。ドルビーデジタル、及びドルビーデジタルプラスエンコーダは通常はゲインワードを送信するのに対し、ＡＡＣ、及びＨＥ−ＡＡＣエンコーダはしばしばこのゲインにワードを送信しない。しかしながら、このゲインワードを送信するＡＡＣ、及びＨＥ−ＡＡＣエンコーダの数は増加している。応用例は、いずれの状況においても、オーディオ・ストリームを受信するデコーダ、又はトランスコーダが正しく動作することを可能とする。オーディオゲインワードが提供される場合、「正しい取り扱い」は、受信したオーディオゲインワードを、できる限り忠実に処理することである。しかし、受信されたオーディオゲインが、信号クリッピングを防止するために振幅を減少させるに十分でない場合、例えばダウンミックスの場合には、これを無視（ｏｖｅｒｒｉｄｅ）する。ゲイン値が提供されない場合には、「正しい取り扱い」は、信号クリッピングを防止するゲイン値を算出し、かつ提供することになる。

図１は、トランスコーダの実施例である。トランスコーダによって、信号クリッピングからの保護を提供する。特にダウンミックスする（例えば５．１−チャンネル信号から２−チャンネル信号へのダウンミックスの）際に、クリッピングから保護する。トランスコーダは、オーディオメタデータを有するデジタルオーディオストリーム１を受信する。例えば、デジタルオーディオストリームは、ＡＡＣ、又はＨＥ−ＡＡＣ（ＨＥ−ＡＡＣバージョン１、又はＨＥ−ＡＡＣバージョン２）デジタルオーディオストリームである。デジタルオーディオストリームは、ＤＶＢビデオ／オーディオ・ストリーム（例えばＤＶＢ−Ｔ、ＤＶＢ−Ｓ、又はＤＶＢ−Ｃストリーム）の部分であってもよい。トランスコーダは、受信されたオーディオ・ストリーム１を、異なるフォーマット（例えばドルビーデジタル、又はドルビーデジタルプラス）にエンコードし、出力オーディオ・ストリーム１４にトランスコーディングする。通常は、ドルビーデジタル・デコーダは、多重チャネル信号のダウンミキシングをサポートし、かつ受信されたドルビーデジタル・メタデータに含まれる時変ゲインエンベロープがダウンミックス・クリッピングの保護を含むと仮定する。残念なことに、ビットストリーム１（例えばＡＡＣ／ＨＥ−ＡＡＣビット列）が時変ゲインエンベロープ・メタデータを必ずしも含むというわけではない。そして、この種のデータがある場合でさえ、データがクリッピングを保護する点を含むかどうか明らかでない。トランスコーダ（例えばドルビーデジタル・デコーダ）は、受信デバイス（トランスコーダのダウンストリーム）のデコーダが信号をダウンミックスする場合に、クリッピングアーティファクトを含む出力信号を生成するのを防止する。トランスコーダは、出力オーディオ・ストリーム１４が、ダウンミックスのクリッピング保護を含む時変ゲインエンベロープ・メタデータを含むことを確実にする。

図１において、ユニット２は、オーディオ・ストリーム１のオーディオメタデータに含まれるダイナミック・レンジコントロールゲイン値３を読み出す。任意に、ゲイン値３は、ユニット５において更に処理される。例えば、ゲイン値３は、リサンプリングされ、かつトランスコードされた出力オーディオ・ストリーム１４のデータ・セグメント・タイミングに従ってトランスコードされる。メタデータゲイン値のリサンプリング、及びトランスコーディングは、非特許文献１に記載されている。本論文（特にリサンプリングするためのコンセプト、及びメタデータゲイン値のトランスコーディング）の開示は、本願明細書に引用したものとする。加えて、出願人による「オーディオメタデータのトランスコーディング」と題する２００８年９月３０日に出願した特許文献１は、メタデータゲイン値をリサンプリングし、トランスコーディングすることに関して開示している。この出願、特にリサンプリングするためのコンセプト、及びメタデータゲイン値のトランスコーディングの開示は、本願明細書に引用したものとする。

リサンプリングすることと並行して、オーディオ・データデコーダ６によって、オーディオ・ストリーム１のオーディオ・データは、通常はＰＣＭ（パルス符号変調）に、デコードされる。デコードされたオーディオ・データ７は、複数のパラレル信号チャネル（例えば５．１−チャンネル信号の場合には６つの信号チャネル又は７．１−チャンネル信号の場合には８つの信号チャネル）を有する。

コンピューティングユニット８は、オーディオ・データ７に基づいて計算されたゲイン値９を決定する。計算されたゲイン値９は、トランスコーディングされたオーディオ・ストリームを受信するトランスコーダの受信デバイスダウンストリームにおいて、特に受信デバイスの信号をダウンミックスする場合に、信号クリッピングからの保護として充分である。この種のデバイスは、ＡＶＲ、又はテレビであってもよい。計算されたゲイン値は、ダウンミックスされた信号が最大で０ｄＢＦＳ以下であることを保証しなければならない。オーディオ・ストリーム１から得られるゲイン値４と、計算されたゲイン値９とは、メタデータユニット１０において比較される。ユニット１０は、ゲイン値１１を出力する。ここでゲイン値ストリーム４のそれぞれのゲイン値が受信デバイスの信号クリッピングを防止するのに十分でない場合には、ゲイン値ストリーム４のゲイン値はゲイン値ストリーム９から得られるゲイン値と置き換えられる。並行して、オーディオ・データ７は、出力オーディオ・エンコーディングフォーマットに（例えばドルビーデジタル、又はドルビーデジタルプラスに）、エンコーダ１２によってエンコードされる。エンコードされたオーディオ・データ、及びゲイン値１１は、ユニット１３おいて統合される。その結果得られるオーディオ・ストリームは、特に信号ダウンミックスの場合に信号クリッピングを防止するオーディオゲインメタデータを提供する。

通常、受信したオーディオゲインメタデータは、このゲインメタデータが信号クリッピングの保護を提供する限り、できる限り温存するべきである。ほとんどの場合、入力されたオーディオ・ストリーム（図１の１を参照）のデータ・セグメント（例えばブロック又はフレーム）の長さと、出力オーディオ・ストリーム（図１の１４を参照）のデータ・セグメント（例えばブロック又はフレーム）の長さとは、異なる。さらに、通常は、（データセグメント長が同一の場合であっても）入力されたオーディオ・ストリームのデータセグメントの始まり、及び出力されるオーディオ・ストリームのデータセグメントの始まりは、整列配置（ａｌｉｇｎｅｄ）されない。したがって、通常はメタデータから出力されるメタデータへのマッピングが必要である。

図２は、出力されるメタデータに、受信したメタデータをマッピングするための好適なアプローチを例示している。上述のように、通常は、各々のデータ・セグメント（例えばブロック又はフレーム）は、ダイナミック・レンジコントロールデータの一つのゲイン値（又は複数のゲイン値、例えば８個のゲイン値）を有する。しかしながら、入力データ・セグメント（例えばブロック又はフレーム）と一緒に伝送されるメタデータは、ダイナミック・レンジコントロール・インパクト（すなわちゲイン値の適用が効果を及ぼすストリームの範囲）の領域を持つ。これは、正確にデータセグメントと同じではないが、比較的大きい。この理由は、使用されたトランスコードのオーバーラップアッド（ｏｖｅｒｌａｐ−ａｄｄ）の特徴によるものであり（すなわち、データセグメントより大きいウィンドウが使用され、ウィンドウが重なる）、加えて、ダイナミック・レンジコントロールがスペクトル領域においてしばしば適用されるということによるものである。同じことは、出力されるオーディオ・ビットストリームのダイナミック・レンジコントロールデータに対してもしばしば当てはまる。図２において、実線は、入力ストリームのデータセグメント２０−２３の始めと終わり、及び出力ストリームのデータセグメント２４−２６の始めと終わりを表す。図２において、ゲイン値のダイナミック・レンジコントロール・インパクト３０−３３、及び３４−３６の各々の領域は、それぞれのデータセグメントの終わり、及び始まりを越えて重なっている。インパクト３０−３３、及び３４−３６の各々の領域は、破線によって示される。

例えば、ＨＥ−ＡＡＣで、ブロック・サイズは２５６のサンプルであるのに対し、デコーディングのウィンドウは５１２のサンプルを有する。５１２のサンプルの全部のウィンドウは、インパクトの領域と考えてもよい。しかしながら、ウィンドウの外側端縁のゲイン値のインパクトは、ウィンドウの中央でのインパクトと比較してより小さい。したがって、インパクトの領域は、また、ウィンドウの一部と考えてもよい。インパクトの領域は、ブロック／フレームサイズ（この場合には、２５６サンプル）からウィンドウサイズ（この場合には、５１２サンプル）の間から選択され得る。望ましくは、インパクトの使用された領域は、データ・セグメント（ブロック、又はフレーム）のサイズより大きい。

どの入力ダイナミック・レンジコントロール値が与えられた出力データセグメントに影響するかを決定するためには、（入力、及び出力データセグメントの重なりに注目する代わりに）入力と出力のインパクト領域の重なりに注目することが好ましい。図２において、入力ストリームのインパクト３０−３３のどの領域が、入与えられた出力データセグメント２４−２６のインパクト３４−３６の領域と重なるかが決定される。例えば、出力ストリームのデータセグメント２４のインパクトの領域３４は、領域３０、３１、３２、及び３３と重なる。したがって、好ましくは、４つのデータセグメント２０、２１、２２及びの２３に関連するゲイン値は、図示の出力ストリーム第１のデータセグメント２４のゲイン値を決定する場合に考慮される。第１のデータセグメント２４は、４つの入力データセグメント２０−２３によって影響される。あるいは、本方法は、入力インパクト領域及び出力信号セグメントの重なり、又は、入力データセグメント及び出力データ・グメントの重なりに注目してもよい。

この種のマッピング又はリサンプリングのプロセスは、図１のユニット５において行われてもよい。そして、これは、入力ストリーム１のゲイン値３を受信し、かつゲイン値３の一つ以上をゲイン値４にマップする。

図３は、受信されたオーディオ・データに基づいてピーク値を決定するためのブロック５０の実施例である。ブロック５０を決定するこの種のピークは、図１のブロック８の部分であってもよい。複数のチャネル（この場合、５．１−チャンネル信号の５チャネルであり、低周波効果チャネルは考慮されない）を有するデコードされた多重チャネルオーディオ・データ７に基づいて、一つ以上のダウンミックス方式によって、ダウンミキシングが（一つ以上のダウンミキシングマトリックスに従って）実行される。トランスコーダは、ダウンミキシングが受信デバイスにおいて実行されるかどうかについて全く知っておらず、かつ、どのダウンミキシング方式が受信デバイスにおいて使用されるかわからない点に留意する必要がある。したがって、多重チャネル信号が独立のチャネルによって再生されるか、又は、いくつかの方式のうちの１つでダウンミキシングが実行されるかは、知られていない。トランスコーダは、全てのケースをシミュレーションし、かつ最悪のケースを決定する。

図３の実施例において、Ｌｏ／Ｒｏダウンミキシング方式に従って、ブロック４１においてダウンミキシングが実行される。ＰｒｏＬｏｇｉｃ（ＰＬ）ダウンミキシング方式に従って、ブロック４２において、ダウンミキシングが実行される。ＰｒｏＬｏｇｉｃＩＩ（ＰＬＩＩ）ダウンミキシング方式に従って、ブロック４３において、ダウンミキシングが実行される。ＰＬダウンミキシング方式及びＰＬＩＩダウンミキシング方式は、上述のＬｔ／Ｒｔダウンミキシング方式の変形例である。各々のダウンミキシングの方式は、右チャンネル信号、及び左チャンネル信号を出力する。それから、ダウンミックスした後の信号の絶対値が計算される（図３のブロック４４を参照）。望ましくは、また、多重チャネル・オーディオ信号７のさまざまなチャネルの絶対のサンプル値が計算される（絶対値を計算するブロック４０を参照）。チャネルの絶対値を（ダウンミックスせずに）考慮することは、ダウンミキシング以外の別のケースにおいて、信号クリッピングを防止するために有用である。例えば、信号が余分のゲインによって後で増幅される場合（例えば後述するように、ＲＦモードの場合の１１ｄＢゲイン）が挙げられる。

絶対値の最大（＝ピーク値）は、ブロック４５において一度に計算される。最大の計算は連続的に行われる。それによって、ピーク値４６のストリームを生成する。さまざまなサンプルは、異なる信号処理によって、異なる信号遅延が発生し得る。この種の異なる信号遅延は、整列配置してもよい（図示せず）。サンプル値の最大は、全てのケースにおいて信号が持ち得る最大振幅を表す。したがって、これはクリッピング保護アルゴリズムが考慮する最悪のケースである。トランスコーダは、したがって一度に受信デバイスの信号の最悪の場合の振幅をシミュレーションする。クリッピングからの保護を達成するダイナミック・レンジコントロール値は、最大で０のｄＢＦＳになるよう、振幅を減少させるか増幅させなければならない。ブロック５０は、図３に示す複数の絶対値より少ない絶対値に基づいて（例えば、ダウンミキシングされていないチャネルの絶対値を考慮せずに）ピーク値を決定してもよい点に留意する必要がある。あるいは、付加的な絶対値（例えば、他のダウンミキシング方式の絶対値）に基づいてこれを決定してもよい（図３に図示せず）。あるいは、ピーク値を判断することなくチャネル７をダウンミキシングすることも可能である。例えば、その結果得られる２つのチャネルが統合されてもよい。そして、統合された信号は（ブロック４５に出力されるピーク値４６を使用する代わりに）更に処理される。

ピーク値４６の更なる処理を図４に示す。図１及び４の要素で同じ参照符号が付されたものは、基本的に同じ要素を示している。ピーク値４６は、ブロッキングし、かつ最大を生成するユニット６０のステップの処理を通過する。この場合に、最も高いピーク値は、与えられた出力データ・セグメント（例えば１ブロック）に対して決定される。換言すれば、ピーク値は、複数のピーク値から、出力データセグメントに対する最も高いピーク値を選択することによってダウンサンプリングされる（それは、最も重要なものである）。好ましくは、出力部分のサンプルが最大を決定するために考慮されるのは、信号に対応する連続的なピーク値だけではない点に留意する必要がある。むしろ、与えられたデータセグメントに影響する付加的な（先の、及び後の）ピーク値が考慮される。すなわち、デコーディング・ウィンドウの始めと終わりで信号サンプルに関するピーク値である。望ましくは、ウィンドウの全てのサンプルが考慮される。

このサンプリングの結果は、式Ｃ＝１／Ｘに従って、ブロック６１においてインバート（ｉｎｖｅｒｔ）される。ここで、Ｃは計算されたゲイン値９を指す。そして、Ｘは、出力ストリーム１４のブロックに対するそれぞれの最も高いピークを指す。結果Ｃは、ゲインがそれぞれのオーディオ・サンプルに適用される場合に、データ・セグメント（例えば、ブロック）の各々のオーディオ・サンプルが最大信号レベル１（０ｄＢＦＳに対応する）より小さいことを保証する倍率（ｆａｃｔｏｒ）（ゲイン）を表す。これは、このデータセグメントに対するクリッピングを回避する。最大信号レベルとは、トランスコードされたオーディオ・ストリームのレシーバの信号の最大信号レベルを意味する点に留意する必要がある。したがって、ブロック６０の出力で、振幅は、１より大きくてもよい（Ｃ＜１とき）。計算されたゲインＣは、クリッピングを防止する最大許容ゲインである。また、計算されたゲインＣより小さいゲイン値が使用されてもよい（この場合、その結果得られる信号は、さらに小さい）。ゲインＣが１より小さい場合には、ゲインＣ（又はより小さいゲイン）が適用されなければならない点に留意する必要がある。そうでないと、少なくとも信号は最悪ケースのシナリオでクリッピングすることなる。

ブロック５で、メタデータからの受信したゲイン値３が同様にリサンプリングされる。出力データセグメントに関連する多くの受信したゲインから、最も小さいゲインが選択され、かつ更なる処理のために使用される。望ましくは、図２に対応して述べたように、リサンプリングが実行される。受信したゲイン値のうち、どれが出力データセグメントに関連するか決定するために、入力と出力のインパクト領域の重なりが考慮される。受信したデータセグメントのインパクト領域が与えられた出力データセグメントのインパクト領域と重なる場合、最も小さいゲイン値を決定する場合に、受信したデータ・セグメント（すなわちそのゲイン値）が考慮される。その代わりに、また、図２で述べたように、２つのアプローチが使用されてもよい。

以上の処理をする理由は、受信した値を保存するためである。しかしながら、ゲイン値は出力ストリームのタイミングに従ってリサンプリングされなければならないので、これは可能でない。複数の連続的なゲイン値からの最も小さいゲイン値を用いることは、より目立たず、耳障りでないかたちで、信号振幅を減少させる傾向があると考えられている。

関連したダイナミック・レンジコントロールデータが、受信したデータストリーム１に存在する場合には、この（好ましくはブロック５でリサンプリングした後での）ゲインと、クリッピングを保護するために十分であると計算されたゲイン値９とが、ブロック１０で比較される。ブロック６２は、リサンプリングされたゲイン値４と、計算されたゲイン値９との間で最小値のものを決定する。より小さいゲイン値が、出力されるゲイン値として使用される（ブロック６２最小値セレクタを形成する）。

受信したゲイン値が存在しない場合には、図４のスイッチ６３が上の位置に切り替えられ、ブロック６２において、ゲイン１と計算されたゲイン値との間の最小値を特定する。より小さいゲイン値が出力されるゲイン値として使用される。したがって、受信したゲイン値がない場合には、出力されるゲイン値は最大ゲインが１に限られる。

以下のテーブルは、ブロック１０の比較オペレーションを示す。ここで、「Ｉ」は、（リサンプリングした後の）受信したダイナミック・レンジコントロールゲイン４を意味する。そして、「Ｃ」は計算されたゲイン９を意味する。

Ｉ及びＣが１より小さいか等しい場合には、最小値が選定される。これはＩがすでにクリッピングの保護を保証する場合、または、そうでない場合、これはＣと置き換えられる。

Ｃ＞１かつＩ＝＜１の場合、信号は、増幅することができ、かつ依然としてクリッピングしない。例えばダイナミックレンジを制限する目的で、受信したストリームは、振幅を減少させるリクエストを要求する。したがって、Ｉは維持される（この場合Ｉは、Ｉ及びＣの最小値である）。

Ｉ＞１かつＣ＝＜１の場合、受信した値はクリッピング保護を妨害する。したがって、Ｃが採用される（この場合Ｃは、Ｉ及びＣの最小値である）。

Ｉ及びＣが１より大きい場合には、入力は増幅される。未だクリッピングが起こらない限り、この増幅は許される。したがって、Ｉ及びＣのうち小さい方が使用される。

ダイナミックレンジ値が受信されない場合には、Ｃ＝＜１である限り、Ｃを使用することによりクリッピング保護は確実となる。Ｃ＞１の場合においては、信号は修正されない（すなわち、信号は、クリッピング境界に近くなるような不必要な増幅はなされてはならない）。それで、出力のゲインの統一がなされる。いずれの場合においても、ゲイン値が受信されない場合には、（ＩとＣとの間の最小値ではなく）１及びＣのうちの最小値が使用される。

図５は、出力されるゲイン値１１の選択のフローチャートである。ゲイン値Ｉが存在するか（図５の１３０を参照）どうかが判断される。現在、ゲイン値Ｉが存在する場合、出力されるゲイン値は受信したゲイン値Ｉ、及び計算されたゲイン値Ｃの値に依存する。Ｉ＝＜１かつＣ＝＜１の場合、選択されたゲイン値は、Ｉ及びＣの最小値に対応する（１３１を参照）。Ｉ＜＝１かつＣ＞１である場合、選択されたゲイン値は、Ｉに対応する（１３２を参照）。Ｉ＞１かつＣ＝＜１である場合、選択されたゲイン値はＣに対応する（１３３を参照）。Ｉ＞１かつＣ＞１である場合ある、選択されたゲイン値は、Ｉ及びＣの最小値に対応する（１３４を参照）。これらの４つのケースの全てで、依然として出力される値は、Ｉ及びＣの最小値に対応する点に留意する必要がある。したがって、Ｉ及びＣは、＝＜１かどうかについて判定する必要ない。

現在のゲイン値Ｉが存在しない場合、出力されるゲイン値は、計算されたゲイン値Ｃの値に依存する。Ｃ＝＜１である場合、出力されるゲイン値はＣに対応する（１３５を参照）。Ｃ＞１である場合、出力されるゲイン値は１に対応する（１３６を参照）。いずれの場合においても、依然として出力される値は、１とＣのうちの最小値に対応する点に留意する必要がある。したがって、Ｃ＝＜１であるかどうかについて決定することは必要でない。

上述の実施例では、受信したダイナミックスは保持され、クリッピングが起こる場合には、ダイナミックスはクリッピングを防止するために変更されるよう達成される。ダイナミック・レンジコントロール値がない場合には、充分なダイナミック・レンジコントロール値が、クリッピングするのを防止するために、ストリームに加えられる。モード間の切り替えは即座に、かつ滑らかに作用する。それによって、いかなるアーティファクトをも緩和する。

図６は、図４の実施例の変形例である。図４及び６の要素のうち、同じ記号のものは、基本的に同じものを表す。図６において、２つの異なるモードの異なるゲインメタデータ、すなわちライン・モード、及びＲＦモードが受信され、かつトランスコードされる。図６の実施例において、２つのタイプの異なるメタデータを使用するため、ＲＦモード、及びライン・モードに対する異なるゲインワードが計算される。ライン・モード・メタデータは、より小さいレンジの値をカバーし、かつより頻繁に送られる（通常はブロック毎に１回）。これに対して、ＲＦモード・メタデータは、より大きいレンジの値をカバーし、かつ送られる頻度はより少ない（通常はフレーム毎に１回）。ＲＦモードにおいて、信号は１１ｄＢの追加的ゲインによってブーストされる。そして、ダイナミックスが非常に限られたチャネル（例えばセットトップボックスからアナログＲＦアンテナ・リンクを介してＴＶのＲＦ入力へ）で信号が伝送される場合に、より高い信号対雑音比を実現する。さらに、ＲＦモードゲインメタデータは、ライン・モードのゲインメタデータより広いレンジの値をカバーするため、ＲＦモードは、より高いダイナミックレンジの圧縮を可能とする。ライン・モードのゲインメタデータは「ＤＲＣ」（符号３を参照）として表現される。これに対して、ＲＦモードのゲインメタデータは、「ｃｏｍｐｒ」として表現される（符号３’を参照）。ＤＶＢで、ＲＦモードのゲインメタデータは、「圧縮（ｃｏｍｐｒｅｓｓｉｏｎ）」、又は「強い圧縮（ｈｅａｖｙｃｏｍｐｒｅｓｓｉｏｎ）」として表現される点に注意する必要がある。さらに、図６の実施例は、また、プログラム基準レベル（ＰＲＬ：ｐｒｏｇｒａｍｒｅｆｅｒｅｎｃｅｌｅｖｅｌ）を考慮する。これは、メタデータの一部として伝送されてもよい。ＰＲＬは、オーディオ・コンテンツの基準ラウドネスを示す。（例えばＨＥ−ＡＡＣで、ＰＲＬは、０ｄＢから−３１．７５ｄＢの間で変化する）ＰＲＬの適用は、所与の目標基準レベルにオーディオのラウドネスを低下させる。オーディオ・エンコーディングフォーマットに依存して、他の語も共通に使われる。例えば、ダイヤログレベル、ダイヤログノーマライゼーション又はｄｉａｌｎｏｒｍが挙げられる。

図６において、受信されたＰＲＬに依存して（通常、レベルは、ＰＲＬによって減少する）、データブロックの最も高いピーク値（ユニット６０によって生成される）は、ユニット７０においてレベルが調整される。ライン・モードに関連づけられた計算ゲイン値については、レベル調整されたサンプルは、ブロック６１でインバートされる。このことにより、計算されたゲイン値を生成する。このゲイン値は、オーディオ信号が、レシーバにおいてＰＲＬによって調整された場合、各ブロックのオーディオ・サンプルは、最大信号レベル１より小さいか等しいことを保証する。ブロック５における受信したＤＲＣデータ３のリサンプリング、及びリサンプリングされたゲイン値４の比較、及び計算されたゲイン値は、図４と同一である。ＲＦモードに関連するゲイン値の計算のために、レベルが調整されたサンプルが、ブロック７１において１１ｄＢ増幅される。その理由は、レシーバにおいても、ＲＦモードを使用する場合には、この信号は１１ｄＢ増幅されるからである。トランスコーダは、したがって受信デバイスの信号の最悪の場合の振幅をシミュレーションする。ブーストされたサンプルはブロック６１’においてインバートされる。このことにより、オーディオ信号がＰＲＬによってレシーバにおいて調整され、かつ１１ｄＢブーストされた場合、各々のオーディオ・サンプルが１（＝最大信号振幅）以下であることを保証するＲＦモードの計算されたゲイン値を生成する
図６の実施例は、好ましくはドルビーデジタル・オーディオ・ストリーム（例えばドルビーデジタル・トランスコーダに対するＨＥ−ＡＡＣ又はドルビーデジタル・トランスコーダに対するＡＡＣ）を出力するトランスコーダに対して使用される。ドルビーデジタルによって、ライン・モード各々の符号化ブロックは、「ＤＲＣ」（ダイナミック・レンジコントロール）ゲイン値を有する。これに対してＲＦモードにおいて、各々のフレーム（６ブロックを含む）は、「ｃｏｍｐｒ」ゲイン値を有する。にもかかわらず、両方のタイプのゲイン値は、ダイナミック・レンジコントロールに関連する。ＲＦモードの計算されたゲイン値は、ブロック７３において、ブロックレートからフレームレートにダウンサンプリングされる。ブロック７３は、連続的な６ブロックの合計数の計算されたゲイン値の最小値を決定する。各々の最小値は、フレーム全体に対して、計算されたゲイン値７２に割り当てられる。ブロック５’において受信したｃｏｍｐｒゲイン値３’のリサンプリングは、ブロック５のリサンプリングとは異なる。これは、出力フレームのための最小値が判断されるという点で異なる。リサンプリングされたゲイン値４’と、計算されたフレーム・ベースのゲイン値７２については、既に述べた内容と同じである。

図６の実施例は、ダウンミキシングの場合のクリッピングだけでなく、ＲＦモードでの１１ｄＢの追加のゲインを適用する場合の信号クリッピングに対しても、保護を提供する（そうでないと、ダウンミキシングの信号を使用しないときでも、１１ｄＢブーストされた信号はクリッピングし得る）。したがって、ブロック５０において、ダウンミックスのないチャネルの絶対値を考えることは有利である。

ＰＲＬが受信されない場合には、好ましくは、ＰＲＬがデフォルト値にセットされる点に留意する必要がある。

計算ゲイン値のために、スムージングステージが使用されてもよい。図７は、ブロック５０の出力と、ブロック６１及び６１の入力との間のパスのどこに配置されてもよい、スムージングステージ８０の実施例である。望ましくは、スムージングステージ８０はブロック５０の出力に配置される。それによって、ピーク値４６に基づいてスムーズジングされたピーク値４６’を生成する。スムージングステージ８０は、スムージングステージの入力信号の低域フィルタをインプリメントする（例えばピーク値信号）。この目的は、クリッピング保護が投入された後の聴覚的な印象を改善するためである。クリッピング保護の後いきなりゲインを調節すると、耳障りとなることがあるためである。広くリミッタのインプリメンテーションで採用されているように、したがってピーク値信号（及びこれによって得られるゲイン信号：後述）に第１次のローパスフィルタによってフィルタをかける。これは、時定数τが２００ｍｓｅｃで動作することが望ましい。（新規な入力値がスムージングされた信号より高いために）新規な入力値が、スムージングされた信号が達成する程度より高いクリッピングの保護を要求する場合、これはスムージングステージをバイパスし、かつ直ちにエフェクトを与える。この場合、図７の最大計算ブロック８１の上の入力は、下の入力より大きい。望ましくは、図３乃至７の実施例は、オーディオ・トランスコーダの一部である。例えばＡＡＣ及び／又はＨＥ−ＡＡＣからのドルビーデジタルへの、又は、ドルビーＥ又はドルビーデジタルからのＡＡＣ及び／又はＨＥ−ＡＡＣへのトランスコーディングである。しかしながら、図３乃至７の実施例は、必ずしもオーディオ・トランスコーダの部分である必要はない点に留意する必要がある。これらの実施例は、受信したオーディオ・ストリーム１を受信し、かつ（トランスコーディングなしで）修正されたゲイン値を適用するデバイスの部分であってもよい。修正されたゲイン値は、受信されたオーディオ・ストリームのゲインを調整するために、直接使用されてもよい。例えば、図３乃至７の実施例は、ＡＶＲ、又はテレビの部分であってもよい。

図８は、ダウンミックス保護を提供するための別の実施例である。装置は、オーディオメタデータに含まれるか、又は、それから得られる、受信したゲインワード９０を受け取る。ゲインワード９０は、図１及び図４のゲイン値３又は４に対応してもよい。更に、この装置は、オーディオ・サンプル９１（例えばＰＣＭオーディオ・サンプル）を受信する。例えば、図３のブロック５０で生成されるように、オーディオ・サンプル９１はピーク値であってもよい。オーディオ・サンプル９１が絶対値でない場合、オーディオ・サンプル９１の絶対値が算出されてもよい。ブロック９２において、最大可能ゲイン値ｇａｉｎ_ｍａｘ（ｔ）が以下のように除算によって計算される。

この場合に、ｓｉｇｎａｌ_{ｍａｘ，ａｌｌｏｗｅｄ}は、最大可能信号振幅（例えばｓｉｇｎａｌ_ｍａｘ，_{ａｌｌｏｗｅｄ}＝１）を意味する。ｓｉｇｎａｌ（ｔ）は、現在のオーディオ・サンプル９１を意味する。

ブロック９３において、最大可能ゲイン値は最大ゲインの１までに限られる。ｇａｉｎ_ｍａｘ（ｔ）の値が１よりも大きい場合、ｇａｉｎ_ｍａｘ（ｔ）は、１に設定される。しかしながら、ｇａｉｎ_ｍａｘ（ｔ）の値が１以下の場合、その値は修正されない。ブロック９３の出力は、スムージングフィルタステージ９４に供給される。スムージングフィルタステージ９４は、低域フィルタ、及び２つの入力の最小値を選択する最小セレクタ９５を含む。処理は、図７のスムージングフィルタステージ８０と類似する。しかしながら、この場合に、最大セレクタ８１の代わりに最小セレクタ９５が使用される。なぜなら、フィルタステージ９４は、オーディオ・サンプル（ゲイン値は、オーディオ・サンプルをインバートすることによって得られる）の代わりにゲイン値をスムージングするからである。ブロック９２（それは、インバージョンによってゲイン値を決定する）のアップストリームに配置される場合には、スムージングフィルタステージ８０がその代わりに使用されてもよい。同様に、スムージングフィルタステージ９４は、ブロック６１及び／又は６１’のダウンストリームに配置される場合には、図４及び図５において使用されてもよい（なぜなら、ブロック６１及び／又は６１のダウンストリームは、ゲイン信号が処理されるからである）。スムージングフィルタステージ９４は、ブロック９３でゲイン値の突然の増加がある場合に信号傾斜をスムージングする（そうしないと、オーディオが耳障りに聞こえることがある）。これに対して、スムージングフィルタステージ９４は、ゲイン値が突然減少する場合には、ゲイン信号をスムージングせずに通過させる（そうしないと、信号がクリッピングするためである）。スムージングフィルタステージ９５の出力の計算されたゲイン信号９６は、受信したゲインワード９０と、最小セレクタ９７で比較される。実際の計算されたゲイン値９６、及び実際の受信したゲインワード９０の最小値は、最小セレクタ９７の出力となる。上述のように、最小セレクタ９７の出力のゲイン値９８は、ダウンミックス保護を提供し、かつトランスコードされたオーディオ・ストリームに埋め込まれてもよい。

図８の実施例が必ずしもオーディオ・トランスコーダの部分であるというわけではない点に留意する必要がある。出力ゲイン値は、受信されたオーディオ・ストリームのレベルを調整するために、直接使用されてもよい。この場合、図８の装置は、ＡＶＲ、又はテレビの部分であってもよい。

さらに、図８の実施例は、ダウンミキシングを考慮せずに、信号クリッピングを防止するために使用されてもよい。例えば、図８の実施例は、ブロック５０の更なる前処理をせずに、従来のＰＣＭオーディオ・サンプル９１を受信してもよい。この場合、図８の実施例は、ＰＣＭサンプル９１が出力ゲイン値によって増幅される時に、クリッピングするのを防止する。

図９は、別の実施例である。図８及び９の要素と同じ番号の要素は、基本的に同じものを示している。図８の実施例とは対照的に、図９の実施例は、図４及び図６の実施例のようなブロックに関する（ｂｌｏｃｋ−ｗｉｓｅ）作動バージョンである。ここでは、１つの除算だけが、信号ブロック（又はフレームなどのその他のいかなるデータセグメント）毎に実行される。これは、時間毎に除算の数を減少させる。図８ですでに述べたように、オーディオ・サンプル９１が図３のブロック５０で生成されてもよい。オーディオ・サンプル９１が絶対値でない場合、オーディオ・サンプル９１の絶対値が算出されてもよい（図９では示していない）。オーディオ・サンプル９１は、それから、スムージングフィルタステージ８０に供給される。これは、図７のスムージングフィルタステージ８０に対応する。図８とは対照的に、スムージングフィルタステージ８０は、ゲインサンプルの代わりにオーディオ・サンプルを処理する。したがって、スムージングフィルタステージ８０は、最小セレクタ９５の代わりに最大セレクタ８１を使用する。スムージングした後に、オーディブロック毎にサンプルの最大が、ユニット１００において決定される。それから、最大値はブロック１０１においてインバートされる。これによって、ブロック毎に最大許容ゲインを計算する。このゲイン値は、最小セレクタ９７において現在のゲイン値９０と比較される。両方の値のうちの最小値が最小セレクタ９７の出力として取り出される。上述のように、最小セレクタ９７の出力のゲイン値９８はダウンミックスのクリッピング保護を提供し、かつトランスコードされたオーディオ・ストリームに埋め込まれてもよい。図９の実施例は、受信したゲイン値９０がない場合には、類似した方法でゲイン値９８を生成するために変更されてもよい。受信したゲイン値９０が無く、かつ計算されたゲインが１以下の場合には、計算されたゲイン値が出力される。計算されたゲイン値が１より大きい場合（かつ受信したゲイン値９０が無い場合）には、１のゲインを有するゲイン値が出力される。これは、図６の付加的なスイッチ６３によって実現されてもよい。このスイッチには、受信したゲイン値９０の存在に依存して、受信したゲイン値９０、及びのゲイン１との間のスイッチ切り替えを行う。上述したように、この実施例は、異なる圧縮インスタンスからのゲイン値を尊重するリミッタに対応する点に留意する必要がある。図１０は、図１のトランスコーダによって生成されたオーディオ・ストリーム１４をトランスコーディングしたものを受信する受信デバイスである。ブロック１２１は、ゲイン値１１をオーディオ・ストリーム１４から分離する。受信デバイスは、更に、デコードされたオーディオ信号１２０を生成するデコーダ１１０を備えている。デコードされたオーディオ信号１２０の振幅は図１において得られたゲイン値１１によってブロック１１２において調整される。オプションのダウンミックスがブロック１１３で実行される場合には、出力信号１１４はクリッピングしない。なぜなら、ゲイン値１１は、ダウンミックスの場合に、信号クリッピングを防止するのに十分であるからである。デコードされたオーディオ信号１２０の振幅は、ＰＲＬ（図示せず）によって更に調整されてもよい。また、図６に関連して述べたように、ゲイン値１１すなわちＲＦモードの１１ｄＢのブーストを考慮する場合には、オーディオ信号１２０は、また、クリッピング無しに（信号ダウンミックスの場合に、及び信号ダウンミックス以外の場合の両方で）１１ｄＢブーストされてもよい。

【０００８】
【特許文献】
【特許文献１】米国仮特許出願番号６１／１０１４９７号
【特許文献２】ＷＯ２００８／１００００９８

さらに、一部のオーディオ・エンコーディングフォーマットでは、メタデータが任意であるため、受信されたオーディオ・ストリームに、ダイナミック・レンジコントロールメタデータが全く含まれなくてもよい。ダイナミック・レンジコントロールメタデータが圧縮オーディオ・ストリームに含まれないか、又ダウンミックスのクリッピング保護が含まれない場合、マルチチャネル信号がより少ないチャネル数にダウンミックスされる場合、望ましくないクリッピングアーティファクトがデコードされた信号に発生しうる。特許文献２は、オブジェクトベースのオーディオ信号の処理のためのオーディオ符号化／復号化の方法を開示している。

Claims

デジタルオーディオ・データから得られるオーディオ信号の信号クリッピングからの保護を提供する方法であって：
受信されたオーディオメタデータに基づく第１のゲイン値が前記オーディオ信号のクリッピングからの保護に充分であるかどうかを決定するステップであって、前記受信されたオーディオメタデータは第１のデジタルオーディオストリームに埋め込まれている、ステップと；
第１のゲイン値が充分でない場合には、前記それぞれの第１のゲイン値を前記オーディオ信号のクリッピングからの保護に充分なゲイン値と置き換えるステップと；
を有する方法。
前記決定するステップは：
前記デジタルオーディオ・データに基づいて第２のゲイン値を計算するステップであって、前記第２のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分である、ステップと；
前記受信されたオーディオメタデータに基づく前記第１のゲイン値、及び、前記計算された第２のゲイン値を比較するステップと；
を含む、請求項１記載の方法。
前記第２のゲイン値を計算するステップは：
最大許容ゲイン値を決定するステップ；
を含む、請求項２記載の方法。
前記比較するステップに依存して、ゲイン値は、前記第１のゲイン値、及び前記計算された第２のゲイン値から選択され、
ゲイン値と置き換えるステップは、計算された第２のゲイン値を選択することによって実行される、
請求項２又は３に記載の方法。
一対の第１及び第２のゲイン値の最小値が選択される、
請求項４記載の方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有する、
請求項１ないし５のうちいずれか１項記載の方法。
前記オーディオ信号はダウンミックスされたオーディオ信号であり、
当該方法は、前記ダウンミックスされた信号に対する信号クリッピングからの保護を提供する、
請求項１ないし６のうちいずれか１項記載の方法。
前記第１のゲイン値が保護に充分であるかどうかを決定するステップは、
少なくとも第１のダウンミキシングの方式によって前記デジタルオーディオ・データをダウンミキシングするステップ；
を含む、請求項１ないし７のうちいずれか１項記載の方法。
前記第１のゲイン値が保護に充分であるかどうかを決定するステップは、
ピーク値を計算するステップ、を含み、
ピーク値は一度に、少なくとも２つのオーディオ信号の絶対値の最大を決定することによって計算され、
前記少なくとも２つのオーディオ信号は、
・前記第１のダウンミキシングの方式によってダウンミックスした後の一つ以上のオーディオ信号、
・ダウンミキシングの前の一つ以上のオーディオ信号、及び、
・第２のダウンミキシングの方式によってダウンミックスした後の一つ以上のオーディオ信号、
の群から選択される、
請求項８記載の方法。
前記第１のゲイン値が保護に充分であるかどうかを決定するステップは、
前記デジタルオーディオ・データから得られる複数の連続的な信号値の最大を決定するステップ；
を含む、請求項１ないし９のうちいずれか１項記載の方法。
前記第１のゲイン値が保護に充分であるかどうかを決定するステップは、
計算ピーク値を計算するステップ、を含み、
ピーク値は、一度に少なくとも２つのオーディオ信号の絶対値の最大を決定することによって計算され、
前記少なくとも２つのオーディオ信号は、
・第１のダウンミキシングの方式によってダウンミックスした後の一つ以上のオーディオ信号、
・ダウンミキシングの前の一つ以上のオーディオ信号、及び、
・第２のダウンミキシングの方式に従ってダウンミックスした後の一つ以上のオーディオ信号、
の群から選択され、かつ、
複数の連続的な信号値は、連続的なピーク値、又は連続的なフィルタリングされたピーク値に対応する、
請求項１０記載の方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
前記第２のオーディオ・ストリームはデータセグメントで構成され、かつ、
前記第２のオーディオ・ストリームのセグメントに関連する複数の信号値の前記最大が決定される、
請求項１０又は１１に記載の方法。
最大の信号値は、前記決定された最大によって除算される、
請求項１０ないし１２のうちいずれか１項記載の方法。
前記決定された最大は、インバートされる、
請求項１０ないし１２のうちいずれか１項記載の方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
前記第１のオーディオ・ストリームは、データセグメントで構成され、少なくとも１つのゲイン値が、前記第１のオーディオ・ストリームのデータセグメント毎に受信され、
前記第２のオーディオ・ストリームは、データセグメントで構成され、かつ、
当該方法は、
前記第１のオーディオ・ストリームのゲイン値をリサンプリングするステップ、を更に有する、
請求項１ないし１４のうちいずれか１項記載の方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
前記第１のオーディオ・ストリームは、データセグメントで構成され、少なくとも１つのゲイン値が、前記第１のオーディオ・ストリームのデータセグメント毎に受信され、
前記第２のオーディオ・ストリームは、データセグメントで構成され、かつ、
当該方法は、
前記第１のオーディオ・ストリームの複数の連続的なゲイン値の最小値を決定するステップ、を更に有する、
請求項１ないし１５のうちいずれか１項記載の方法。
前記複数の連続的なゲイン値は、各々インパクト領域を有し、かつ、これらのゲイン値の前記インパクト領域は、前記第２のストリームのゲイン値の前記インパクト領域と重なる、
請求項１６記載の方法。
ダイナミック・レンジコントロールに関連するメタデータが、前記第１のオーディオ・ストリームに存在しない場合には、前記オーディオ信号のクリッピングからの保護に充分なゲイン値が加えられる、
請求項１ないし１７のうちいずれか１項記載の方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
ダイナミック・レンジコントロールに関連するメタデータが、前記第１のオーディオ・ストリームに存在しない場合には、前記オーディオ信号のクリッピングからの保護に充分なゲイン値が前記第２のオーディオ・ストリームに加えられる、
請求項１８記載の方法。
前記加えられたゲイン値は、最大でゲイン１に限定されている、
請求項１８又は１９に記載の方法。
当該方法は、前記デジタルオーディオ・データに基づいて、第２のゲイン値を計算するステップを有し、前記第２のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分であり、
それぞれの計算された第２のゲイン値が１より小さいゲインを有する場合、前記加えられたゲイン値は、前記計算された第２のゲイン値に対応し、かつ、
それぞれの計算された第２のゲイン値が１より大きいゲインを有する場合、前記加えられたゲイン値は、ゲイン１に対応する、
請求項２０記載の方法。
スムージングフィルタが、前記第２のゲイン値を生成するために使用される、
請求項２ないし２１のうちいずれか１項記載の方法。
デジタルオーディオ・データから得られるオーディオ信号の信号クリッピングからの保護を提供する装置であって：
受信されたオーディオメタデータに基づいて、第１のゲイン値が前記オーディオ信号のクリッピングからの保護に充分であるかどうかを決定するための決定手段であって、前記受信されたオーディオメタデータは、第１のデジタルオーディオストリームに埋め込まれている、決定手段と；
前記第１のゲイン値が保護に充分でない場合には、第１のゲイン値を前記オーディオ信号のクリッピングからの保護に充分なゲイン値と置き換えるための置換手段と；
を有する方法。
前記決定手段は、
前記デジタルオーディオ・データに基づいて、第２のゲイン値を計算するための計算手段であって、前記第２のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分である、計算手段と；
前記受信されたオーディオメタデータに基づく前記第１のゲイン値、及び、前記計算された第２のゲイン値を比較するための比較手段と；
を有する請求項２３記載の装置。
当該装置はトランスコーダの部分であり、
前記トランスコーダは、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへ、トランスコーディングし、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有する、
請求項２３又は２４に記載の装置。
前記オーディオ信号はダウンミックスされたオーディオ信号であり、
当該装置は、前記ダウンミックスされた信号に対する信号クリッピングからの保護を提供する、
請求項２３ないし２５のうちいずれか１項記載の装置。
トランスコーダは、
第１のオーディオ符号化フォーマットで符号化された第１のオーディオ・ストリームから、
第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへトランスコーディングするように構成した、
請求項２３ないし２６のうちいずれか１項記載の装置を有するトランスコーダ。
前記第１のオーディオ・ストリームは、デジタル放送信号である、
請求項２７記載のトランスコーダ。
デジタルオーディオ・データから得られるオーディオ信号の信号クリッピングからの保護を提供する方法であって、
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
ダイナミック・レンジコントロールに関連するメタデータが前記第１のオーディオ・ストリームに存在しない場合、オーディオ信号のクリッピングに対する保護のために充分なゲイン値が、前記第２のオーディオ・ストリームに加えられる、
方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか、又はそこから得られるゲイン値を有し、
前記第１のオーディオ符号化フォーマットはＡＡＣ又はＨＥ−ＡＡＣであり、かつ、
前記第２のオーディオ符号化フォーマットはドルビーデジタルである、
請求項１ないし２２のうちいずれか１項記載の方法。
前記第１のオーディオ・ストリームは、ＤＶＢビデオ／オーディオ・ストリームの部分である、請求項３０記載の方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか、又はそこから得られるゲイン値を有し、
前記第２のオーディオ・ストリームはデータブロックで構成され、
前記第１のオーディオ・ストリームに埋め込まれた前記オーディオメタデータが、前記オーディオ・コンテンツのラウドネスを示しているメタデータを有し、
第２のゲイン値が、前記デジタルオーディオ・データに基づいて計算され、前記第２のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分であり、
前記第２のゲイン値の計算は、
前記第２のオーディオ・ストリームのデータブロックの複数のピーク値の最大値を決定するステップと；
前記オーディオ・コンテンツのラウドネスを示している前記メタデータに依存して、前記最大値のレベルを調整するステップと；
を含み、
前記受信されたオーディオメタデータに基づく第１のゲイン値及び前記計算された第２のゲイン値が比較される、
請求項９記載の方法。
前記オーディオ・コンテンツのラウドネスを示す前記メタデータは、プログラム基準レベル・メタデータである、請求項３２記載の方法。
前記第１のオーディオ・ストリームは、第１のモードのゲインメタデータと第２のモードの異なるゲインメタデータとを含み、前記第２のモードは、前記第１のモードより高いダイナミックレンジ圧縮を可能とし；
前記第１のモードの第２のゲイン値は、レベル調整された最大値に基づいて計算され、前記第１のモードの前記第２のゲイン値は、前記第１のモードのクリッピングを保護するに充分であり；
前記第１のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第１のモードの前記計算された第２のゲイン値とが比較され；
前記第２のモードの第２のゲイン値は、レベル調整された最大値を１１ｄＢだけ増幅することによって計算され、前記第２のモードの前記第２のゲイン値は、前記第２のモードのクリッピング保護に充分であり；
前記第２のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第２のモードの前記計算された第２のゲイン値とが比較される；
請求項３２又は３３に記載の方法。
当該方法は、
第１のオーディオ符号化フォーマットで符号化された前記第１のオーディオ・ストリームから、
前記第１のオーディオ符号化フォーマットと異なる第２のオーディオ符号化フォーマットで符号化された第２のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
前記第２のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか、又はそこから得られるゲイン値を有し、
前記第２のオーディオ・ストリームはデータブロックで構成され、
前記第１のオーディオ・ストリームは、第１のモードのゲインメタデータと第２のモードの異なるゲインメタデータとを含み、前記第２のモードは、前記第１のモードより高いダイナミックレンジ圧縮を可能とし；
前記第１のモードの第２のゲイン値は、最大値に基づいて計算され、最大値は、前記第２のオーディオ・ストリームのデータブロックの複数のピーク値の前記最大値であり、かつ、前記第１のモードの前記第２のゲイン値は前記第１のモードのクリッピングを保護するに充分であり；
前記第１のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第１のモードの前記計算された第２のゲイン値とが比較され；
前記第２のモードの第２のゲイン値は、前記最大値を１１ｄＢだけ増幅するか又は値はこれに依存することによって計算され、前記第２のモードの前記第２のゲイン値は、前記第２のモードのクリッピング保護に充分であり；かつ、
前記第２のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第２のモードの前記計算された第２のゲイン値とが比較される、
請求項９記載の方法。
前記第２のモードの前記第２のゲイン値は、ブロックレートからフレームレートにダウンサンプリングすることによって計算される、請求項３４又は３５に記載の方法。
前記ダウンサンプリングは、連続的な合計数が６個のブロックの計算されたゲイン値の最小値を決定することによって実行される、請求項３６記載の方法。