JP5603339B2 - 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 - Google Patents
既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 Download PDFInfo
- Publication number
- JP5603339B2 JP5603339B2 JP2011534654A JP2011534654A JP5603339B2 JP 5603339 B2 JP5603339 B2 JP 5603339B2 JP 2011534654 A JP2011534654 A JP 2011534654A JP 2011534654 A JP2011534654 A JP 2011534654A JP 5603339 B2 JP5603339 B2 JP 5603339B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- gain value
- gain
- signal
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 81
- 230000005236 sound signal Effects 0.000 claims description 65
- 238000009499 grossing Methods 0.000 claims description 22
- 230000006835 compression Effects 0.000 claims description 8
- 238000007906 compression Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012952 Resampling Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000003321 amplification Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002620 method output Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Control Of Amplification And Gain Control (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
デジタル伝送は高ダイナミックレンジを可能とする。しかし、聞いている状況はその恩恵を必ずしも受けない。高ダイナミックレンジは、静かなリビング室内条件においては望ましいものである。しかし、それは高いバックグラウンド・ノイズ・レベルが生じる環境、例えばカーラジオその他の条件では適切でない。多種多様なリスニング環境に対応するため、伝送の前にダイナミックレンジを減少させる代わりに、レシーバに対してダイナミックレンジを減少させるよう指示するメタデータを、デジタルオーディオストリームに挿入することができる。前者のアプローチは、フルダイナミックレンジのオーディオをレシーバが再生することができないため、好ましくない。これに対して、後者のアプローチは、リスニングの環境に応じて、リスナーに対してダイナミックレンジのコントロールを行うことを可能とする点で好ましい。この種のダイナミック・レンジコントロールメタデータは、リスナーの好みで利用でき、デコードされた信号の高品質のアーティステックなダイナミックレンジの圧縮データを作る。
多重チャネル信号(例えば5.1−チャンネル・オーディオ信号)がダウンミックスされる場合に、通常は2つのチャネルに、チャネル数が減少する。ステレオ・スピーカーを介して2つ以上のチャネル(例えば5.1−チャンネル・オーディオ信号は、5つの主チャネル、及び1つの低周波効果チャネル)を有する多重チャネル・オーディオ信号を再生する場合には、通常は、レシーバ・サイドは、ダウンミックス・オペレーションが実行される。ここで、多重チャネル信号は、2つのチャネルにミックスされる。ミキシング動作は、ダウンミックス・マトリックスに記述することができる。例えば、5つのチャンネル信号を2つのチャンネル(ステレオの)信号にダウンミックスする場合には、2つのロウ及び5つのカラムから成る2−5のマトリックスによって記述される(低周波効果チャネルは、通常はダウンミックスにおいては考慮されない)。5.1−チャンネル信号の5つの主チャネルを2つのチャネルにミックスするための異なるダウンミックス方式が知られている。この例としては、Lo/Ro(左だけ、右だけ)、又は、Lt/Rt(左トータル、右トータル)が挙げられる。ダウンミックス・ステップは、デジタル・ステレオ信号のオーバーロードの発生を引き起こす危険性の可能性がある。それによって、望まれていないクリッピングアーティファクトが生成されることになる。この種のクリッピングは、ダウンミックスされたデジタル信号が、最大(又は最小)の表現可能な値を超えた振幅が、最大(又は最小)の表現可能な値で制限される場合に起こり得る。例えば、単純な符号なし固定小数点2進数の表現の場合には、計算されたダウンミックスされた振幅が最大値のワード(すなわち、全てのビットが1である値)によって制限される場合にクリッピングが発生する。16ビット符号付き表現の場合には、最大の値は、例えばワード「0111111111111111」に対応してもよい。
ダイナミックスが非常に限られたチャネルにおける(例えばセットトップボックスからアナログRFリンクを介してTVのRF入力への)再送信に対して、通常は、このパスでより良好な信号対雑音比を達成するために、信号が11dBブーストされる。この種の応用例において、11dB増幅される場合に、クリッピングが結果として発生してしまう信号に対して、ダイナミック・レンジコントロールメタデータは、オーディオ・ストリームに11dBの増幅を適用する前に信号の振幅を減少させるよう、レシーバに命令し、クリッピングするのを動的に防止する。
【特許文献】
【特許文献1】米国仮特許出願番号61/101497号
【特許文献2】 WO2008/1000098
図6の実施例は、好ましくはドルビーデジタル・オーディオ・ストリーム(例えばドルビーデジタル・トランスコーダに対するHE−AAC又はドルビーデジタル・トランスコーダに対するAAC)を出力するトランスコーダに対して使用される。ドルビーデジタルによって、ライン・モード各々の符号化ブロックは、「DRC」(ダイナミック・レンジコントロール)ゲイン値を有する。これに対してRFモードにおいて、各々のフレーム(6ブロックを含む)は、「compr」ゲイン値を有する。にもかかわらず、両方のタイプのゲイン値は、ダイナミック・レンジコントロールに関連する。RFモードの計算されたゲイン値は、ブロック73において、ブロックレートからフレームレートにダウンサンプリングされる。ブロック73は、連続的な6ブロックの合計数の計算されたゲイン値の最小値を決定する。各々の最小値は、フレーム全体に対して、計算されたゲイン値72に割り当てられる。ブロック5’において受信したcomprゲイン値3’のリサンプリングは、ブロック5のリサンプリングとは異なる。これは、出力フレームのための最小値が判断されるという点で異なる。リサンプリングされたゲイン値4’と、計算されたフレーム・ベースのゲイン値72については、既に述べた内容と同じである。
Claims (35)
- デジタルオーディオ・データから得られるオーディオ信号の信号クリッピングからの保護を提供する方法であって:
受信されたオーディオメタデータに基づく第1のゲイン値が前記オーディオ信号のクリッピングからの保護に充分であるかどうかを決定するステップであって、前記受信されたオーディオメタデータは第1のデジタルオーディオストリームに埋め込まれている、ステップと;
第1のゲイン値が充分でない場合には、前記それぞれの第1のゲイン値を前記オーディオ信号のクリッピングからの保護に充分なゲイン値と置き換えるステップと;
を有する方法であって、
前記決定するステップは:
前記デジタルオーディオ・データに基づいて第2のゲイン値を計算するステップであって、前記第2のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分である、ステップと;
前記受信されたオーディオメタデータに基づく前記第1のゲイン値、及び、前記計算された第2のゲイン値を比較するステップと;
を含む、
方法。 - 前記第2のゲイン値を計算するステップは:
最大許容ゲイン値を決定するステップ;
を含む、請求項1記載の方法。 - 前記比較するステップに依存して、ゲイン値は、前記第1のゲイン値、及び前記計算された第2のゲイン値から選択され、
ゲイン値と置き換えるステップは、計算された第2のゲイン値を選択することによって実行される、
請求項1又は2に記載の方法。 - 一対の第1及び第2のゲイン値の最小値が選択される、
請求項3記載の方法。 - 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有する、
請求項1ないし4のうちいずれか1項記載の方法。 - 前記オーディオ信号はダウンミックスされたオーディオ信号であり、
当該方法は、前記ダウンミックスされた信号に対する信号クリッピングからの保護を提供する、
請求項1ないし5のうちいずれか1項記載の方法。 - 前記第1のゲイン値が保護に充分であるかどうかを決定するステップは、
少なくとも第1のダウンミキシングの方式によって前記デジタルオーディオ・データをダウンミキシングするステップ;
を含む、請求項1ないし6のうちいずれか1項記載の方法。 - 前記第1のゲイン値が保護に充分であるかどうかを決定するステップは、
ピーク値を計算するステップ、を含み、
ピーク値は一度に、少なくとも2つのオーディオ信号の絶対値の最大を決定することによって計算され、
前記少なくとも2つのオーディオ信号は、
・前記第1のダウンミキシングの方式によってダウンミックスした後の一つ以上のオーディオ信号、
・ダウンミキシングの前の一つ以上のオーディオ信号、及び、
・第2のダウンミキシングの方式によってダウンミックスした後の一つ以上のオーディオ信号、
の群から選択される、
請求項7記載の方法。 - 前記第1のゲイン値が保護に充分であるかどうかを決定するステップは、
前記デジタルオーディオ・データから得られる複数の連続的な信号値の最大を決定するステップ;
を含む、請求項1ないし8のうちいずれか1項記載の方法。 - 前記第1のゲイン値が保護に充分であるかどうかを決定するステップは、
計算ピーク値を計算するステップ、を含み、
ピーク値は、一度に少なくとも2つのオーディオ信号の絶対値の最大を決定することによって計算され、
前記少なくとも2つのオーディオ信号は、
・第1のダウンミキシングの方式によってダウンミックスした後の一つ以上のオーディオ信号、
・ダウンミキシングの前の一つ以上のオーディオ信号、及び、
・第2のダウンミキシングの方式に従ってダウンミックスした後の一つ以上のオーディオ信号、
の群から選択され、かつ、
複数の連続的な信号値は、連続的なピーク値、又は連続的なフィルタリングされたピーク値に対応する、
請求項9記載の方法。 - 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
前記第2のオーディオ・ストリームはデータセグメントで構成され、かつ、
前記第2のオーディオ・ストリームのセグメントに関連する複数の信号値の前記最大が決定される、
請求項9又は10に記載の方法。 - 最大の信号値は、前記決定された最大によって除算される、
請求項9ないし11のうちいずれか1項記載の方法。 - 前記決定された最大は、インバートされる、
請求項9ないし11のうちいずれか1項記載の方法。 - 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
前記第1のオーディオ・ストリームは、データセグメントで構成され、少なくとも1つのゲイン値が、前記第1のオーディオ・ストリームのデータセグメント毎に受信され、
前記第2のオーディオ・ストリームは、データセグメントで構成され、かつ、
当該方法は、
前記第1のオーディオ・ストリームのゲイン値をリサンプリングするステップ、を更に有する、
請求項1ないし13のうちいずれか1項記載の方法。 - 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
前記第1のオーディオ・ストリームは、データセグメントで構成され、少なくとも1つのゲイン値が、前記第1のオーディオ・ストリームのデータセグメント毎に受信され、
前記第2のオーディオ・ストリームは、データセグメントで構成され、かつ、
当該方法は、
前記第1のオーディオ・ストリームの複数の連続的なゲイン値の最小値を決定するステップ、を更に有する、
請求項1ないし14のうちいずれか1項記載の方法。 - 前記複数の連続的なゲイン値は、各々インパクト領域を有し、かつ、これらのゲイン値の前記インパクト領域は、前記第2のオーディオ・ストリームのゲイン値の前記インパクト領域と重なる、
請求項15記載の方法。 - ダイナミック・レンジコントロールに関連するメタデータが、前記第1のオーディオ・ストリームに存在しない場合には、前記オーディオ信号のクリッピングからの保護に充分なゲイン値が加えられる、
請求項1ないし16のうちいずれか1項記載の方法。 - 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへのトランスコーディングにおいて実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有し、
ダイナミック・レンジコントロールに関連するメタデータが、前記第1のオーディオ・ストリームに存在しない場合には、前記オーディオ信号のクリッピングからの保護に充分なゲイン値が前記第2のオーディオ・ストリームに加えられる、
請求項17記載の方法。 - 前記加えられたゲイン値は、最大でゲイン1に限定されている、
請求項17又は18に記載の方法。 - 当該方法は、前記デジタルオーディオ・データに基づいて、第2のゲイン値を計算するステップを有し、前記第2のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分であり、
それぞれの計算された第2のゲイン値が1より小さいゲインを有する場合、前記加えられたゲイン値は、前記計算された第2のゲイン値に対応し、かつ、
それぞれの計算された第2のゲイン値が1より大きいゲインを有する場合、前記加えられたゲイン値は、ゲイン1に対応する、
請求項19記載の方法。 - スムージングフィルタが、前記第2のゲイン値を生成するために使用される、
請求項1ないし20のうちいずれか1項記載の方法。 - デジタルオーディオ・データから得られるオーディオ信号の信号クリッピングからの保護を提供する装置であって:
受信されたオーディオメタデータに基づいて、第1のゲイン値が前記オーディオ信号のクリッピングからの保護に充分であるかどうかを決定するための決定手段であって、前記受信されたオーディオメタデータは、第1のデジタルオーディオストリームに埋め込まれている、決定手段と;
前記第1のゲイン値が保護に充分でない場合には、第1のゲイン値を前記オーディオ信号のクリッピングからの保護に充分なゲイン値と置き換えるための置換手段と;
を有し、
前記決定手段は、
前記デジタルオーディオ・データに基づいて、第2のゲイン値を計算するための計算手段であって、前記第2のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分である、計算手段と;
前記受信されたオーディオメタデータに基づく前記第1のゲイン値、及び、前記計算された第2のゲイン値を比較するための比較手段と;
を有する装置。 - 当該装置はトランスコーダの部分であり、
前記トランスコーダは、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへ、トランスコーディングし、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか又はそこから得られるゲイン値を有する、
請求項22に記載の装置。 - 前記オーディオ信号はダウンミックスされたオーディオ信号であり、
当該装置は、前記ダウンミックスされた信号に対する信号クリッピングからの保護を提供する、
請求項22又は23に記載の装置。 - トランスコーダは、
第1のオーディオ符号化フォーマットで符号化された第1のオーディオ・ストリームから、
第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへトランスコーディングするように構成した、
請求項22ないし24のうちいずれか1項記載の装置を有するトランスコーダ。 - 前記第1のオーディオ・ストリームは、デジタル放送信号である、
請求項25記載のトランスコーダ。 - デジタルオーディオ・データから得られるオーディオ信号の信号クリッピングからの保護を提供する方法であって、
当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
ダイナミック・レンジコントロールに関連するメタデータが前記第1のオーディオ・ストリームに存在しない場合、オーディオ信号のクリッピングに対する保護のために充分なゲイン値が、前記第1のオーディオ・ストリームに含まれる前記デジタルオーディオ・データに基づいて、前記ゲイン値を計算することによって、前記第2のオーディオ・ストリームに加えられる、
方法。 - 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか、又はそこから得られるゲイン値を有し、
前記第1のオーディオ符号化フォーマットはAAC又はHE−AACであり、かつ、
前記第2のオーディオ符号化フォーマットはドルビーデジタルである、
請求項1ないし21のうちいずれか1項記載の方法。 - 前記第1のオーディオ・ストリームは、DVBビデオ/オーディオ・ストリームの部分である、請求項28記載の方法。
- 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか、又はそこから得られるゲイン値を有し、
前記第2のオーディオ・ストリームはデータブロックで構成され、
前記第1のオーディオ・ストリームに埋め込まれた前記オーディオメタデータが、前記オーディオ・コンテンツのラウドネスを示しているメタデータを有し、
第2のゲイン値が、前記デジタルオーディオ・データに基づいて計算され、前記第2のゲイン値は、前記オーディオ信号のクリッピングを保護するに充分であり、
前記第2のゲイン値の計算は、
前記第2のオーディオ・ストリームのデータブロックの複数のピーク値の最大値を決定するステップと;
前記オーディオ・コンテンツのラウドネスを示している前記メタデータに依存して、前記最大値のレベルを調整するステップと;
を含み、
前記受信されたオーディオメタデータに基づく第1のゲイン値及び前記計算された第2のゲイン値が比較される、
請求項8記載の方法。 - 前記オーディオ・コンテンツのラウドネスを示す前記メタデータは、プログラム基準レベル・メタデータである、請求項30記載の方法。
- 前記第1のオーディオ・ストリームは、第1のモードのゲインメタデータと第2のモードの異なるゲインメタデータとを含み、前記第2のモードは、前記第1のモードより高いダイナミックレンジ圧縮を可能とし;
前記第1のモードの第2のゲイン値は、レベル調整された最大値に基づいて計算され、前記第1のモードの前記第2のゲイン値は、前記第1のモードのクリッピングを保護するに充分であり;
前記第1のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第1のモードの前記計算された第2のゲイン値とが比較され;
前記第2のモードの第2のゲイン値は、レベル調整された最大値を11dBだけ増幅することによって計算され、前記第2のモードの前記第2のゲイン値は、前記第2のモードのクリッピング保護に充分であり;
前記第2のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第2のモードの前記計算された第2のゲイン値とが比較される;
請求項30又は31に記載の方法。 - 当該方法は、
第1のオーディオ符号化フォーマットで符号化された前記第1のオーディオ・ストリームから、
前記第1のオーディオ符号化フォーマットと異なる第2のオーディオ符号化フォーマットで符号化された第2のオーディオ・ストリームへ、トランスコーディングの過程で実行され、
前記第2のオーディオ・ストリームは、前記オーディオ信号のクリッピングからの保護に充分な前記置き換えられたゲイン値を含むオーディオメタデータを有するか、又はそこから得られるゲイン値を有し、
前記第2のオーディオ・ストリームはデータブロックで構成され、
前記第1のオーディオ・ストリームは、第1のモードのゲインメタデータと第2のモードの異なるゲインメタデータとを含み、前記第2のモードは、前記第1のモードより高いダイナミックレンジ圧縮を可能とし;
前記第1のモードの第2のゲイン値は、最大値に基づいて計算され、最大値は、前記第2のオーディオ・ストリームのデータブロックの複数のピーク値の前記最大値であり、かつ、前記第1のモードの前記第2のゲイン値は前記第1のモードのクリッピングを保護するに充分であり;
前記第1のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第1のモードの前記計算された第2のゲイン値とが比較され;
前記第2のモードの第2のゲイン値は、前記最大値を11dBだけ増幅するか又は値はこれに依存することによって計算され、前記第2のモードの前記第2のゲイン値は、前記第2のモードのクリッピング保護に充分であり;かつ、
前記第2のモードの前記受信されたオーディオメタデータに基づくゲイン値と、前記第2のモードの前記計算された第2のゲイン値とが比較される、
請求項8記載の方法。 - 前記第2のモードの前記第2のゲイン値は、ブロックレートからフレームレートにダウンサンプリングすることによって計算される、請求項32又は33に記載の方法。
- 前記ダウンサンプリングは、連続的な合計数が6個のブロックの計算されたゲイン値の最小値を決定することによって実行される、請求項34記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10943308P | 2008-10-29 | 2008-10-29 | |
US61/109,433 | 2008-10-29 | ||
PCT/US2009/062004 WO2010053728A1 (en) | 2008-10-29 | 2009-10-26 | Signal clipping protection using pre-existing audio gain metadata |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012507059A JP2012507059A (ja) | 2012-03-22 |
JP5603339B2 true JP5603339B2 (ja) | 2014-10-08 |
Family
ID=41508867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011534654A Active JP5603339B2 (ja) | 2008-10-29 | 2009-10-26 | 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 |
Country Status (9)
Country | Link |
---|---|
US (1) | US8892450B2 (ja) |
EP (3) | EP3217395B1 (ja) |
JP (1) | JP5603339B2 (ja) |
CN (1) | CN102203854B (ja) |
BR (1) | BRPI0919880B1 (ja) |
ES (1) | ES2963744T3 (ja) |
RU (1) | RU2468451C1 (ja) |
TW (1) | TWI416505B (ja) |
WO (1) | WO2010053728A1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009086174A1 (en) | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
AR077680A1 (es) | 2009-08-07 | 2011-09-14 | Dolby Int Ab | Autenticacion de flujos de datos |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
TWI413110B (zh) | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
JP5771618B2 (ja) | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
US9508356B2 (en) * | 2010-04-19 | 2016-11-29 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, encoding method and decoding method |
CN101951504B (zh) * | 2010-09-07 | 2012-07-25 | 中国科学院深圳先进技术研究院 | 基于重叠边界的多媒体切片转码方法和系统 |
CN102005206B (zh) * | 2010-11-16 | 2012-07-25 | 华平信息技术股份有限公司 | 多路音频帧的混音方法 |
TWI759223B (zh) * | 2010-12-03 | 2022-03-21 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
CN103443854B (zh) | 2011-04-08 | 2016-06-08 | 杜比实验室特许公司 | 用于混合来自两个编码位流的音频节目的元数据的自动配置 |
IN2014KN01222A (ja) * | 2011-12-15 | 2015-10-16 | Fraunhofer Ges Forschung | |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
CN104303229B (zh) | 2012-05-18 | 2017-09-12 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
CN102968995B (zh) * | 2012-11-16 | 2018-10-02 | 新奥特(北京)视频技术有限公司 | 一种音频信号的混音方法及装置 |
EP2757558A1 (en) * | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
KR102071860B1 (ko) * | 2013-01-21 | 2020-01-31 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
CN105190750B (zh) * | 2013-01-28 | 2019-10-25 | 弗劳恩霍夫应用研究促进协会 | 解码器设备以及解码比特流的方法 |
CN116665683A (zh) | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
US9559651B2 (en) * | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
ES2617314T3 (es) * | 2013-04-05 | 2017-06-16 | Dolby Laboratories Licensing Corporation | Aparato de compresión y método para reducir un ruido de cuantización utilizando una expansión espectral avanzada |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US10095468B2 (en) | 2013-09-12 | 2018-10-09 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
SG11201603116XA (en) | 2013-10-22 | 2016-05-30 | Fraunhofer Ges Forschung | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9769550B2 (en) | 2013-11-06 | 2017-09-19 | Nvidia Corporation | Efficient digital microphone receiver process and system |
US9454975B2 (en) * | 2013-11-07 | 2016-09-27 | Nvidia Corporation | Voice trigger |
CN109036441B (zh) | 2014-03-24 | 2023-06-06 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
EP3123469B1 (en) * | 2014-03-25 | 2018-04-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
WO2016039287A1 (ja) * | 2014-09-12 | 2016-03-17 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
FR3031852B1 (fr) * | 2015-01-19 | 2018-05-11 | Devialet | Amplificateur a reglage de niveau sonore automatique |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
KR20160132574A (ko) * | 2015-05-11 | 2016-11-21 | 현대자동차주식회사 | 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법 |
US10109288B2 (en) * | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US10015612B2 (en) | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
CN109005452A (zh) * | 2018-10-09 | 2018-12-14 | 深圳市亿联智能有限公司 | 一种应用于智能机顶盒的串行混音方法 |
CN111819863A (zh) | 2018-11-13 | 2020-10-23 | 杜比实验室特许公司 | 用音频信号及相关联元数据表示空间音频 |
CN112153533B (zh) * | 2020-09-25 | 2021-09-07 | 展讯通信(上海)有限公司 | 音频信号的破音消除方法及装置、存储介质、终端 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5821889A (en) * | 1996-11-06 | 1998-10-13 | Sabine, Inc. | Automatic clip level adjustment for digital processing |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US20050120870A1 (en) * | 1998-05-15 | 2005-06-09 | Ludwig Lester F. | Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications |
JP2000181477A (ja) * | 1998-12-14 | 2000-06-30 | Olympus Optical Co Ltd | 音声処理装置 |
US6778966B2 (en) * | 1999-11-29 | 2004-08-17 | Syfx | Segmented mapping converter system and method |
JP4251769B2 (ja) | 2000-11-15 | 2009-04-08 | ヤマハ株式会社 | ディジタルオーディオアンプ |
US6704704B1 (en) * | 2001-03-06 | 2004-03-09 | Microsoft Corporation | System and method for tracking and automatically adjusting gain |
EP1472786A2 (en) * | 2002-01-24 | 2004-11-03 | Koninklijke Philips Electronics N.V. | A method for decreasing the dynamic range of a signal and electronic circuit |
JP2003280691A (ja) * | 2002-03-19 | 2003-10-02 | Sanyo Electric Co Ltd | 音声処理方法および音声処理装置 |
AU2002307884A1 (en) * | 2002-04-22 | 2003-11-03 | Nokia Corporation | Method and device for obtaining parameters for parametric speech coding of frames |
EP1523863A1 (en) | 2002-07-16 | 2005-04-20 | Koninklijke Philips Electronics N.V. | Audio coding |
JP2004214843A (ja) * | 2002-12-27 | 2004-07-29 | Alpine Electronics Inc | デジタルアンプ及びそのゲイン調整方法 |
DE10344638A1 (de) * | 2003-08-04 | 2005-03-10 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
EP1719117A1 (en) * | 2004-02-16 | 2006-11-08 | Koninklijke Philips Electronics N.V. | A transcoder and method of transcoding therefore |
CN1930914B (zh) | 2004-03-04 | 2012-06-27 | 艾格瑞系统有限公司 | 对多声道音频信号进行编码和合成的方法和装置 |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US8290181B2 (en) * | 2005-03-19 | 2012-10-16 | Microsoft Corporation | Automatic audio gain control for concurrent capture applications |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
US8116485B2 (en) * | 2005-05-16 | 2012-02-14 | Qnx Software Systems Co | Adaptive gain control system |
CN101199015A (zh) * | 2005-06-15 | 2008-06-11 | Lg电子株式会社 | 记录介质、用于混合音频数据的装置及其方法 |
KR101492826B1 (ko) * | 2005-07-14 | 2015-02-13 | 코닌클리케 필립스 엔.브이. | 다수의 출력 오디오 채널들을 생성하기 위한 장치 및 방법과, 그 장치를 포함하는 수신기 및 오디오 재생 디바이스, 데이터 스트림 수신 방법, 및 컴퓨터 판독가능 기록매체 |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
US7760886B2 (en) * | 2005-12-20 | 2010-07-20 | Fraunhofer-Gesellschaft zur Foerderung der Angewandten Forscheng e.V. | Apparatus and method for synthesizing three output channels using two input channels |
JP5054035B2 (ja) * | 2006-02-07 | 2012-10-24 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
CN101501988B (zh) * | 2006-08-09 | 2012-03-28 | 杜比实验室特许公司 | 慢级和快级中的音频限峰 |
JP2008197199A (ja) * | 2007-02-09 | 2008-08-28 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置及びオーディオ復号化装置 |
CA2645915C (en) | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
EP2256724A1 (en) * | 2008-03-19 | 2010-12-01 | Pioneer Corporation | Overtone production device, acoustic device, and overtone production method |
WO2009120387A1 (en) * | 2008-03-27 | 2009-10-01 | Analog Devices, Inc. | Method and apparatus for scaling signals to prevent amplitude clipping |
US8094809B2 (en) * | 2008-05-12 | 2012-01-10 | Visteon Global Technologies, Inc. | Frame-based level feedback calibration system for sample-based predictive clipping |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
KR101722747B1 (ko) | 2015-02-25 | 2017-04-03 | 주식회사 제일메디칼코퍼레이션 | 본 플레이트 시스템 |
-
2009
- 2009-10-26 ES ES17166101T patent/ES2963744T3/es active Active
- 2009-10-26 WO PCT/US2009/062004 patent/WO2010053728A1/en active Application Filing
- 2009-10-26 CN CN2009801426899A patent/CN102203854B/zh active Active
- 2009-10-26 EP EP17166101.0A patent/EP3217395B1/en active Active
- 2009-10-26 JP JP2011534654A patent/JP5603339B2/ja active Active
- 2009-10-26 EP EP09744862.5A patent/EP2353161B1/en active Active
- 2009-10-26 US US13/125,846 patent/US8892450B2/en active Active
- 2009-10-26 EP EP23202859.7A patent/EP4293665A3/en active Pending
- 2009-10-26 BR BRPI0919880-6A patent/BRPI0919880B1/pt active IP Right Grant
- 2009-10-26 RU RU2011121587/08A patent/RU2468451C1/ru active
- 2009-10-26 TW TW098136170A patent/TWI416505B/zh active
Also Published As
Publication number | Publication date |
---|---|
WO2010053728A1 (en) | 2010-05-14 |
BRPI0919880A2 (pt) | 2015-12-15 |
US8892450B2 (en) | 2014-11-18 |
JP2012507059A (ja) | 2012-03-22 |
EP4293665A2 (en) | 2023-12-20 |
EP3217395B1 (en) | 2023-10-11 |
ES2963744T3 (es) | 2024-04-01 |
US20110208528A1 (en) | 2011-08-25 |
RU2468451C1 (ru) | 2012-11-27 |
CN102203854A (zh) | 2011-09-28 |
EP2353161A1 (en) | 2011-08-10 |
EP3217395A1 (en) | 2017-09-13 |
EP2353161B1 (en) | 2017-05-24 |
CN102203854B (zh) | 2013-01-02 |
TW201042637A (en) | 2010-12-01 |
EP4293665A3 (en) | 2024-01-10 |
TWI416505B (zh) | 2013-11-21 |
BRPI0919880B1 (pt) | 2020-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5603339B2 (ja) | 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 | |
JP6851523B2 (ja) | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 | |
US11563411B2 (en) | Metadata for loudness and dynamic range control | |
JP6768735B2 (ja) | オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念 | |
JP5129888B2 (ja) | トランスコード方法、トランスコーディングシステム及びセットトップボックス | |
JP7544324B2 (ja) | 効率的なdrcプロファイル伝送 | |
TW202422318A (zh) | 用於執行感知激勵增益控制之方法、設備及系統 | |
JP2011118215A (ja) | 符号化装置、符号化方法、プログラムおよび電子機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140805 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5603339 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |