JP2022077033A - ダイナミックレンジ制御のための延期されたラウドネス調整 - Google Patents
ダイナミックレンジ制御のための延期されたラウドネス調整 Download PDFInfo
- Publication number
- JP2022077033A JP2022077033A JP2021183523A JP2021183523A JP2022077033A JP 2022077033 A JP2022077033 A JP 2022077033A JP 2021183523 A JP2021183523 A JP 2021183523A JP 2021183523 A JP2021183523 A JP 2021183523A JP 2022077033 A JP2022077033 A JP 2022077033A
- Authority
- JP
- Japan
- Prior art keywords
- loudness
- drc
- sequence
- gain
- bitstream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010606 normalization Methods 0.000 claims abstract description 114
- 230000005236 sound signal Effects 0.000 claims abstract description 86
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 14
- 230000006835 compression Effects 0.000 description 13
- 238000007906 compression Methods 0.000 description 13
- 238000005259 measurement Methods 0.000 description 13
- 238000013507 mapping Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
y(n)=f(x(n))
y(n)+ΔL=f(x(n)+ΔL)
Claims (34)
- プロセッサと、
ビットストリームを取得するように前記プロセッサを構成する命令を内部に記憶して有するメモリと
を備えるオーディオデコーダ装置であって、前記ビットストリームが、
オーディオ信号の符号化バージョンと、
前記オーディオ信号を第1のDRC特性に適用するエンコーダ側処理によって決定された、第1のダイナミックレンジ制御、すなわちDRC、利得シーケンスと、
前記第1のDRC利得シーケンスを決定するときに前記エンコーダ側によって適用されたラウドネスノーマライゼーション利得と、
前記第1のDRC特性のインデックスであって、前記インデックスが前記第1のDRC特性を識別又は指示する、インデックスと、
統合ラウドネス更新値の経時的な複数のインスタンスと、
を含む、
オーディオデコーダ装置。 - 前記インデックスが第1の値を有することに応じて、前記プロセッサが、前記オーディオ信号にDRCを適用するときにラウドネスノーマライゼーションを行う、請求項1に記載のオーディオデコーダ装置。
- 前記ビットストリームが前記プロセッサに、前記DRC利得シーケンスに逆DRC特性を適用した後に、前記エンコーダ側によって前記DRC利得シーケンスを決定するときに適用されたラウドネスノーマライゼーションを、前記ビットストリーム内の前記ラウドネスノーマライゼーション利得を使用して相殺するか取り消すことによってラウドネスノーマライゼーションを行うように指示する、請求項1に記載のオーディオデコーダ装置。
- 前記メモリが命令を内部に記憶して有し、前記命令が、前記プロセッサを、
前記第1のDRC特性の逆数に前記第1のDRC利得シーケンスを適用することによって、ラウドネスシーケンスを復元し、
前記復元されたラウドネスシーケンスに対してラウドネスノーマライゼーションを行い、
前記復元されたラウドネスシーケンスを第2のDRC特性に適用することによって第2のDRC利得シーケンスを生成し、
前記第2のDRC利得シーケンスを前記オーディオ信号に適用する、
ように構成する、
請求項1~5のいずれか一項に記載のオーディオデコーダ装置。 - 前記ラウドネスノーマライゼーション利得がdBの単位であり、ラウドネスノーマライゼーションを行うことが、前記ラウドネスノーマライゼーション利得を、前記復元されたラウドネスシーケンス及び前記統合ラウドネス更新値のインスタンスと結合することを含む、請求項6に記載のオーディオデコーダ装置。
- 前記ラウドネスノーマライゼーションを行うことが、前記第2のDRC特性を、前記ラウドネスノーマライゼーション利得及び前記統合ラウドネス更新値のインスタンスに基づく量だけ入力軸に沿ってシフトさせることを含む、請求項1~6のいずれか一項に記載のオーディオデコーダ装置。
- 前記プロセッサが、前記統合ラウドネス更新値の各インスタンスについて、DRC入力ラウドネス目標と前記統合ラウドネス更新値の前記インスタンスとの差としてノーマライゼーション利得に対する更新を計算し、前記ノーマライゼーション利得を前記復元されたラウドネスシーケンスに加算してノーマライズされたラウドネスシーケンスを生成してから、前記ノーマライズされたラウドネスシーケンスを前記第2のDRC特性に適用して前記第2のDRC利得シーケンスを生成する、請求項1~8のいずれか一項に記載のオーディオデコーダ装置。
- 隣接する前記統合ラウドネス更新値のインスタンスが、1~10秒間だけ離れている、請求項1~9のいずれか一項に記載のオーディオデコーダ装置。
- 前記統合ラウドネス更新値が前記オーディオ信号の移動平均統合ラウドネスを表す、請求項1~10のいずれか一項に記載のオーディオデコーダ装置。
- 前記プロセッサが、
前記ビットストリームから前記第1のDRC特性への前記インデックスを抽出して、前記抽出されたインデックスを使用して前記第1のDRC特性の逆数を取得し、
前記第1のDRC特性の前記逆数に前記第1のDRC利得シーケンスを適用することによって、ラウドネスシーケンスを復元し、
前記インデックスが第1の既定値を有する場合には、統合ラウドネス更新値の各インスタンスについて、i)DRC入力ラウドネス目標と、ii)統合ラウドネス更新値の前記インスタンスとエンコーダ側処理によって使用されたエンコーダ側ラウドネスノーマライゼーション利得との合計との差として、ノーマライゼーション利得更新値を計算し、前記ノーマライゼーション利得更新値を前記復元されたラウドネスシーケンスに加えて、ノーマライズされたラウドネスシーケンスを生成し、
前記ノーマライズされたラウドネスシーケンスを第2のDRC特性に適用することによって第2のDRC利得シーケンスを生成し、
前記第2のDRC利得シーケンスを前記オーディオ信号に適用する、
ように構成されている、請求項1に記載のオーディオデコーダ装置。 - 前記プロセッサが、前記インデックスが第2の規定値を有する場合には、前記第2のDRC特性に前記復元されたラウドネスシーケンスを、ラウドネスノーマライゼーションを伴わずに適用することによって、前記第2のDRC利得シーケンスを生成するように構成されている、請求項12に記載のオーディオデコーダ装置。
- プロセッサと、
ビットストリームを取得するように前記プロセッサを構成する命令を内部に記憶して有するメモリと、
を備えるオーディオデコーダ装置であって、前記ビットストリームが、
オーディオ信号の符号化バージョンと、
前記オーディオ信号を第1のDRC特性に適用するエンコーダ側処理によって決定された、第1のダイナミックレンジ制御、すなわちDRC、利得シーケンスと、
前記第1のDRC特性のインデックスであって、前記インデックスが前記第1のDRC特性を識別又は指示する、インデックスと、
統合ラウドネス更新値の経時的な複数のインスタンスと、
フラグであって、前記フラグが第1の値を有するときは前記ビットストリームがエンコーダ側ラウドネスノーマライゼーション利得を含み、又は前記フラグが第2の値を有するときは前記ビットストリームが前記エンコーダ側ラウドネスノーマライゼーション利得を含まない、フラグと、
を含む、
オーディオデコーダ装置。 - 前記フラグが前記第1の値を有することに応答して、前記プロセッサが、第2のDRC特性を使用し、かつラウドネスノーマライゼーションを伴って、前記オーディオ信号にDRCを適用し、前記ラウドネスノーマライゼーションが、i)前記エンコーダ側ラウドネスノーマライゼーション利得、及びii)統合ラウドネス更新値の前記複数のインスタンスを使用する、請求項14に記載のオーディオデコーダ装置。
- i)前記フラグが前記第2の値を有することに応答して、ii)前記インデックスが第1の値を有するときに、前記プロセッサが、第2のDRC特性を使用し、かつラウドネスノーマライゼーションを伴って、前記オーディオ信号にDRCを適用し、前記ラウドネスノーマライゼーションが、統合ラウドネス更新値の前記複数のインスタンスを使用するがエンコーダ側ラウドネスノーマライゼーション利得は使用しない、請求項14に記載のオーディオデコーダ装置。
- 前記インデックスが前記第1の値とは異なる第2の値であることに応答して、前記プロセッサが、前記第2のDRC特性を使用するがラウドネスノーマライゼーションは伴わない、前記オーディオ信号にDRCを適用する、請求項16に記載のオーディオデコーダ装置。
- プロセッサと、
ビットストリームを取得するように前記プロセッサを構成する命令を内部に記憶して有するメモリと、
を備えるオーディオデコーダ装置であって、前記ビットストリームが、
オーディオ信号の符号化バージョンと、
前記オーディオ信号を第1のDRC特性に適用するエンコーダ側処理によって決定された、第1のダイナミックレンジ制御、すなわちDRC、利得シーケンスと、
前記第1のDRC特性のインデックスであって、前記インデックスが前記第1のDRC特性を識別又は指示する、インデックスと、
統合ラウドネス更新値の経時的な複数のインスタンスと、
フラグと、を含み、前記フラグが第1の値を有するときは、前記プロセッサが、前記ビットストリーム内の従来型拡張ペイロードの一部又は全ての従来型DRC特性インデックス値を、前記ビットストリーム内の新拡張ペイロードに含まれるDRC特性インデックス値に置き換える、
オーディオデコーダ装置。 - プロセッサと、
ビットストリームを取得するように前記プロセッサを構成する命令を内部に記憶して有するメモリと、
を備えるオーディオデコーダ装置であって、前記ビットストリームが、
オーディオ信号の符号化バージョンと、
前記オーディオ信号を第1のDRC特性に適用するエンコーダ側処理によって決定された、第1のダイナミックレンジ制御、すなわちDRC、利得シーケンスと、
前記第1のDRC特性のインデックスであって、前記インデックスが前記第1のDRC特性を識別又は指示する、インデックスと、
統合ラウドネス更新値の経時的な複数のインスタンスと、
を含み、
前記ビットストリームがエンコーダ側DRCノーマライゼーション利得を含み、前記プロセッサが、デコーダ側DRCラウドネスノーマライゼーションを適用するときに前記エンコーダ側DRCノーマライゼーション利得を相殺する、
オーディオデコーダ装置。 - プロセッサと、
ビットストリームを生成するように前記プロセッサを構成する命令を内部に記憶して有するメモリと、
を備えるオーディオデコーダ装置であって、前記ビットトリームが、
オーディオ信号の符号化バージョンと、
前記オーディオ信号を第1のDRC特性に適用するエンコーダ側処理によって決定された、第1のダイナミックレンジ制御、すなわちDRC、利得シーケンスと、
前記第1のDRC特性のインデックスと、
統合ラウドネス更新値の経時的な複数のインスタンスと、
を含み、
デコーダ側処理が、ラウドネスノーマライゼーションを行いながら前記オーディオ信号にDRCを適用する様式を、前記ビットストリームが制御する、
オーディオデコーダ装置。 - 前記プロセッサがフラグを前記ビットストリームに挿入し、前記フラグが第1の値を有するときは前記ビットストリームがエンコーダ側ラウドネスノーマライゼーション利得を含み、又は前記フラグが第2の値を有するときは前記ビットストリームが前記エンコーダ側ラウドネスノーマライゼーション利得を含まない、請求項21に記載のオーディオエンコーダ装置。
- 前記フラグが前記第1の値を有するときは、前記第1のDRC利得シーケンスを決定するときに前記エンコーダ側処理によって前記ラウドネスノーマライゼーション利得が適用された、請求項22に記載のオーディオエンコーダ装置。
- ビットストリームを取得することであって、前記ビットストリームが、オーディオ信号の符号化バージョンと、前記オーディオ信号を第1のDRC特性に適用するエンコーダ側処理によって決定された第1のダイナミックレンジ制御、すなわちDRC、利得シーケンスと、前記第1のDRC特性のインデックスであって、前記インデックスが、前記第1のDRC特性を識別又は指示するインデックスと、統合ラウドネス更新値の経時的な複数のインスタンスと、を含む、ことと、
前記インデックスを使用して逆DRC特性を取得することと、
前記第1のDRC利得シーケンスに前記逆DRC特性を適用した後にラウドネスノーマライゼーションを行って、ノーマライズされたラウドネスシーケンスを生成することと、
前記ノーマライズされたラウドネスシーケンスを第2のDRC特性に適用して、第2のDRC利得シーケンスを生成することと、
前記第2のDRC利得シーケンスを前記オーディオ信号に適用して、圧縮されたオーディオを生成することと、
を含む、デジタルオーディオの方法。 - 前記ビットストリームが、前記第1のDRC特性に前記オーディオ信号を適用することによって前記第1のDRC利得シーケンスを判定するときにエンコーダ側によって適用された、ラウドネスノーマライゼーション利得を含み、
前記ビットストリームが前記プロセッサに、前記第1のDRC利得シーケンスを決定するときに前記エンコーダ側によって適用されたラウドネスノーマライゼーションを、前記ビットストリーム内の前記ラウドネスノーマライゼーション利得を使用して相殺するか又は取り消すことによってラウドネスノーマライゼーションを行うように指示する、
請求項30に記載の方法。 - 前記ビットストリームがフラグを含み、前記フラグが第1の値を有するときは、前記第1のDRC利得シーケンスが、ラウドネスノーマライゼーションを伴って前記オーディオ信号を前記第1のDRC特性に適用する前記エンコーダ側処理によって決定されている、請求項30に記載の方法。
- 前記フラグが第2の値を有するときは、前記第1のDRC利得シーケンスが、ラウドネスノーマライゼーションを伴わずに前記オーディオ信号を前記第1のDRC特性に適用する前記エンコーダ側処理によって決定されている、請求項32に記載の方法。
- ラウドネスノーマライゼーションを行うことが、
前記ノーマライズされたラウドネスシーケンスを調整し、次いで前記調整されたラウドネスシーケンスを前記第2のDRC特性に適用すること、
を含む、請求項30~33のいずれか一項に記載の方法。 - オーディオ信号を符号化して、前記オーディオ信号の符号化バージョンを生成することと、
前記オーディオ信号を処理して、統合ラウドネス更新値の経時的な複数のインスタンスを生成することと、
前記オーディオ信号をダイナミックレンジ制御、すなわちDRC、特性に適用して、DRC利得シーケンスを決定することと、
前記オーディオ信号の前記符号化バージョンと、前記DRC利得シーケンスと、前記DRC特性のインデックスと、統合ラウドネス更新値の経時的な前記複数のインスタンスと、を含むビットストリームを生成することと、を含み、デコーダ側処理が、ラウドネスノーマライゼーションを行いながら前記オーディオ信号にDRCを適用する様式を、前記ビットストリームが制御する、
デジタルオーディオ処理。 - 前記ビットストリームにフラグを挿入することを更に含み、前記フラグが第1の値を有するときは前記ビットストリームがエンコーダ側ラウドネスノーマライゼーション利得を含み、又は前記フラグが第2の値を有するときは前記ビットストリームが前記エンコーダ側ラウドネスノーマライゼーション利得を含まない、
請求項35に記載の処理。 - プロセッサと、
命令を内部に記憶して有するメモリと、
を備えるオーディオデコーダ装置であって、前記命令が、前記プロセッサを、
ビットストリームを取得し、前記ビットストリームは、オーディオ信号の符号化バージョンと、瞬間ラウドネスシーケンスと、統合ラウドネス値と、を含み、
DRC入力ラウドネス目標を前記ビットストリームから抽出された前記統合ラウドネス値と結合することによって、ノーマライゼーション利得を計算し、
前記ビットストリームから抽出された前記瞬間ラウドネスシーケンスを、前記ラウドネスノーマライゼーション利得を使用して調整して、ノーマライズされた瞬間ラウドネスシーケンスを生成し、
前記ノーマライズされた瞬間ラウドネスシーケンスをDRC特性に適用することによってDRC利得シーケンスを生成し、
前記DRC利得シーケンスを前記オーディオ信号に適用することによって、前記オーディオ信号に対してDRCを行う、
ように構成する、オーディオデコーダ装置。 - 前記ビットストリームにおける前記瞬間ラウドネスシーケンスが、ラウドネスノーマライズされていない、請求項40に記載のオーディオデコーダ装置。
- 前記統合ラウドネス値が、前記ビットストリームに含まれる統合ラウドネス更新値の複数のインスタンスのうち1つのインスタンスであり、隣接するインスタンスが、例えば1~10秒だけ離れており、前記統合ラウドネス更新値が、前記オーディオ信号の移動平均統合ラウドネスを表す、請求項40~43のいずれか一項に記載のオーディオデコーダ装置。
- 前記ビットストリームが、前記瞬間ラウドネスシーケンス及び前記オーディオ信号の前記符号化バージョンと共に前記統合ラウドネス値が書き込まれたファイルである、請求項40~43のいずれか一項に記載のオーディオデコーダ装置。
- プロセッサと、
ビットストリームを生成するように前記プロセッサを構成する命令を内部に記憶して有するメモリと、
を備えるオーディオデコーダ装置であって、前記ビットストリームが、オーディオ信号の符号化バージョンと、前記オーディオ信号の瞬間ラウドネスシーケンスと、デコーダ側が、前記瞬間ラウドネスシーケンスをDRC特性に適用するときに、ラウドネスノーマライゼーションを伴って前記オーディオ信号にダイナミックレンジ制御、すなわちDRCを適用する様式を制御するための命令とを含む、
オーディオエンコーダ装置。 - ビットストリームを取得することであって、前記ビットストリームは、オーディオ信号の符号化バージョンと、瞬間ラウドネスシーケンスと、統合ラウドネス値と、を含む、ことと、
DRC入力ラウドネス目標を前記ビットストリームから抽出された前記統合ラウドネス値と結合することによって、ノーマライゼーション利得を計算することと、
前記ビットストリームからの前記瞬間ラウドネスシーケンスを、前記ラウドネスノーマライゼーション利得を使用して調整して、ノーマライズされた瞬間ラウドネスシーケンスを生成することと、
前記ノーマライズされた瞬間ラウドネスシーケンスをDRC特性に適用することによってDRC利得シーケンスを生成することと、
前記DRC利得シーケンスを前記オーディオ信号に適用することによって、前記オーディオ信号に対してDRCを行うことと、
を含む、デジタルオーディオ処理。 - オーディオ信号を符号化して、前記オーディオ信号の符号化バージョンを生成することと、
前記オーディオ信号を処理して、前記オーディオ信号の瞬間ラウドネスシーケンスを生成することと、
前記オーディオ信号の前記符号化バージョンと、前記瞬間ラウドネスシーケンスと、デコーダ側が、前記瞬間ラウドネスシーケンスをDRC特性に適用するときに、ラウドネスノーマライゼーションを伴って前記オーディオ信号にダイナミックレンジ制御、すなわちDRCを適用する様式を制御するための命令と、を含むビットストリームを生成することと、
を含む、デジタルオーディオ処理。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063111759P | 2020-11-10 | 2020-11-10 | |
US63/111,759 | 2020-11-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022077033A true JP2022077033A (ja) | 2022-05-20 |
JP7465858B2 JP7465858B2 (ja) | 2024-04-11 |
Family
ID=81256074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021183523A Active JP7465858B2 (ja) | 2020-11-10 | 2021-11-10 | ダイナミックレンジ制御のための延期されたラウドネス調整 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11907611B2 (ja) |
JP (1) | JP7465858B2 (ja) |
KR (1) | KR20220063733A (ja) |
CN (1) | CN114464199A (ja) |
DE (1) | DE102021128853A1 (ja) |
GB (3) | GB2619594B (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008505586A (ja) * | 2004-07-01 | 2008-02-21 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ情報の再生音量とダイナミックレンジに影響を与えるメタデータを修正する方法 |
US20140294200A1 (en) * | 2013-03-29 | 2014-10-02 | Apple Inc. | Metadata for loudness and dynamic range control |
JP2017534903A (ja) * | 2014-10-01 | 2017-11-24 | ドルビー・インターナショナル・アーベー | 効率的なdrcプロファイル伝送 |
JP2018522286A (ja) * | 2015-07-31 | 2018-08-09 | アップル インコーポレイテッド | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105190750B (zh) | 2013-01-28 | 2019-10-25 | 弗劳恩霍夫应用研究促进协会 | 解码器设备以及解码比特流的方法 |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
CN105556837B (zh) | 2013-09-12 | 2019-04-19 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2021
- 2021-10-14 US US17/501,839 patent/US11907611B2/en active Active
- 2021-11-03 KR KR1020210149867A patent/KR20220063733A/ko not_active Application Discontinuation
- 2021-11-05 DE DE102021128853.3A patent/DE102021128853A1/de active Pending
- 2021-11-09 CN CN202111321699.8A patent/CN114464199A/zh active Pending
- 2021-11-10 GB GB2305068.5A patent/GB2619594B/en active Active
- 2021-11-10 JP JP2021183523A patent/JP7465858B2/ja active Active
- 2021-11-10 GB GB2116188.0A patent/GB2602873B/en active Active
- 2021-11-10 GB GBGB2405585.7A patent/GB202405585D0/en active Pending
-
2024
- 2024-01-03 US US18/403,432 patent/US20240143271A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008505586A (ja) * | 2004-07-01 | 2008-02-21 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ情報の再生音量とダイナミックレンジに影響を与えるメタデータを修正する方法 |
US20140294200A1 (en) * | 2013-03-29 | 2014-10-02 | Apple Inc. | Metadata for loudness and dynamic range control |
JP2017534903A (ja) * | 2014-10-01 | 2017-11-24 | ドルビー・インターナショナル・アーベー | 効率的なdrcプロファイル伝送 |
JP2018522286A (ja) * | 2015-07-31 | 2018-08-09 | アップル インコーポレイテッド | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 |
Also Published As
Publication number | Publication date |
---|---|
CN114464199A (zh) | 2022-05-10 |
GB2619594B (en) | 2024-06-05 |
US20240143271A1 (en) | 2024-05-02 |
GB202405585D0 (en) | 2024-06-05 |
GB2602873A (en) | 2022-07-20 |
DE102021128853A1 (de) | 2022-05-12 |
JP7465858B2 (ja) | 2024-04-11 |
KR20220063733A (ko) | 2022-05-17 |
GB2602873B (en) | 2023-05-17 |
US20220147311A1 (en) | 2022-05-12 |
GB202305068D0 (en) | 2023-05-17 |
GB2619594A (en) | 2023-12-13 |
US11907611B2 (en) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6982604B2 (ja) | 符号化されたオーディオメタデータに基づくラウドネス等化及びdrc中の動的等化 | |
JP6778781B2 (ja) | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 | |
JP6945092B2 (ja) | 効率的なdrcプロファイル伝送 | |
CN105103222B (zh) | 用于响度和动态范围控制的元数据 | |
EP2545646B1 (en) | System for combining loudness measurements in a single playback mode | |
US11545166B2 (en) | Using metadata to aggregate signal processing operations | |
JP2022077033A (ja) | ダイナミックレンジ制御のための延期されたラウドネス調整 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211117 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221128 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230710 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240229 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7465858 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |