JP2016509693A - 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 - Google Patents
新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 Download PDFInfo
- Publication number
- JP2016509693A JP2016509693A JP2015554174A JP2015554174A JP2016509693A JP 2016509693 A JP2016509693 A JP 2016509693A JP 2015554174 A JP2015554174 A JP 2015554174A JP 2015554174 A JP2015554174 A JP 2015554174A JP 2016509693 A JP2016509693 A JP 2016509693A
- Authority
- JP
- Japan
- Prior art keywords
- volume
- value
- control
- audio
- dynamic range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 38
- 230000005236 sound signal Effects 0.000 claims abstract description 52
- 238000007906 compression Methods 0.000 claims description 57
- 230000006835 compression Effects 0.000 claims description 55
- 230000006870 function Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 11
- 208000016354 hearing loss disease Diseases 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 5
- 238000013144 data compression Methods 0.000 description 10
- 238000010606 normalization Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000003068 static effect Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000002265 prevention Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 206010011878 Deafness Diseases 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000010370 hearing loss Effects 0.000 description 3
- 231100000888 hearing loss Toxicity 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000008450 motivation Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 208000019300 CLIPPERS Diseases 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
Description
音声データから音声信号を再構成するために構成される音声デコーダ装置と、
音声信号に基づく音声出力信号を生成するために構成される信号処理器と、
を含み、
ここで、信号処理器は、音声出力信号のレベルを調整するために構成されるゲイン制御装置を含み、
ゲイン制御装置は、音量値を創出するために構成される参照音量デコーダを含み、参照音量値がビットストリームに存在する場合に、音量値は参照音量値であり、
ゲイン制御装置は、音量値と、ユーザが、ボリューム制御値を制御することを許容するユーザインタフェースによって生成される、ボリューム制御値とに基づくゲイン値を算出するために構成されるゲイン計算機を含み、
ゲイン制御装置は、ゲイン値に基づく音声出力信号の音量を制御するために構成される音量処理器を含む。
ここで、ダイナミックレンジ制御装置は、音量メタデータから少なくとも1つのダイナミックレンジ制御値を導出し、導出されたダイナミックレンジ制御値またはプリセットのダイナミックレンジ制御値のうちの1つを、選択的に出力するために構成されるダイナミックレンジ制御スイッチを含み、
ダイナミックレンジ制御装置は、ダイナミックレンジ制御スイッチによって出力されたダイナミックレンジ制御値と、ユーザが、圧縮制御値を制御することを許容するユーザインタフェースによって生成される、圧縮制御値とに基づくダイナミックレンジ値を算出するために構成されるダイナミックレンジ計算機を含み、
ダイナミックレンジ制御装置は、ダイナミックレンジ値に基づく音声出力信号のダイナミックレンジを制御するために構成されるダイナミックレンジ処理器を含む。
音声デコーダ装置を用いて音声データから音声信号を再構成するステップと、
信号処理器を用いて音声信号に基づく音声出力信号を生成するステップと、
を含み、
ここで、音声出力信号の音量レベルは、信号処理器に含まれるゲイン制御装置を使用して調整され、
音量値は、ゲイン制御装置に含まれる参照音量デコーダによって創出され、参照音量値がビットストリームに存在する場合に、音量値は参照音量値であり、
ゲイン値は、ゲイン制御装置に含まれるゲイン計算機によって、音量値と、ユーザが、ボリューム制御値を制御することを許容するユーザインタフェースによって生成される、ボリューム制御値とに基づき算出され、
音声出力信号の音量レベルは、ゲイン制御装置に含まれる音量処理器によってゲイン値に基づき制御される。
音声データ2から音声信号8を再構成するために構成される音声デコーダ装置9と、
音声信号8に基づく音声出力信号42を生成するために構成される信号処理器27と、
を含み、
ここで、信号処理器27は、音声出力信号42のレベルを調整するために構成されるゲイン制御装置10,15,28を含み、
ゲイン制御装置10,15,28は、音量値37を創出するために構成される参照音量デコーダ10を含み、参照音量値4がビットストリーム1に存在する場合に、音量値37は、参照音量値4であり、
ゲイン制御装置10,15,28は、音量値37と、ユーザが、ボリューム制御値20を制御することを許容するユーザインタフェースによって生成される、ボリューム制御値20とに基づくゲイン値33を算出するために構成されるゲイン計算機28を含み、
ゲイン制御装置10,15,28は、ゲイン値33に基づく音声出力信号42の音量を制御するために構成される音量処理器15を含む。
ここで、ダイナミックレンジ制御装置12,13,14は、音量メタデータ3から少なくとも1つのダイナミックレンジ制御値6,7を導出し、導出されたダイナミックレンジ制御値6,7またはプリセットのダイナミックレンジ制御値43をのうちの1つを、選択的に出力するために構成されるダイナミックレンジ制御スイッチ12を含み、
ダイナミックレンジ制御装置12,13,14は、ダイナミックレンジ制御スイッチ12によって出力されたダイナミックレンジ制御値6,7,43と、ユーザが、圧縮制御値25を制御することを許容するユーザインタフェースによって生成される、圧縮制御値25とに基づくダイナミックレンジ値44を算出するために構成されるダイナミックレンジ計算機14を含み、
ダイナミックレンジ制御装置12,13,14は、ダイナミックレンジ値44に基づく音声出力信号42のダイナミックレンジを制御するために構成されるダイナミックレンジ処理器13を含む。
2 音声データ
3 音量メタデータ
4 参照音量値
5 ダウンミックスゲイン値
6 軽ダイナミックレンジ制御値
7 重ダイナミックレンジ制御値
8 音声信号
9 音声デコーダ装置
10 参照音量デコーダ
11 ダウンミックスゲインデコーダ
12 ダイナミックレンジ制御スイッチ
13 ダイナミックレンジ処理器
14 ダイナミックレンジ計算機
15 音量処理器
16 ゲイン計算機
17 静的ターゲットレベルプロバイダ
18 音声出力信号
19 混合音声信号
20 ボリューム制御値
21 デコーダ装置
22 補助音声信号
23 音声信号ミキサ
24 補助音声信号を調整した音量
25 圧縮制御値
26 信号処理器
27 信号処理器
28 ゲイン計算機
29 混合音声信号
30 リミッタ装置
31 音量値
32 アーティスティックリミッタパラメータ
33 ゲイン値
34 ビットレート値
35 処理された音声信号
36 真のピークの値
37 音量値
41 デコーダ装置
42 音声出力信号
43 プリセットのダイナミックレンジ制御値
44 ダイナミックレンジ値
51 リミッタ
52 リミッタスイッチ
53 バイパス装置
54 クリッピング予測装置
55 比較器
56 クリッピング予測機能
57 ボリュームリミット値
58 ボリュームリミットスイッチ
59 ミニマムファインダ
60 真のピークの値スイッチ
61 コンバイナ
62 リミッタ成分
63 制御構成要素
71 コンバイナ
72 ミニマムファインダ
73 ダイナミックレンジ制御スイッチ
74 ダイナミックレンジ制御スイッチの出力データ
70a アーティスティックリミッタ閾値
70b アーティスティックリミッタアタック時間値
70c アーティスティックリミッタリリース時間値
Claims (16)
- 音声出力信号(42)を生成するためにビットストリーム(1)を復号化するためのデコーダ装置であって、前記ビットストリーム(1)は、音声データ(2)および任意の方法で参照音量値(4)を含む音量メタデータ(3)から構成され、前記デコーダ装置は、
前記音声データ(2)から音声信号(8)を再構成するために構成される音声デコーダ装置(9)と、
前記音声信号(8)に基づく前記音声出力信号(42)を生成するために構成される信号処理器(27)と、
を含み、
ここで、前記信号処理器(27)は、前記音声出力信号(42)の音量レベルを調整するために構成されるゲイン制御装置(10,15,28)を含み、
前記ゲイン制御装置(10,15,28)は、音量値(37)を創出するために構成される参照音量デコーダ(10)を含み、前記参照音量値(4)が前記ビットストリーム(1)に存在する場合に、前記音量値(37)は前記参照音量値(4)であり、
前記ゲイン制御装置(10,15,28)は、前記音量値(37)と、ユーザが、ボリューム制御値(20)を制御することを許容するユーザインタフェースによって生成される、前記ボリューム制御値(20)とに基づくゲイン値(33)を算出するために構成されるゲイン計算機(28)を含み、
前記ゲイン制御装置(10,15,28)は、前記ゲイン値(33)に基づく前記音声出力信号(42)の前記音量レベルを制御するために構成される音量処理器(15)を含む、デコーダ装置。 - 前記参照音量値(4)が前記ビットストリーム(1)に存在しない場合に、前記音量値(33)はプリセットの音量値である、請求項1に記載のデコーダ装置。
- 前記プリセットの音量値は、フルスケールの振幅に参照された、−4dBおよび−10dBの間、特に、−6dBおよび−8dBの間の値に設定される、請求項1または請求項2に記載のデコーダ装置。
- 前記信号処理器(27)は、前記音声出力信号(42)のダイナミックレンジを調整するために構成されるダイナミックレンジ制御装置(12,13,14)を含み、
ここで、前記ダイナミックレンジ制御装置(12,13,14)は、前記音量メタデータ(3)から少なくとも1つのダイナミックレンジ制御値(6,7)を導出し、前記導出されたダイナミックレンジ制御値(6,7)またはプリセットのダイナミックレンジ制御値(43)のうちの1つを、選択的に出力するために構成されるダイナミックレンジ制御スイッチ(12)を含み、
前記ダイナミックレンジ制御装置(12,13,14)は、前記ダイナミックレンジ制御スイッチ(12)によって出力された前記ダイナミックレンジ制御値(6,7,43)と、ユーザが、圧縮制御値(25)を制御することを許容するユーザインタフェースによって生成される、圧縮制御値(25)とに基づくダイナミックレンジ値(44)を算出するために構成されるダイナミックレンジ計算機(14)を含み、
前記ダイナミックレンジ制御装置(12,13,14)は、前記ダイナミックレンジ値(44)に基づく前記音声出力信号(42)の前記ダイナミックレンジを制御するために構成されるダイナミックレンジ処理器(13)を含む、請求項1ないし請求項3のいずれかに記載のデコーダ装置。 - 前記信号処理器(27)は、前記出力音声信号(42)の振幅を制限するために構成されるリミッタ装置(30)を含み、ここで、前記リミッタ装置(30)は、リミッタ(51)を有するリミッタコンポーネント(62)と、前記リミッタコンポーネント(62)を制御するために構成される制御コンポーネント(63)とを含み、前記ゲイン制御装置(10,15,28)によって少なくとも処理されることによって前記音声信号(8)から導出される処理された音声信号(35)は、前記リミッタコンポーネント(62)に入力され、前記音声出力信号(42)は、前記リミッタコンポーネント(62)から出力される、請求項1ないし請求項4のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ビットストリーム(1)のビットレートに応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項5に記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記音声デコーダ装置(9)の圧縮効率に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項5または請求項6に記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ビットストリーム(1)の前記音量メタデータ(3)において送信され、そして外部のエンコーダによって前記ビットストリーム(1)に変換される音声ソースの最大のピークのレベルを示す、真のピーク値(36)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項5ないし請求項7のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ゲイン制御装置(10,15,28)の前記ゲイン値(33)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項5ないし請求項8のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、聴覚障害を防止するために、ユーザまたは製造業者によって設定されるボリュームリミット値(57)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項5ないし請求項9のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ビットストリーム(1)の前記音量メタデータ(3)において送信され、そして、アーティスティックリミッタ閾値(74a)、アーティスティックリミッタアタック時間値(74b)および/またはアーティスティックリミッタリリース時間値(74c)を示す、アーティスティックリミッタパラメータ(32)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項5ないし請求項10のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、継続的にまたは繰り返し、前記リミッタコンポーネント(62)を制御するために構成される、請求項5ないし請求項11のいずれかに記載のデコーダ装置。
- 前記リミッタ装置(30)は、ゲインまたは遅延に関して、リミッタ(51)の伝達関数に類似の伝達関数を有するバイパス装置(53)を経由して、前記リミッタ(51)をバイパスするために構成される、請求項5ないし請求項12のいずれかに記載のデコーダ装置。
- システムは、デコーダ装置(41)およびエンコーダを備え、前記デコーダ装置(41)は、請求項1ないし請求項13のうちの1つにより設計される、システム。
- 音声出力信号(42)を生成するためにビットストリーム(1)を復号化する方法であって、前記ビットストリーム(1)は、音声データ(2)および任意の方法で参照音量値(4)を含む音量メタデータ(3)から構成され、前記方法は、
音声デコーダ装置(9)を用いて前記音声データ(2)から音声信号(8)を再構成するステップと、
信号処理器(27)を用いて前記音声信号(8)に基づく前記音声出力信号(42)を生成するステップと、
を含み、
ここで、前記音声出力信号(42)の音量レベルは、前記信号処理器(27)に含まれるゲイン制御装置(10,15,28)を使用して調整され、
前記音量値(37)は、前記ゲイン制御装置(10,15,28)に含まれる参照音量デコーダ(10)によって創出され、前記参照音量値(4)が前記ビットストリームに存在する場合に、前記音量値(37)は前記参照音量値(4)であり、
ゲイン値(33)は、前記ゲイン制御装置(10,15,28)に含まれるゲイン計算機(28)によって、音量値(37)と、ユーザが、ボリューム制御値(20)を制御することを許容するユーザインタフェースによって生成される、前記ボリューム制御値(20)とに基づき算出され、
前記音声出力信号(42)の前記音量レベルは、前記ゲイン制御装置(10,15,28)に含まれる音量処理器(15)によって前記ゲイン値(33)に基づき制御される、復号化する方法。 - プログラムコードがコンピュータ上で実行されると、前記コンピュータが請求項15の方法を実行する、前記プログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361757606P | 2013-01-28 | 2013-01-28 | |
US61/757,606 | 2013-01-28 | ||
PCT/EP2014/051484 WO2014114781A1 (en) | 2013-01-28 | 2014-01-27 | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016509693A true JP2016509693A (ja) | 2016-03-31 |
JP6445460B2 JP6445460B2 (ja) | 2018-12-26 |
Family
ID=50002749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554174A Active JP6445460B2 (ja) | 2013-01-28 | 2014-01-27 | 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 |
Country Status (13)
Country | Link |
---|---|
US (1) | US9576585B2 (ja) |
EP (1) | EP2948947B1 (ja) |
JP (1) | JP6445460B2 (ja) |
KR (1) | KR101849612B1 (ja) |
CN (2) | CN105190750B (ja) |
AR (1) | AR096574A1 (ja) |
BR (6) | BR122021011658B1 (ja) |
CA (1) | CA2898567C (ja) |
ES (1) | ES2628153T3 (ja) |
MX (1) | MX351187B (ja) |
RU (1) | RU2639663C2 (ja) |
TW (1) | TWI524330B (ja) |
WO (1) | WO2014114781A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018066383A1 (ja) * | 2016-10-07 | 2018-04-12 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
WO2021039189A1 (ja) * | 2019-08-30 | 2021-03-04 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8090120B2 (en) | 2004-10-26 | 2012-01-03 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
JP6174129B2 (ja) | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
UA122050C2 (uk) | 2013-01-21 | 2020-09-10 | Долбі Лабораторіс Лайсензін Корпорейшн | Аудіокодер і аудіодекодер з метаданими гучності та границі програми |
KR102660144B1 (ko) | 2013-01-21 | 2024-04-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
CN105074818B (zh) | 2013-02-21 | 2019-08-13 | 杜比国际公司 | 音频编码系统、用于产生比特流的方法以及音频解码器 |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
CN110083714B (zh) | 2013-04-05 | 2024-02-13 | 杜比实验室特许公司 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US9521501B2 (en) | 2013-09-12 | 2016-12-13 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
CN109785851B (zh) | 2013-09-12 | 2023-12-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN110808723A (zh) | 2014-05-26 | 2020-02-18 | 杜比实验室特许公司 | 音频信号响度控制 |
WO2016039150A1 (ja) * | 2014-09-08 | 2016-03-17 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN113257274A (zh) | 2014-10-01 | 2021-08-13 | 杜比国际公司 | 高效drc配置文件传输 |
WO2016057530A1 (en) | 2014-10-10 | 2016-04-14 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
TWI631835B (zh) * | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
TWI693595B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP4156180A1 (en) * | 2015-06-17 | 2023-03-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Loudness control for user interactivity in audio coding systems |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
CN106354469B (zh) * | 2016-08-24 | 2019-08-09 | 北京奇艺世纪科技有限公司 | 一种响度调节方法及装置 |
EP3389183A1 (en) | 2017-04-13 | 2018-10-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for processing an input audio signal and corresponding method |
WO2019161191A1 (en) * | 2018-02-15 | 2019-08-22 | Dolby Laboratories Licensing Corporation | Loudness control methods and devices |
US11282533B2 (en) * | 2018-09-28 | 2022-03-22 | Dolby Laboratories Licensing Corporation | Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model |
CN109217834B (zh) * | 2018-10-19 | 2022-06-21 | 歌尔科技有限公司 | 增益调整方法、音频设备及可读存储介质 |
WO2020123424A1 (en) * | 2018-12-13 | 2020-06-18 | Dolby Laboratories Licensing Corporation | Dual-ended media intelligence |
WO2020185927A1 (en) * | 2019-03-12 | 2020-09-17 | Whelen Engineering Company, Inc. | Volume scaling and synchronization of tones |
US11517815B2 (en) * | 2019-08-19 | 2022-12-06 | Cirrus Logic, Inc. | System and method for use in haptic signal generation |
KR102508413B1 (ko) * | 2019-11-01 | 2023-03-10 | 가우디오랩 주식회사 | 주파수 스펙트럼 보정을 위한 오디오 신호 처리 방법 및 장치 |
WO2021195429A1 (en) * | 2020-03-27 | 2021-09-30 | Dolby Laboratories Licensing Corporation | Automatic leveling of speech content |
US11907611B2 (en) | 2020-11-10 | 2024-02-20 | Apple Inc. | Deferred loudness adjustment for dynamic range control |
CN112951266B (zh) * | 2021-02-05 | 2024-02-06 | 杭州网易云音乐科技有限公司 | 齿音调整方法、装置、电子设备及计算机可读存储介质 |
WO2022271187A1 (en) * | 2021-06-25 | 2022-12-29 | Hewlett-Packard Development Company, L.P. | Electronic device audio adjustment |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011110525A1 (en) * | 2010-03-10 | 2011-09-15 | Dolby International Ab | System for combining loudness measurements in a single playback mode |
WO2014113471A1 (en) * | 2013-01-21 | 2014-07-24 | Dolby Laboratories Licensing Corporation | System and method for optimizing loudness and dynamic range across different playback devices |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040199933A1 (en) * | 2003-04-04 | 2004-10-07 | Michael Ficco | System and method for volume equalization in channel receivable in a settop box adapted for use with television |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
RU2406166C2 (ru) * | 2007-02-14 | 2010-12-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов |
US8295494B2 (en) * | 2007-08-13 | 2012-10-23 | Lg Electronics Inc. | Enhancing audio with remixing capability |
CN101267189A (zh) * | 2008-04-16 | 2008-09-17 | 深圳华为通信技术有限公司 | 音量自动调节装置、方法以及移动终端 |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
US8284959B2 (en) * | 2008-07-29 | 2012-10-09 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
JP5603339B2 (ja) * | 2008-10-29 | 2014-10-08 | ドルビー インターナショナル アーベー | 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 |
US8538042B2 (en) * | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
TWI529703B (zh) * | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP6185457B2 (ja) * | 2011-04-28 | 2017-08-23 | ドルビー・インターナショナル・アーベー | 効率的なコンテンツ分類及びラウドネス推定 |
US8848932B2 (en) * | 2011-10-13 | 2014-09-30 | Blackberry Limited | Proximity sensing for user detection and automatic volume regulation with sensor interruption override |
-
2014
- 2014-01-27 CN CN201480018076.5A patent/CN105190750B/zh active Active
- 2014-01-27 KR KR1020157022271A patent/KR101849612B1/ko active IP Right Grant
- 2014-01-27 BR BR122021011658-0A patent/BR122021011658B1/pt active IP Right Grant
- 2014-01-27 BR BR122022020276-4A patent/BR122022020276B1/pt active IP Right Grant
- 2014-01-27 ES ES14701394.0T patent/ES2628153T3/es active Active
- 2014-01-27 BR BR122022020326-4A patent/BR122022020326B1/pt active IP Right Grant
- 2014-01-27 EP EP14701394.0A patent/EP2948947B1/en active Active
- 2014-01-27 BR BR122022020284-5A patent/BR122022020284B1/pt active IP Right Grant
- 2014-01-27 JP JP2015554174A patent/JP6445460B2/ja active Active
- 2014-01-27 BR BR122022020319-1A patent/BR122022020319B1/pt active IP Right Grant
- 2014-01-27 CN CN201910925735.8A patent/CN110853660B/zh active Active
- 2014-01-27 BR BR112015017295-4A patent/BR112015017295B1/pt active IP Right Grant
- 2014-01-27 WO PCT/EP2014/051484 patent/WO2014114781A1/en active Application Filing
- 2014-01-27 MX MX2015009534A patent/MX351187B/es active IP Right Grant
- 2014-01-27 CA CA2898567A patent/CA2898567C/en active Active
- 2014-01-27 RU RU2015136531A patent/RU2639663C2/ru active
- 2014-01-28 AR ARP140100258A patent/AR096574A1/es active IP Right Grant
- 2014-01-28 TW TW103103168A patent/TWI524330B/zh active
-
2015
- 2015-07-28 US US14/811,203 patent/US9576585B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011110525A1 (en) * | 2010-03-10 | 2011-09-15 | Dolby International Ab | System for combining loudness measurements in a single playback mode |
WO2014113471A1 (en) * | 2013-01-21 | 2014-07-24 | Dolby Laboratories Licensing Corporation | System and method for optimizing loudness and dynamic range across different playback devices |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018066383A1 (ja) * | 2016-10-07 | 2018-04-12 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US10630254B2 (en) | 2016-10-07 | 2020-04-21 | Sony Corporation | Information processing device and information processing method |
WO2021039189A1 (ja) * | 2019-08-30 | 2021-03-04 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6445460B2 (ja) | 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 | |
JP6778781B2 (ja) | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 | |
JP6851523B2 (ja) | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 | |
CN105103222B (zh) | 用于响度和动态范围控制的元数据 | |
CN106796799B (zh) | 高效drc配置文件传输 | |
JP2013521539A (ja) | 単一再生モードにおいてラウドネス測定値を合成するシステム | |
EP3761672B1 (en) | Using metadata to aggregate signal processing operations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170704 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170929 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171226 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180807 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20180830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6445460 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |