JP6445460B2 - 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 - Google Patents
新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 Download PDFInfo
- Publication number
- JP6445460B2 JP6445460B2 JP2015554174A JP2015554174A JP6445460B2 JP 6445460 B2 JP6445460 B2 JP 6445460B2 JP 2015554174 A JP2015554174 A JP 2015554174A JP 2015554174 A JP2015554174 A JP 2015554174A JP 6445460 B2 JP6445460 B2 JP 6445460B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- volume
- control
- limiter
- dynamic range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000007906 compression Methods 0.000 claims description 57
- 230000006835 compression Effects 0.000 claims description 55
- 230000005236 sound signal Effects 0.000 claims description 46
- 230000006870 function Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 11
- 208000016354 hearing loss disease Diseases 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 6
- 238000004587 chromatography analysis Methods 0.000 claims 1
- 238000013144 data compression Methods 0.000 description 10
- 238000010606 normalization Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000003068 static effect Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000002265 prevention Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 206010011878 Deafness Diseases 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000010370 hearing loss Effects 0.000 description 3
- 231100000888 hearing loss Toxicity 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000008450 motivation Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 208000019300 CLIPPERS Diseases 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Control Of Amplification And Gain Control (AREA)
Description
音声データから音声信号を再構成するために構成される音声デコーダ装置と、
音声信号に基づく音声出力信号を生成するために構成される信号処理器と、
を含み、
ここで、信号処理器は、音声出力信号のレベルを調整するために構成されるゲイン制御装置を含み、
ゲイン制御装置は、音量値を創出するために構成される参照音量デコーダを含み、参照音量値がビットストリームに存在する場合に、音量値は参照音量値であり、
ゲイン制御装置は、音量値と、ユーザが、ボリューム制御値を制御することを許容するユーザインタフェースによって生成される、ボリューム制御値とに基づくゲイン値を算出するために構成されるゲイン計算機を含み、
ゲイン制御装置は、ゲイン値に基づく音声出力信号の音量を制御するために構成される音量処理器を含む。
ここで、ダイナミックレンジ制御装置は、音量メタデータから少なくとも1つのダイナミックレンジ制御値を導出し、導出されたダイナミックレンジ制御値またはプリセットのダイナミックレンジ制御値のうちの1つを、選択的に出力するために構成されるダイナミックレンジ制御スイッチを含み、
ダイナミックレンジ制御装置は、ダイナミックレンジ制御スイッチによって出力されたダイナミックレンジ制御値と、ユーザが、圧縮制御値を制御することを許容するユーザインタフェースによって生成される、圧縮制御値とに基づくダイナミックレンジ値を算出するために構成されるダイナミックレンジ計算機を含み、
ダイナミックレンジ制御装置は、ダイナミックレンジ値に基づく音声出力信号のダイナミックレンジを制御するために構成されるダイナミックレンジ処理器を含む。
音声デコーダ装置を用いて音声データから音声信号を再構成するステップと、
信号処理器を用いて音声信号に基づく音声出力信号を生成するステップと、
を含み、
ここで、音声出力信号の音量レベルは、信号処理器に含まれるゲイン制御装置を使用して調整され、
音量値は、ゲイン制御装置に含まれる参照音量デコーダによって創出され、参照音量値がビットストリームに存在する場合に、音量値は参照音量値であり、
ゲイン値は、ゲイン制御装置に含まれるゲイン計算機によって、音量値と、ユーザが、ボリューム制御値を制御することを許容するユーザインタフェースによって生成される、ボリューム制御値とに基づき算出され、
音声出力信号の音量レベルは、ゲイン制御装置に含まれる音量処理器によってゲイン値に基づき制御される。
音声データ2から音声信号8を再構成するために構成される音声デコーダ装置9と、
音声信号8に基づく音声出力信号42を生成するために構成される信号処理器27と、
を含み、
ここで、信号処理器27は、音声出力信号42のレベルを調整するために構成されるゲイン制御装置10,15,28を含み、
ゲイン制御装置10,15,28は、音量値37を創出するために構成される参照音量デコーダ10を含み、参照音量値4がビットストリーム1に存在する場合に、音量値37は、参照音量値4であり、
ゲイン制御装置10,15,28は、音量値37と、ユーザが、ボリューム制御値20を制御することを許容するユーザインタフェースによって生成される、ボリューム制御値20とに基づくゲイン値33を算出するために構成されるゲイン計算機28を含み、
ゲイン制御装置10,15,28は、ゲイン値33に基づく音声出力信号42の音量を制御するために構成される音量処理器15を含む。
ここで、ダイナミックレンジ制御装置12,13,14は、音量メタデータ3から少なくとも1つのダイナミックレンジ制御値6,7を導出し、導出されたダイナミックレンジ制御値6,7またはプリセットのダイナミックレンジ制御値43をのうちの1つを、選択的に出力するために構成されるダイナミックレンジ制御スイッチ12を含み、
ダイナミックレンジ制御装置12,13,14は、ダイナミックレンジ制御スイッチ12によって出力されたダイナミックレンジ制御値6,7,43と、ユーザが、圧縮制御値25を制御することを許容するユーザインタフェースによって生成される、圧縮制御値25とに基づくダイナミックレンジ値44を算出するために構成されるダイナミックレンジ計算機14を含み、
ダイナミックレンジ制御装置12,13,14は、ダイナミックレンジ値44に基づく音声出力信号42のダイナミックレンジを制御するために構成されるダイナミックレンジ処理器13を含む。
2 音声データ
3 音量メタデータ
4 参照音量値
5 ダウンミックスゲイン値
6 軽ダイナミックレンジ制御値
7 重ダイナミックレンジ制御値
8 音声信号
9 音声デコーダ装置
10 参照音量デコーダ
11 ダウンミックスゲインデコーダ
12 ダイナミックレンジ制御スイッチ
13 ダイナミックレンジ処理器
14 ダイナミックレンジ計算機
15 音量処理器
16 ゲイン計算機
17 静的ターゲットレベルプロバイダ
18 音声出力信号
19 混合音声信号
20 ボリューム制御値
21 デコーダ装置
22 補助音声信号
23 音声信号ミキサ
24 補助音声信号を調整した音量
25 圧縮制御値
26 信号処理器
27 信号処理器
28 ゲイン計算機
29 混合音声信号
30 リミッタ装置
31 音量値
32 アーティスティックリミッタパラメータ
33 ゲイン値
34 ビットレート値
35 処理された音声信号
36 真のピークの値
37 音量値
41 デコーダ装置
42 音声出力信号
43 プリセットのダイナミックレンジ制御値
44 ダイナミックレンジ値
51 リミッタ
52 リミッタスイッチ
53 バイパス装置
54 クリッピング予測装置
55 比較器
56 クリッピング予測機能
57 ボリュームリミット値
58 ボリュームリミットスイッチ
59 ミニマムファインダ
60 真のピークの値スイッチ
61 コンバイナ
62 リミッタ成分
63 制御構成要素
71 コンバイナ
72 ミニマムファインダ
73 ダイナミックレンジ制御スイッチ
74 ダイナミックレンジ制御スイッチの出力データ
70a アーティスティックリミッタ閾値
70b アーティスティックリミッタアタック時間値
70c アーティスティックリミッタリリース時間値
Claims (17)
- ビットストリーム(1)から音声出力信号(42)を生成するために、前記ビットストリーム(1)を復号化するために構成されたデコーダ装置であって、前記ビットストリーム(1)は、音声データ(2)と、参照音量値(4)を含む音量メタデータ(3)とを含み、前記デコーダ装置は、
前記音声データ(2)から音声信号(8)を再構成するために構成される音声デコーダ装置(9)と、
前記音声信号(8)に基づいて前記音声出力信号(42)を生成するために構成される信号処理器(27)と、
ユーザがボリューム制御値(20)を制御できるようにするように構成されるユーザインタフェースと、
を含み、
ここで、前記信号処理器(27)は、前記音声出力信号(42)の音量レベルを調整するために構成されるゲイン制御装置(10,15,28)を含み、
前記ゲイン制御装置(10,15,28)は、前記参照音量値(4)を含む前記音量メタデータ(3)を復号化することによって音量値(37)を創出するために構成される参照音量デコーダ(10)を含み、前記音量値(37)は、前記ビットストリーム(1)内に存在する前記音量メタデータ(3)に含まれる前記参照音量値(4)であり、
前記ゲイン制御装置(10,15,28)は、前記参照音量値(4)に対応する前記音量値(37)と、ユーザが、ボリューム制御値(20)を制御することを許容する前記ユーザインタフェースから受信される前記ボリューム制御値(20)とに基づいてゲイン値(33)を算出するために構成されるゲイン計算機(28)を含み、
前記ゲイン制御装置(10,15,28)は、前記ゲイン値(33)に基づいて前記音声出力信号(42)の前記音量レベルを制御するために構成される音量処理器(15)を含む、デコーダ装置。 - 前記音量値(37)は、前記ビットストリーム(1)内に前記参照音量値(4)が存在しない前記ビットストリーム内の一節については、プリセットの音量値である、請求項1に記載のデコーダ装置。
- 前記プリセットの音量値は、フルスケールの振幅に参照された、−4dBおよび−10dBの間の値に設定される、請求項2に記載のデコーダ装置。
- 前記プリセットの音量値は、フルスケールの振幅に参照された、−6dBおよび−8dBの間の値に設定される、請求項2に記載のデコーダ装置。
- 前記信号処理器(27)は、前記音声出力信号(42)のダイナミックレンジを調整するために構成されるダイナミックレンジ制御装置(12,13,14)を含み、
ここで、前記ダイナミックレンジ制御装置(12,13,14)は、前記音量メタデータ(3)から少なくとも1つのダイナミックレンジ制御値(6,7)を導出し、前記導出されたダイナミックレンジ制御値(6,7)またはプリセットのダイナミックレンジ制御値(43)のうちの1つを、選択的に出力するために構成されるダイナミックレンジ制御スイッチ(12)を含み、
前記ダイナミックレンジ制御装置(12,13,14)は、前記ダイナミックレンジ制御スイッチ(12)によって出力された前記ダイナミックレンジ制御値(6,7,43)と、ユーザが圧縮制御値(25)を制御することを許容するユーザインタフェースによって提供される、圧縮制御値(25)とに基づいてダイナミックレンジ値(44)を算出するために構成されるダイナミックレンジ計算機(14)を含み、
前記ダイナミックレンジ制御装置(12,13,14)は、前記ダイナミックレンジ値(44)に基づいて前記音声出力信号(42)の前記ダイナミックレンジを制御するために構成されるダイナミックレンジ処理器(13)を含む、請求項1ないし請求項4のいずれかに記載のデコーダ装置。 - 前記信号処理器(27)は、前記音声出力信号(42)の振幅を制限するために構成されるリミッタ装置(30)を含み、ここで、前記リミッタ装置(30)は、リミッタ(51)を有するリミッタコンポーネント(62)と、前記リミッタコンポーネント(62)を制御するために構成される制御コンポーネント(63)とを含み、少なくとも前記ゲイン制御装置(10,15,28)によって処理されることによって前記音声信号(8)から導出される処理された音声信号(35)が、前記リミッタコンポーネント(62)に入力され、前記音声出力信号(42)が、前記リミッタコンポーネント(62)から出力される、請求項1ないし請求項5のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ビットストリーム(1)のビットレートに応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項6に記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記音声デコーダ装置(9)の圧縮効率に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項6または請求項7に記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ビットストリーム(1)の前記音量メタデータ(3)において送信され、そして外部のエンコーダによって前記ビットストリーム(1)に変換される音声ソースの最大のピークのレベルを示す、真のピーク値(36)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項6ないし請求項8のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ゲイン制御装置(10,15,28)の前記ゲイン値(33)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項6ないし請求項9のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、聴覚障害を防止するために、ユーザまたは製造業者によって設定されるボリュームリミット値(57)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項6ないし請求項10のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、前記ビットストリーム(1)の前記音量メタデータ(3)において送信され、そして、アーティスティックリミッタ閾値(74a)、アーティスティックリミッタアタック時間値(74b)および/またはアーティスティックリミッタリリース時間値(74c)を示す、アーティスティックリミッタパラメータ(32)に応じて前記リミッタコンポーネント(62)を制御するために構成される、請求項6ないし請求項11のいずれかに記載のデコーダ装置。
- 前記制御コンポーネント(63)は、継続的にまたは繰り返し、前記リミッタコンポーネント(62)を制御するために構成される、請求項6ないし請求項12のいずれかに記載のデコーダ装置。
- 前記リミッタ装置(30)は、ゲインおよび遅延に関して、リミッタ(51)の伝達機能に類似する伝達機能を有するバイパス装置(53)によって、前記リミッタ(51)をバイパスするために構成される、請求項6ないし請求項13のいずれかに記載のデコーダ装置。
- システムは、デコーダ装置(41)およびエンコーダを備え、前記デコーダ装置(41)は、請求項1ないし請求項14のうちの1つにより設計される、システム。
- ビットストリーム(1)から音声出力信号(42)を生成するために、前記ビットストリームを復号化する方法であって、前記ビットストリーム(1)は、音声データ(2)と、参照音量値(4)を含む音量メタデータ(3)とを含み、前記方法は、
前記音声データ(2)から音声信号(8)を再構成するステップと、
前記音声信号(8)に基づいて前記音声出力信号(42)を生成するステップと、
ユーザによるボリューム制御値(20)の制御を許容するように構成されたユーザインタフェースからボリューム制御値(20)を受信するステップと、
を含み、
音量値(37)は、前記参照音量値(4)を含む前記音量メタデータ(3)を復号化することによって創出され、前記音量値(37)は、前記ビットストリーム内に存在する前記音量メタデータ(3)に含まれる前記参照音量値(4)であり、
ゲイン値(33)は、前記参照音量値(4)に対応する前記音量値(37)と、前記ユーザインタフェースが受信する前記ボリューム制御値(20)とに基づいて算出され、
前記音声出力信号(42)の前記音量レベルは、前記ゲイン値(33)に基づいて調整される、復号化する方法。 - プログラムコードがコンピュータまたはプロセッサ上で実行されると、前記コンピュータまたはプロセッサが請求項16の方法を実行する、前記プログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361757606P | 2013-01-28 | 2013-01-28 | |
US61/757,606 | 2013-01-28 | ||
PCT/EP2014/051484 WO2014114781A1 (en) | 2013-01-28 | 2014-01-27 | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016509693A JP2016509693A (ja) | 2016-03-31 |
JP6445460B2 true JP6445460B2 (ja) | 2018-12-26 |
Family
ID=50002749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554174A Active JP6445460B2 (ja) | 2013-01-28 | 2014-01-27 | 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 |
Country Status (13)
Country | Link |
---|---|
US (1) | US9576585B2 (ja) |
EP (1) | EP2948947B1 (ja) |
JP (1) | JP6445460B2 (ja) |
KR (1) | KR101849612B1 (ja) |
CN (2) | CN110853660B (ja) |
AR (1) | AR096574A1 (ja) |
BR (6) | BR112015017295B1 (ja) |
CA (1) | CA2898567C (ja) |
ES (1) | ES2628153T3 (ja) |
MX (1) | MX351187B (ja) |
RU (1) | RU2639663C2 (ja) |
TW (1) | TWI524330B (ja) |
WO (1) | WO2014114781A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2581810C (en) | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
CN112185399B (zh) | 2012-05-18 | 2024-07-30 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
BR122020007932B1 (pt) | 2013-01-21 | 2022-09-27 | Dolby International Ab | Dispositivo de processamento de áudio e método para decodificar um ou mais quadros de um fluxo de bits de áudio codificado |
UA112249C2 (uk) | 2013-01-21 | 2016-08-10 | Долбі Лабораторіс Лайсензін Корпорейшн | Аудіокодер і аудіодекодер з метаданими гучності та границі програми |
EP3582218A1 (en) | 2013-02-21 | 2019-12-18 | Dolby International AB | Methods for parametric multi-channel encoding |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
WO2014165304A1 (en) | 2013-04-05 | 2014-10-09 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109785851B (zh) | 2013-09-12 | 2023-12-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN110675883B (zh) | 2013-09-12 | 2023-08-18 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
CN110808723B (zh) | 2014-05-26 | 2024-09-17 | 杜比实验室特许公司 | 音频信号响度控制 |
CN106663435A (zh) * | 2014-09-08 | 2017-05-10 | 索尼公司 | 编码装置和方法、解码装置和方法、以及程序 |
US10020001B2 (en) | 2014-10-01 | 2018-07-10 | Dolby International Ab | Efficient DRC profile transmission |
ES2916254T3 (es) | 2014-10-10 | 2022-06-29 | Dolby Laboratories Licensing Corp | Sonoridad de programa basada en la presentación, independiente de la transmisión |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
TWI693595B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
CA2988645C (en) * | 2015-06-17 | 2021-11-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Loudness control for user interactivity in audio coding systems |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
CN106354469B (zh) * | 2016-08-24 | 2019-08-09 | 北京奇艺世纪科技有限公司 | 一种响度调节方法及装置 |
CN109891504A (zh) * | 2016-10-07 | 2019-06-14 | 索尼公司 | 信息处理设备和方法以及程序 |
EP3389183A1 (en) * | 2017-04-13 | 2018-10-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for processing an input audio signal and corresponding method |
EP3753105B1 (en) * | 2018-02-15 | 2023-01-11 | Dolby Laboratories Licensing Corporation | Loudness control methods and devices |
WO2020069120A1 (en) * | 2018-09-28 | 2020-04-02 | Dolby Laboratories Licensing Corporation | Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model |
CN109217834B (zh) * | 2018-10-19 | 2022-06-21 | 歌尔科技有限公司 | 增益调整方法、音频设备及可读存储介质 |
JP7455836B2 (ja) * | 2018-12-13 | 2024-03-26 | ドルビー ラボラトリーズ ライセンシング コーポレイション | デュアルエンドのメディア・インテリジェンス |
EP3939014A1 (en) * | 2019-03-12 | 2022-01-19 | Whelen Engineering Company, Inc. | Volume scaling and synchronization of tones |
US11517815B2 (en) * | 2019-08-19 | 2022-12-06 | Cirrus Logic, Inc. | System and method for use in haptic signal generation |
WO2021039189A1 (ja) * | 2019-08-30 | 2021-03-04 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
KR102508413B1 (ko) * | 2019-11-01 | 2023-03-10 | 가우디오랩 주식회사 | 주파수 스펙트럼 보정을 위한 오디오 신호 처리 방법 및 장치 |
KR102295287B1 (ko) * | 2019-12-26 | 2021-08-30 | 네이버 주식회사 | 오디오 신호 처리 방법 및 시스템 |
WO2021195429A1 (en) * | 2020-03-27 | 2021-09-30 | Dolby Laboratories Licensing Corporation | Automatic leveling of speech content |
US11907611B2 (en) | 2020-11-10 | 2024-02-20 | Apple Inc. | Deferred loudness adjustment for dynamic range control |
CN112951266B (zh) * | 2021-02-05 | 2024-02-06 | 杭州网易云音乐科技有限公司 | 齿音调整方法、装置、电子设备及计算机可读存储介质 |
US20240281202A1 (en) * | 2021-06-25 | 2024-08-22 | Hewlett-Packard Development Company, L.P. | Electronic Device Audio Adjustment |
US20240276143A1 (en) * | 2023-02-09 | 2024-08-15 | Samsung Electronics Co., Ltd. | Signal normalization using loudness metadata for audio processing |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040199933A1 (en) * | 2003-04-04 | 2004-10-07 | Michael Ficco | System and method for volume equalization in channel receivable in a settop box adapted for use with television |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
RU2406166C2 (ru) * | 2007-02-14 | 2010-12-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов |
US8295494B2 (en) * | 2007-08-13 | 2012-10-23 | Lg Electronics Inc. | Enhancing audio with remixing capability |
CN101267189A (zh) * | 2008-04-16 | 2008-09-17 | 深圳华为通信技术有限公司 | 音量自动调节装置、方法以及移动终端 |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
KR101599535B1 (ko) * | 2008-07-29 | 2016-03-03 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 장치 |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
WO2010053728A1 (en) * | 2008-10-29 | 2010-05-14 | Dolby Laboratories Licensing Corporation | Signal clipping protection using pre-existing audio gain metadata |
US8538042B2 (en) * | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) * | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
WO2012146757A1 (en) * | 2011-04-28 | 2012-11-01 | Dolby International Ab | Efficient content classification and loudness estimation |
US8848932B2 (en) * | 2011-10-13 | 2014-09-30 | Blackberry Limited | Proximity sensing for user detection and automatic volume regulation with sensor interruption override |
BR122020007932B1 (pt) * | 2013-01-21 | 2022-09-27 | Dolby International Ab | Dispositivo de processamento de áudio e método para decodificar um ou mais quadros de um fluxo de bits de áudio codificado |
-
2014
- 2014-01-27 WO PCT/EP2014/051484 patent/WO2014114781A1/en active Application Filing
- 2014-01-27 CN CN201910925735.8A patent/CN110853660B/zh active Active
- 2014-01-27 JP JP2015554174A patent/JP6445460B2/ja active Active
- 2014-01-27 BR BR112015017295-4A patent/BR112015017295B1/pt active IP Right Grant
- 2014-01-27 CA CA2898567A patent/CA2898567C/en active Active
- 2014-01-27 KR KR1020157022271A patent/KR101849612B1/ko active IP Right Grant
- 2014-01-27 ES ES14701394.0T patent/ES2628153T3/es active Active
- 2014-01-27 RU RU2015136531A patent/RU2639663C2/ru active
- 2014-01-27 BR BR122022020319-1A patent/BR122022020319B1/pt active IP Right Grant
- 2014-01-27 BR BR122022020276-4A patent/BR122022020276B1/pt active IP Right Grant
- 2014-01-27 BR BR122022020284-5A patent/BR122022020284B1/pt active IP Right Grant
- 2014-01-27 BR BR122021011658-0A patent/BR122021011658B1/pt active IP Right Grant
- 2014-01-27 EP EP14701394.0A patent/EP2948947B1/en active Active
- 2014-01-27 BR BR122022020326-4A patent/BR122022020326B1/pt active IP Right Grant
- 2014-01-27 CN CN201480018076.5A patent/CN105190750B/zh active Active
- 2014-01-27 MX MX2015009534A patent/MX351187B/es active IP Right Grant
- 2014-01-28 AR ARP140100258A patent/AR096574A1/es active IP Right Grant
- 2014-01-28 TW TW103103168A patent/TWI524330B/zh active
-
2015
- 2015-07-28 US US14/811,203 patent/US9576585B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6445460B2 (ja) | 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置 | |
JP6778781B2 (ja) | エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御 | |
JP7543386B2 (ja) | 多様な再生環境のためのダイナミックレンジ制御 | |
JP6851523B2 (ja) | 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化 | |
CN105103222B (zh) | 用于响度和动态范围控制的元数据 | |
JP5695677B2 (ja) | 単一再生モードにおいてラウドネス測定値を合成するシステム | |
CN106796799B (zh) | 高效drc配置文件传输 | |
EP3761672B1 (en) | Using metadata to aggregate signal processing operations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170704 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170929 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20171201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171226 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180807 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20180830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6445460 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |