JP6767545B2 - 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 - Google Patents
入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 Download PDFInfo
- Publication number
- JP6767545B2 JP6767545B2 JP2019123458A JP2019123458A JP6767545B2 JP 6767545 B2 JP6767545 B2 JP 6767545B2 JP 2019123458 A JP2019123458 A JP 2019123458A JP 2019123458 A JP2019123458 A JP 2019123458A JP 6767545 B2 JP6767545 B2 JP 6767545B2
- Authority
- JP
- Japan
- Prior art keywords
- drc
- audio signal
- input audio
- parameter
- drc gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 76
- 238000000034 method Methods 0.000 title claims description 48
- 238000004590 computer program Methods 0.000 title claims description 7
- 238000012805 post-processing Methods 0.000 claims description 103
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 2
- 102100025018 Dynein regulatory complex subunit 2 Human genes 0.000 description 75
- 101000908413 Homo sapiens Dynein regulatory complex subunit 2 Proteins 0.000 description 75
- 102100025032 Dynein regulatory complex protein 1 Human genes 0.000 description 60
- 101000908373 Homo sapiens Dynein regulatory complex protein 1 Proteins 0.000 description 60
- 102100025015 Dynein regulatory complex subunit 3 Human genes 0.000 description 52
- 101000908408 Homo sapiens Dynein regulatory complex subunit 3 Proteins 0.000 description 52
- 101000813988 Homo sapiens Epidermal growth factor receptor kinase substrate 8-like protein 1 Proteins 0.000 description 52
- 238000004458 analytical method Methods 0.000 description 33
- 238000007781 pre-processing Methods 0.000 description 26
- 230000015572 biosynthetic process Effects 0.000 description 24
- 238000003786 synthesis reaction Methods 0.000 description 24
- 238000007906 compression Methods 0.000 description 21
- 230000006835 compression Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101100031387 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) drc-1 gene Proteins 0.000 description 1
- 101100465868 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) drc-2 gene Proteins 0.000 description 1
- 101100410018 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) drc-3 gene Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B21/00—Methods or apparatus for flushing boreholes, e.g. by use of exhaust air from motor
- E21B21/003—Means for stopping loss of drilling fluid
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B33/00—Sealing or packing boreholes or wells
- E21B33/10—Sealing or packing boreholes or wells in the borehole
- E21B33/13—Methods or devices for cementing, for plugging holes, crevices or the like
- E21B33/138—Plastering the borehole wall; Injecting into the formation
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B41/00—Equipment or details not covered by groups E21B15/00 - E21B40/00
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Geology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Mathematical Physics (AREA)
- Environmental & Geological Engineering (AREA)
- Fluid Mechanics (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geochemistry & Mineralogy (AREA)
- Quality & Reliability (AREA)
- Mechanical Engineering (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
[関連出願への相互参照]
この出願は、2012年5月18日出願の米国仮特許出願第61/649,036号、2012年 7月25日出願の米国仮特許出願第61/664,507号、及び2012年10月12日出願の米国仮特許出願第61/713,005号の優先権を主張するものであり、上記文献はそれぞれ全体をここに参照援用する。
ここで、「オーディオ信号」とは、純粋なオーディオ信号、またはオーディオビジュアル信号やマルチメディア信号のオーディオ部分である。
・ 前記ビットストリームを受け取り、符号化コア信号Y〜(訳注:「〜」は「Y」の上にある)と一以上のマルチチャンネルコーディングパラメータ(これは集合的にαと表す);
・ 前記符号化されたコア信号を受け取り、mチャンネルコア信号を出力する、ここで1≦m<nであるコア信号デコーダ;
・ 前記コア信号とマルチチャンネルコーディングパラメータとを受け取り、前記マルチチャンネルコーディングパラメータに依存するゲインを用いて前記コア信号のチャンネルの線形結合を形成することにより、前記nチャンネル信号を出力するパラメトリック合成ステージ。
・前記符号化コア信号をmチャンネルコア信号に復号する、1<m<nであるステップと、
・パラメトリック合成を行い、前記コア信号と前記マルチチャンネルコーディングパラメータとに基づき前記nチャンネル信号を再構成するステップ。
・前記nチャンネル信号を受け取り、それに基づいて、前記符号化システムのパラメトリックコーディングモードで、mチャンネルコア信号Yと一以上のマルチチャンネルコーディングパラメータαとを出力する、1<m<nである、パラメトリック分析ステージと、
・前記コア信号を受け取り、符号化コア信号Y〜(訳注:「〜」は「Y」の上にある)を出力するコア信号エンコーダ。
・時間ブロックにパーティションされたnチャンネルオーディオ信号Xを受け取るステップ;
・mチャンネルコア信号Yと一以上のマルチチャンネルコーディングパラメータαとを生成し、一方、時間ブロックベースでダイナミックレンジ制限を行い、適用されたダイナミックレンジ制限を定量化した一以上の前処理DRCパラメータDRC2を生成するステップ;
・コア信号と、マルチチャンネルコーディングパラメータと、前処理DRCパラメータDRC2とを含むビットストリームPを出力するステップ。
II.実施形態:符号化側
図1aは、一般化したブロック図形式で、一実施形態によるデュアルモード符号化システム1を示す。nチャンネルオーディオ信号Xを、上部(これは符号化システム1の少なくとも一離散的コーディングモードでアクティブである)及び下部(これはシステム1の少なくともパラメトリックコーディングモードでアクティブである)の各々に供給する。
III.実施形態:復号器側
図2aは、ビットストリームPに基づきnチャンネルオーディオ信号を再構成するシングルモード復号システム51を示す。ビットストリームPは、符号化コア信号Y〜(訳注:「〜」は「Y」の上にある)、マルチチャンネルコーディングパラメータα、前処理DRCパラメータDRC2、及び補償された後処理DRCパラメータDRC3を含み、これらの量は復号システム51の入力に配置されたデマルチプレクサ70により、ビットストリームから抽出される。コア信号復号器71は、符号化コア信号Y〜(訳注:「〜」は「Y」の上にある)を受信し、それに基づき、mチャンネルコア信号Y(1≦m≦n)を出力する。復号に関して、コア信号復号器71は、さらに、復号された後処理DRCパラメータDRC3により数量化されたDRCを実行する。コア信号復号器71は、補償された後処理DRCパラメータDRC3またはその一部分により表されるフルDRCを生じさせるように動作する。この決定は、ユーザによりマニュアル制御されてもよいし、再生機器の特性の検出に基づいてもよい。コア信号デコーダ71の下流には、DRCプロセッサ74が配置され、g↑との表示が示すように、前処理DRCパラメータDRC2で定量化されている、符号化器側で科されたダイナミックレンジ制限をキャンセルすることにより、コア信号のダイナミックレンジを回復する。DRCプロセッサ74は、中間信号YCを出力する。これは、ダイナミックレンジを除けばコア信号Yと同じであり、パラメトリック合成段階72に入力される。パラメトリック合成ステージ72は、中間信号YC中のmチャンネルのnチャンネル線形結合を形成し(適用されるゲインはマルチチャンネルコーディングパラメータαにより制御される)、再構成されたnチャンネルオーディオ信号Xを出力する。パラメトリック合成ステージ72の線形結合は、中間信号YCまたはコア信号Yから得られる非相関信号(decorrelated signal)をさらに含む。非相関信号は、さらにアーティファクト減衰などの非線形処理をされる。非相関信号は、コア信号修正ユニットまたはデコリレータ(decorrelator)(図示せず)で生成され得る。概要を上記した単純な実施形態では、符号化器側で科されたダイナミックレンジ制限のDRCプロセッサ74におけるキャンセレーションは、信号を広いスペクトル範囲で、前処理ダイナミックレンジ制限を定量化するパラメータDRC2の逆数に対応する係数だけスケーリングするということになる。
ここで、f∈[0,1]は予め決まっており、DRC2>0かつDRC1=DRC2+DRC3(対数スケール)である。上記から、DRC1とDRC3は正でも負でもよいことがわかる。上記の通り、コア信号デコーダ71の動作がレンジコンパクティング(range compacting)(DRC3=y>0)である場合、コア信号デコーダ71とDRCプロセッサ74との両方を動作させることを回避することが望ましい。これは、k71=0またはk74=0の場合に上記の方程式を解くことになる。
本発明のさらなる実施形態は、上記の説明を読めば、当業者には明らかになるだろう。本明細書と図面は実施形態と実施例を開示しているが、本発明はこれらの具体的な例に制約されない。添付した特許請求の範囲で規定した本発明の範囲から逸脱することなく、多数の修正や変形をすることができる。請求項に現れる参照符号は、その範囲を限定するものと考えてはいけない。
実施形態について付記する。
(付記1) ビットストリームに基づきnチャンネルオーディオ信号を再構成するように構成された復号システムであって、
前記ビットストリームを受け取り、それに基づいて、前記システムのパラメトリックコーディングモードにおいて、符号化されたコア信号とマルチチャンネルコーディングパラメータとを出力する、パラメトリックモードデマルチプレクサと、
前記符号化されたコア信号を受け取り、それに基づいて、mチャンネルコア信号を出力する、ここで1≦m<nであるコア信号復号器と、
前記コア信号と前記マルチチャンネルコーディングパラメータとを受け取り、それに基づき、前記nチャンネル信号を出力するパラメトリック合成ステージとを有し、
前記パラメータモードデマルチプレクサは、さらに、前記ビットストリームに基づいて、前記コア信号のエンコーダ側ダイナミックレンジ制限を定量化する前処理ダイナミックレンジ制御(DRC)パラメータを出力するように構成され、
前記復号システムは、前記前処理DRCパラメータに基づき、前記エンコーダ側ダイナミックレンジ制限をキャンセルするように動作可能である、
復号システム。
(付記2) 前記パラメトリックモードデマルチプレクサは、さらに、前記ビットストリームに基づき、前記システムの前記パラメトリックコーディングモードにおいて、適用されるデコーダ側DRCを定量化する補償された後処理DRCパラメータを出力するように構成され、
前記復号システムは、
1)前記パラメトリック合成ステージ内またはその下流、及び
2)前記コア信号デコーダ内、
のうち一方で、前記デコーダ側DRCを適用するように動作可能である、
付記1に記載の復号システム。
(付記3) さらに、前記エンコーダ側ダイナミックレンジ制限をまたはその一部をキャンセルし、補償されたコア信号を出力するように動作可能なDRCプロセッサを有し、
前記コア信号デコーダは、前記デコーダ側DRCまたはその一部を適用するように動作可能である、
付記2に記載の復号システム。
(付記4) 前記コア信号デコーダと前記DRCプロセッサに通信可能に結合したDRCプリプロセッサをさらに有し、前記DRCプリプロセッサは、目標DRCレベルと、前記前処理DRCパラメータと、前記補償された後処理DRCパラメータとを受け取り、
−前記目標DRCレベルが前記コア信号のデコーダ入力DRCレベルに関するダイナミックレンジブーストに対応するとき、前記DRCプロセッサに、前記目標DRCレベルに基づいて、前記エンコーダ側ダイナミックレンジ制限またはその一部をキャンセルさせ、
−前記目標DRCレベルが前記コア信号の前記デコーダ入力DRCレベルに関するダイナミックレンジ圧縮に対応するとき、前記コア信号デコーダに、前記目標DRCレベルに基づいて、前記デコーダ側DRCまたはその一部を適用させ、
前記DRCプリプロセッサは、前記目標DRCレベルに応じて前記一部を決定する、
付記3に記載の復号システム。
(付記5) 前記パラメトリックモードデマルチプレクサは、さらに、前記ビットストリームに基づき、前記システムの前記パラメトリックコーディングモードにおいて、補償された後処理DRCパラメータを出力するように構成され、
前記システムはさらに、
前記補償された後処理DRCパラメータと前記前処理DRCパラメータとを受け取り、それに基づいて、適用するデコーダ側DRCを定量化した回復された後処理DRCパラメータを出力するDRCダウン補償器と、
前記システムのパラメトリックコーディングモードにおいて、前記回復された後処理DRCパラメータに応じて前記nチャンネルオーディオ信号にDRCを適用するように構成されたDRCプロセッサとを有し、
前記回復されたDRCパラメータにより表されるデコーダ側DRCは、前記コア信号のエンコーダ側ダイナミックレンジ制限と、前記補償された後処理DRCパラメータにより表されるデコーダ側DRCとの結合と数量的に等価である、
付記1ないし4いずれか一項に記載の復号システム。
(付記6) 前記ビットストリームを受け取り、それに基づいて、前記システムの離散コーディングモードにおいて、符号化nチャンネル信号と、適用されるデコーダ側DRCを数量化した後処理DRCパラメータとを出力する離散モードデマルチプレクサと、
前記ビットストリームに含まれる符号化nチャンネル信号を受け取り、それに基づいて、前記システムの離散コーディングモードにおいて、前記nチャンネルオーディオ信号を出力するデコーダとを有し、
前記DRCプロセッサは、さらに、前記システムの離散コーディングモードにおいて、前記後処理DRCパラメータに応じて、前記nチャンネルオーディオ信号にDRCを適用するように構成されている、
付記5に記載の復号システム。
(付記7) 前記パラメトリック合成ステージは、
前記コア信号と前記前処理DRCパラメータとを受け取り、前記エンコーダ側ダイナミックレンジ制限をキャンセルすることにより得られたダイナミックレンジ補償されたコア信号を出力するプリコンディショナと、
前記ダイナミックレンジ補償されたコア信号と前記マルチチャンネルコーディングパラメータとを受け取り、それに基づき、前記nチャンネル信号を出力するパラメトリック合成プロセッサとを有する、
付記5または6に記載の復号システム。
(付記8) 前記パラメトリック合成ステージは、
前記コア信号と前記マルチチャンネルコーディングパラメータとを受け取り、それに基づき、中間信号を出力するパラメトリック合成プロセッサと、
前記中間信号と前記前処理DRCパラメータとを受け取り、前記エンコーダ側ダイナミックレンジ制限をキャンセルすることにより得られたnチャンネル信号を出力するポストコンディショナとを有する、
付記5または6に記載の復号システム。
(付記9) 前記パラメトリックモードデマルチプレクサは、前記前処理DRCパラメータの各値を、指数を表す2ビットフィールドと仮数を表す5ビットフィールドとして読むようにさらに構成されている、
付記1ないし4いずれか一項に記載の復号システム。
(付記10) ビットストリームに基づいてnチャンネルオーディオ信号を再構成する方法であって、
符号化コード信号と、マルチチャンネルコーディングパラメータと、前記コア信号のエンコーダ側ダイナミックレンジ制限を数量化する前処理ダイナミックレンジ制御(DRC)パラメータとを含むビットストリームに応じて、
a−1)前記符号化コア信号をmチャンネルコア信号に復号する、1<m<nであるステップと、
a−2)パラメトリック合成を行い、前記コア信号と前記マルチチャンネルコーディングパラメータとに基づき前記nチャンネル信号を再構成するステップとを実行するステップを有し、
前記方法は、さらに、前記前処理DRCパラメータに基づき、前記エンコーダ側ダイナミックレンジ制限をキャンセルするステップを有する、
方法。
(付記11) 前記ビットストリームが、符号化コア信号と、マルチチャンネルコーディングパラメータと、前処理DRCパラメータとを含み、さらに適用されるデコーダ側DRCを数量化した補償された後処理DRCパラメータをさらに含む場合に応じて、
ステップa−1と、a−2と、
a−3)前記前処理DRCパラメータに基づいて、前記エンコーダ側ダイナミックレンジ制限またはその一部をキャンセルするステップ、及び
a−4)前記補償された後処理DRCパラメータに応じて、前記デコーダ側DRCまたはその一部を適用するステップのうち少なくとも一方とを実行するステップと、
付記10に記載の方法。
(付記12) ステップa−1及びa−2を実行することにより前記場合に対応するステップと、
目標DRCレベルを受け取り、これをデコーダ入力DRCレベルと比較して、前記目標DRCレベルがダイナミックレンジブーストに対応するかダイナミックレンジ圧縮に対応するか決めるステップと、
前記比較に基づいて、
a−3)前記前処理DRCパラメータに基づいて、前記エンコーダ側ダイナミックレンジ制限またはその一部をキャンセルするステップ、及び
a−4)前記補償された後処理DRCパラメータに応じて、前記デコーダ側DRCまたはその一部を適用するステップのうち選択された一方を実行するステップと、
を有する、付記11に記載の方法。
(付記13) 前記ビットストリームは、さらに、適用されるデコーダ側DRCを数量化した後処理DRCパラメータを含み、
前記方法は、さらに、前記後処理DRCパラメータにより前記nチャンネル信号にDRCを適用するステップを有し、前記ビットストリームが前処理DRCパラメータを含み、前記ビットストリーム中の前記後処理DRCパラメータが補償された後処理DRCパラメータであるとき、前記補償された後処理DRCパラメータの替わりに、回復された後処理DRCパラメータを用い、
前記回復された後処理DRCパラメータは前記補償された後処理DRCパラメータと前記前処理DRCパラメータに基づき得られ、前記回復されたDRCパラメータにより表されるデコーダ側DRCは、前記コア信号のエンコーダ側ダイナミックレンジ制限と、前記後処理DRCパラメータにより表されるデコーダ側DRCとの結合に数量的に等価である、
付記10ないし12いずれか一項に記載の方法。
(付記14) 前記ビットストリームが符号化nチャンネル信号を含むのに応じて、
b)前記符号化nチャンネル信号を復号することにより、前記nチャンネル信号を再構成するステップをさらに有する、
付記13に記載の方法。
(付記15) 時間ブロックにパーティションされたnチャンネルオーディオ信号をビットストリームとして符号化するように構成された復号システムであって、
前記nチャンネル信号を受け取り、それに基づいて、前記符号化システムのパラメトリックコーディングモードで、mチャンネルコア信号とマルチチャンネルコーディングパラメータとを出力する、1<m<nである、パラメトリック分析ステージと、
前記コア信号を受け取り、それに基づいて、符号化コア信号を出力するコア信号エンコーダとを有し、
前記パラメトリック分析ステージは、さらに、時間セグメントベースの適応的ダイナミックレンジ制限を行い、適用される前記ダイナミックレンジ制限を数量化する前処理ダイナミックレンジ制御(DRC)パラメータを出力し、
前記システムは、さらに、前記システムのパラメトリックコーディングモードにおいて、前記システムから出力される、少なくとも前記符号化コア信号、前記マルチチャンネルコーディングパラメータ、及び前記前処理DRCパラメータを含むビットストリームを形成するように動作可能なパラメトリックモードマルチプレクサを有する、
復号システム。
(付記16) 前記nチャンネルオーディオ信号を受け取り、それに基づいて、適用されるデコーダ側DRCを数量化した後処理DRCパラメータを出力する少なくとも1つのDRCアナライザと、
前記後処理DRCパラメータと前記前処理DRCパラメータを受け取り、それに基づいて、適用されるデコーダ側DRCを数量化した補償された後処理DRCパラメータを出力する、前記補償された後処理DRCパラメータは前記パラメトリックコーディングモードにおいて前記ビットストリームに含まれる、DRCアップ補償器とを有し、
前記後処理DRCパラメータにより表されるデコーダ側DRCは、前記パラメトリック分析ステージにより適用されるダイナミックレンジ制限と、前記補償された後処理DRCパラメータにより数量化されたデコーダ側DRCとの結合と数量的に等価である、
付記15に記載の符号化システム。
(付記17) 前記少なくとも1つのDRCアナライザは、第1の数p1 >1の時間ロックを含むシングルセグメントに基づいて、前記後処理DRCパラメータの値を計算するように構成され、
前記パラメトリック分析ステージは、第2の数p2 >1の時間ブロックを含むシングルセグメントに基づいて、前記前処理DRCパラメータの値を計算するように構成され、
前記第1の数は前記第2の数以下である、すなわちp1 <p2である、
付記16に記載の符号化システム。
(付記18) 前記nチャンネル信号を受け取り、それに基づいて、前記システムの離散コーディングモードにおいて前記システムから出力されるビットストリームの一部を形成する符号化nチャンネル信号を出力するエンコーダと、
前記システムの離散コーディングモードにおいて前記システムから出力されるビットストリームを形成するように動作可能な離散モードマルチプレクサとを有し、前記ビットストリームは少なくとも前記符号化nチャンネル信号と前記後処理DRCパラメータとを含む、
付記16または17に記載の符号化システム。
(付記19) 前記システムは、2つのDRCアナライザを有し、これらは機能的に等価であり、すなわち離散モードDRCアナライザとパラメトリックモードDRCアナライザとである、
付記15ないし18いずれか一項に記載の符号化システム。
(付記20) 前記後処理DRCパラメータと前記符号化nチャンネル信号とを受け取り、離散コーディングモードにおいて前記システムから出力するビットストリームを形成するように動作可能な離散モードマルチプレクサをさらに有する、
付記15ないし19いずれか一項に記載の符号化システム。
(付記21) 前記パラメトリック分析ステージは、
前記nチャンネル信号を受け取り、ダイナミックレンジ制限されたnチャンネル信号とDRCパラメータとを出力するプリプロセッサと、
前記ダイナミックレンジ制限されたnチャンネル信号を受け取り、それに基づき、前記mチャンネル信号とマルチチャンネルコーディングパラメータとを出力するパラメトリック分析プロセッサとを有する、
付記15ないし20いずれか一項に記載の符号化システム。
(付記22) 前記パラメトリックモードデマルチプレクサは、前記前処理DRCパラメータの各値を、指数を表す2ビットフィールドと仮数を表す5ビットフィールドとして含むように構成されている、
付記15ないし21いずれか一項に記載の符号化システム。
(付記23) 時間ブロックにパーティションされたnチャンネルオーディオ信号を符号化する方法であって、
前記方法は、mチャンネルコア信号とマルチチャンネルコーディングパラメータとを生成する、1<m<nであるステップを有し、
前記生成するステップは、時間ブロックベースでダイナミックレンジ制限を実行するステップと、前記適用されたダイナミックレンジ制限を数量化した前処理ダイナミックレンジ制御(DRC)パラメータを生成するステップとを有し、
前記方法は、さらに、前記コア信号及び前記マルチチャンネルコーディングパラメータと同時に前記前処理DRCパラメータを送信するステップをさらに有する、
方法。
(付記24) 付記10ないし14及び23いずれか一項に記載の方法を実行するコンピュータ実行可能命令を有するコンピュータ読み出し可能媒体を含むコンピュータプログラム製品。
(付記25) n=6かつm=2である、付記1ないし24いずれか一項に記載のシステム、方法、またはコンピュータプログラム製品。
Claims (10)
- 入力オーディオ信号のダイナミックレンジ制御(DRC)の方法であって、
復号システムが、入力オーディオ信号、エンコーダ生成ラウドネスメタデータ、及びエンコーダ生成DRCメタデータを含むビットストリームを受信することであって、前記エンコーダ生成ラウドネスメタデータは前記入力オーディオ信号のラウドネスレベルを含み、前記エンコーダ生成DRCメタデータは複数のDRCゲインセットを含み、前記複数のDRCゲインセットは、前記復号システムにより前記入力オーディオ信号に適用される第1のDRCゲインセットと第2のDRCゲインセットとを含む、受信することと、
ユーザ入力または再生機器の特性のうち1つ以上に基づいて、前記第1のDRCゲインセットまたは前記第2のDRCゲインセットのうち1つを、前記入力オーディオ信号に適用すべき特定のDRCゲインセットとして決定することと、
前記特定のDRCゲインセットと、前記入力オーディオ信号のラウドネスレベル及び目標出力レベルに応じて決まったゲインとを、前記入力オーディオ信号に適用する全体的ゲインの一部として適用することとを含む、
方法。 - 前記ビットストリームは適応的ビットレートで前記復号システムに送信される、
請求項1に記載の方法。 - ゲイン全体は少なくとも部分的に修正パラメータに基づき決定される、
請求項1に記載の方法。 - 前記修正パラメータはユーザ定義される、
請求項3に記載の方法。 - 前記入力オーディオ信号は、各々が複数の時間ブロックを含む複数の時間フレームを含み、
前記第1のDRCゲインセットまたは前記第2のDRCゲインセットの一方または両方は、前記入力オーディオ信号中の一時間ブロックに適用される一ゲイン値を含む、
請求項1に記載の方法。 - 前記入力オーディオ信号は、各々がオーディオデータフレーム中に複数の時間ブロックを含む複数の時間フレームを含み、
前記第1のDRCゲインセットまたは前記第2のDRCゲインセットの一方または両方は、前記入力オーディオ信号中の一時間フレーム中のすべての時間ブロックに適用される一ゲイン値を含む、
請求項1に記載の方法。 - 前記第1のDRCゲインセットは前処理DRCゲインを表し、
前記第2のDRCゲインセットは補償された後処理DRCゲインを表し、
前記前処理DRCゲインと前記補償された後処理DRCゲインの組み合わせは、後処理DRCゲインを表す、
請求項1に記載の方法。 - 前記復号システムは2つのオーディオチャンネルで動作する、
請求項1に記載の方法。 - 一以上のプロセッサにより実行されると、前記一以上のプロセッサに、
復号システムが、入力オーディオ信号、エンコーダ生成ラウドネスメタデータ、及びエンコーダ生成DRCメタデータを含むビットストリームを受信することであって、前記エンコーダ生成ラウドネスメタデータは前記入力オーディオ信号のラウドネスレベルを含み、前記エンコーダ生成DRCメタデータは複数のDRCゲインセットを含み、前記複数のDRCゲインセットは、前記復号システムにより前記入力オーディオ信号に適用される第1のDRCゲインセットと第2のDRCゲインセットとを含む、受信することと、
ユーザ入力または再生機器の特性のうち1つ以上に基づいて、前記第1のDRCゲインセットまたは前記第2のDRCゲインセットのうち1つを、前記入力オーディオ信号に適用すべき特定のDRCゲインセットとして決定することと、
前記特定のDRCゲインセットと、前記入力オーディオ信号のラウドネスレベル及び目標出力レベルに応じて決まったゲインとを、前記入力オーディオ信号に適用する全体的ゲインの一部として適用することとを実行させる、
コンピュータプログラム。 - 1つ以上のプロセッサと、
ソフトウェア命令を格納した非一時的コンピュータ可読記憶媒体であって、前記ソフトウェア命令は、前記1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、
復号システムが、入力オーディオ信号、エンコーダ生成ラウドネスメタデータ、及びエンコーダ生成DRCメタデータを含むビットストリームを受信することであって、前記エンコーダ生成ラウドネスメタデータは前記入力オーディオ信号のラウドネスレベルを含み、前記エンコーダ生成DRCメタデータは複数のDRCゲインセットを含み、前記複数のDRCゲインセットは、前記復号システムにより前記入力オーディオ信号に適用される第1のDRCゲインセットと第2のDRCゲインセットとを含む、受信することと、
ユーザ入力または再生機器の特性のうち1つ以上に基づいて、前記第1のDRCゲインセットまたは前記第2のDRCゲインセットのうち1つを、前記入力オーディオ信号に適用する特定のDRCゲインセットとして決定することと、
前記特定のDRCゲインセットと、前記入力オーディオ信号のラウドネスレベル及び目標出力レベルに応じて決まったゲインとを、前記入力オーディオ信号に適用する全体的ゲインの一部として適用することとを実行させる非一時的コンピュータ可読記憶媒体とを含む、
装置。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261649036P | 2012-05-18 | 2012-05-18 | |
US61/649,036 | 2012-05-18 | ||
US201261664507P | 2012-07-25 | 2012-07-25 | |
US61/664,507 | 2012-07-25 | ||
US201261713005P | 2012-10-12 | 2012-10-12 | |
US61/713,005 | 2012-10-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017131761A Division JP6552555B2 (ja) | 2012-05-18 | 2017-07-05 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020156364A Division JP6805387B1 (ja) | 2012-05-18 | 2020-09-17 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019197216A JP2019197216A (ja) | 2019-11-14 |
JP6767545B2 true JP6767545B2 (ja) | 2020-10-14 |
Family
ID=48485447
Family Applications (9)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015512676A Active JP6174129B2 (ja) | 2012-05-18 | 2013-05-02 | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
JP2017131761A Active JP6552555B2 (ja) | 2012-05-18 | 2017-07-05 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2019123458A Active JP6767545B2 (ja) | 2012-05-18 | 2019-07-02 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2020156364A Active JP6805387B1 (ja) | 2012-05-18 | 2020-09-17 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2020200948A Active JP6853408B1 (ja) | 2012-05-18 | 2020-12-03 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2021039246A Active JP7000613B2 (ja) | 2012-05-18 | 2021-03-11 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2021209256A Active JP7127198B2 (ja) | 2012-05-18 | 2021-12-23 | 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体 |
JP2022129917A Active JP7471356B2 (ja) | 2012-05-18 | 2022-08-17 | 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体 |
JP2024062458A Pending JP2024084841A (ja) | 2012-05-18 | 2024-04-09 | 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015512676A Active JP6174129B2 (ja) | 2012-05-18 | 2013-05-02 | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
JP2017131761A Active JP6552555B2 (ja) | 2012-05-18 | 2017-07-05 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
Family Applications After (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020156364A Active JP6805387B1 (ja) | 2012-05-18 | 2020-09-17 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2020200948A Active JP6853408B1 (ja) | 2012-05-18 | 2020-12-03 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2021039246A Active JP7000613B2 (ja) | 2012-05-18 | 2021-03-11 | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 |
JP2021209256A Active JP7127198B2 (ja) | 2012-05-18 | 2021-12-23 | 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体 |
JP2022129917A Active JP7471356B2 (ja) | 2012-05-18 | 2022-08-17 | 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体 |
JP2024062458A Pending JP2024084841A (ja) | 2012-05-18 | 2024-04-09 | 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体 |
Country Status (6)
Country | Link |
---|---|
US (9) | US9401152B2 (ja) |
EP (2) | EP2850612B1 (ja) |
JP (9) | JP6174129B2 (ja) |
CN (7) | CN112185399B (ja) |
HK (2) | HK1246964A1 (ja) |
WO (1) | WO2013173080A1 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5581449B2 (ja) * | 2010-08-24 | 2014-08-27 | ドルビー・インターナショナル・アーベー | Fmステレオ無線受信機の断続的モノラル受信の隠蔽 |
JP6174129B2 (ja) * | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
AU2014339086B2 (en) * | 2013-10-22 | 2017-12-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9276544B2 (en) * | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10411494B2 (en) | 2016-02-05 | 2019-09-10 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Adapter and method for charging control |
US10002086B1 (en) * | 2016-12-20 | 2018-06-19 | Sandisk Technologies Llc | Multi-channel memory operations based on bit error rates |
US10924078B2 (en) | 2017-03-31 | 2021-02-16 | Dolby International Ab | Inversion of dynamic range control |
US10609499B2 (en) * | 2017-12-15 | 2020-03-31 | Boomcloud 360, Inc. | Spatially aware dynamic range control system with priority |
US11929085B2 (en) * | 2018-08-30 | 2024-03-12 | Dolby International Ab | Method and apparatus for controlling enhancement of low-bitrate coded audio |
CN113841197B (zh) | 2019-03-14 | 2022-12-27 | 博姆云360公司 | 具有优先级的空间感知多频带压缩系统 |
CN110364172B (zh) * | 2019-07-16 | 2022-01-25 | 建荣半导体(深圳)有限公司 | 一种实现动态范围控制的方法、装置和计算设备 |
KR102295287B1 (ko) * | 2019-12-26 | 2021-08-30 | 네이버 주식회사 | 오디오 신호 처리 방법 및 시스템 |
WO2023196219A1 (en) * | 2022-04-08 | 2023-10-12 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for user generated content capture and adaptive rendering |
Family Cites Families (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69026278T3 (de) | 1989-01-27 | 2002-08-08 | Dolby Laboratories Licensing Corp., San Francisco | Adaptiv Bitzuordnung für Audio-Koder und Dekoder |
AU5663296A (en) | 1995-04-10 | 1996-10-30 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals fo r digital transmission |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JPH10207499A (ja) * | 1997-01-22 | 1998-08-07 | Alpine Electron Inc | Dab受信機のダイナミックレンジ制御方法 |
GB2354139B (en) * | 1999-09-07 | 2004-01-28 | Sony Uk Ltd | Signal processor |
WO2001086638A2 (en) | 2000-05-09 | 2001-11-15 | Destiny Software Productions Inc. | Method and system for audio compression and distribution |
US6785655B1 (en) * | 2000-05-15 | 2004-08-31 | Lsi Logic Corporation | Method for independent dynamic range control |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
JP2003078428A (ja) * | 2001-09-04 | 2003-03-14 | Kenwood Corp | ディジタルオーディオ放送受信装置及びその出力制御方法 |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
WO2006006809A1 (en) | 2004-07-09 | 2006-01-19 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and cecoding multi-channel audio signal using virtual source location information |
CN101046963B (zh) * | 2004-09-17 | 2011-03-23 | 广州广晟数码技术有限公司 | 解码经编码的音频数据流的方法 |
AU2005299410B2 (en) * | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
EP1691348A1 (en) | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
CN101243488B (zh) * | 2005-06-30 | 2012-05-30 | Lg电子株式会社 | 用于编码和解码音频信号的装置及其方法 |
US20070063741A1 (en) * | 2005-09-22 | 2007-03-22 | Tarango Tony M | Testing of integrated circuit receivers |
JP2007109328A (ja) * | 2005-10-14 | 2007-04-26 | Kenwood Corp | 再生装置 |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
KR100878816B1 (ko) * | 2006-02-07 | 2009-01-14 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
CN101410892B (zh) * | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
JP4981123B2 (ja) * | 2006-04-04 | 2012-07-18 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整 |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
DE102007017254B4 (de) | 2006-11-16 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Kodieren und Dekodieren |
MX2009007412A (es) | 2007-01-10 | 2009-07-17 | Koninkl Philips Electronics Nv | Decodificador de audio. |
JP5254983B2 (ja) | 2007-02-14 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
US7522074B2 (en) * | 2007-09-17 | 2009-04-21 | Samplify Systems, Inc. | Enhanced control for compression and decompression of sampled signals |
WO2009067741A1 (en) | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
US20110282674A1 (en) | 2007-11-27 | 2011-11-17 | Nokia Corporation | Multichannel audio coding |
US20090164223A1 (en) * | 2007-12-19 | 2009-06-25 | Dts, Inc. | Lossless multi-channel audio codec |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
JP4591557B2 (ja) * | 2008-06-16 | 2010-12-01 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム |
WO2010004473A1 (en) | 2008-07-07 | 2010-01-14 | Koninklijke Philips Electronics N.V. | Audio enhancement |
FI3573056T3 (fi) * | 2008-07-11 | 2022-11-30 | Audiokooderi ja audiodekooderi | |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
WO2010013450A1 (ja) * | 2008-07-29 | 2010-02-04 | パナソニック株式会社 | 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
MX2011011399A (es) | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
EP4293665A3 (en) * | 2008-10-29 | 2024-01-10 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
JP2010114803A (ja) * | 2008-11-10 | 2010-05-20 | Panasonic Corp | 音声処理装置 |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
KR101622950B1 (ko) | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US20100223061A1 (en) | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
US8302047B2 (en) * | 2009-05-06 | 2012-10-30 | Texas Instruments Incorporated | Statistical static timing analysis in non-linear regions |
EP2461321B1 (en) * | 2009-07-31 | 2018-05-16 | Panasonic Intellectual Property Management Co., Ltd. | Coding device and decoding device |
KR101106465B1 (ko) * | 2009-11-09 | 2012-01-20 | 네오피델리티 주식회사 | 멀티밴드 drc 시스템의 게인 설정 방법 및 이를 이용한 멀티밴드 drc 시스템 |
CN102118668B (zh) * | 2010-01-06 | 2014-10-15 | 宏达国际电子股份有限公司 | 扬声器系统和扬声器驱动电路 |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
JP5650227B2 (ja) * | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
ES2565394T3 (es) | 2011-12-15 | 2016-04-04 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, método y programa informático para evitar artefactos de recorte |
JP6174129B2 (ja) | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
RU2639663C2 (ru) | 2013-01-28 | 2017-12-21 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
AU2014339086B2 (en) | 2013-10-22 | 2017-12-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
KR101967810B1 (ko) | 2014-05-28 | 2019-04-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 데이터 프로세서 및 사용자 제어 데이터의 오디오 디코더들과 렌더러들로의 전송 |
RU2019122989A (ru) | 2014-05-30 | 2019-09-16 | Сони Корпорейшн | Устройство обработки информации и способ обработки информации |
US20180165358A1 (en) | 2014-06-30 | 2018-06-14 | Sony Corporation | Information processing apparatus and information processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
ES2870749T3 (es) | 2015-05-29 | 2021-10-27 | Fraunhofer Ges Forschung | Dispositivo y procedimiento para el control de volumen |
PT3311379T (pt) | 2015-06-17 | 2023-01-06 | Fraunhofer Ges Forschung | Controlo de intensidade sonora para interatividade de utilizador em sistemas de codificação de áudio |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2013
- 2013-05-02 JP JP2015512676A patent/JP6174129B2/ja active Active
- 2013-05-02 CN CN202011087994.7A patent/CN112185399B/zh active Active
- 2013-05-02 CN CN202011087991.3A patent/CN112185398B/zh active Active
- 2013-05-02 WO PCT/US2013/039344 patent/WO2013173080A1/en active Application Filing
- 2013-05-02 CN CN201380025886.9A patent/CN104303229B/zh active Active
- 2013-05-02 EP EP13724945.4A patent/EP2850612B1/en active Active
- 2013-05-02 US US14/399,861 patent/US9401152B2/en active Active
- 2013-05-02 CN CN201710814971.3A patent/CN107403624B/zh active Active
- 2013-05-02 CN CN202011087998.5A patent/CN112185400B/zh active Active
- 2013-05-02 CN CN202011087926.0A patent/CN112185397B/zh active Active
- 2013-05-02 CN CN201710814631.0A patent/CN107591158B/zh active Active
- 2013-05-02 EP EP19168175.8A patent/EP3547312B1/en active Active
-
2016
- 2016-06-09 US US15/178,102 patent/US9721578B2/en active Active
-
2017
- 2017-07-05 JP JP2017131761A patent/JP6552555B2/ja active Active
- 2017-07-13 US US15/648,733 patent/US9881629B2/en active Active
-
2018
- 2018-01-26 US US15/881,393 patent/US10074379B2/en active Active
- 2018-05-18 HK HK18106514.4A patent/HK1246964A1/zh unknown
- 2018-07-11 HK HK18108996.7A patent/HK1249654A1/zh unknown
- 2018-07-19 US US16/039,608 patent/US10217474B2/en active Active
- 2018-12-17 US US16/222,975 patent/US10388296B2/en active Active
-
2019
- 2019-07-02 JP JP2019123458A patent/JP6767545B2/ja active Active
- 2019-07-17 US US16/514,533 patent/US10522163B2/en active Active
- 2019-12-19 US US16/720,497 patent/US10950252B2/en active Active
-
2020
- 2020-09-17 JP JP2020156364A patent/JP6805387B1/ja active Active
- 2020-12-03 JP JP2020200948A patent/JP6853408B1/ja active Active
-
2021
- 2021-03-11 JP JP2021039246A patent/JP7000613B2/ja active Active
- 2021-12-23 JP JP2021209256A patent/JP7127198B2/ja active Active
-
2022
- 2022-08-17 JP JP2022129917A patent/JP7471356B2/ja active Active
-
2023
- 2023-07-19 US US18/355,168 patent/US20240018844A1/en active Pending
-
2024
- 2024-04-09 JP JP2024062458A patent/JP2024084841A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6767545B2 (ja) | 入力オーディオ信号のダイナミックレンジ制御方法、コンピュータプログラム及び装置 | |
US11708741B2 (en) | System for maintaining reversible dynamic range control information associated with parametric audio coders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200818 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6767545 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |