JP6113294B2 - 軽減された計算量の変換器snr計算 - Google Patents
軽減された計算量の変換器snr計算 Download PDFInfo
- Publication number
- JP6113294B2 JP6113294B2 JP2015538514A JP2015538514A JP6113294B2 JP 6113294 B2 JP6113294 B2 JP 6113294B2 JP 2015538514 A JP2015538514 A JP 2015538514A JP 2015538514 A JP2015538514 A JP 2015538514A JP 6113294 B2 JP6113294 B2 JP 6113294B2
- Authority
- JP
- Japan
- Prior art keywords
- control parameter
- bitstream
- audio
- bits
- data rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title description 14
- 230000005236 sound signal Effects 0.000 claims description 111
- 238000000034 method Methods 0.000 claims description 89
- 230000000873 masking effect Effects 0.000 claims description 59
- 238000013139 quantization Methods 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 46
- 238000004088 simulation Methods 0.000 claims description 46
- 238000009826 distribution Methods 0.000 claims description 40
- 230000003595 spectral effect Effects 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000007667 floating Methods 0.000 claims description 14
- 238000012856 packing Methods 0.000 claims description 7
- 238000012804 iterative process Methods 0.000 claims description 5
- 108010014173 Factor X Proteins 0.000 claims description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 16
- 230000008878 coupling Effects 0.000 description 8
- 238000010168 coupling process Methods 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 238000009877 rendering Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本願は2012年11月7日に出願された米国仮特許出願第61/723,687号の優先権を主張する。同出願の内容はここに参照によりその全体において組み込まれる。
本稿は、オーディオ・エンコード/デコードに関する。特に、本稿はオーディオ・エンコード/デコードのコンテキストにおいて使用されるビット割り当てプロセスの複雑さを軽減するための方法およびシステムに関する。
いくつかの態様を記載しておく。
〔態様1〕
第一のオーディオ・コーデック・システムに基づくオーディオ信号のフレームをエンコードして、それにより第一の目標データレートの第一のビットストリームを与えるよう構成されているオーディオ・エンコーダであって、当該オーディオ・エンコーダは:
・前記オーディオ信号のフレームに基づいてスペクトル係数の集合を決定するよう構成された変換ユニットと;
・前記スペクトル係数の集合に基づいて、スケール因子の集合およびスケーリングされた値の集合を決定し、
前記スケール因子の集合をエンコードしてエンコードされたスケール因子の集合を与えるよう構成された
浮動小数点エンコード・ユニットと;
・前記第一の目標データレートに基づき、かつ前記エンコードされたスケール因子の集合について使われるビット数に基づき、前記スケーリングされた値の集合を量子化するための利用可能なビットの総数を決定し、
前記スケーリングされた値の集合のスケーリングされた値を量子化するための利用可能なビットの総数の割り当てを示す第一の制御パラメータを決定し、
前記第一の制御パラメータに基づいて、前記スケーリングされた値の集合を量子化して、量子化されたスケーリングされた値の集合を与えるよう構成されている、
ビット割り当ておよび量子化ユニットと;
・トランスコーダが前記第一のビットストリームを第二の目標データレートの第二のビットストリームに変換できるようにするための第二の制御パラメータを導出するよう構成されたトランスコード・シミュレーション・ユニットであって、前記第二のビットストリームは、前記第一のオーディオ・コーデック・システムとは異なる第二のオーディオ・コーデック・システムに一致し、前記トランスコード・シミュレーション・ユニットは、前記第一の制御パラメータから前記第二の制御パラメータを導出するよう構成されている、トランスコード・シミュレーション・ユニットと;
・量子化されたスケーリングされた値の集合、エンコードされたスケール因子の集合、前記第一の制御パラメータおよび前記第二の制御パラメータを含む前記第一のビットストリームを生成するよう構成されたビットストリーム・パッキング・ユニットを有する、
オーディオ・エンコーダ。
〔態様2〕
前記トランスコード・シミュレーション・ユニットが、前記第一の制御パラメータだけから前記第二の制御パラメータを導出するよう構成されている、態様1記載のオーディオ・エンコーダ。
〔態様3〕
前記トランスコード・シミュレーション・ユニットは、第一の制御パラメータに等しい前記第二の制御パラメータの値を設定するよう構成されている、態様1または2記載のオーディオ・エンコーダ。
〔態様4〕
前記トランスコード・シミュレーション・ユニットは、前記第二のオーディオ・コーデック・システムに基づくビット割り当てプロセスを実行することなく前記第二の制御パラメータを導出するよう構成されている、態様1ないし3のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様5〕
・前記第一の制御パラメータは粗い成分および細かい成分を含み、
・前記トランスコード・シミュレーション・ユニットは、前記粗い成分および細かい成分を組み合わせて前記第二の制御パラメータを導出するよう構成されている、
態様1ないし4のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様6〕
・前記第一のビットストリームは第一のフォーマットに準拠し;
・前記第二のビットストリームは第二のフォーマットに準拠し;
・前記トランスコード・シミュレーション・ユニットは、前記量子化されたスケーリングされた値の集合および前記エンコードされたスケール因子の集合を表現するために前記第二のフォーマットによって要求される超過ビットの数を決定するよう構成されており;
・前記ビット割り当ておよび量子化ユニットは、超過ビットの数にも基づいて利用可能なビットの前記総数を決定するよう構成されている、
態様1ないし5のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様7〕
前記ビット割り当ておよび量子化ユニットが、利用可能なビットの前記総数を、前記超過ビットの数だけ減らすよう構成されている、態様6記載のオーディオ・エンコーダ。
〔態様8〕
前記超過ビットの数が、
・前記オーディオ信号の当該フレームについて特定的に決定される、または
・あらかじめ決定された値、たとえば最悪ケースの値である、
態様6または7記載のオーディオ・エンコーダ。
〔態様9〕
前記第一の目標データレートが前記第二の目標データレートに等しい、態様5ないし8のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様10〕
前記トランスコード・シミュレーション・ユニットが、
・前記第一の制御パラメータに基づくデフォルトの第二の制御パラメータ、たとえば前記第一の制御パラメータに対応するデフォルトの第二の制御パラメータを決定し、
・前記デフォルトの第二の制御パラメータに基づいてトランスコードされるデフォルトの第二のビットストリームが前記第二の目標データレートを超過するかどうかを判定し、
・前記デフォルトの第二のビットストリームが前記第二の目標データレートを超過しない場合、前記デフォルトの第二の制御パラメータに基づいて前記第二の制御パラメータを決定するよう構成されている、
態様1ないし9のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様11〕
前記トランスコード・シミュレーション・ユニットは、
・前記第一の制御パラメータを使って、前記量子化されたスケーリングされた値の集合を量子化解除して、量子化解除されたスケーリングされた値の集合を与え、
・前記デフォルトの第二の制御パラメータを使って量子化解除されたスケーリングされた値の集合を再量子化して再量子化されたスケーリングされた値の集合を与えるよう構成されている、
態様10記載のオーディオ・エンコーダ。
〔態様12〕
前記デフォルトの第二のビットストリームが前記第二の目標データレートを超過すると判定される場合、前記トランスコード・シミュレーション・ユニットは、前記第二のオーディオ・コーデック・システムに基づくビット割り当ておよび量子化を実行して、前記第二の制御パラメータに基づいてトランスコードされる前記第二のビットストリームが前記第二の目標データレートを超過しないよう前記第二の制御パラメータを決定するよう構成されている、態様11記載のオーディオ・エンコーダ。
〔態様13〕
前記第二のオーディオ・コーデック・システムに基づくビット割り当ておよび量子化が、
・前記第二の目標データレートに基づき、かつ前記エンコードされたスケール因子の集合を前記第二のオーディオ・コーデック・システムに基づいて再エンコードするために使われるビットの数に基づいて、量子化解除されたスケーリングされた値の集合を量子化するための利用可能なビットの第二の総数を決定し;
・量子化解除されたスケーリングされた値の集合のスケーリングされた値を量子化するための利用可能なビットの前記第二の総数の割り当てを示す第二の制御パラメータを決定することを含む、
態様12記載のオーディオ・エンコーダ。
〔態様14〕
前記第二のオーディオ・コーデック・システムに基づくビット割り当ておよび量子化がさらに、
・前記エンコードされたスケール因子の集合に基づいてパワースペクトル密度(PSD)分布を決定し;
・前記エンコードされたスケール因子の集合に基づいてマスキング曲線を決定し;
・中間的な第二の制御パラメータを使って前記マスキング曲線をオフセットすることによってオフセット・マスキング曲線を決定し;
・前記PSD分布と前記オフセット・マスキング曲線の比較に基づいて、量子化解除されたスケーリングされた値の集合の量子化解除されたスケーリングされた値を量子化するための必要とされるビットの数を決定し;
・前記中間的な第二の制御パラメータを、必要とされるビットの数と利用可能なビットの前記第二の総数との間の差が縮小されるよう、かつ、必要とされるビットの数が利用可能なビットの前記第二の総数を超過しないよう、逐次反復プロセスにおいて調整し、それにより前記第二の制御パラメータを与えることを含む、
態様13記載のオーディオ・エンコーダ。
〔態様15〕
前記トランスコード・シミュレーション・ユニットが、
・前記中間的な第二の制御パラメータを、前記第一の制御パラメータで初期化し;
・前記PSD分布と前記オフセット・マスキング曲線の比較に基づいて決定される量子化ノイズが所定のノイズ閾値を下回る場合に、前記逐次反復手順を停止するよう構成されている、
態様14記載のオーディオ・エンコーダ。
〔態様16〕
前記デフォルトの第二のビットストリームが前記第二の目標データレートを超過すると判定される場合、前記トランスコード・シミュレーション・ユニットは、前記デフォルトの第二の制御パラメータを所定の制御パラメータ・オフセット値だけオフセットすることによって、前記第二の制御パラメータを決定するよう構成されている、態様11ないし15のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様17〕
前記変換ユニットが、前記オーディオ信号の当該フレームから導出される一つまたは複数のブロックに対して、修正離散コサイン変換を実行するよう構成されている、態様1ないし16のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様18〕
・前記スケール因子が指数eに対応し、
・前記スケーリングされた値が仮数mに対応し、
・前記浮動小数点エンコード・ユニットは、公式X=m・2 -e を使って変換係数Xについて指数eおよび仮数mを決定するよう構成されている、
態様1ないし17のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様19〕
前記ビット割り当ておよび量子化ユニットが、前記第一の制御パラメータを決定することを、
・前記エンコードされたスケール因子の集合に基づいてパワースペクトル密度(PSD)分布を決定し;
・前記エンコードされたスケール因子の集合に基づいてマスキング曲線を決定し;
・中間的な第一の制御パラメータを使って前記マスキング曲線をオフセットすることによってオフセット・マスキング曲線を決定し;
・前記PSD分布と前記オフセット・マスキング曲線の比較に基づいて、前記スケーリングされた値の集合のスケーリングされた値を量子化するための必要とされるビットの数を決定し;
・前記中間的な第一の制御パラメータを、必要とされるビットの数と利用可能なビットの前記総数との間の差が縮小されるよう、かつ、必要とされるビットの数が利用可能なビットの前記総数を超過しないよう調整し、それにより前記第一の制御パラメータを与えることによって行なうよう構成されている、
態様1ないし18のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様20〕
前記ビットストリーム・パッキング・ユニットは、前記第一のビットストリームが前記第一の目標データレートに準拠するよう、一つまたは複数の充填ビットを前記第一のビットストリーム中に挿入するよう構成されている、態様1ないし19のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様21〕
前記オーディオ信号がマルチチャネル・オーディオ信号、たとえば5.1チャネル・オーディオ信号である、態様1ないし20のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様22〕
前記フレームが、前記オーディオ信号の所定の数のサンプル、たとえば1536個のサンプルを含む、態様1ないし21のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様23〕
・前記第一のオーディオ・コーデック・システムがドルビー・デジタル・プラス・コーデック・システム、たとえば低計算量ドルビー・デジタル・プラス・システムに準拠する;および/または
・前記第一の制御パラメータがドルビー・デジタル・プラスSNRオフセット値を含む;および/または
・前記第二のコーデック・システムがドルビー・デジタル・コーデック・システムに準拠する;および/または
・前記第二の制御パラメータがドルビー・デジタルSNRオフセット値を含む、
態様1ないし22のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様24〕
・前記第一の目標データレートが384kbps、448kbps、640kbpsのうちの一つである;および/または
・前記第二の目標データレートが640kbpsである、
態様1ないし23のうちいずれか一項記載のオーディオ・エンコーダ。
〔態様25〕
オーディオ・トランスコーダであって、
・第一のデータレートでの第一のビットストリームを受領するよう構成されており、
・前記第一のビットストリームは、第一のオーディオ・コーデック・システムに基づいてエンコードされたオーディオ信号のフレームを示し、
・前記第一のビットストリームは、量子化されたスケーリングされた値の集合、エンコードされたスケール因子の集合、第一の制御パラメータおよび第二の制御パラメータを含み、
・前記量子化されたスケーリングされた値の集合および前記エンコードされたスケール因子の集合は前記オーディオ信号の前記フレームのスペクトル成分を示し、
・前記第一の制御パラメータは、前記量子化されたスケーリングされた値の集合を量子化するために使われた量子化器の分解能を示し、
・前記第二の制御パラメータは、第二の目標データレートでの第二のビットストリームのために前記量子化されたスケーリングされた値を再量子化するために当該トランスコーダによって使用される量子化器を示し、
・前記第二のビットストリームは、前記第一のオーディオ・コーデック・システムとは異なる第二のオーディオ・コーデック・システムに一致し、
当該トランスコーダはさらに、
・前記第一のデータレートが前記第二の目標データレートに等しいかどうかを判定し、
・前記第一の制御パラメータが前記第二の制御パラメータに対応するかどうかを判定し、
・前記第一のデータレートが前記第二の目標データレートに等しく、かつ前記第一の制御パラメータが前記第二の制御パラメータに対応する場合、前記量子化されたスケーリングされた値の集合、前記エンコードされたスケール因子の集合および前記第二の制御パラメータを前記第二のビットストリームにコピーすることによって、前記第二のビットストリームを決定するよう構成されている、
オーディオ・トランスコーダ。
〔態様26〕
前記第一のデータレートが前記第二の目標データレートより小さく、かつ、前記第一の制御パラメータが前記第二の制御パラメータに対応する場合、さらに、
・前記第一のビットストリームが結合チャネルおよび/またはフル・チャネルを含むかどうかを判定し、
・前記量子化されたスケーリングされた値の集合の量子化されたスケーリングされた値および前記エンコードされたスケール因子の集合のエンコードされたスケール因子であって前記フル・チャネルに関連付けられているものを、前記第二のビットストリームにコピーするよう構成されている、
態様25記載のオーディオ・トランスコーダ。
〔態様27〕
・前記量子化されたスケーリングされた値の集合の量子化されたスケーリングされた値および前記エンコードされたスケール因子の集合のエンコードされたスケール因子であって前記結合チャネルに関連付けられているものを分離し、それにより量子化されたスケーリングされた値の第一の集合およびエンコードされたスケール因子の第一の集合を与え、
・前記第一の制御パラメータを使って前記量子化されたスケーリングされた値の第一の集合を量子化解除して量子化解除されたスケーリングされた値の第一の集合を与え、
・前記第二の制御パラメータを使って前記量子化解除されたスケーリングされた値の第一の集合を再量子化し、それにより再量子化されたスケーリングされた値の第一の集合を与え、
・前記再量子化されたスケーリングされた値の第一の集合を、前記第二のビットストリーム中に挿入するようさらに構成されている、
態様26記載のオーディオ・トランスコーダ。
〔態様28〕
第一のオーディオ・コーデック・システムに基づいてオーディオ信号を第一のビットストリームにエンコードする方法であって、
・前記オーディオ信号のスペクトル成分に基づいてスケール因子の集合およびスケーリングされた値の集合を決定する段階と;
・前記第一のオーディオ・コーデック・システムに基づく逐次反復式のビット割り当てプロセスを使って前記スケーリングされた値の集合を量子化するための量子化器の分解能を示す第一の制御パラメータを決定する段階であって、前記分解能は、前記第一のビットストリームの第一の目標データレートに依存する、段階と;
・前記第一のビットストリームの、第二の目標データレートの第二のビットストリームへの変換を可能にするための第二の制御パラメータを決定する段階であって、前記第二のビットストリームは、前記第一のオーディオ・コーデック・システムとは異なる第二のオーディオ・コーデック・システムに一致するものであり、前記第二の制御パラメータを決定する段階は、前記第二のオーディオ・コーデック・システムに基づく逐次反復式のビット割り当てプロセスを実行することなく、前記第一の制御パラメータに基づいて前記第二の制御パラメータを決定することを含み、前記第一のビットストリームは、前記第一および第二の制御パラメータを示す、段階とを含む、
方法。
〔態様29〕
第一のオーディオ・コーデック・システムに基づいてエンコードされたオーディオ信号を示す第一のビットストリームを、前記第一のオーディオ・コーデック・システムとは異なる第二のオーディオ・コーデック・システムに基づく第二のビットストリームにトランスコードする方法であって、
・第一のデータレートでの前記第一のビットストリームを受領する段階であって、
・前記第一のビットストリームは、量子化されたスケーリングされた値の集合、エンコードされたスケール因子の集合、第一の制御パラメータおよび第二の制御パラメータを含み、
・前記量子化されたスケーリングされた値の集合および前記エンコードされたスケール因子の集合は、前記オーディオ信号のスペクトル成分を示し、
・前記第一の制御パラメータは、前記量子化されたスケーリングされた値の集合を量子化するために使われた量子化器を示し、
・前記第二の制御パラメータは、第二の目標データレートの第二のビットストリームのために前記量子化されたスケーリングされた値の集合を再量子化するためにトランスコーダによって使われるべき量子化器を示す、段階と;
・前記第一のデータレートが前記第二の目標データレートに等しいかどうかを判定する段階と;
・前記第一の制御パラメータが前記第二の制御パラメータに対応するかどうかを判定する段階と;
・前記第一のデータレートが前記第二の目標データレートに等しく、前記第一の制御パラメータが前記第二の制御パラメータに対応する場合、前記量子化されたスケーリングされた値の集合、前記エンコードされたスケール因子の集合および前記第二の制御パラメータを前記第二のビットストリームにコピーすることによって、前記第二のビットストリームを決定する段階とを含む、
方法。
〔態様30〕
ドルビー・デジタル・プラス・コーデック・システムに基づくオーディオ信号をエンコードし、それにより第一の目標データレートでの第一のビットストリームを与えるよう構成されたオーディオ・エンコーダであって、当該オーディオ・エンコーダは、
・ドルビー・デジタル・プラス・コーデック・システムに基づいて前記第一の目標データレートについてのsnroffsetパラメータを決定し、トランスコーダが前記第一のビットストリームを第二の目標データレートの第二のビットストリームに変換できるようにするため、前記snroffsetパラメータからconvsnroffsetパラメータを導出するよう構成されており、
前記第二のビットストリームは、ドルビー・デジタル・コーデック・システムに一致し、前記第一のビットストリームは前記snroffsetパラメータおよび前記convsnroffsetパラメータを含む、
オーディオ・エンコーダ。
〔態様31〕
第一のフォーマットに対応する第一のビットストリームの、第二のフォーマットに対応する第二のビットストリームへの変換を可能にする方法であって、前記第一および第二のビットストリームは、エンコードされたオーディオ信号の少なくとも一つの同一のフレームに関係し、前記第一のビットストリームは、該第一のビットストリームに関連する第一のビット割り当てプロセスを示す第一の制御パラメータを含み、前記第一の制御パラメータは粗い成分および細かい成分を含み、前記第二のビットストリームは、該第二のビットストリームに関連する第二のビット割り当てプロセスを示す第二の制御パラメータを含み、前記第二のビットストリームは、前記第二の制御パラメータを使って前記第一のビットストリームから生成され、当該方法は:
・前記粗い成分および細かい成分の組み合わせのみに基づいて前記第二の制御パラメータを決定し;
・前記第二の制御パラメータを前記第一のビットストリーム中に挿入することを含む、
方法。
〔態様32〕
オーディオ・トランスコーダであって、
・第一のデータレートでの第一のビットストリームを受領する段階であって、
・前記第一のビットストリームは、ドルビー・デジタル・プラス・コーデック・システムに基づいてエンコードされたオーディオ信号を示し、
・前記第一のビットストリームは、量子化されたスケーリングされた値の集合、snroffsetパラメータおよびconvsnroffsetパラメータを含み、
・前記convsnroffsetパラメータは、第二の目標データレートの第二のビットストリームを生成するために当該トランスコーダによって使われるべき量子化器を指示し、
・前記第二のビットストリームはドルビー・デジタル・オーディオ・コーデック・システムに従う、段階と;
・前記第一のデータレートが前記第二の目標データレートに等しいかどうかを判定する段階と;
・前記snroffsetパラメータが前記convsnroffsetパラメータに対応するかどうかを判定する段階と;
前記第一のデータレートが前記第二の目標データレートに等しく、前記snroffsetパラメータが前記convsnroffsetパラメータに対応する場合、前記量子化されたスケーリングされた値の集合および前記convsnroffsetパラメータを前記第二のビットストリームにコピーすることによって、前記第二のビットストリームを決定する段階とを実行するよう構成されている、
トランスコーダ。
Claims (26)
- 第一のオーディオ・コーデック・システムに基づくオーディオ信号のフレームをエンコードして、それにより第一の目標データレートの第一のビットストリームを与えるよう構成されているオーディオ・エンコーダであって、当該オーディオ・エンコーダは:
・前記オーディオ信号のフレームに基づいてスペクトル係数の集合を決定するよう構成された変換ユニットと;
・前記スペクトル係数の集合に基づいて、スケール因子の集合およびスケーリングされた値の集合を決定し、
前記スケール因子の集合をエンコードしてエンコードされたスケール因子の集合を与えるよう構成された
浮動小数点エンコード・ユニットと;
・前記第一の目標データレートに基づき、かつ前記エンコードされたスケール因子の集合について使われるビット数に基づき、前記スケーリングされた値の集合を量子化するための利用可能なビットの総数を決定し、
前記スケーリングされた値の集合のスケーリングされた値を量子化するための利用可能なビットの総数の割り当てを示す第一の制御パラメータを決定し、
前記第一の制御パラメータに基づいて、前記スケーリングされた値の集合を量子化して、量子化されたスケーリングされた値の集合を与えるよう構成されている、
ビット割り当ておよび量子化ユニットと;
・トランスコーダが前記第一のビットストリームを第二の目標データレートの第二のビットストリームに変換できるようにするための第二の制御パラメータを導出するよう構成されたトランスコード・シミュレーション・ユニットであって、前記第二のビットストリームは、前記第一のオーディオ・コーデック・システムとは異なる第二のオーディオ・コーデック・システムに一致し、前記トランスコード・シミュレーション・ユニットは、前記第一の制御パラメータだけから前記第二の制御パラメータを導出するよう構成されている、トランスコード・シミュレーション・ユニットと;
・量子化されたスケーリングされた値の集合、エンコードされたスケール因子の集合、前記第一の制御パラメータおよび前記第二の制御パラメータを含む前記第一のビットストリームを生成するよう構成されたビットストリーム・パッキング・ユニットを有する、
オーディオ・エンコーダ。 - 前記トランスコード・シミュレーション・ユニットは、第一の制御パラメータに等しい前記第二の制御パラメータの値を設定するよう構成されている、請求項1記載のオーディオ・エンコーダ。
- 前記トランスコード・シミュレーション・ユニットは、前記第二のオーディオ・コーデック・システムに基づくビット割り当てプロセスを実行することなく前記第二の制御パラメータを導出するよう構成されている、請求項1または2記載のオーディオ・エンコーダ。
- ・前記第一の制御パラメータは粗い成分および細かい成分を含み、
・前記トランスコード・シミュレーション・ユニットは、前記粗い成分および細かい成分を組み合わせて前記第二の制御パラメータを導出するよう構成されている、
請求項1ないし3のうちいずれか一項記載のオーディオ・エンコーダ。 - ・前記第一のビットストリームは第一のフォーマットに準拠し;
・前記第二のビットストリームは第二のフォーマットに準拠し;
・前記トランスコード・シミュレーション・ユニットは、前記量子化されたスケーリングされた値の集合および前記エンコードされたスケール因子の集合を表現するために前記第二のフォーマットによって要求される超過ビットの数を決定するよう構成されており;
・前記ビット割り当ておよび量子化ユニットは、超過ビットの数にも基づいて利用可能なビットの前記総数を決定するよう構成されている、
請求項1ないし4のうちいずれか一項記載のオーディオ・エンコーダ。 - 前記ビット割り当ておよび量子化ユニットが、利用可能なビットの前記総数を、前記超過ビットの数だけ減らすよう構成されている、請求項5記載のオーディオ・エンコーダ。
- 前記超過ビットの数が、
・前記オーディオ信号の当該フレームについて特定的に決定される、または
・あらかじめ決定された値、たとえば最悪ケースの値である、
請求項5または6記載のオーディオ・エンコーダ。 - 前記第一の目標データレートが前記第二の目標データレートに等しい、請求項4ないし7のうちいずれか一項記載のオーディオ・エンコーダ。
- 前記トランスコード・シミュレーション・ユニットが、
・前記第一の制御パラメータに基づくデフォルトの第二の制御パラメータ、たとえば前記第一の制御パラメータに対応するデフォルトの第二の制御パラメータを決定し、
・前記デフォルトの第二の制御パラメータに基づいてトランスコードされるデフォルトの第二のビットストリームが前記第二の目標データレートを超過するかどうかを判定し、
・前記デフォルトの第二のビットストリームが前記第二の目標データレートを超過しない場合、前記デフォルトの第二の制御パラメータに基づいて前記第二の制御パラメータを決定するよう構成されている、
請求項1ないし8のうちいずれか一項記載のオーディオ・エンコーダ。 - 前記トランスコード・シミュレーション・ユニットは、
・前記第一の制御パラメータを使って、前記量子化されたスケーリングされた値の集合を量子化解除して、量子化解除されたスケーリングされた値の集合を与え、
・前記デフォルトの第二の制御パラメータを使って量子化解除されたスケーリングされた値の集合を再量子化して再量子化されたスケーリングされた値の集合を与えるよう構成されている、
請求項9記載のオーディオ・エンコーダ。 - 前記デフォルトの第二のビットストリームが前記第二の目標データレートを超過すると判定される場合、前記トランスコード・シミュレーション・ユニットは、前記第二のオーディオ・コーデック・システムに基づくビット割り当ておよび量子化を実行して、前記第二の制御パラメータに基づいてトランスコードされる前記第二のビットストリームが前記第二の目標データレートを超過しないよう前記第二の制御パラメータを決定するよう構成されている、請求項10記載のオーディオ・エンコーダ。
- 前記第二のオーディオ・コーデック・システムに基づくビット割り当ておよび量子化が、
・前記第二の目標データレートに基づき、かつ前記エンコードされたスケール因子の集合を前記第二のオーディオ・コーデック・システムに基づいて再エンコードするために使われるビットの数に基づいて、量子化解除されたスケーリングされた値の集合を量子化するための利用可能なビットの第二の総数を決定し;
・量子化解除されたスケーリングされた値の集合のスケーリングされた値を量子化するための利用可能なビットの前記第二の総数の割り当てを示す第二の制御パラメータを決定することを含む、
請求項11記載のオーディオ・エンコーダ。 - 前記第二のオーディオ・コーデック・システムに基づくビット割り当ておよび量子化がさらに、
・前記エンコードされたスケール因子の集合に基づいてパワースペクトル密度(PSD)分布を決定し;
・前記エンコードされたスケール因子の集合に基づいてマスキング曲線を決定し;
・中間的な第二の制御パラメータを使って前記マスキング曲線をオフセットすることによってオフセット・マスキング曲線を決定し;
・前記PSD分布と前記オフセット・マスキング曲線の比較に基づいて、量子化解除されたスケーリングされた値の集合の量子化解除されたスケーリングされた値を量子化するための必要とされるビットの数を決定し;
・前記中間的な第二の制御パラメータを、必要とされるビットの数と利用可能なビットの前記第二の総数との間の差が縮小されるよう、かつ、必要とされるビットの数が利用可能なビットの前記第二の総数を超過しないよう、逐次反復プロセスにおいて調整し、それにより前記第二の制御パラメータを与えることを含む、
請求項12記載のオーディオ・エンコーダ。 - 前記トランスコード・シミュレーション・ユニットが、
・前記中間的な第二の制御パラメータを、前記第一の制御パラメータで初期化し;
・前記PSD分布と前記オフセット・マスキング曲線の比較に基づいて決定される量子化ノイズが所定のノイズ閾値を下回る場合に、前記逐次反復プロセスを停止するよう構成されている、
請求項13記載のオーディオ・エンコーダ。 - 前記デフォルトの第二のビットストリームが前記第二の目標データレートを超過すると判定される場合、前記トランスコード・シミュレーション・ユニットは、前記デフォルトの第二の制御パラメータを所定の制御パラメータ・オフセット値だけオフセットすることによって、前記第二の制御パラメータを決定するよう構成されている、請求項10ないし14のうちいずれか一項記載のオーディオ・エンコーダ。
- 前記変換ユニットが、前記オーディオ信号の当該フレームから導出される一つまたは複数のブロックに対して、修正離散コサイン変換を実行するよう構成されている、請求項1ないし15のうちいずれか一項記載のオーディオ・エンコーダ。
- ・前記スケール因子が指数eに対応し、
・前記スケーリングされた値が仮数mに対応し、
・前記浮動小数点エンコード・ユニットは、公式X=m・2-eを使って変換係数Xについて指数eおよび仮数mを決定するよう構成されている、
請求項1ないし16のうちいずれか一項記載のオーディオ・エンコーダ。 - 前記ビット割り当ておよび量子化ユニットが、前記第一の制御パラメータを決定することを、
・前記エンコードされたスケール因子の集合に基づいてパワースペクトル密度(PSD)分布を決定し;
・前記エンコードされたスケール因子の集合に基づいてマスキング曲線を決定し;
・中間的な第一の制御パラメータを使って前記マスキング曲線をオフセットすることによってオフセット・マスキング曲線を決定し;
・前記PSD分布と前記オフセット・マスキング曲線の比較に基づいて、前記スケーリングされた値の集合のスケーリングされた値を量子化するための必要とされるビットの数を決定し;
・前記中間的な第一の制御パラメータを、必要とされるビットの数と利用可能なビットの前記総数との間の差が縮小されるよう、かつ、必要とされるビットの数が利用可能なビットの前記総数を超過しないよう調整し、それにより前記第一の制御パラメータを与えることによって行なうよう構成されている、
請求項1ないし17のうちいずれか一項記載のオーディオ・エンコーダ。 - 前記ビットストリーム・パッキング・ユニットは、前記第一のビットストリームが前記第一の目標データレートに準拠するよう、一つまたは複数の充填ビットを前記第一のビットストリーム中に挿入するよう構成されている、請求項1ないし18のうちいずれか一項記載のオーディオ・エンコーダ。
- 前記オーディオ信号がマルチチャネル・オーディオ信号、たとえば5.1チャネル・オーディオ信号である、請求項1ないし19のうちいずれか一項記載のオーディオ・エンコーダ。
- 前記フレームが、前記オーディオ信号の所定の数のサンプル、たとえば1536個のサンプルを含む、請求項1ないし20のうちいずれか一項記載のオーディオ・エンコーダ。
- ・前記第一のオーディオ・コーデック・システムがドルビー・デジタル・プラス・コーデック・システム、たとえば低計算量ドルビー・デジタル・プラス・システムに準拠する;および/または
・前記第一の制御パラメータがドルビー・デジタル・プラスSNRオフセット値を含む;および/または
・前記第二のコーデック・システムがドルビー・デジタル・コーデック・システムに準拠する;および/または
・前記第二の制御パラメータがドルビー・デジタルSNRオフセット値を含む、
請求項1ないし21のうちいずれか一項記載のオーディオ・エンコーダ。 - ・前記第一の目標データレートが384kbps、448kbps、640kbpsのうちの一つである;および/または
・前記第二の目標データレートが640kbpsである、
請求項1ないし22のうちいずれか一項記載のオーディオ・エンコーダ。 - 第一のオーディオ・コーデック・システムに基づいてオーディオ信号を第一のビットストリームにエンコードする方法であって、
・前記オーディオ信号のスペクトル成分に基づいてスケール因子の集合およびスケーリングされた値の集合を決定する段階と;
・前記第一のオーディオ・コーデック・システムに基づく逐次反復式のビット割り当てプロセスを使って前記スケーリングされた値の集合を量子化するための量子化器の分解能を示す第一の制御パラメータを決定する段階であって、前記分解能は、前記第一のビットストリームの第一の目標データレートに依存する、段階と;
・前記第一のビットストリームの、第二の目標データレートの第二のビットストリームへの変換を可能にするための第二の制御パラメータを決定する段階であって、前記第二のビットストリームは、前記第一のオーディオ・コーデック・システムとは異なる第二のオーディオ・コーデック・システムに一致するものであり、前記第二の制御パラメータを決定する段階は、前記第二のオーディオ・コーデック・システムに基づく逐次反復式のビット割り当てプロセスを実行することなく、前記第一の制御パラメータに基づいて前記第二の制御パラメータを決定することを含み、前記第一のビットストリームは、前記第一および第二の制御パラメータを示す、段階とを含む、
方法。 - ドルビー・デジタル・プラス・コーデック・システムに基づくオーディオ信号をエンコードし、それにより第一の目標データレートでの第一のビットストリームを与えるよう構成されたオーディオ・エンコーダであって、当該オーディオ・エンコーダは、
・ドルビー・デジタル・プラス・コーデック・システムに基づいて前記第一の目標データレートについてのsnroffsetパラメータを決定し、トランスコーダが前記第一のビットストリームを第二の目標データレートの第二のビットストリームに変換できるようにするため、前記snroffsetパラメータだけからconvsnroffsetパラメータを導出するよう構成されており、
前記第二のビットストリームは、ドルビー・デジタル・コーデック・システムに一致し、前記第一のビットストリームは前記snroffsetパラメータおよび前記convsnroffsetパラメータを含む、
オーディオ・エンコーダ。 - 第一のフォーマットに対応する第一のビットストリームの、第二のフォーマットに対応する第二のビットストリームへの変換を可能にする方法であって、前記第一および第二のビットストリームは、エンコードされたオーディオ信号の少なくとも一つの同一のフレームに関係し、前記第一のビットストリームは、該第一のビットストリームに関連する第一のビット割り当てプロセスを示す第一の制御パラメータを含み、前記第一の制御パラメータは粗い成分および細かい成分を含み、前記第二のビットストリームは、該第二のビットストリームに関連する第二のビット割り当てプロセスを示す第二の制御パラメータを含み、前記第二のビットストリームは、前記第二の制御パラメータを使って前記第一のビットストリームから生成され、当該方法は:
・前記粗い成分および細かい成分の組み合わせのみに基づいて前記第二の制御パラメータを決定し;
・前記第二の制御パラメータを前記第一のビットストリーム中に挿入することを含む、
方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261723687P | 2012-11-07 | 2012-11-07 | |
US61/723,687 | 2012-11-07 | ||
PCT/EP2013/072961 WO2014072260A2 (en) | 2012-11-07 | 2013-11-04 | Reduced complexity converter snr calculation |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017048191A Division JP6474845B2 (ja) | 2012-11-07 | 2017-03-14 | 軽減された計算量の変換器snr計算 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015532981A JP2015532981A (ja) | 2015-11-16 |
JP6113294B2 true JP6113294B2 (ja) | 2017-04-12 |
Family
ID=49517525
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015538514A Active JP6113294B2 (ja) | 2012-11-07 | 2013-11-04 | 軽減された計算量の変換器snr計算 |
JP2017048191A Active JP6474845B2 (ja) | 2012-11-07 | 2017-03-14 | 軽減された計算量の変換器snr計算 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017048191A Active JP6474845B2 (ja) | 2012-11-07 | 2017-03-14 | 軽減された計算量の変換器snr計算 |
Country Status (9)
Country | Link |
---|---|
US (2) | US9378748B2 (ja) |
EP (1) | EP2917909B1 (ja) |
JP (2) | JP6113294B2 (ja) |
KR (1) | KR101726205B1 (ja) |
CN (1) | CN104781878B (ja) |
BR (1) | BR112015010023B1 (ja) |
IN (1) | IN2015DN04001A (ja) |
RU (1) | RU2610588C2 (ja) |
WO (1) | WO2014072260A2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9819984B1 (en) | 2007-03-26 | 2017-11-14 | CSC Holdings, LLC | Digital video recording with remote storage |
MY164393A (en) * | 2010-04-09 | 2017-12-15 | Dolby Int Ab | Mdct-based complex prediction stereo coding |
US9786286B2 (en) * | 2013-03-29 | 2017-10-10 | Dolby Laboratories Licensing Corporation | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals |
US9412385B2 (en) * | 2013-05-28 | 2016-08-09 | Qualcomm Incorporated | Performing spatial masking with respect to spherical harmonic coefficients |
US10200519B2 (en) * | 2016-08-11 | 2019-02-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Systems and methods for dynamic switching of codec modes of operation used by a terminal |
US10904329B1 (en) * | 2016-12-30 | 2021-01-26 | CSC Holdings, LLC | Virtualized transcoder |
CN112970063B (zh) * | 2018-10-29 | 2024-10-18 | 杜比国际公司 | 用于利用生成模型的码率质量可分级编码的方法及设备 |
WO2020164752A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
EP3751567B1 (en) * | 2019-06-10 | 2022-01-26 | Axis AB | A method, a computer program, an encoder and a monitoring device |
US11284165B1 (en) | 2021-02-26 | 2022-03-22 | CSC Holdings, LLC | Copyright compliant trick playback modes in a service provider network |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU677688B2 (en) | 1993-07-16 | 1997-05-01 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5623577A (en) | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5970461A (en) | 1996-12-23 | 1999-10-19 | Apple Computer, Inc. | System, method and computer readable medium of efficiently decoding an AC-3 bitstream by precalculating computationally expensive values to be used in the decoding algorithm |
WO1999053479A1 (en) * | 1998-04-15 | 1999-10-21 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. | Fast frame optimisation in an audio encoder |
JP2000059790A (ja) * | 1998-08-05 | 2000-02-25 | Victor Co Of Japan Ltd | 動画像符号列変換装置及びその方法 |
US6430529B1 (en) | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
JP2000347679A (ja) * | 1999-06-07 | 2000-12-15 | Mitsubishi Electric Corp | オーディオ符号化装置及びオーディオ符号化方法 |
DE69932861T2 (de) | 1999-10-30 | 2007-03-15 | Stmicroelectronics Asia Pacific Pte Ltd. | Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung |
WO2002015587A2 (en) | 2000-08-16 | 2002-02-21 | Dolby Laboratories Licensing Corporation | Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information |
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
US7133521B2 (en) * | 2002-10-25 | 2006-11-07 | Dilithium Networks Pty Ltd. | Method and apparatus for DTMF detection and voice mixing in the CELP parameter domain |
KR100837451B1 (ko) * | 2003-01-09 | 2008-06-12 | 딜리시움 네트웍스 피티와이 리미티드 | 향상된 품질의 음성 변환부호화를 위한 방법 및 장치 |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
DE10339498B4 (de) * | 2003-07-21 | 2006-04-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodateiformatumwandlung |
JP4405510B2 (ja) * | 2003-07-21 | 2010-01-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオファイルフォーマット変換 |
DE602005017358D1 (de) * | 2004-01-28 | 2009-12-10 | Koninkl Philips Electronics Nv | Verfahren und vorrichtung zur zeitskalierung eines signals |
JP2007524124A (ja) * | 2004-02-16 | 2007-08-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | トランスコーダ及びそのための符号変換方法 |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
US7676360B2 (en) * | 2005-12-01 | 2010-03-09 | Sasken Communication Technologies Ltd. | Method for scale-factor estimation in an audio encoder |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
EP1903559A1 (en) | 2006-09-20 | 2008-03-26 | Deutsche Thomson-Brandt Gmbh | Method and device for transcoding audio signals |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US7873513B2 (en) * | 2007-07-06 | 2011-01-18 | Mindspeed Technologies, Inc. | Speech transcoding in GSM networks |
US8386271B2 (en) * | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
JP5551695B2 (ja) | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム |
CA2871268C (en) * | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
CN101425293B (zh) | 2008-09-24 | 2011-06-08 | 天津大学 | 一种高效感知音频比特分配方法 |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
US8194862B2 (en) | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5316896B2 (ja) * | 2010-03-17 | 2013-10-16 | ソニー株式会社 | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
MY164393A (en) * | 2010-04-09 | 2017-12-15 | Dolby Int Ab | Mdct-based complex prediction stereo coding |
KR101688946B1 (ko) * | 2010-11-26 | 2016-12-22 | 엘지전자 주식회사 | 신호 처리 장치 및 그 방법 |
TWI505262B (zh) | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
-
2013
- 2013-11-04 IN IN4001DEN2015 patent/IN2015DN04001A/en unknown
- 2013-11-04 RU RU2015116854A patent/RU2610588C2/ru active
- 2013-11-04 CN CN201380058046.2A patent/CN104781878B/zh active Active
- 2013-11-04 WO PCT/EP2013/072961 patent/WO2014072260A2/en active Application Filing
- 2013-11-04 JP JP2015538514A patent/JP6113294B2/ja active Active
- 2013-11-04 KR KR1020157011796A patent/KR101726205B1/ko active IP Right Grant
- 2013-11-04 BR BR112015010023-6A patent/BR112015010023B1/pt active IP Right Grant
- 2013-11-04 EP EP13785889.0A patent/EP2917909B1/en active Active
- 2013-11-04 US US14/439,795 patent/US9378748B2/en active Active
-
2014
- 2014-02-20 US US14/184,961 patent/US9208789B2/en active Active
-
2017
- 2017-03-14 JP JP2017048191A patent/JP6474845B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
RU2610588C2 (ru) | 2017-02-13 |
JP2017138610A (ja) | 2017-08-10 |
CN104781878B (zh) | 2018-03-02 |
US20150269950A1 (en) | 2015-09-24 |
WO2014072260A3 (en) | 2014-07-10 |
US20140188488A1 (en) | 2014-07-03 |
JP6474845B2 (ja) | 2019-02-27 |
US9378748B2 (en) | 2016-06-28 |
KR20150066565A (ko) | 2015-06-16 |
JP2015532981A (ja) | 2015-11-16 |
BR112015010023B1 (pt) | 2021-10-19 |
KR101726205B1 (ko) | 2017-04-12 |
CN104781878A (zh) | 2015-07-15 |
EP2917909B1 (en) | 2018-10-31 |
EP2917909A2 (en) | 2015-09-16 |
RU2015116854A (ru) | 2016-11-27 |
WO2014072260A2 (en) | 2014-05-15 |
BR112015010023A2 (pt) | 2017-07-11 |
IN2015DN04001A (ja) | 2015-10-02 |
US9208789B2 (en) | 2015-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6474845B2 (ja) | 軽減された計算量の変換器snr計算 | |
US12080306B2 (en) | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and a computer program | |
JP6407928B2 (ja) | オーディオ処理システム | |
JP5922684B2 (ja) | マルチチャネルの復号化装置 | |
TWI505262B (zh) | 具多重子流之多通道音頻信號的有效編碼與解碼 | |
EP2346029B1 (en) | Audio encoder, method for encoding an audio signal and corresponding computer program | |
JP6735053B2 (ja) | マルチチャネル符号化におけるステレオ充填装置及び方法 | |
US8831960B2 (en) | Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program for encoding audio using a weighted residual signal | |
KR20090007396A (ko) | 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치 | |
IL295809B1 (en) | Decoding bitstreams with a spectral band duplication meta-method enhanced by at least one filler element | |
US20220238127A1 (en) | Method and system for coding metadata in audio streams and for flexible intra-object and inter-object bitrate adaptation | |
KR101103004B1 (ko) | 오디오 인코딩 시의 레이트-왜곡 제어 구조 | |
JP2008261999A (ja) | オーディオ復号装置 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
WO2024052450A1 (en) | Encoder and encoding method for discontinuous transmission of parametrically coded independent streams with metadata | |
WO2024051955A1 (en) | Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160923 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6113294 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |