JP2013507648A - 線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム - Google Patents
線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2013507648A JP2013507648A JP2012532577A JP2012532577A JP2013507648A JP 2013507648 A JP2013507648 A JP 2013507648A JP 2012532577 A JP2012532577 A JP 2012532577A JP 2012532577 A JP2012532577 A JP 2012532577A JP 2013507648 A JP2013507648 A JP 2013507648A
- Authority
- JP
- Japan
- Prior art keywords
- linear prediction
- audio content
- mode
- encoded
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 135
- 238000007493 shaping process Methods 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims description 60
- 238000004590 computer program Methods 0.000 title claims description 18
- 230000003595 spectral effect Effects 0.000 claims abstract description 321
- 238000001228 spectrum Methods 0.000 claims abstract description 60
- 230000007704 transition Effects 0.000 claims description 96
- 238000013139 quantization Methods 0.000 claims description 46
- 230000005284 excitation Effects 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 35
- 238000004458 analytical method Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 10
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 239000003607 modifier Substances 0.000 claims description 5
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【選択図】図11
Description
(1)周波数ドメインモード
オーディオコンテンツの時間ドメイン表現は、MDCT330aを用いて周波数ドメインに変換され、スペクトル整形がオーディオコンテンツの周波数ドメイン表現330bにスケールファクタ330dに従って適用される。スペクトル整形された周波数ドメイン表現330fの量子化され、符号化されたバージョン332と、符号化されたスケールファクタ情報334は、周波数ドメインモードを用いて符号化されたオーディオフレームに対するビットストリームに含まれる。
(2)線形予測モード
線形予測モードにおいて、LPCフィルタ係数340bがオーディオコンテンツの部分に対して決定され、前記LPCフィルタ係数340bを用いて、変換符号化された励振(第1のサブモード)またはACEL符号化された励振のいずれかが、符号化された励振のうちどちらがより効果的なビットレートであるかに依存して決定される。符号化された励振342と符号化されたLPCフィルタ係数情報344は、線形予測モードにおいて符号化されたオーディオフレームに対するビットストリームに含まれる。
(3)LPCフィルタ係数ベースのスペクトル整形による周波数ドメインモード
代替として、第3の可能なモードで、周波数ドメインコーダ930によってオーディオコンテンツを処理することができる。しかしながら、スケールファクタ330dの代わりに、結合器330eにおけるスペクトル整形に対して線形予測ドメインゲイン値350cが適用される。したがって、オーディオコンテンツのスペクトル整形された周波数ドメイン表現330fの量子化され、エントロピー符号化されたバージョン332は、ビットストリームに含まれ、スペクトル整形された周波数ドメイン表現330fは、線形予測ドメインコーダ340によって提供される線形予測ドメインゲイン値350cによってスペクトル整形される。加えて、符号化されたLPCフィルタ係数情報344が、このようなオーディオフレームに対するビットストリームに含まれる。
5.1 デコーダの概要
復号化されたスケールファクタ値は、スケールファクタパラメータのセット1154として役立つことができる。
8.1 MDCTベースのTCXツールの記述
ビットストリーム変数「noise_factor」は、ノイズレベルの量子化インデックスを表す。
変数「ノイズレベル」は、復元されたスペクトルにおいて注入されたノイズのレベルを表す。
変数「ノイズ[]」は、生成されたノイズのベクトルを表す。
ビットストリーム変数「global_gain」は、再スケーリングゲインの量子化インデックスを表す。
変数「g」は、再スケーリングゲインを表す。
変数「rms」は、合成された時間ドメイン信号「x[]」の実効値を表す。
変数「x[]」は、合成された時間ドメイン信号を表す。
noise_level=0.0625*(8−noise_factor)
noise[i]=random_sign()*noise_level
(1)スペクトルの第1四半期の各8次元ブロックに対するインデックスmでの8次元ブロックのエネルギーEmを算出する
(2)比率Rm=sqrt(Em/EI)を計算する。ここで、Iは、全てのEmの最高値でのブロックインデックスである。
(3)Rm<0.1の場合、次にRm=0.1をセットする。
(4)Rm<Rm−1の場合、次にRm=Rm−1にセットする。
rr[i]=g[k]・r[i]
Xi,k=rr[k]、または
spec[i][k]=rr[k]
ウィンドウ化は、上述のように、ウィンドウW(n)を用いて、図15に示されたウィンドウ化パラメータを考慮して実行することができる。したがって、ウィンドウ化された時間ドメインは表現zi,nは、次のように取得される。
zi,n=xw[n]・W(n)
x[]は、逆修正離散コサイン変換の出力を表し、z[]は、時間ドメインにおける復号化されウィンドウ化された信号を表し、out[]は、合成された時間ドメイン信号を表す。
9.3.1 フィルタバンクおよびブロックスイッチング―IMDCT
・ 周波数ドメインコーダと線形予測ドメインコーダの間の非クリティカルにサンプリングされた遷移(例えば、非特許文献4参照)
・ 非クリティカルなサンプリングを生成し、オーバーラップサイズとオーバーヘッド情報の間をトレードオフし、MDCTの性能(時間ドメイン時間歪み解消TDAC)を完全には使用しない。
・ 周波数ドメインコーダからLPDコーダまで行くときに、余分のLPC係数のセットを送信することを必要とする。
・ 異なるドメインにおいて時間ドメイン折り返し歪み解消(TDAC)を適用する(例えば、非特許文献5参照)。
LPCフィルタリングは、フォールディングとDCTの間で、MDCT内で実行される
・ 時間ドメイン折り返し歪の生じた信号は、フィルタリングに対して適当ではないかもしれない。
・ 周波数ドメインコーダからLPDコーダに行くとき、余分のLPC係数のセットを送信する必要がある。
・ 非切換型コーダ(TwinVQ)に対して、MDCTドメインにおいてLPC係数を演算する(例えば、非特許文献6参照)。
・ スペクトルをフラット化するためのスペクトル包絡の提示として、LPCのみを用いる。それは、他のオーディオコーダへ切換るときに、量子化ノイズを整形するためにも、遷移を容易にするためにも、LPCを利用しない。
・ ACELPのような音声コーダへの切換に対して依然としてLPCを用いることができる。
・ TCXからの/への、周波数ドメインコーダへの/からの遷移の間、時間ドメイン折り返し歪み解消(TDAC)が可能であり、それでクリティカルなサンプリングが維持される。
・ LPCは、ACELPの周囲において、ノイズ整形器として依然として用いられ、同じ目的関数を用い、TCXとACELPの両方に対して最大化する(例えば、閉ループ決定プロセスにおけるLPCベースの重み付けセグメント式SNR)ことを可能にする。
(1)変換符号化励振(TCX)と周波数ドメイン(FD)の間の遷移は、周波数ドメインにおいて線形予測符号化を適用することによって、有意に簡略化され、統合化される。
(2)TCXの場合に、LPC係数の送信を維持することによって、(時間ドメインにおいてLPCフィルタを適用するとき)TCXとACELPの間の遷移を他の実施態様のように有利に実現することができる。
Claims (26)
- オーディオコンテンツの符号化表現(1110;1208)に基づいて、前記オーディオコンテンツの復号化表現(1112;1212)を提供する、多重モードオーディオ信号デコーダ(1100;1200)であって、
前記オーディオコンテンツの複数の部分(1410、1412、1414、1416)に対して、復号化されたスペクトル係数(1132;1230d;r[i])のセット(1132;1230d)を取得するように構成された、スペクトル値決定器(1130;1230a、1230c)と、
復号化されたスペクトル係数のセット(1132;1230d;r[i])またはその前処理されたバージョン(1132’)に、線形予測モードにおいて符号化された前記オーディオコンテンツの部分に対する線形予測ドメインパラメータのセットに従ってスペクトル整形を適用し、復号化されたスペクトル係数のセット(1132;1230d;r[i])またはその前処理されたバージョン(1232’)に、周波数ドメインモードにおいて符号化された前記オーディオコンテンツの部分(1410;1416)に対するスケールファクタパラメータ(1152;1260b)のセットに従ってスペクトル整形を適用するように構成された、スペクトルプロセッサ(1230e;1378)と、
線形予測モードにおいて符号化された前記オーディオコンテンツの部分に対する復号化されたスペクトル係数のスペクトル整形されたセット(1158;1230f)に基づいて、前記オーディオコンテンツの時間ドメイン表現(1162;1232;xi,n)を取得し、周波数ドメインモードにおいて符号化された前記オーディオコンテンツの部分に対する復号化されたスペクトル係数のスペクトル整形されたセットに基づいて、前記オーディオコンテンツの時間ドメイン表現(1162;1232)を取得するように構成された、周波数ドメイン−時間ドメイン変換器(1160;1230g)と、
を備えた、多重モードオーディオ信号デコーダ。 - 線形予測モードにおいて符号化された前記オーディオコンテンツの部分の時間ドメイン表現を、周波数ドメインモードにおいて符号化された前記オーディオコンテンツの部分と、オーバーラップおよび加算するように構成された、重ね合せ器(1233)を更に備えた、請求項1に記載の多重モードオーディオ信号デコーダ。
- 前記周波数ドメイン−時間ドメイン変換器(1160;1230g)は、線形予測モードにおいて符号化された前記オーディオコンテンツの部分(1412;1414)に対して、前記オーディオコンテンツの時間ドメイン表現を、ラップド変換を用いて取得し、周波数ドメインモードにおいて符号化された前記オーディオコンテンツの部分(1410;1416)に対して、前記オーディオコンテンツの時間ドメイン表現を、ラップド変換を用いて取得するように構成され、
前記重ね合せ器は、異なるモードにおいて符号化された前記オーディオコンテンツの引き続く部分の時間ドメイン表現をオーバーラップするように構成された、
請求項2に記載の多重モードオーディオ信号デコーダ。 - 前記周波数ドメイン−時間ドメイン変換器(1160;1230g)は、異なるモードにおいて符号化された前記オーディオコンテンツの部分に対して前記オーディオコンテンツの時間ドメイン表現を取得するために、同じ変換タイプのラップド変換を適用するように構成され、
前記重ね合せ器は、異なるモードにおいて符号化された前記オーディオコンテンツの引き続く部分の時間ドメイン表現を、前記ラップド変換によって生じた時間ドメイン折り返し歪みが低減または除去されるように、オーバーラップおよび加算するように構成された、
請求項3に記載の多重モードオーディオ信号デコーダ。 - 前記重ね合せ器は、関係するラップド変換によって提供されたような第1のモードにおいて符号化された前記オーディオコンテンツの第1の部分(1414)のウィンドウ化された時間ドメイン表現、またはその振幅スケーリングされたがスペクトル的に歪められていないバージョンと、関係するラップド変換によって提供されたような第2のモードにおいて符号化された前記オーディオコンテンツの第2の引き続く部分(1416)のウィンドウ化された時間ドメイン表現、またはその振幅スケーリングされたがスペクトル的に歪められていないバージョンを、オーバーラップおよび加算するように構成された、請求項4に記載の多重モードオーディオ信号デコーダ。
- 前記周波数ドメイン−時間ドメイン変換器(1160;1230g)は、前記提供された時間ドメイン表現が、前記提供された時間ドメイン表現の一方または両方にウィンドウ化遷移演算以外の信号整形フィルタリング演算を適用することなく線形に結合可能であるという点で同じドメインにあるように、異なるモードにおいて符号化された前記オーディオコンテンツの部分(1410、1412、1414、1416)の時間ドメイン表現を提供するように構成された、請求項1から請求項5のいずれかに記載の多重モードオーディオ信号デコーダ。
- 前記周波数ドメイン−時間ドメイン変換器(1160;1230g)は、逆修正離散コサイン変換を実行し、前記逆修正離散コサイン変換の結果として、線形予測モードにおいて符号化された前記オーディオコンテンツの部分と周波数ドメインモードにおいて符号化された前記オーディオコンテンツの部分の両方に対して、オーディオ信号ドメインにおける前記オーディオコンテンツの時間ドメイン表現を取得するように構成された、請求項1から請求項6のいずれかに記載の多重モードオーディオ信号デコーダ。
- 線形予測モードにおいて符号化された前記オーディオコンテンツの部分に対する前記線形予測符号化フィルタ係数の符号化された表現に基づいて、復号化された線形予測符号化フィルタ係数(a1〜a16)を取得するように構成された、線形予測符号化フィルタ係数決定器と、
異なる周波数に関する線形予測モードのゲイン値(g[k])を取得するために、前記復号化された線形予測符号化係数(1260d;a1〜a16)をスペクトル表現(1260f;X0[k])に変換するように構成された、フィルタ係数変換器(1260e)と、
周波数ドメインモードにおいて符号化された前記オーディオコンテンツの部分に対する前記スケールファクタ値の符号化された表現(1254)に基づいて、復号化されたスケールファクタ値(1260f)を取得するように構成された、スケールファクタ決定器(1260a)と、を更に備え、
前記スペクトルプロセッサ(1150;1230e)は、前記復号化されたスペクトル係数(1130;1230d;r[i])、またはその前処理されたバージョンの貢献度が、前記線形予測モードのゲイン値(g[k])に従って重み付けされた、前記復号化されたスペクトル係数のゲイン処理されたバージョン(1158;1230f;rr[i])を取得するために、線形予測モードにおいて符号化された前記オーディオコンテンツの部分に関する復号化されたスペクトル係数のセット(1132;1230d;r[i])、またはその前処理されたバージョンを、前記線形予測モードのゲイン値(g[k])と結合するように構成され、また、前記復号化されたスペクトル係数、またはその前処理されたバージョンの貢献度が、前記スケールファクタ値に従って重み付けされた、前記復号化されたスペクトル係数(x_ac_invquant)のスケールファクタ処理されたバージョン(x_rescal)を取得するために、周波数ドメインモードにおいて符号化された前記オーディオコンテンツの部分に関する復号化されたスペクトル係数のセット(1132;1230d;x_ac_invquant)、またはその前処理されたバージョンを、前記スケールファクタ値(1260b)と結合するように構成された、スペクトル修正器を備える、
請求項1から請求項7のいずれかに記載の多重モードオーディオ信号デコーダ。 - 前記フィルタ係数変換器(1260e)および前記結合器(1230e)は、与えられた復号化スペクトル係数(r[i])、またはその前処理されたバージョンの、前記与えられたスペクトル係数のゲイン処理されたバージョン(rr[i])への貢献度が、前記与えられた復号化スペクトル係数(r[i])に関する線形予測モードのゲイン値(g[k])の大きさによって決定されるように構成された、請求項8または請求項9に記載の多重モードオーディオ信号デコーダ。
- 前記スペクトルプロセッサ(1230e)は、与えられた復号化スペクトル係数(r[i])、またはその前処理されたバージョンの、前記与えられたスペクトル係数のゲイン処理されたバージョン(rr[i])への貢献度の重み付けが、前記与えられた復号化スペクトル係数(r[i])に関する線形予測モードのゲイン値(g[k])の大きさの増加と共に増加するように、または、与えられた復号化スペクトル係数(r[i])、またはその前処理されたバージョンの、前記与えられたスペクトル係数のゲイン処理されたバージョン(rr[i])への貢献度の重み付けが、前記復号化された線形予測符号化フィルタ係数のスペクトル表現の関係するスペクトル係数(X0[k])の大きさの増加と共に減少するように構成された、請求項1から請求項9のいずれかに記載の多重モードオーディオ信号デコーダ。
- 前記スペクトル値決定器(1130;1230e、1230c)は、復号化され、逆量子化されたスペクトル係数(1132;1230d)を取得するために、復号化され、量子化されたスペクトル係数に逆量子化を適用するように構成され、
前記スペクトルプロセッサ(1230e)は、与えられた復号化スペクトル係数(r[i])に対して、前記与えられた復号化スペクトル係数(r[i])に関する線形予測モードのゲイン値(g[k])の大きさに従って、効果的な量子化ステップを調整することによって、量子化ノイズ整形を実行するように構成された、
請求項1から請求項11のいずれかに記載の多重モードオーディオ信号デコーダ - 周波数ドメインモードのフレーム(1410)から、複合された線形予測モード/代数符号励振線形予測モードのフレームに遷移するために、中間の線形予測モードのスタートフレーム(1212)を用いるように構成され、
前記線形予測モードのスタートフレームに対して、復号化されたスペクトル係数のセットを取得し、
前記線形予測モードのスタートフレーム、またはその前処理されたバージョンに対する前記復号化されたスペクトル係数のセットに、関係する線形予測ドメインパラメータのセットに従ってスペクトル整形を適用し、
復号化されたスペクトル係数のスペクトル整形されたセットに基づいて、前記線形予測モードのスタートフレームの時間ドメイン表現を取得し、
前記線形予測モードのスタートフレームの前記時間ドメイン表現に、比較的長い左側遷移スロープと比較的短い右側遷移スロープを有するスタートウィンドウを適用するように構成された、
請求項1から請求項12のいずれかに記載の多重モードオーディオ信号デコーダ。 - 前記線形予測モードのスタートフレーム(1412)に先行する周波数ドメインモードのフレーム(1410)の時間ドメイン表現の右側部分を、前記線形予測モードのスタートフレームの時間ドメイン表現の左側部分とオーバーラップし、時間ドメイン折り返し歪みの低減または解消を得るように構成された、請求項13に記載の多重モードオーディオ信号デコーダ。
- 前記線形予測モードのスタートフレームに追従する前記複合された線形予測モード/代数符号励振線形予測モードのフレームの少なくとも部分を符号化する代数符号励振線形予測モードデコーダを初期化するために、前記線形予測モードのスタートフレーム(1412)に関する線形予測ドメインパラメータを用いるように構成された、請求項13または請求項14に記載の多重モードオーディオ信号デコーダ。
- オーディオコンテンツの入力表現(110;310;1010)に基づいて、前記オーディオコンテンツの符号化表現(112;312;1012)を提供する、多重モードオーディオ信号エンコーダ(100;300;900;1000)であって、
前記オーディオコンテンツの入力表現(110;310;1010)を処理し、前記オーディオコンテンツの周波数ドメイン表現(122;330b;1030b)を取得するように構成された、時間ドメイン−周波数ドメイン変換器(120;330a;350a;1030a)と、
スペクトル係数のセット、またはその前処理されたバージョンに、線形予測モードにおいて符号化される前記オーディオコンテンツの部分に対する線形予測ドメインパラメータのセット(134;340b)に従ってスペクトル整形を適用し、スペクトル係数のセット、またはその前処理されたバージョンに、周波数ドメインモードにおいて符号化される前記オーディオコンテンツの部分に対するスケールファクタパラメータ(136)に従ってスペクトル整形を適用するように構成された、スペクトルプロセッサ(130;330e;350d;1030e)と、
線形予測モードにおいて符号化される前記オーディコンテンツの部分に対するスペクトル係数のスペクトル整形されたセット(132;350e;1030f)の符号化されたバージョン(142;322、342;1032)を提供し、周波数ドメインモードにおいて符号化される前記オーディオコンテンツの部分に対するスペクトル係数のスペクトル整形されたセット(132;330f;1030f)の符号化されたバージョン(142;322、342;1032)を提供するように構成された、量子化エンコーダ(140;330g、330i、350f、350h;1030g、1030i)と、
を備えた、多重モードオーディオ信号エンコーダ。 - 前記時間ドメイン−周波数ドメイン変換器(120;330a;350a;1030a)は、オーディオ信号ドメインにおけるオーディオコンテンツの時間ドメイン表現(110;310;1010)を、線形予測モードにおいて符号化される前記オーディオコンテンツの部分と周波数ドメインモードにおいて符号化される前記オーディオコンテンツの部分の両方に対して、前記オーディオコンテンツの周波数ドメイン表現(122;330b;1030b)に変換するように構成された、請求項16に記載の多重モードオーディオ信号エンコーダ。
- 前記時間ドメイン−周波数ドメイン変換器(120;330a;350a;1030a)は、異なるモードにおいて符号化される前記オーディオコンテンツの部分に対する周波数ドメイン表現を取得する同じ変換タイプのラップド変換を適用するように構成された、請求項16または請求項17に記載の多重モードオーディオ信号エンコーダ。
- 前記スペクトルプロセッサ(130;330e;330e;350b;1030e)は、スペクトル係数の前記セット(122;330b;1030b)、またはその前処理されたバージョンに、線形予測モードにおいて符号化される前記オーディオコンテンツの部分の相関ベースの解析を用いて取得された線形予測ドメインパラメータのセット(134;340b)に従って、または周波数ドメインモードにおいて符号化される前記オーディオコンテンツの部分の音響心理学的モデル解析(330c;1070a)を用いて取得されたスケールファクタパラメータのセット(136;330d;1070b)に従って、選択的に前記スペクトル整形を適用するように構成された、請求項16から請求項18のいずれかに記載の多重モードオーディオ信号エンコーダ。
- 前記オーディオコンテンツの部分を線形予測モードにおいて符号化するかまたは周波数ドメインモードにおいて符号化するかを決定するために、前記オーディオコンテンツを解析するように構成された、モードセレクタを備えた、請求項19に記載の多重モードオーディオ信号エンコーダ。
- 周波数ドメインモードのフレームと、複合された変換符号化励振線形予測モード/代数符号励振線形予測モードのフレームの間のオーディオフレームを、線形予測モードのスタートフレームとして符号化するように構成され、
前記線形予測モードのスタートフレームの時間ドメイン表現に、比較的長い左側遷移スロープと比較的短い右側遷移スロープを有するスタートウィンドウを適用して、ウィンドウ化された時間ドメイン表現を取得し、
前記線形予測モードのスタートフレームのウィンドウ化された時間ドメイン表現の周波数ドメイン表現を取得し、
前記線形予測モードのスタートフレームに対して、線形予測ドメインパラメータのセットを取得し、
前記線形予測モードのスタートフレームのウィンドウ化された時間ドメイン表現の周波数ドメイン表現、またはその前処理されたバージョンに、前記線形予測ドメインパラメータのセットに従ってスペクトル整形を適用し、
前記線形予測ドメインパラメータのセットと、前記線形予測モードのスタートフレームのウィンドウ化された時間ドメイン表現のスペクトル整形された周波数ドメイン表現を符号化するように構成された、
請求項16から請求項20のいずれかに記載の多重モードオーディオ信号エンコーダ。 - 前記線形予測モードのスタートフレームに追従する複合された変換符号化励振線形予測モード/代数符号励振線形予測モードのフレームの少なくとも部分を符合化する代数符号励振線形予測モードエンコーダを初期化するために、前記線形予測モードのスタートフレームに関する前記ドメインパラメータを用いるように構成された、請求項21に記載の多重モードオーディオ信号エンコーダ。
- 線形予測モードにおいて符号化される前記オーディオコンテンツの部分、またはその前処理されたバージョンを解析し、前記線形予測モードにおいて符号化されるオーディオコンテンツの部分に関する線形予測符号化フィルタ係数を決定するように構成された、線形予測符号化フィルタ係数決定器(340a;1070c)と、
異なる周波数に関する線形予測モードのゲイン値(g[k]、350c)を取得するために、前記線形予測符号化フィルタ係数をスペクトル表現(X0[k])に変換するように構成された、フィルタ係数変換器(350b;1070d)と、
前記周波数ドメインモードにおいて符号化されるオーディオコンテンツの部分、またはその前処理されたバージョンを解析し、前記周波数ドメインモードにおいて符号化されるオーディオコンテンツの部分に関するスケールファクタを決定するように構成された、スケールファクタ決定器(330c;1070a)と、
前記線形予測モードおいて符号化されるオーディオコンテンツの部分の周波数ドメイン表現、またはその前処理されたバージョンを、前記線形予測モードのゲイン値(g[k])と結合し、前記オーディオコンテンツの周波数ドメイン表現のスペクトル成分の貢献度が前記線形予測モードのゲイン値に従って重み付けされる、ゲイン処理されたスペクトル成分を取得し、前記周波数ドメインモードにおいて符号化されるオーディオコンテンツの部分の周波数ドメイン表現、またはその前処理されたバージョンを、前記スケールファクタと結合し、前記オーディオコンテンツの周波数ドメイン表現のスペクトル成分の貢献度が前記スケールファクタに従って重み付けされる、ゲイン処理されたスペクトル成分を取得するように構成された、結合器構成(330e;350d;1030e)と、を備え、
前記ゲイン処理されたスペクトル成分は、スペクトル係数のスペクトル整形されたセットを形成する、
請求項16から請求項22のいずれかに記載の多重モードオーディオ信号エンコーダ。 - オーディオコンテンツの符号化表現に基づいて前記オーディオコンテンツの復号化表現を提供する方法であって、
前記オーディオコンテンツの複数の部分に対して、復号化されたスペクトル係数のセットを取得するステップと、
前記復号化されたスペクトル係数のセット、またはその前処理されたバージョンに、前記線形予測モードにおいて符号化されたオーディオコンテンツの部分に対する線形予測ドメインパラメータのセットに従ってスペクトル整形を適用し、前記復号化されたスペクトル係数のセット、またはその前処理されたバージョンに、前記周波数ドメインモードにおいて符号化されたオーディオコンテンツの部分に対するスケールファクタパラメータのセットに従ってスペクトル整形を適用するステップと、
前記線形予測モードにおいて符号化されたオーディオコンテンツの部分に対する復号化されたスペクトル係数のスペクトル整形されたセットに基づいて前記オーディオコンテンツの時間ドメイン表現を取得するステップと、前記周波数ドメインモードにおいて符号化されたオーディオコンテンツの部分に対する復号化されたスペクトル係数のスペクトル整形されたセットに基づいて前記オーディオコンテンツの時間ドメイン表現を取得するステップと、
を備えた、オーディオコンテンツの復号化された表現を提供する方法。 - オーディオコンテンツの入力表現に基づいて前記オーディオコンテンツの符号化表現を提供する方法であって、
オーディオコンテンツの入力表現を処理し、前記オーディオコンテンツの周波数ドメイン表現を取得するステップと、
スペクトル係数のセット、またはその前処理されたバージョンに、前記線形予測モードにおいて符号化されたオーディオコンテンツの部分に対する線形予測ドメインパラメータのセットに従ってスペクトル整形を適用するステップと、
スペクトル係数のセット、またはその前処理されたバージョンに、前記周波数ドメインモードにおいて符号化されたオーディオコンテンツの部分に対するスケールファクタパラメータのセットに従ってスペクトル整形を適用するステップと、
前記線形予測モードにおいて符号化されたオーディオコンテンツの部分に対するスペクトル係数のスペクトル整形されたセットの符号化された表現を、量子化符合化を用いて提供するステップと、
前記周波数ドメインモードにおいて符号化されたオーディオコンテンツの部分に対するスペクトル係数のスペクトル整形されたセットの符号化されたバージョンを、量子化符合化を用いて提供するステップと、
を備えた、オーディオコンテンツの符号化された表現を提供する方法。 - コンピュータプログラムがコンピュータ上で動作するときに、請求項24または請求項25に記載された方法を実行するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US24977409P | 2009-10-08 | 2009-10-08 | |
US61/249,774 | 2009-10-08 | ||
PCT/EP2010/064917 WO2011042464A1 (en) | 2009-10-08 | 2010-10-06 | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013507648A true JP2013507648A (ja) | 2013-03-04 |
JP5678071B2 JP5678071B2 (ja) | 2015-02-25 |
Family
ID=43384656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012532577A Active JP5678071B2 (ja) | 2009-10-08 | 2010-10-06 | 線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム |
Country Status (18)
Country | Link |
---|---|
US (1) | US8744863B2 (ja) |
EP (1) | EP2471061B1 (ja) |
JP (1) | JP5678071B2 (ja) |
KR (1) | KR101425290B1 (ja) |
CN (1) | CN102648494B (ja) |
AR (1) | AR078573A1 (ja) |
AU (1) | AU2010305383B2 (ja) |
BR (2) | BR112012007803B1 (ja) |
CA (1) | CA2777073C (ja) |
ES (1) | ES2441069T3 (ja) |
HK (1) | HK1172727A1 (ja) |
MX (1) | MX2012004116A (ja) |
MY (1) | MY163358A (ja) |
PL (1) | PL2471061T3 (ja) |
RU (1) | RU2591661C2 (ja) |
TW (1) | TWI423252B (ja) |
WO (1) | WO2011042464A1 (ja) |
ZA (1) | ZA201203231B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016528562A (ja) * | 2013-08-23 | 2016-09-15 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | オーバーラップ範囲における組み合わせを用いて音声信号を処理するための装置及び方法 |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9313359B1 (en) | 2011-04-26 | 2016-04-12 | Gracenote, Inc. | Media content identification on mobile devices |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MY159110A (en) * | 2008-07-11 | 2016-12-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
WO2011048099A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
BR122021008583B1 (pt) | 2010-01-12 | 2022-03-22 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
MX2012011532A (es) * | 2010-04-09 | 2012-11-16 | Dolby Int Ab | Codificacion a estereo para prediccion de complejos basados en mdct. |
JP2012032648A (ja) * | 2010-07-30 | 2012-02-16 | Sony Corp | 機械音抑圧装置、機械音抑圧方法、プログラムおよび撮像装置 |
GB2487399B (en) * | 2011-01-20 | 2014-06-11 | Canon Kk | Acoustical synthesis |
CA2833874C (en) | 2011-04-21 | 2019-11-05 | Ho-Sang Sung | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
CN103620675B (zh) | 2011-04-21 | 2015-12-23 | 三星电子株式会社 | 对线性预测编码系数进行量化的设备、声音编码设备、对线性预测编码系数进行反量化的设备、声音解码设备及其电子装置 |
IN2014DN03022A (ja) * | 2011-11-03 | 2015-05-08 | Voiceage Corp | |
US11140439B2 (en) | 2012-02-21 | 2021-10-05 | Roku, Inc. | Media content identification on mobile devices |
JP6065452B2 (ja) * | 2012-08-14 | 2017-01-25 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
JP6335190B2 (ja) * | 2012-12-21 | 2018-05-30 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 |
CN103915100B (zh) * | 2013-01-07 | 2019-02-15 | 中兴通讯股份有限公司 | 一种编码模式切换方法和装置、解码模式切换方法和装置 |
KR101757347B1 (ko) * | 2013-01-29 | 2017-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 지각적 변환 오디오 코딩에서의 노이즈 채움 |
AU2014211520B2 (en) | 2013-01-29 | 2017-04-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-frequency emphasis for LPC-based coding in frequency domain |
CA2900437C (en) | 2013-02-20 | 2020-07-21 | Christian Helmrich | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
JP6146069B2 (ja) | 2013-03-18 | 2017-06-14 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
MX343673B (es) | 2013-04-05 | 2016-11-16 | Dolby Int Ab | Codificador y decodificador de audio. |
SG11201510513WA (en) * | 2013-06-21 | 2016-01-28 | Fraunhofer Ges Forschung | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
PL3011557T3 (pl) | 2013-06-21 | 2017-10-31 | Fraunhofer Ges Forschung | Urządzenie i sposób do udoskonalonego stopniowego zmniejszania sygnału w przełączanych układach kodowania sygnału audio podczas ukrywania błędów |
EP2830060A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling in multichannel audio coding |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
CA2925734C (en) * | 2013-10-18 | 2018-07-10 | Guillaume Fuchs | Coding of spectral coefficients of a spectrum of an audio signal |
AU2014350366B2 (en) | 2013-11-13 | 2017-02-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
EP4095854B1 (en) * | 2014-01-15 | 2024-08-07 | Samsung Electronics Co., Ltd. | Weight function determination device and method for quantizing linear prediction coding coefficient |
EP2916319A1 (en) * | 2014-03-07 | 2015-09-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for encoding of information |
KR101826237B1 (ko) * | 2014-03-24 | 2018-02-13 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
US9685164B2 (en) * | 2014-03-31 | 2017-06-20 | Qualcomm Incorporated | Systems and methods of switching coding technologies at a device |
US9666210B2 (en) * | 2014-05-15 | 2017-05-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Audio signal classification and coding |
CN105336336B (zh) * | 2014-06-12 | 2016-12-28 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP3000110B1 (en) * | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
CN106448688B (zh) * | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
FR3024581A1 (fr) | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
US10008214B2 (en) * | 2015-09-11 | 2018-06-26 | Electronics And Telecommunications Research Institute | USAC audio signal encoding/decoding apparatus and method for digital radio services |
WO2017050398A1 (en) * | 2015-09-25 | 2017-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding |
US11176954B2 (en) * | 2017-04-10 | 2021-11-16 | Nokia Technologies Oy | Encoding and decoding of multichannel or stereo audio signals |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
BR112020012648A2 (pt) | 2017-12-19 | 2020-12-01 | Dolby International Ab | métodos e sistemas de aparelhos para aprimoramentos de decodificação de fala e áudio unificados |
KR102250835B1 (ko) * | 2019-08-05 | 2021-05-11 | 국방과학연구소 | 수동 소나의 협대역 신호를 탐지하기 위한 lofar 또는 demon 그램의 압축 장치 |
CN113571073A (zh) * | 2020-04-28 | 2021-10-29 | 华为技术有限公司 | 一种线性预测编码参数的编码方法和编码装置 |
KR20220066749A (ko) * | 2020-11-16 | 2022-05-24 | 한국전자통신연구원 | 잔차 신호의 생성 방법과 그 방법을 수행하는 부호화기 및 복호화기 |
CN118193470B (zh) * | 2024-03-26 | 2024-10-18 | 广州亿达信息科技有限公司 | 核酸质谱数据的解压方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001500640A (ja) * | 1997-07-14 | 2001-01-16 | フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. | オーディオ信号の符号化方法 |
WO2004082288A1 (en) * | 2003-03-11 | 2004-09-23 | Nokia Corporation | Switching between coding schemes |
WO2006049204A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、符号化方法及び復号化方法 |
JP2007525707A (ja) * | 2004-02-18 | 2007-09-06 | ヴォイスエイジ・コーポレーション | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス |
WO2008089705A1 (fr) * | 2007-01-23 | 2008-07-31 | Huawei Technologies Co., Ltd. | Procédé et appareil de codage et de décodage |
WO2008151755A1 (en) * | 2007-06-11 | 2008-12-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding an audio signal having an impulse- like portion and stationary portion, encoding methods, decoder, decoding method; and encoded audio signal |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7167828B2 (en) | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
DE102004007191B3 (de) * | 2004-02-13 | 2005-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
KR100923156B1 (ko) * | 2006-05-02 | 2009-10-23 | 한국전자통신연구원 | 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8041578B2 (en) * | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
BRPI0721079A2 (pt) * | 2006-12-13 | 2014-07-01 | Panasonic Corp | Dispositivo de codificação, dispositivo de decodificação e método dos mesmos |
FR2912249A1 (fr) * | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
EP2063417A1 (en) * | 2007-11-23 | 2009-05-27 | Deutsche Thomson OHG | Rounding noise shaping for integer transform based encoding and decoding |
EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
MY159110A (en) | 2008-07-11 | 2016-12-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
MY152252A (en) | 2008-07-11 | 2014-09-15 | Fraunhofer Ges Forschung | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
CA2763793C (en) * | 2009-06-23 | 2017-05-09 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
EP4362014A1 (en) * | 2009-10-20 | 2024-05-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
ES2534972T3 (es) * | 2011-02-14 | 2015-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral |
-
2010
- 2010-10-06 WO PCT/EP2010/064917 patent/WO2011042464A1/en active Application Filing
- 2010-10-06 MX MX2012004116A patent/MX2012004116A/es active IP Right Grant
- 2010-10-06 JP JP2012532577A patent/JP5678071B2/ja active Active
- 2010-10-06 CN CN201080055600.8A patent/CN102648494B/zh active Active
- 2010-10-06 BR BR112012007803-8A patent/BR112012007803B1/pt active IP Right Grant
- 2010-10-06 AU AU2010305383A patent/AU2010305383B2/en active Active
- 2010-10-06 KR KR1020127011268A patent/KR101425290B1/ko active IP Right Grant
- 2010-10-06 PL PL10760726T patent/PL2471061T3/pl unknown
- 2010-10-06 MY MYPI2012001497A patent/MY163358A/en unknown
- 2010-10-06 CA CA2777073A patent/CA2777073C/en active Active
- 2010-10-06 ES ES10760726.9T patent/ES2441069T3/es active Active
- 2010-10-06 RU RU2012119291/08A patent/RU2591661C2/ru active
- 2010-10-06 EP EP10760726.9A patent/EP2471061B1/en active Active
- 2010-10-06 BR BR122021023896-0A patent/BR122021023896B1/pt active IP Right Grant
- 2010-10-07 TW TW099134191A patent/TWI423252B/zh active
- 2010-10-08 AR ARP100103679A patent/AR078573A1/es active IP Right Grant
-
2012
- 2012-04-06 US US13/441,469 patent/US8744863B2/en active Active
- 2012-05-04 ZA ZA2012/03231A patent/ZA201203231B/en unknown
- 2012-12-27 HK HK12113383.4A patent/HK1172727A1/xx unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001500640A (ja) * | 1997-07-14 | 2001-01-16 | フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. | オーディオ信号の符号化方法 |
WO2004082288A1 (en) * | 2003-03-11 | 2004-09-23 | Nokia Corporation | Switching between coding schemes |
JP2007525707A (ja) * | 2004-02-18 | 2007-09-06 | ヴォイスエイジ・コーポレーション | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス |
WO2006049204A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、符号化方法及び復号化方法 |
WO2008089705A1 (fr) * | 2007-01-23 | 2008-07-31 | Huawei Technologies Co., Ltd. | Procédé et appareil de codage et de décodage |
JP2010517083A (ja) * | 2007-01-23 | 2010-05-20 | 華為技術有限公司 | 符号化及び復号化の方法及び装置 |
WO2008151755A1 (en) * | 2007-06-11 | 2008-12-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding an audio signal having an impulse- like portion and stationary portion, encoding methods, decoder, decoding method; and encoded audio signal |
JP2010530079A (ja) * | 2007-06-11 | 2010-09-02 | フラウンホッファー−ゲゼルシャフト ツァー フェーデルング デア アンゲバンテン フォルシュング エー ファー | インパルス状の部分と定常部分とを有するオーディオ信号を符号化するオーディオ符号器、符号化方法、復号器、復号化方法、および符号化されたオーディオ信号 |
Non-Patent Citations (1)
Title |
---|
JPN5013002616; Jeremie Lecomte, et al.: '"Efficient Cross-Fade Windows for Transitions between LPC-Based and Non-LPC Based Audio Coding"' Convention Paper of the 126th Convention No.7712, 200905, pp.1-9, Audio Engineering Society * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016528562A (ja) * | 2013-08-23 | 2016-09-15 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | オーバーラップ範囲における組み合わせを用いて音声信号を処理するための装置及び方法 |
US10157624B2 (en) | 2013-08-23 | 2018-12-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an audio signal using a combination in an overlap range |
US10210879B2 (en) | 2013-08-23 | 2019-02-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Andewandten Forschung E.V. | Apparatus and method for processing an audio signal using an aliasing error signal |
Also Published As
Publication number | Publication date |
---|---|
BR122021023896B1 (pt) | 2023-01-10 |
RU2591661C2 (ru) | 2016-07-20 |
MX2012004116A (es) | 2012-05-22 |
CN102648494B (zh) | 2014-07-02 |
CA2777073A1 (en) | 2011-04-14 |
JP5678071B2 (ja) | 2015-02-25 |
KR101425290B1 (ko) | 2014-08-01 |
AR078573A1 (es) | 2011-11-16 |
HK1172727A1 (en) | 2013-04-26 |
AU2010305383A1 (en) | 2012-05-10 |
ZA201203231B (en) | 2013-01-30 |
TWI423252B (zh) | 2014-01-11 |
WO2011042464A1 (en) | 2011-04-14 |
RU2012119291A (ru) | 2013-11-10 |
TW201137860A (en) | 2011-11-01 |
CA2777073C (en) | 2015-11-24 |
PL2471061T3 (pl) | 2014-03-31 |
CN102648494A (zh) | 2012-08-22 |
KR20120063543A (ko) | 2012-06-15 |
US20120245947A1 (en) | 2012-09-27 |
EP2471061A1 (en) | 2012-07-04 |
ES2441069T3 (es) | 2014-01-31 |
EP2471061B1 (en) | 2013-10-02 |
BR112012007803B1 (pt) | 2022-03-15 |
US8744863B2 (en) | 2014-06-03 |
BR112012007803A2 (pt) | 2020-08-11 |
AU2010305383B2 (en) | 2013-10-03 |
MY163358A (en) | 2017-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5678071B2 (ja) | 線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム | |
KR101411759B1 (ko) | 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법 | |
KR101565634B1 (ko) | 음성/음악 통합 신호의 부호화/복호화 장치 | |
KR101250309B1 (ko) | 에일리어싱 스위치 기법을 이용하여 오디오 신호를 인코딩/디코딩하는 장치 및 방법 | |
TWI479478B (zh) | 用以使用對齊的預看部分將音訊信號解碼的裝置與方法 | |
CN101878504A (zh) | 使用时间分辨率能选择的低复杂性频谱分析/合成 | |
WO2013061584A1 (ja) | 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法 | |
Fuchs et al. | MDCT-based coder for highly adaptive speech and audio coding | |
CN103137135B (zh) | Lpc系数量化方法和装置及多编码核音频编码方法和设备 | |
KR101455648B1 (ko) | 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템 | |
BR122021023890B1 (pt) | Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130604 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130902 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130909 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140513 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140804 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5678071 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |