JP5978227B2 - 予測符号化と変換符号化を繰り返す低遅延音響符号化 - Google Patents
予測符号化と変換符号化を繰り返す低遅延音響符号化 Download PDFInfo
- Publication number
- JP5978227B2 JP5978227B2 JP2013545471A JP2013545471A JP5978227B2 JP 5978227 B2 JP5978227 B2 JP 5978227B2 JP 2013545471 A JP2013545471 A JP 2013545471A JP 2013545471 A JP2013545471 A JP 2013545471A JP 5978227 B2 JP5978227 B2 JP 5978227B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- encoding
- coding
- predictive
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 65
- 238000004590 computer program Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 description 91
- 230000015572 biosynthetic process Effects 0.000 description 35
- 238000003786 synthesis reaction Methods 0.000 description 35
- 238000004458 analytical method Methods 0.000 description 28
- 230000005284 excitation Effects 0.000 description 27
- 238000013139 quantization Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 230000003595 spectral effect Effects 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 11
- 230000000630 rising effect Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000002301 combined effect Effects 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000005562 fading Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
・音声タイプの信号の場合:AMR-WB+符号化から取り出された以下の2つの異なるモードを含むLPD(「線形予測領域」)モード
-ACELPモード
-(AMR-WB+コーデックとは異なる)MDCTタイプの変換を使用するwLPT(「加重線形予測変換」)と呼ばれるTCXモード
・音楽タイプの信号の場合:1024サンプル上でMPEG AAC(「アドバンストオーディオコーディング」)タイプのMDCT(「修正ディスクリートコサイン変換」)変換符号化を使用するFD(「周波数領域」)モード
・この場合「MDCTウィンドウ」と呼ばれる2Mの長さをもつウィンドウによる信号の重み付け
・長さMのブロックを形成するための時間領域エイリアシング
・長さMのDCT(「ディスクリートコサイン変換」)変換
-予測符号化によりデジタル信号のサンプルの先行するフレームを符号化するステップと、
-変換符号化によりデジタル信号のサンプルの現在のフレームを符号化するステップと
を含む、デジタル音響信号を符号化するための方法を提案する。
-予測符号化によって受信および符号化されたデジタル信号のサンプルの先行するフレームを予測復号するステップと、
-変換符号化によって受信および符号化されたデジタル信号のサンプルの現在のフレームを逆変換復号するステップと
を含む、デジタル音響信号を復号する方法に関し、
方法は、現在のフレームの第1の部分の先行するフレームの予測復号に対して制限された予測復号によって復号するステップも含むものである。
-デジタル信号のサンプルの先行するフレームを符号化するための予測符号化モジュールと、
-デジタル信号のサンプルの現在のフレームを符号化するための変換符号化モジュールと
を含む、デジタル音響エンコーダに関する。エンコーダは、また、先行するフレームの予測符号化の少なくとも1つのパラメータを再使用すること、および現在のフレームの第1の部分の再使用されていないパラメータのみを符号化することにより、現在のフレームの第1の部分を符号化するために先行するフレームの予測符号化に対して制限された予測符号化モジュールを含む。
-予測符号化によって受信および符号化されたデジタル信号のサンプルの先行するフレームを復号するための予測復号モジュールと、
-変換符号化によって受信および符号化されたデジタル信号のサンプルの現在のフレームを復号するための逆変換復号モジュールと
を含む、デジタル音響信号デコーダに関する。デコーダは、また、先行するフレームの予測復号の少なくとも1つのパラメータを再使用すること、および現在のフレームのこの第1の部分について受信されたパラメータのみを復号することにより、制限された予測符号化によって受信および符号化された現在のフレームの第1の部分を復号するための、先行するフレームの予測復号に対して制限された予測復号モジュールを含むものである。
-第1のケース:先行するフレームがMDCTモードによって符号化された。この場合、ローカル(およびリモート)のデコーダ内でMDCT合成に必要なメモリ(または状態)は利用可能であり、時間領域エイリアシングを取り消すためにMDCTによって使用される加算/重複の動作は実現可能である。MDCTフレームは全フレームにわたって正確に復号される。これはMDCT符号化/復号の「通常」動作を要する。
-第2のケース:先行するフレームがCELPモードによって符号化された。この場合、(ローカルおよびリモート)のデコーダでのフレームの復元は完璧ではない。上記で説明したように、MDCTは、復号されるべきフレームの時間領域エイリアシングを取り除き、ブロックの影響も防止し、フレームより長いウィンドウの使用により周波数分解能を高めるために、(メモリに格納された状態で)現在のフレームと先行するフレームの間の加算/重複の動作を復元に使用する。最も広く使用されているMDCTウィンドウ(正弦曲線タイプ)で、時間領域エイリアシングに起因する信号のひずみは、ウィンドウの終端部でより大きく、ウィンドウの中央で実質的にゼロである。この厳密なケースでは、先行するフレームがCELPタイプの場合、最後のフレームがMDCT変換符号化されていないので、MDCTメモリは利用可能ではない。
-フレームのMDCT符号化:図4aの上部に示された例示的な実施形態では、この符号化用に選ばれたウィンドウは、25msの効率的な長さをもつ、上記に定義されたウィンドウw(n)である。MDCT遷移フレーム(CELPフレームに続く最初のMDCTフレーム)内でw(n)と交換する他の形態のウィンドウは、25msとは異なる可能性がある全く同一の効率的な長さで、図4b、4c、4dおよび4eで示される。図4aの場合、現在のフレームの20msは、ウィンドウのゼロでない部分の先頭に配置され、残りの5msはルックアヘッドフレームの最初の5ミリ秒である。(エイリアシングおよびディスクリートコサイン変換(DCT)による)MDCTの計算後、MDCTスペクトルの256サンプルがその結果取得される。これらの係数の量子化は、この場合、スペクトル包絡線の伝送、および包絡線の標準化された各サブバンドについての球形ベクトル量子化によって実行される。「通常の」MDCT符号化の前の説明との差異は、遷移フレーム内でベクトル量子化に割り当てられた集まりがもはやBtot-Benv-Binjではなく、むしろBtot-Benv-Binj-Btransであることであり、Btransは遷移エンコーダ内でフィルタ
-(図4aから図4eの下部での)量子化スペクトルの復号:(MDCTメモリが先行するフレームから利用可能でないので加算重複のない、合成ウィンドウによるアンチエイリアシングおよび乗算による)量子化スペクトルの復元および部分的な逆MDCT変換動作の後、時間領域信号が取得され、その中で最初の5ミリ秒(最初のサブフレーム)が時間領域エイリアシングを含み、次いで、復元信号の15ms、最後の5ミリ秒が、後者がMDCTタイプの場合次のフレームの復元に必要なMDCTメモリに与える働きを最後にする。次のフレームがCELPタイプの場合、このメモリは通常使用されない。
-制限された予測符号化を含む遷移符号化による最初のサブフレーム(図4aから図4eで「TR」と記されたグレイゾーン)の符号化。
201 デシメーションフィルタ
210 事前強調
211 予測符号化モジュール
212 強調解除
220 MDCTウィンドウ
221 変換符号化モジュール
222 復号
223 MDCTインデックス
230 事前強調
231 予測符号化モジュール
232 強調解除
240 結合
250 符号化エラー計算
251 フィルタ
252 符号化エラー計算
253 フィルタ
254 モード選択
260 マルチプレクサ
501 予測復号モジュール
502 強調解除
503 逆変換復号モジュール
504 MDCTインデックス
505 予測復号モジュール
506 強調解除
507 結合
509 スイッチ
510 復元信号
511 デマルチプレクサ
Claims (17)
- デジタル音響信号を符号化するための方法であって、
-予測符号化により前記デジタル信号のサンプルの先行するフレームを符号化する(E601)ステップと、
-変換符号化により前記デジタル信号のサンプルの現在のフレームを符号化する(E603)ステップと
を含み、
前記現在のフレームは、複数のサブフレームを含み、
前記先行するフレームの前記予測符号化の少なくとも1つのパラメータを再使用すること、および前記現在のフレームの第1のサブフレームの再使用されていないパラメータのみを符号化することにより、前記現在のフレームの前記第1のサブフレームが前記先行するフレームの前記予測符号化に対して制限された予測符号化によって符号化される(E602)ことを特徴とする方法。 - 前記制限された予測符号化が、予測符号化の前記先行するフレームからコピーされた予測フィルタを使用することを特徴とする、請求項1に記載の方法。
- 前記制限された予測符号化が、予測符号化の前記先行するフレームのピッチおよび/またはそれに関連するゲインの復号された値も使用することを特徴とする、請求項2に記載の方法。
- 前記制限された予測符号化に使用される予測符号化のある特定のパラメータが、予測符号化の前記先行するフレームの復号されたパラメータに対して差動モードで量子化されることを特徴とする、請求項1に記載の方法。
- 前記現在のフレームの前記第1のサブフレームの前記予測および変換のローカルの符号化および復号から生じる復元された信号を取得するステップと、これらの復元された信号のクロスフェードによって結合する(E604)ステップとを含むことを特徴とする、請求項1に記載の方法。
- 前記復元された信号の前記クロスフェードが、前記変換符号化のウィンドウの形の関数として前記現在のフレームの前記第1のサブフレームの一部に実行されることを特徴とする、請求項5に記載の方法。
- 前記復元された信号の前記クロスフェードが、前記現在のフレームの前記第1のサブフレームの一部に実行されることを特徴とし、前記一部が時間領域エイリアシングを含まない、請求項5に記載の方法。
- 前記変換符号化が、重み付けウィンドウの終端および先頭でゼロの値が選ばれた数連続する重み付け係数を含む重み付けウィンドウを使用することを特徴とする、請求項1に記載の方法。
- 前記変換符号化が、非対称重み付けウィンドウの少なくとも1つの終端でゼロの値が選ばれた数連続する重み付け係数を含む非対称重み付けウィンドウを使用することを特徴とする、請求項1に記載の方法。
- デジタル音響信号を復号するための方法であって、
-予測符号化によって受信および符号化された前記デジタル信号のサンプルの先行するフレームを予測復号する(E605)ステップと、
-変換符号化によって受信および符号化された前記デジタル信号のサンプルの現在のフレームを逆変換復号する(E607)ステップと
を含み、
前記現在のフレームは、複数のサブフレームを含み、
前記先行するフレームの前記予測復号の少なくとも1つのパラメータを再使用すること、および前記現在のフレームの第1のサブフレームについて受信された前記パラメータのみを復号することにより、制限された予測符号化により受信および符号化された前記現在のフレームの前記第1のサブフレームを、前記先行するフレームの前記予測復号に対して制限された予測復号によって復号する(E606)ステップをさらに含むことを特徴とする方法。 - 逆変換によって復号された信号のクロスフェード、および前記現在のフレームの前記第1のサブフレームの少なくとも1つの部分についての制限された予測復号によって結合する(E608)ステップを含むことを特徴とする、請求項10に記載の方法。
- 前記制限された予測復号が、前記先行するフレームの前記予測復号によって復号および使用された予測フィルタを使用することを特徴とする、請求項10に記載の方法。
- 前記制限された予測復号が、前記先行するフレームの前記予測復号のピッチおよび/またはそれに関連するゲインの復号された値も使用することを特徴とする、請求項12に記載の方法。
- デジタル音響信号エンコーダであって、
-前記デジタル信号のサンプルの先行するフレームを符号化するための予測符号化モジュール(211)と、
-前記デジタル信号のサンプルの現在のフレームを符号化するための変換符号化モジュール(221)と
を含み、
前記現在のフレームは、複数のサブフレームを含み、
前記先行するフレームの予測符号化の少なくとも1つのパラメータを再使用すること、および前記現在のフレームの第1のサブフレームの再使用されていないパラメータのみを符号化することにより、前記現在のフレームの前記第1のサブフレームを符号化するための、前記先行するフレームの前記予測符号化に対して制限された予測符号化モジュール(231)をさらに含むことを特徴とするデジタル音響信号エンコーダ。 - デジタル音響信号デコーダであって、
-予測符号化によって受信および符号化された前記デジタル信号のサンプルの先行するフレームを復号するための予測復号モジュール(501)と、
-変換符号化によって受信および符号化された前記デジタル信号のサンプルの現在のフレームを復号するための逆変換復号モジュール(503)と
を含み、
前記現在のフレームは、複数のサブフレームを含み、
前記先行するフレームの前記予測復号の少なくとも1つのパラメータを再使用すること、および前記現在のフレームの第1のサブフレームについて受信された前記パラメータのみを復号することにより、制限された予測符号化によって受信および符号化された前記現在のフレームの前記第1のサブフレームを復号するための、前記先行するフレームの前記予測復号に対して制限された予測復号モジュール(505)をさらに含むことを特徴とするデジタル音響信号デコーダ。 - プロセッサによってこれらの命令が実行されると、請求項1から請求項9のいずれか一項に記載の符号化方法のステップを実施するためのコード命令を含む、コンピュータプログラム。
- プロセッサによってこれらの命令が実行されると、請求項10から請求項13のいずれか一項に記載の復号方法のステップを実施するためのコード命令を含む、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1061203 | 2010-12-23 | ||
FR1061203A FR2969805A1 (fr) | 2010-12-23 | 2010-12-23 | Codage bas retard alternant codage predictif et codage par transformee |
PCT/FR2011/053097 WO2012085451A1 (fr) | 2010-12-23 | 2011-12-20 | Codage de son à bas retard alternant codage prédictif et codage par transformée |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014505272A JP2014505272A (ja) | 2014-02-27 |
JP5978227B2 true JP5978227B2 (ja) | 2016-08-24 |
Family
ID=44059261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013545471A Active JP5978227B2 (ja) | 2010-12-23 | 2011-12-20 | 予測符号化と変換符号化を繰り返す低遅延音響符号化 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9218817B2 (ja) |
EP (1) | EP2656343B1 (ja) |
JP (1) | JP5978227B2 (ja) |
KR (1) | KR101869395B1 (ja) |
CN (1) | CN103384900B (ja) |
BR (1) | BR112013016267B1 (ja) |
ES (1) | ES2529221T3 (ja) |
FR (1) | FR2969805A1 (ja) |
RU (1) | RU2584463C2 (ja) |
WO (1) | WO2012085451A1 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4977157B2 (ja) * | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
JP6189831B2 (ja) * | 2011-05-13 | 2017-08-30 | サムスン エレクトロニクス カンパニー リミテッド | ビット割り当て方法及び記録媒体 |
EP2849180B1 (en) * | 2012-05-11 | 2020-01-01 | Panasonic Corporation | Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal |
KR101498113B1 (ko) * | 2013-10-23 | 2015-03-04 | 광주과학기술원 | 사운드 신호의 대역폭 확장 장치 및 방법 |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
US9489955B2 (en) * | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US10134403B2 (en) * | 2014-05-16 | 2018-11-20 | Qualcomm Incorporated | Crossfading between higher order ambisonic signals |
FR3023036A1 (fr) * | 2014-06-27 | 2016-01-01 | Orange | Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard |
EP2980797A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980796A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
CN109389987B (zh) * | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
CN110556118B (zh) * | 2018-05-31 | 2022-05-10 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
JP3317470B2 (ja) * | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7171355B1 (en) * | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
CN101308656A (zh) * | 2007-05-17 | 2008-11-19 | 展讯通信(上海)有限公司 | 音频暂态信号的编解码方法 |
ES2558229T3 (es) * | 2008-07-11 | 2016-02-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas |
FR2936898A1 (fr) * | 2008-10-08 | 2010-04-09 | France Telecom | Codage a echantillonnage critique avec codeur predictif |
RU2393548C1 (ru) * | 2008-11-28 | 2010-06-27 | Общество с ограниченной ответственностью "Конвент Люкс" | Устройство для изменения входящего голосового сигнала в выходящий голосовой сигнал в соответствии с целевым голосовым сигналом |
JP4977157B2 (ja) * | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
-
2010
- 2010-12-23 FR FR1061203A patent/FR2969805A1/fr not_active Withdrawn
-
2011
- 2011-12-20 US US13/997,446 patent/US9218817B2/en active Active
- 2011-12-20 RU RU2013134227/08A patent/RU2584463C2/ru active
- 2011-12-20 CN CN201180068351.0A patent/CN103384900B/zh active Active
- 2011-12-20 BR BR112013016267-8A patent/BR112013016267B1/pt active IP Right Grant
- 2011-12-20 WO PCT/FR2011/053097 patent/WO2012085451A1/fr active Application Filing
- 2011-12-20 KR KR1020137019387A patent/KR101869395B1/ko active IP Right Grant
- 2011-12-20 ES ES11815474.9T patent/ES2529221T3/es active Active
- 2011-12-20 EP EP11815474.9A patent/EP2656343B1/fr active Active
- 2011-12-20 JP JP2013545471A patent/JP5978227B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
RU2584463C2 (ru) | 2016-05-20 |
US9218817B2 (en) | 2015-12-22 |
CN103384900A (zh) | 2013-11-06 |
RU2013134227A (ru) | 2015-01-27 |
EP2656343B1 (fr) | 2014-11-19 |
KR101869395B1 (ko) | 2018-06-20 |
JP2014505272A (ja) | 2014-02-27 |
BR112013016267A2 (pt) | 2018-07-03 |
ES2529221T3 (es) | 2015-02-18 |
FR2969805A1 (fr) | 2012-06-29 |
US20130289981A1 (en) | 2013-10-31 |
CN103384900B (zh) | 2015-06-10 |
BR112013016267B1 (pt) | 2021-02-02 |
WO2012085451A1 (fr) | 2012-06-28 |
EP2656343A1 (fr) | 2013-10-30 |
KR20130133816A (ko) | 2013-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5978227B2 (ja) | 予測符号化と変換符号化を繰り返す低遅延音響符号化 | |
US8630864B2 (en) | Method for switching rate and bandwidth scalable audio decoding rate | |
JP6306175B2 (ja) | 時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法 | |
JP6306177B2 (ja) | 時間ドメイン励振信号を修正するエラーコンシールメントを用いて、復号化されたオーディオ情報を提供する、オーディオデコーダおよび復号化されたオーディオ情報を提供する方法 | |
US7876966B2 (en) | Switching between coding schemes | |
JP6126006B2 (ja) | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 | |
JP2019091077A (ja) | 異なるサンプリングレートを有するフレーム間の移行による音声信号の線形予測符号化および復号のための方法、符号器および復号器 | |
KR20130133846A (ko) | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 | |
JPWO2013061584A1 (ja) | 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法 | |
US9984696B2 (en) | Transition from a transform coding/decoding to a predictive coding/decoding | |
CN106575505A (zh) | Fd/lpd转换环境中的帧丢失管理 | |
CN112133315B (zh) | 确定用于编码lpd/fd过渡帧的预算 | |
JP5457171B2 (ja) | オーディオデコーダ内で信号を後処理する方法 | |
EP2132732B1 (en) | Postfilter for layered codecs | |
Ogunfunmi et al. | Scalable and Multi-Rate Speech Coding for Voice-over-Internet Protocol (VoIP) Networks | |
Herre et al. | 18. Perceptual Perceptual Audio Coding of Speech Signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5978227 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |