JP5625126B2 - スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム - Google Patents

スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム Download PDF

Info

Publication number
JP5625126B2
JP5625126B2 JP2013553901A JP2013553901A JP5625126B2 JP 5625126 B2 JP5625126 B2 JP 5625126B2 JP 2013553901 A JP2013553901 A JP 2013553901A JP 2013553901 A JP2013553901 A JP 2013553901A JP 5625126 B2 JP5625126 B2 JP 5625126B2
Authority
JP
Japan
Prior art keywords
spectrum
spectral
autocorrelation
linear prediction
audio encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013553901A
Other languages
English (en)
Other versions
JP2014510306A (ja
Inventor
ゴラン・マルコヴィッチ
ギルラウム・フッハス
ニコラウス・レッテルバハ
クリスティアン・ヘルムリヒ
ベンヤミン・シュベルト
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2014510306A publication Critical patent/JP2014510306A/ja
Application granted granted Critical
Publication of JP5625126B2 publication Critical patent/JP5625126B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、USACで知られるTCXモード等の周波数領域ノイズ整形を使用する線形予測ベースのオーディオコーデックに関する。
比較的新しいオーディオコーデックとして、最近、USACが作られた。USACは、いくつかのコーディングモード、例えば、AAC類似コーディングモード、線形予測コーディングを使用する時間領域コーディングモードすなわちACELP、及びデータストリームを介して送信された線形予測係数を使用してスペクトル領域整形が制御される中間コーディングモードを形成する変換符号化励振コーディング(transform coded excitation coding:TCX)等の間での切替えをサポートするコーデックである。特許文献1では、AAC類似コーディングモードを使用不可にし、コーディングモードをACELP及びTCXのみに制限することによって、低遅延用途のためにUSACコーディングスキームをより適切にすることが提案されている。さらに、フレーム長を減らすことを提案している。
しかしながら、例えば速度/歪み率の点ではコーディング効率を維持しながら、スペクトル領域整形を使用する線形予測ベースコーディングスキームの複雑さを減らす可能性を手元に有していることが望ましいであろう。
国際公開第2011/47950号
USAC codec (Unified Speech and Audio Codec), ISO/IEC CD 23003-3 dated September 24, 2010
したがって、本発明の目的は、同等又はより高いコーディング効率で複雑さの低減を可能にするスペクトル領域整形を使用するそのような線形予測ベースコーディングスキームを提供することである。
この目的は独立クレームの主題によって実現される。
本発明の基礎をなす基本的な考えは、一連のスペクトルを備えるスペクトログラムへのオーディオ入力信号のスペクトル分解が線形予測係数計算と線形予測係数に基づくスペクトル領域整形のための入力の両方に対して使用される場合、線形予測ベースでスペクトル領域ノイズ整形を使用する符号化概念は、例えば、速度/歪み率の点において同等なコーディング効率で複雑さを減らすことができるということである。
この点に関して、エイリアシングを引き起こしMDCT等の厳格にサンプリングする重複変換(lapped transform)等の時間エイリアシング相殺を必要とするような重複変換がスペクトル分解に対して使用される場合でも、コーディング効率は維持されることが明らかとなった。
本発明の様態の有利な実施態様が従属クレームの主題である。
特に、本出願の好適な実施形態を図面に関して説明する。
比較例又は実施形態によるオーディオ符号器のブロック図を示す。 本出願の一実施形態によるオーディオ符号器を示す。 図2のオーディオ符号器に適合することが可能なオーディオ復号器のブロック図を示す。 本出願の一実施形態による他のオーディオ符号器のブロック図を示す。
以下にさらに記載される本発明の実施形態の主態様と利点の理解を容易にするために、図1を予備的に参照する。図1は、スペクトル領域ノイズ整形を使用する線形予測ベースオーディオ符号器を示す。
特に、図1のオーディオ符号器は、入力オーディオ信号12を一連のスペクトルからなるスペクトログラムにスペクトル分解するスペクトル分解器10を備えている。スペクトログラムは図1中に符号14で示されている。図1に示されるように、スペクトル分解器10は、入力オーディオ信号10を時間領域からスペクトル領域に移すためにMDCTを使用することができる。特に、窓器(windower)16がスペクトル分解器12のMDCTモジュール18に先行して入力オーディオ信号12の互いに重複する部分を窓化し、窓化部分はMDCTモジュール18においてそれぞれ個別に変換され、スペクトログラム14の一連のスペクトルのスペクトルを得る。しかしながら、スペクトル分解器10は、あるいは、他のあらゆる厳格にサンプリングする重複変換等のエイリアシングを引き起こす他のあらゆる重複変換を使用してもよい。
さらに、図1のオーディオ符号器は、入力オーディオ信号12を分析して、そこから線形予測係数を導出する線形予測アナライザ20を備えている。図1のオーディオ符号器のスペクトル領域整形器22は、線形予測アナライザ20によってもたらされる線形予測係数に基づいて、スペクトログラム14の一連のスペクトルの電流スペクトルをスペクトル整形するよう構成されている。特に、スペクトル領域整形器22は、スペクトル領域整形器22に入力される電流スペクトルを、線形予測分析フィルタ伝達関数に対応する伝達関数に従ってスペクトル整形するよう構成されている。そのスペクトル整形は、アナライザ20からの線形予測係数をスペクトル加重値に変換し、その加重値を除数として適用して電流スペクトルをスペクトル形成又は整形することによって行われる。整形されたスペクトルは、図1のオーディオ符号器の量子化器24において量子化される。スペクトル領域整形器22での整形によって、復号器側での量子化スペクトルの逆整形(de-shaping)により生じる量子化ノイズはシフトされて隠され、すなわち、コーディングは可能な限り知覚的に透明になる。
時間領域ノイズ整形モジュール26はスペクトル分解器10からスペクトル領域整形器22に転送されるスペクトルを時間領域ノイズ整形してもよく、低周波数エンファシスモジュール28は量子化24の前にスペクトル領域整形器22によって出力された各整形スペクトルを適応的にフィルタリングしてもよいが、それは完全性の目的のためにすぎないことを留意すべきである
量子化され、スペクトル整形されたスペクトルは、スペクトル整形で使用された線形予測係数に関する情報と共にデータストリーム30に挿入され、その結果、復号化側では、逆整形と逆量子化(de-quantization)を実行することができる。
図1に示すオーディオコーデックのほとんどの構成要素は、TNSモジュール26の存在を除いて、例えば、新しいオーディオコーデックUSACにおいて、特に、そのTCXモード内で実施され、記述されている。したがって、さらに詳しくは、例えばUSAC規格、例えば非特許文献1を参照されたい。
それでも、線形予測アナライザ20に関しては、以下においてさらに説明する。図1に示すように、線形予測アナライザ20は、入力オーディオ信号12で直接動作する。プリエンファシスモジュール32は、例えば、FIRフィルタリングによって、入力オーディオ信号12をあらかじめフィルタリングし、その後、一続きの窓器34、自己相関器36、及びラグ窓器(lag windower)38によって自己相関が連続的に導出される。窓器34は、あらかじめフィルタリングされた入力オーディオ信号から、時間的に互いに重なる可能性のある窓化部分を形成する。自己相関器36は窓器34によって出力された窓化部分毎の自己相関を計算する。ラグ窓器38は、必須ではないが、ラグ窓関数を自己相関に適用し、以下の線形予測パラメータ推定アルゴリズムに対して自己相関をより適切にするように設けられている。特に、線形予測パラメータ推定器40は、ラグ窓出力を受け取り、例えば、Wiener-Levinson-Durbin又は他の適切なアルゴリズムを窓化した自己相関に実行し、自己相関毎の線形予測係数を導出する。スペクトル領域整形器22内では、導出された線形予測係数が、一連のモジュール42、44、46及び48を通過する。モジュール42は、データストリーム30内の線形予測係数に関する情報を、復号化側に転送する役割を担う。図1に示すように、線形予測係数データストリーム挿入器42は、線形予測アナライザ20によって決定された線形予測係数を、線スペクトル対(line spectral pair)領域又は線スペクトル周波数(line spectral frequency)領域において量子化するよう構成することができる。その量子化は、量子化された係数をデータストリーム30内に符号化すること、及び量子化された予測値を再びLPC係数に再変換することを含んでいる。線形予測係数に関する情報がデータストリーム30内に伝えられる更新率を減らすために、何らかの補間法を使用してもよい。したがって、スペクトル領域整形器22に入る電流スペクトルに関する線形予測係数に何らかの重み付け処理を行う役割を担う後続のモジュール44は、線形予測係数が復号化側でも利用可能なように線形予測係数にアクセスする、すなわち、量子化された線形予測係数にアクセスする。後続のモジュール46は、重み付けされた線形予測係数を、次いで周波数領域ノイズ整形器モジュール48によって適用されるスペクトル重み付けに変換し、周波数領域ノイズ整形器モジュール48が入力電流スペクトルをスペクトル整形する。
以上の説明から明らかになったように、アナライザ20によって実行される線形予測分析は、ブロック10及び22で実行されるスペクトル分解とスペクトル領域整形に完全に加算される経費を発生させ、そのため、計算に係る経費はかなり大きい。
図2は、コーディング効率は同等であるが、コーディングの複雑さを減少させた本出願の一実施形態によるオーディオ符号器を示す。
簡単に言うと、本出願の一実施形態を表す図2のオーディオ符号器では、図1の線形予測アナライザは、スペクトル分解器10とスペクトル領域整形器22との間に直列に接続された一連の自己相関コンピュータ50と線形予測係数コンピュータ52とによって置き換えられている。図1から図2への変形に対する動機づけと、モジュール50及び52の詳細な機能を明らかにする数学的説明を以下に述べる。しかしながら、自己相関及び自己相関前の窓化に含まれる一連の計算と比較した場合、複雑な計算は自己相関コンピュータ50の方が少ないことを考慮すると、図2のオーディオ符号器の計算経費が図1のオーディオ符号器と比較して減少することは明らかである。
図2の実施形態の詳細と数学的枠組みについて記述する前に、図2のオーディオ符号器の構造を簡単に説明する。特に、参照符号60を使用して概ね示される図2のオーディオ符号器は、入力オーディオ信号12を受信する入力62と、オーディオ符号器が入力オーディオ信号12を符号化するデータストリーム30を出力する出力64を備えている。スペクトル分解器10、時間領域ノイズ整形器26、スペクトル領域整形器22、低周波数エンファシス回路28及び量子化器24が、入力62と出力64との間に記載順に直列に接続されている。時間領域ノイズ整形器26と低周波数エンファシス回路28はオプションのモジュールであり、代替実施形態では取り去ってもよい。時間領域ノイズ整形器26は、設けるとすれば、適応的に作動可能に構成することができる。すなわち、時間領域ノイズ整形器26による時間領域ノイズ整形は入力オーディオ信号の特性に応じて作動又は停止することができ、例えば、以下でより詳細に説明するであろうように、決定の結果が、例えば、データストリーム30を介して復号化側に転送される
図2のスペクトル領域整形器22の内部は、図1に示すように、図1に関して記載したように構成されている。しかしながら、図2の内部構造は重要な問題と解釈されるべきではなく、スペクトル領域整形器22の内部構造は図2に示す構造と比べて完全には一致しないようにすることもできる。
図2の整形予測係数コンピュータ52は、自己相関コンピュータ50とスペクトル領域整形器22との間に直列接続されたラグ窓器38と線形予測係数推定器40を備えている。ラグ窓器は、例えば、オプションの機能でもあることに留意されたい。ラグ窓器を設けるならば、自己相関コンピュータ50によってもたらされる個々の自己相関にラグ窓器38によって適用される窓は、ガウス窓又は二項形状窓(binomial shaped window)としてもよい。線形予測係数推定器40に関し、必ずしも必要ではないが、Wiener-Levinson-Durbinアルゴリズムを使用することを留意されたい。線形予測係数を計算するために、別のアルゴリズムを使用してもよい。
自己相関コンピュータ50は、内部に、電力スペクトルコンピュータ54、スケールワーパー(scale warper)/スペクトル重み付け器56及び逆変換器58をこの順に含む一連の構成を備えている。一連のモジュール54から58の詳細及び有意性は、以下により詳細に記載する。
線形予測係数計算だけでなく整形器22内でのスペクトル領域ノイズ整形のためにも、分解器10のスペクトル分解を使用できる理由を理解するために、自己相関がDFTを使用して計算できることを示すWiener-Khinchinの定理を考慮すべきである。
Figure 0005625126
ここで、
Figure 0005625126
このように、Rmは、DFTがXkである信号の部分xnの自己相関の自己相関係数である。
したがって、スペクトル分解器10が重複変換を実施し、入力オーディオ信号12の一連のスペクトルを生成するためにDFTを使用する場合、自己相関計算器50は、概説したばかりのWiener-Khinchinの定理に従うことによって、その出力で自己相関の計算をより高速に行うことができる。
自己相関のすべてのラグmに対する値が必要とされる場合、スペクトル分解器10のDFTはFFTを使用して実行でき、逆FFTが自己相関コンピュータ50内で使用でき、説明したばかりの数式を使用して、そこから自己相関が導出される。しかしながら、M<<Nラグのみが必要とされる場合、スペクトル分解に対してFFTを使用し、逆DFTを直接適用して、関連する自己相関係数を得ることがより高速になるであろう。
上記のDFTがODFT、すなわち、奇数周波数DFTと置き換えられる場合、同じことが当てはまり、時系列xの一般化DFTは以下のように定義される。
Figure 0005625126
そして、
Figure 0005625126
が、ODFT(奇数周波数DFT)のために設定される。
しかしながら、図2の実施形態で、DFTやFFTではなくMDCTが使用される場合、事態が異なる。MDCTは、IV型の離散余弦変換を含み、実数値スペクトルを示すのみである。すなわち、この変換によって位相情報が失われる。MDCTは以下のように書き表すことができる。
Figure 0005625126
ここで、xn(n=0...2N−1)は、窓器16によって出力される入力オーディオ信号12の現在の窓化部分を定義し、それ故、Xkは、この窓化部分に対する結果としてのスペクトルのk番目のスペクトル係数である。
電力スペクトルコンピュータ54は、MDCTの出力から以下により各変換係数Xkを2乗することによって電力スペクトルを計算する。
Figure 0005625126
kによって定義されるMDCTスペクトルとODFTスペクトルXk ODFTとの間の関係は、以下のように書き表すことができる。
Figure 0005625126
これは、自己相関手順のためにMDCTを実行する自己相関コンピュータ50に対する入力としてODFTの代わりにMDCTを使用することは、以下のスペクトル重み付けをもってODFTから得られる自己相関と等価であることを意味する。
Figure 0005625126
求められる自己相関のこの歪みは、しかしながら、復号化側に対して透明である。それは、整形器22内のスペクトル領域整形がスペクトル分解器10の1つ、つまり、MDCTと全く同じスペクトル領域内で行われるからである。言い換えると、図2の周波数領域ノイズ整形器48による周波数領域ノイズ整形がMDCT領域で適用されるので、これは、スペクトル重み付けfk mdctがMDCTの変調を打ち消し、MDCTがODFTと置き換えられる場合に図1に示すような従来のLPCがもたらすものと同様の結果をもたらすことを事実上意味する。
したがって、自己相関コンピュータ50において、逆変換器58は逆ODFTを実行し、対称的な実数入力の逆ODFTはII型DCTに等しい。
Figure 0005625126
このように、これは、図2の自己相関コンピュータ50においてMDCTベースのLPCの高速計算を可能にし、逆変換器58の出力で逆ODFTによって決定された自己相関が、電力スペクトルコンピュータ54での先に概説した2乗計算、及び逆変換器58での逆ODFT等のほんの少数の計算ステップを必要とするだけであるので、比較的低い計算コストで得られる。
スケールワーパー/スペクトル重み付け器56に関する詳細はまだ記載していない。特に、このモジュールはオプションであり、取り去るか、周波数領域デシメータで置き換えることができる。モジュール56により行われ得る処理に関する詳細を以下に記載する。しかしながら、その前に、図2に示す他の要素の一部に関する詳細をいくつか概説する。例えば、ラグ窓器38に関し、ラグ窓器38は、推定器40によって実行される線形予測係数推定の条件を改善するためにホワイトノイズ補償を行うことができることに留意されたい。モジュール44で実行されるLPC重み付けはオプションであるが、もし実行される場合、実際の帯域拡大を実現するように実行することができる。すなわち、LPCの極は、例えば以下に従い、定数因子によって起点に向かって移動する。
Figure 0005625126
したがって、このように実行されるLPC重み付けは同時マスキングに近似する。定数γ=0.92、又は0.85から0.95(0.85と0.95を含む)の間である場合、良い結果をもたらす。
モジュール42に関して、線形予測係数に関する情報をデータストリーム30に符号化するために、可変ビットレートコーディング又は他の何らかのエントロピーコーディングスキームを使用できることに留意されたい。すでに上述のように、量子化はLSP/LSF領域において実行できるが、ISP/ISF領域も適している。
MDCT領域の場合、以下でMDCT利得と呼ばれるスペクトル加重値にLPCを変換するLPC−MDCTモジュール46に関し、例えばUSACコーデックを参照する。USACコーデックでは、この変換が詳細に説明されている。簡単に言うと、MDCT利得を得るためにLPC係数にODFTを使用することができ、次いで、MDCT利得の逆数は、モジュール48において重み付けをスペクトルの各帯域に適用することによってスペクトルを整形する際のその重み付けとして使用できる。例えば、16のLPC係数がMDCT利得に変換される。当然、MDCT利得の逆数を使用する重み付けの代わりに、MDCT利得を非反転形式で使用する重み付けを復号器側で使用することで、LPC合成フィルタに似た伝達関数を得て、すでに上述したように量子化ノイズを形成する。したがって、要約すると、モジュール46では、FDNS48で使用される利得は、ODFTを使用して線形予測係数から得られ、MDCTを使用する場合はMDCT利得と呼ばれる。
完全を期すために、図3は、オーディオ信号を再びデータストリーム30から再構築するために使用され得るオーディオ復号器のための1つの可能な実施態様を示す。図3の復号器は、オプションである低周波数デエンファシス回路80、スペクトル領域逆整形器82、これもオプションである時間ノイズ逆整形器84、スペクトル−時間領域変換器86を備え、これらは、データストリーム30が入力されるオーディオ復号器のデータストリーム入力88と再構成されたオーディオ信号が出力されるオーディオ復号器の出力90との間に直列接続されている。低周波数デエンファシス回路は、量子化されスペクトル整形されたスペクトルをデータストリーム30から受け取り、図2の低周波数エンファシス回路の伝達関数と逆のフィルタリングを実行する。しかしながら、すでに記載したように、デエンファシス回路80はオプションである。
スペクトル領域逆整形器82は、図2のスペクトル領域整形器22と非常に類似した構造を有する。特に、スペクトル領域逆整形器82は、その内部に、一連の、LPC抽出器92、LPC重み付け器44と同等のLPC重み付け器94、図2のモジュール46とまた同等であるLPC−MDCT変換器96、及び周波数領域ノイズ整形器98を備えている。周波数領域ノイズ整形器98は、図2のFDNS48とは逆に、入力した(非強調:de-emphasized)スペクトルにMDCT利得を適用して、すなわち、除法ではなく乗法により、LPC抽出器92によってデータストリーム30から抽出された線形予測係数の線形予測合成フィルタに対応する伝達関数を得る。LPC抽出器92は、対応する量子化領域、例えば、LSP/LSF又はISP/ISF等から上述の再変換を実行し、再構成されるオーディオ信号の連続した互いに重複する部分に対し、データストリーム30にコード化された個々のスペクトルに対する線形予測係数を得ることができる。
時間領域ノイズ整形器84は図2のモジュール26のフィルタリングを反転させる。これらのモジュールに対する可能な実施態様は、以下にさらに詳細に記載する。しかしながら、あらゆる場合において、図3のTNSモジュール84はオプションであり、図2のTNSモジュール26に関しても記載したように、取り去ることができる。
スペクトルコンポーザー86は、その内部に、逆変換器100と、それに続く重畳加算加算器(overlap-add adder)102などのエイリアシング相殺器を備えている。逆変換器100は、例えば、IMDCTを入力逆整形スペクトルに個別に実行する。重畳加算加算器102は、再変換器100によって出力された再構成窓化バージョンを正確に一時記録し、それらの間で時間エイリアシング相殺を実行し、再構成されたオーディオ信号を出力90に出力するよう構成されている。
すでに上述したように、データストリーム30内の伝達されたLPC係数によって定義されたLPC分析フィルタに対応する伝達関数によるスペクトル領域整形22によって、量子化器24での量子化、例えば、スペクトル的にフラットなノイズを有する量子化は、マスキング閾値未満が隠されるような方法により復号化側でスペクトル領域逆整形器82によって整形される。
TNSモジュール26、及び復号器、つまりモジュール84でのその反転を実施するために、さまざまな可能性が存在する。時間領域ノイズ整形は、スペクトル領域整形器によってスペクトル的に形成された個々のスペクトルが関連した時間部分内で時間に関してノイズを整形するためのものである。時間領域ノイズ整形は、電流スペクトルが関係する各時間部分内に過渡現象が発生している場合に特に有用である。特定の実施形態によれば、時間ノイズ整形器26は、スペクトル分解器10によってスペクトル次元に沿って出力された電流スペクトル又は一連のスペクトルを予測的にフィルタリングするよう構成されたスペクトル予測器として構成されている。すなわち、スペクトル予測器26もまた、データストリーム30に挿入できる予測フィルタ係数を決定することができる。これは、図2において点線で図示されている。結果として、時間ノイズがフィルタリングされたスペクトルは、スペクトル次元に沿って、スペクトル領域と時間領域との間の関係により平滑化され、送信された時間領域ノイズ整形予測に従い時間領域ノイズ逆整形器84内の逆フィルタリングによりデータストリーム30内でフィルタリングし、逆整形により、作用もしくは過渡現象が発生した時間内の雑音を隠蔽もしくは圧縮させる。いわゆるプレエコーは、それにより避けられる。
言い換えると、時間領域ノイズ整形器26で電流スペクトルを予測的にフィルタリングすることによって、時間領域ノイズ整形器26は、スペクトルリマインダー、すなわち、予測的にフィルタリングされたスペクトル取得する。その予測的にフィルタリングされたスペクトルはスペクトル領域整形器22に送られ、そこで、対応する予測係数がデータストリーム30に挿入される。次に、時間領域ノイズ逆整形器84は、スペクトル領域逆整形器82から逆整形されたスペクトルを受け取り、データストリーム30から受け取るか又は抽出した予測フィルタによりこのスペクトルを逆にフィルタリングすることによって、スペクトル領域に沿って時間領域フィルタリングを反転させる。言い換えると、時間領域ノイズ整形器26は、線形予測フィルタ等の分析予測フィルタを使用し、一方、時間領域ノイズ逆整形器84は、同じ予測係数に基づいて、対応する合成フィルタを使用する。
すでに述べたように、このオーディオ符号器は、電流スペクトルに対応するそれぞれの時間部分で、オーディオ入力信号12のフィルタ予測利得、調性又は過渡性に応じて、時間領域ノイズ整形を有効にするか又は無効にするかを決定するように構成することができる。この場合も、決定に関する各情報がデータストリーム30に挿入される。
以下に、ある可能性を説明する。その可能性では、自己相関コンピュータ50は、フィルタリングされなかったスペクトルではなく、図2に示すような予測的にフィルタリングされた、すなわち、TNSフィルタリングされたバージョンのスペクトルから自己相関を計算するよう構成されている。2つの可能性が存在する。すなわち、TNSフィルタリングされたスペクトルは、TNSが適用されたときは常に使用する場合と、オーディオ符号器によって、例えば、符号化される入力オーディオ信号12の特性に基づいて選択された方法で使用する場合である。したがって、図4のオーディオ符号器は、自己相関コンピュータ50の入力が、スペクトル分解器10の出力とTNSモジュール26の出力との両方に接続されているという点で、図2のオーディオ符号器と異なる。
すでに述べたように、スペクトル分解器10によって出力されTNSフィルタリングされたMDCTスペクトルは、コンピュータ50内での自己相関計算に対する入力又は基礎として使用することができる。すでに述べたように、TNSフィルタリングされたスペクトルは、TNSが適用される場合いつでも使用できるか、又は、オーディオ符号器が、TNSを適用したスペクトルに対し、フィルタリングされなかったスペクトルもしくはTNSフィルタリングされたスペクトルのどちらを使用するかを決定できる。前述のように、その決定は、オーディオ入力信号の特性に応じてすることができる。しかしながら、その決定は、周波数領域の逆整形に対してLPC係数情報を単に適用する復号器に対して透明とすることができる。他の可能性として、オーディオ符号器は、スペクトル分解器10の選択した変換長に応じて、TNSが適用されたスペクトルに対して、TNSフィルタリングされたスペクトルと、フィルタリングされなかったスペクトルとの間で切り替える、すなわち、これらのスペクトルに対するこれら2つの選択肢の間で決定をもたらすであろう。
より正確に言えば、図4の分解器10は、オーディオ入力信号をスペクトル的に分解する際に異なる変換長の間で切り替えるよう構成することができ、したがって、スペクトル分解器10によって出力されたスペクトルは、異なるスペクトル解像度となるであろう。すなわち、スペクトル分解器10は、異なる長さの互いに重複する時間部分を可変長の変換もしくはスペクトルに変換し、スペクトルの変換長が対応する重複時間部分の長さに対応するようにするために、例えば、MDCT等の重複変換を使用するであろう。その場合、自己相関コンピュータ50は、電流スペクトルのスペクトル解像度が所定の基準を満たす場合に、予測的フィルタリングもしくはTNSフィルタリングされた電流スペクトルから、又は、電流スペクトルのスペクトル解像度が所定の基準を満たさない場合に、予測的フィルタリングされていない、すなわちフィルタリングされていない電流スペクトルから、自己相関を計算するよう構成できる。所定の基準とは、例えば、電流スペクトルのスペクトル解像度が、何らかの閾値を超過することであるとすることできる。例えば、自己相関計算のためにTNSモジュール26によって出力されたTNSフィルタリングされたスペクトルを使用することは、より長いフレーム(時間部分)、例えば、15msより長いフレームに対して有益であるが、例えば、15msより短い短フレーム(時間部分)に対して不利になる可能性がある。したがって、より長いフレームに対する自己相関コンピュータ50への入力は、TNSフィルタリングされたMDCTスペクトルとすることができ、一方、より短いフレームに対し、分解器10によって出力されたMDCTスペクトルを直接使用することができる。
これまで、どの知覚関連の変形例が、モジュール56内の電力スペクトルに実行されるかをまだ記載していなかった。ここで、さまざまな処理を説明する。それらは、これまでに記載したあらゆる実施形態及び変形体に個別に、又は組み合わせて適用される。特に、スペクトル重み付けは、モジュール56によって、電力スペクトルコンピュータ54により出力される電力スペクトルに適用できる。スペクトル重み付けは、以下の式で可能となる。
Figure 0005625126
ここで、Skは、すでに上述した電力スペクトルの係数である。
スペクトル重み付けは、音響心理学的な見地に従って量子化ノイズを分配するための機構として使用することができる。図1に示したプリエンファシスに対応するスペクトル重み付けは、以下の式によって定義できる。
Figure 0005625126
さらに、スケールワーピングがモジュール56内で使用できる。フルスペクトルが、例えば、サンプル長l1のフレーム又は時間部分に対応するスペクトルに対してはM帯域に、サンプル長l2を有するフレームの時間部分に対応するスペクトルに対しては2M帯域に分割できる。その場合、l2はl1の2倍とし、l1は64、128又は256とすることができる。特に、その分割は以下の式に従うことができる。
Figure 0005625126
帯域分割は、以下の式によるバーク(Bark)スケールの近似値への周波数ワーピングを含むことができる。
Figure 0005625126
あるいは、帯域は、以下の式による線形スケールを形成するように等しく分配することができる。
Figure 0005625126
長さl1のフレームのスペクトルに対し、例えば、帯域の数を20から40の間とし、長さl2のフレームに属するスペクトルに対して帯域の数を48から72の間とすることができる。長さl1のフレームのスペクトルに対しては32帯域が、長さl2のフレームのスペクトルに対しては64帯域が好ましい。
オプションのモジュール56によって実行されることのあるスペクトル重み付け及び周波数ワーピングは、ビット割当て(量子化ノイズ整形)の手段と考えることができる。プリエンファシスに対応する線形スケールにおけるスペクトル重み付けは、定数μ=0.9又は0.8から0.95の間にある定数を使用して実行することができ、その結果、対応するプリエンファシスは、バークスケールワーピングにおおよそ対応する。
モジュール56内の電力スペクトルの変形は、電力スペクトルの拡散、及び同時マスキングのモデル化を含むことができ、したがって、LPC重み付けモジュール44及び94に代わることができる。
線形スケールを使用し、プリエンファシスに対応するスペクトル重み付けが適用された場合、復号化側、すなわち、図3のオーディオ復号器の出力で得られる図4のオーディオ符号器の結果は、図1の実施形態により得られる従来の再構築結果に知覚的に非常に類似する。
いくつかの試聴試験を上記の実施形態を使用して実行した。その試験から、図1に示す従来のLPC分析と、実施形態による線形スケールMDCTベースのLPC分析は、以下の場合、知覚的に同等の結果をもたすことが判明した。
・MDCTベースのLPC分析におけるスペクトル重み付けを、従来のLPC分析におけるプリエンファシスに対応させる。
・スペクトル分解内で、同じ窓化、、例えば低重複正弦窓等を使用する。
・MDCTベースのLPC分析で線形スケールを使用する。
従来のLPC分析と実施形態の線形スケールMDCTベースのLPC分析の間の無視できる違いは、おそらく、LPCが量子化ノイズ整形に対して使用されること、及びMDCT係数を十分正確に符号化するのに48kbit/sで十分であるということに由来する。
さらに、モジュール56内でスケールワーピングを適用することによってバークスケール又は非線形スケールを使用することは、コーディング効率又は試聴試験結果をもたらし、それによって、バークスケールは、試験オーディオ素片Applause、Fatboy、RockYou、Waiting、bohemian、fuguepremikres、kraftwerk、lesvoleurs、teardropに対し、線形スケールより優れていることが判明した。
バークスケールは、hockeyとlinchpinに対し、ひどく劣っている。バークスケールで問題のある他の項目はbibiloloであるが、特定のスペクトル構造を有するため、実験的音楽を提供する本試験に含まれていなかった。視聴者の中にも、bibilolo項目に強い嫌悪を表す者がいた。
しかしながら、図2と図4のオーディオ符号器は、異なるスケールの間で切り替えることが可能である。すなわち、モジュール56は、過渡性もしくは調性等のオーディオ信号の特性に応じて、異なるスペクトルに対し異なるスケールを適用すること、又は、異なる周波数スケールを使用して、複数の量子化された信号ならびに測定値を生成し、どの量子化された信号が知覚的に最も適しているかを判断することが可能であった。スケール切替えは、非切替えバージョン(バークスケール及び線形スケール)の両方と比較した場合、RockYou及びlinchpinにおける過渡現象等の過渡現象のもとで改善をもたらすということが判明した。
上述の実施形態はACELPをサポートするコーデック等のマルチモードオーディオコーデックにおいてTCXモードとして使用することができ、さらに上記実施形態はTCX類似モードとして使用することができることに注意すべきである。1つの構成として、一定長、例えば20msのフレームを使用することができる。このようにして、非常に効果的なUSACコーデックのある種の低遅延バージョンが得られる。TNSとして、AAC−ELDからのTNSを使用することができる。サイド情報に対して使用されるビット数を減らすために、フィルタ数を、一方は600Hzから4500Hzまでで動作し、他方は4500Hzからコアコーダ(core coder)のスペクトルの端までで動作する2つに固定することができる。それらのフィルタは、独立してオンとオフを切り替えることができる。それらのフィルタを適用し、PARCOR係数を使用する格子として伝送することができる。フィルタの最大次数は8に設定することができ、フィルタ係数毎に4ビットを使用することができる。Huffmanコーディングを使用して、フィルタの次数及びその係数に対して使用されるビット数を減らすことができる。
いくつかの態様を装置に関する文脈で記載してきたが、これらの態様はまた、対応する方法の記述も意味し、その対応する方法では、ブロック又はデバイスが、方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップに関する文脈で記載した態様もまた、対応するブロックもしくは項目、又は対応する装置の特徴に関する記述も意味する。一部又はすべての方法ステップは、ハードウェア装置、例えば、マイクロプロセッサ、プログラマブルコンピュータもしくは電子回路等によって(又は使用して)実行することができる。いくつかの実施形態において、いずれか1つ又は複数の最も重要な方法ステップは、そのような装置によって実行することができる。
ある種の実施の要請に応じて、本発明の実施形態はハードウェア又はソフトウェアで実行することができる。その実施は、デジタルストレージメディア、例えば、フロッピーディスク、DVD、Blu−Ray、CD、ROM、PROM、EPROM、EEPROM、又はフラッシュメモリを使用して実行することができる。それらのデジタルストレージメディアは、そこに格納される電子的読取り可能制御信号を有し、それぞれの方法を実行するようにプログラマブルコンピュータシステムと協働する(又は、協働することが可能である)。したがって、デジタルストレージメディアは、コンピュータ読取り可能なものとすることができる。
本発明によるいくつかの実施形態は、本明細書に記載した方法の1つを実行するようにプログラマブルコンピュータシステムと協働することを可能にする電子的に読取り可能な制御信号を有するデータキャリアを含む。
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施することができ、そのプログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるとき、本発明の方法の1つを実行するよう動作する。そのプログラムコードは、例えば、機械読取り可能キャリアに格納することができる。
他の実施形態は、本明細書に記載した方法の1つを実行するための、機械読取り可能キャリアに格納されたコンピュータプログラムを含む。
言い換えると、したがって、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されるとき、本明細書に記載した方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載した方法の1つを実行するためのコンピュータプログラムを記録して備えるデータキャリア(又はデジタルストレージメディア、又はコンピュータ読込み可能なメディア)である。データキャリア、デジタルストレージメディア又は記録メディアは、典型的には有形及び/又は非遷移性(non-transitionary)である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載した方法の1つを実行するためのコンピュータプログラムを表すデータストリーム又は一連の信号である。データストリーム又は一連の信号は、例えば、データ通信接続、例えばインターネットを介して転送されるように構成することができる。
さらなる実施形態は、本明細書に記載した方法の1つを実行するよう構成されているか又は適合されている処理手段、例えば、コンピュータ又はプログラマブル論理デバイスを含む。
さらなる実施形態は、本明細書に記載した方法の1つを実行するためのコンピュータプログラムをインストールしているコンピュータを含む。
本発明によるさらなる実施形態は、本明細書に記載した方法の1つを実行するためのコンピュータプログラムを、受信器に(例えば、電子的に又は光学的に)転送するよう構成された装置又はシステムを含む。受信器は、例えば、コンピュータ、モバイルデバイス、メモリデバイス等とすることができる。本装置もしくはシステムは、例えば、コンピュータプログラムを受信器に転送するファイルサーバを備えることができる。
いくつかの実施形態において、本明細書に記載した方法の機能のいくつか又は全てを実行するために、プログラマブル論理デバイス(例えばフィールド・プログラマブル・ゲートアレイ)を用いることができる。いくつかの実施形態において、フィールド・プログラマブル・ゲートアレイは、本明細書に記載した方法の1つを実行するためにマイクロプロセッサと協働することができる。概して、本方法は、好ましくは、あらゆるハードウェア装置によって実行される。
上記の実施形態は、単に本発明の原理を例示するものである。当業者には、本明細書に記載した構成及び詳細の修正ならびに変形が明らかであることが理解されよう。したがって、本明細書における実施形態の記述及び説明によって提示された特定の詳細ではなく、添付の特許請求の範囲によってのみ限定されるべきものである。

Claims (13)

  1. オーディオ符号器であって、
    MDCTを用いて、オーディオ入力信号(12)を一連のスペクトルからなるスペクトログラム(14)にスペクトル分解するためのスペクトル分解器(10)と、
    前記一連のスペクトルの電流スペクトルから自己相関を計算するよう構成された自己相関コンピュータ(50)と、
    前記自己相関に基づいて線形予測係数を計算するように構成された線形予測係数コンピュータ(52)と、
    前記線形予測係数に基づいて前記電流スペクトルをスペクトル整形するよう構成されたスペクトル領域整形器(22)と、
    前記スペクトル整形されたスペクトルを量子化するよう構成された量子化段階(24)と、を備え、
    該オーディオ符号器は、前記スペクトル整形され量子化されたスペクトルに関する情報及び前記線形予測係数に関する情報をデータストリームに挿入するよう構成されており、
    前記自己相関コンピュータは、前記電流スペクトルから前記自己相関を計算する際、前記電流スペクトルから電力スペクトルを計算し、前記電力スペクトルを逆ODFT変換するように構成されているオーディオ符号器。
  2. スペクトル次元に沿って前記電流スペクトルに予測的フィルタリングを施すよう構成されたスペクトル予測器(26)をさらに備え、
    前記スペクトル領域整形器は、前記予測的フィルタリングが施された電流スペクトルをスペクトル整形するよう構成され、
    該オーディオ符号器は、前記予測的フィルタリングを反転する方法に関する情報を前記データストリームに挿入するよう構成されている請求項1に記載のオーディオ符号器。
  3. 前記スペクトル予測器は、前記スペクトル次元に沿って前記電流スペクトルに線形予測フィルタリングを実行するよう構成され、
    該オーディオ符号器は、前記予測的フィルタリングを反転する方法に関する前記情報が、前記スペクトル次元に沿った前記電流スペクトルへの前記線形予測フィルタリングの基礎をなすさらなる線形予測係数に関する情報を含むように構成されている請求項2に記載のオーディオ符号器。
  4. 該オーディオ符号器は、オーディオ入力信号の調性もしくは過渡性又はフィルタ予測利得に応じて、前記スペクトル予測器を有効にするか又は無効にするかを決定するよう構成され、
    該オーディオ符号器は前記決定に関する情報を前記データストリームに挿入するよう構成されている請求項2又は3に記載のオーディオ符号器。
  5. 前記自己相関コンピュータは、前記予測的フィルタリングが施された電流スペクトルから前記自己相関を計算するよう構成されている請求項2から4のいずれか一項に記載のオーディオ符号器。
  6. 前記スペクトル分解器(10)は、前記オーディオ入力信号(12)をスペクトル分解する際に前記スペクトルが異なるスペクトル解像度となるように異なる変換長の間で切り替えるように構成されており、
    前記自己相関コンピュータ(50)は、前記電流スペクトルのスペクトル解像度が所定の基準を満たす場合に前記予測的フィルタリングが施された電流スペクトルから、又は前記電流スペクトルの前記スペクトル解像度が前記所定の基準を満たさない場合に前記予測的フィルタリングが施されていない電流スペクトルから、前記自己相関を計算するよう構成されている請求項2から5のいずれか一項に記載のオーディオ符号器。
  7. 前記自己相関コンピュータは、前記電流スペクトルの前記スペクトル解像度がスペクトル解像度の閾値より高い場合に前記所定の基準を満たすように構成されている請求項6に記載のオーディオ符号器。
  8. 前記自己相関コンピュータは、前記電流スペクトルから前記自己相関を計算する際、前記電力スペクトルを知覚的に重み付けし、前記電力スペクトルを知覚的に重み付けされた通りに前記逆ODFT変換するように構成されている請求項1から7のいずれか一項に記載のオーディオ符号器。
  9. 前記自己相関コンピュータは、前記電流スペクトルの周波数スケールを変更し、前記変更した周波数スケールにおいて前記電力スペクトルの前記知覚的重み付けを実行するように構成されている請求項8に記載のオーディオ符号器。
  10. 該オーディオ符号器は、前記線形予測係数に関する前記情報を量子化された形式で前記データストリームに挿入するよう構成されており、
    前記スペクトル領域整形器は、前記量子化された線形予測係数に基づいて前記電流スペクトルをスペクトル整形するよう構成されている請求項1から9のいずれか一項に記載のオーディオ符号器。
  11. 該オーディオ符号器は、前記線形予測係数に関する前記情報を、前記線形予測係数の量子化をLSF領域又はLSP領域において実行する場合に従う形式で前記データストリームに挿入するよう構成されている請求項10に記載のオーディオ符号器。
  12. オーディオ符号化方法であって、
    MDCTを用いて、オーディオ入力信号(12)を、一連のスペクトルからなるスペクトログラム(14)にスペクトル分解することと、
    前記一連のスペクトルの電流スペクトルから自己相関を計算することと、
    前記自己相関に基づいて線形予測係数を計算することと、
    前記線形予測係数に基づいて前記電流スペクトルをスペクトル整形することと、
    前記スペクトル整形されたスペクトルを量子化することと、
    前記スペクトル整形され量子化されたスペクトルに関する情報及び前記線形予測係数に関する情報をデータストリームに挿入することと、を含み、
    前記電流スペクトルから前記自己相関をの求める前記計算は、前記電流スペクトルから電力スペクトルを計算すること、及び前記電力スペクトルを逆ODFT変換することを踏むオーディオ符号化方法。
  13. コンピュータ請求項12による方法を実行させるためのコンピュータプログラム。
JP2013553901A 2011-02-14 2012-02-14 スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム Active JP5625126B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052455 WO2012110476A1 (en) 2011-02-14 2012-02-14 Linear prediction based coding scheme using spectral domain noise shaping

Publications (2)

Publication Number Publication Date
JP2014510306A JP2014510306A (ja) 2014-04-24
JP5625126B2 true JP5625126B2 (ja) 2014-11-12

Family

ID=71943596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013553901A Active JP5625126B2 (ja) 2011-02-14 2012-02-14 スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム

Country Status (19)

Country Link
US (1) US9595262B2 (ja)
EP (1) EP2676266B1 (ja)
JP (1) JP5625126B2 (ja)
KR (1) KR101617816B1 (ja)
CN (1) CN103477387B (ja)
AR (1) AR085794A1 (ja)
AU (1) AU2012217156B2 (ja)
BR (2) BR112013020592B1 (ja)
CA (1) CA2827277C (ja)
ES (1) ES2534972T3 (ja)
HK (1) HK1192050A1 (ja)
MX (1) MX2013009346A (ja)
MY (1) MY165853A (ja)
PL (1) PL2676266T3 (ja)
RU (1) RU2575993C2 (ja)
SG (1) SG192748A1 (ja)
TW (1) TWI488177B (ja)
WO (1) WO2012110476A1 (ja)
ZA (1) ZA201306840B (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2311034B1 (en) * 2008-07-11 2015-11-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
CA2777073C (en) * 2009-10-08 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
EP2707873B1 (en) * 2011-05-09 2015-04-08 Dolby International AB Method and encoder for processing a digital stereo audio signal
CA2899542C (en) 2013-01-29 2020-08-04 Guillaume Fuchs Noise filling without side information for celp-like coders
HRP20240674T1 (hr) * 2014-04-17 2024-08-16 Voiceage Evs Llc Postupci, koder i dekoder za linearno prediktivno kodiranje i dekodiranje zvučnih signala pri prijelazu između okvira koji imaju različitu brzinu uzorkovanja
ES2738723T3 (es) * 2014-05-01 2020-01-24 Nippon Telegraph & Telephone Dispositivo de generación de secuencia envolvente combinada periódica, método de generación de secuencia envolvente combinada periódica, programa de generación de secuencia envolvente combinada periódica y soporte de registro
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
US10310826B2 (en) * 2015-11-19 2019-06-04 Intel Corporation Technologies for automatic reordering of sparse matrices
EP3405950B1 (en) * 2016-01-22 2022-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Stereo audio coding with ild-based normalisation prior to mid/side decision
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
ES2971838T3 (es) 2018-07-04 2024-06-10 Fraunhofer Ges Forschung Codificación de audio multiseñal utilizando el blanqueamiento de señal como preprocesamiento
US11527252B2 (en) 2019-08-30 2022-12-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. MDCT M/S stereo
MX2023000340A (es) 2020-07-07 2023-02-09 Fraunhofer Ges Forschung Decodificador de audio, codificador de audio y metodos relacionados que utilizan codificacion conjunta de parametros de escala para canales de una se?al de audio multicanal.

Family Cites Families (211)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69232202T2 (de) 1991-06-11 2002-07-25 Qualcomm, Inc. Vocoder mit veraendlicher bitrate
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
CN1090409C (zh) 1994-10-06 2002-09-04 皇家菲利浦电子有限公司 采用不同编码原理的传送系统
EP0720316B1 (en) * 1994-12-30 1999-12-08 Daewoo Electronics Co., Ltd Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5754733A (en) * 1995-08-01 1998-05-19 Qualcomm Incorporated Method and apparatus for generating and encoding line spectral square roots
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
JP4024427B2 (ja) * 1999-05-24 2007-12-19 株式会社リコー 線形予測係数抽出装置、線形予測係数抽出方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003501925A (ja) 1999-06-07 2003-01-14 エリクソン インコーポレイテッド パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
ES2269112T3 (es) 2000-02-29 2007-04-01 Qualcomm Incorporated Codificador de voz multimodal en bucle cerrado de dominio mixto.
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
US6636830B1 (en) 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7901873B2 (en) 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7206739B2 (en) 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
DE10200653B4 (de) 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
US20040010329A1 (en) 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
EP1543307B1 (en) * 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
CN1703736A (zh) 2002-10-11 2005-11-30 诺基亚有限公司 用于源控制可变比特率宽带语音编码的方法和装置
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463559B1 (ko) 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
AU2003208517A1 (en) 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
KR100556831B1 (ko) 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
DE10321983A1 (de) 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
ES2354427T3 (es) 2003-06-30 2011-03-14 Koninklijke Philips Electronics N.V. Mejora de la calidad de audio decodificado mediante la adición de ruido.
DE10331803A1 (de) 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US6987591B2 (en) 2003-07-17 2006-01-17 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada Volume hologram
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
US7418396B2 (en) 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
WO2005073959A1 (en) 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
EP2770694A1 (en) 2004-02-12 2014-08-27 Core Wireless Licensing S.a.r.l. Classified media quality of experience
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
CN1930607B (zh) 2004-03-05 2010-11-10 松下电器产业株式会社 差错隐藏装置以及差错隐藏方法
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CA2566368A1 (en) 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
JP4168976B2 (ja) 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
WO2006079348A1 (en) 2005-01-31 2006-08-03 Sonorit Aps Method for generating concealment frames in communication system
JP4519169B2 (ja) 2005-02-02 2010-08-04 富士通株式会社 信号処理方法および信号処理装置
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
WO2006136901A2 (en) 2005-06-18 2006-12-28 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
FR2888699A1 (fr) 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US20070174047A1 (en) 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007083931A1 (en) * 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
CN101371295B (zh) 2006-01-18 2011-12-21 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
EP1852848A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
JP2009539132A (ja) * 2006-05-30 2009-11-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号の線形予測符号化
US7959940B2 (en) 2006-05-30 2011-06-14 Advanced Cardiovascular Systems, Inc. Polymer-bioceramic composite implantable medical devices
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
EP2040251B1 (en) 2006-07-12 2019-10-09 III Holdings 12, LLC Audio decoding device and audio encoding device
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
CN101512633B (zh) 2006-07-24 2012-01-25 索尼株式会社 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
EP2054876B1 (en) 2006-08-15 2011-10-26 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8126721B2 (en) 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
EP3288027B1 (en) 2006-10-25 2021-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating complex-valued audio subband values
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
JP5171842B2 (ja) 2006-12-12 2013-03-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8364472B2 (en) 2007-03-02 2013-01-29 Panasonic Corporation Voice encoding device and voice encoding method
JP5241701B2 (ja) 2007-03-02 2013-07-17 パナソニック株式会社 符号化装置および符号化方法
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
DE102007013811A1 (de) 2007-03-22 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
EP2157573B1 (en) 2007-04-29 2014-11-26 Huawei Technologies Co., Ltd. An encoding and decoding method
CN101743586B (zh) 2007-06-11 2012-10-17 弗劳恩霍夫应用研究促进协会 音频编码器、编码方法、解码器、解码方法
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CA2698039C (en) 2007-08-27 2016-05-17 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity spectral analysis/synthesis using selectable time resolution
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8566106B2 (en) 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
AU2009221443B2 (en) 2008-03-04 2012-01-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
MY181231A (en) 2008-07-11 2020-12-21 Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
EP2144171B1 (en) 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
PL2301020T3 (pl) 2008-07-11 2013-06-28 Fraunhofer Ges Forschung Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu
CA2836871C (en) 2008-07-11 2017-07-18 Stefan Bayer Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8380498B2 (en) 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
CN102177426B (zh) 2008-10-08 2014-11-05 弗兰霍菲尔运输应用研究公司 多分辨率切换音频编码/解码方案
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
UA99878C2 (ru) 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
AR075199A1 (es) 2009-01-28 2011-03-16 Fraunhofer Ges Forschung Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
EP2234103B1 (en) 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
EP3764356A1 (en) 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
JP5267362B2 (ja) 2009-07-03 2013-08-21 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
US8635357B2 (en) 2009-09-08 2014-01-21 Google Inc. Dynamic selection of parameter sets for transcoding media data
WO2011048117A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
BR112012009490B1 (pt) 2009-10-20 2020-12-01 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados
BR122020024236B1 (pt) 2009-10-20 2021-09-14 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio e programa de computador para uso em aplicações de baixo retardamento
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8793126B2 (en) 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
TW201214415A (en) 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
EP3373296A1 (en) 2011-02-14 2018-09-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
WO2013075753A1 (en) 2011-11-25 2013-05-30 Huawei Technologies Co., Ltd. An apparatus and a method for encoding an input signal

Also Published As

Publication number Publication date
WO2012110476A1 (en) 2012-08-23
KR20130133848A (ko) 2013-12-09
HK1192050A1 (en) 2014-08-08
ZA201306840B (en) 2014-05-28
MY165853A (en) 2018-05-18
US9595262B2 (en) 2017-03-14
BR112013020592A2 (pt) 2016-10-18
ES2534972T3 (es) 2015-04-30
CN103477387B (zh) 2015-11-25
EP2676266A1 (en) 2013-12-25
BR112013020592B1 (pt) 2021-06-22
BR112013020587B1 (pt) 2021-03-09
RU2013142133A (ru) 2015-03-27
EP2676266B1 (en) 2015-03-11
JP2014510306A (ja) 2014-04-24
SG192748A1 (en) 2013-09-30
BR112013020587A2 (pt) 2018-07-10
RU2575993C2 (ru) 2016-02-27
CA2827277A1 (en) 2012-08-23
CN103477387A (zh) 2013-12-25
AU2012217156B2 (en) 2015-03-19
KR101617816B1 (ko) 2016-05-03
MX2013009346A (es) 2013-10-01
AR085794A1 (es) 2013-10-30
AU2012217156A1 (en) 2013-08-29
TWI488177B (zh) 2015-06-11
PL2676266T3 (pl) 2015-08-31
US20130332153A1 (en) 2013-12-12
CA2827277C (en) 2016-08-30
TW201246189A (en) 2012-11-16

Similar Documents

Publication Publication Date Title
JP5625126B2 (ja) スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
EP2676268B1 (en) Apparatus and method for processing a decoded audio signal in a spectral domain
EP2951814B1 (en) Low-frequency emphasis for lpc-based coding in frequency domain
JP2013508761A (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
AU2013283568B2 (en) Linear prediction based audio coding using improved probability distribution estimation
WO2011044700A1 (en) Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
RU2762301C2 (ru) Устройство и способ для кодирования и декодирования аудиосигнала с использованием понижающей дискретизации или интерполяции масштабных параметров

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140929

R150 Certificate of patent or registration of utility model

Ref document number: 5625126

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250