JP6110314B2 - 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法 - Google Patents
整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法 Download PDFInfo
- Publication number
- JP6110314B2 JP6110314B2 JP2013553900A JP2013553900A JP6110314B2 JP 6110314 B2 JP6110314 B2 JP 6110314B2 JP 2013553900 A JP2013553900 A JP 2013553900A JP 2013553900 A JP2013553900 A JP 2013553900A JP 6110314 B2 JP6110314 B2 JP 6110314B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- frame
- window
- predictive
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 52
- 230000005236 sound signal Effects 0.000 title claims description 29
- 238000004458 analytical method Methods 0.000 claims description 162
- 230000003595 spectral effect Effects 0.000 claims description 55
- 238000003786 synthesis reaction Methods 0.000 claims description 33
- 230000015572 biosynthetic process Effects 0.000 claims description 32
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 239000002131 composite material Substances 0.000 claims description 24
- 230000007704 transition Effects 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 2
- 238000001831 conversion spectrum Methods 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 238000013139 quantization Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000010410 layer Substances 0.000 description 6
- 230000005284 excitation Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 239000012792 core layer Substances 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Description
オーバーラップ加算手順は、オーバーラップ部分、すなわち、現在フレームに対する窓の第3の部分及び次のフレームに対する窓の第1の部分に対してのみ有用である。また、オーバーラップ加算手順は、単純なMDCTにおけるように、1つのブロックから他のブロックまで連続的なフェードイン/フェードアウトをもつように実行され、従来の技術において、用語「タイム・ドメイン・エイリアシング・キャンセル(TDAC)」としても知られているMDCTの厳密にサンプリングされた性質によって、ビットレートを高める必要なしに、最終的に良好なオーディオ品質を得る。
よって、ブロック401〜404で他の計算に使用されるLPCデータのみならずブロック406で使用されるLPCデータは、常に、LPC分析窓あたり16個の元のLPC係数から得られた量子化され再び逆量子化されたISPデータであることが好ましい。
ピー符号化によってさらに処理される。
遅延と品質の間での良好な妥協は20msのフレーム長をもつ交換型のオーディオエンコーダ又はオーディオデコーダによって得ることができることが分かっているが、フレーム長に対する15〜30msという値も受容できる結果を与えることも分かっている。一方で、こと遅延に関しては、ルックアヘッド部分の10msは受容できるが、5〜20msの値も対応する応用次第では有用であることが分かっている。さらに、ルックアヘッド部分とフレーム長との関係は、値0.5をもつ場合に有用であるが、0.4〜0.6の間の他の値も有用であることが分かっている。また、本発明は、一方でACELP、他方でMDCT−TCXについて説明しているが、CELPや任意の他の予測アルゴリズム又は波形アルゴリズムなどの時間ドメインで動作する他のアルゴリズムも同様に有用であることが分かっている。TCX/MDCTに関しては、MDSTなどの他の変換ドメイン符号化アルゴリズムや他の変換ベースのアルゴリズムも同様に適用可能である。
Claims (25)
- オーディオサンプルのストリームをもつオーディオ信号(100)を符号化するための装置であって、
予測分析のための第1の窓化データ(110a)を取得するために前記オーディオサンプルのストリームに予測符号化分析窓(200)を適用し、変換分析のための第2の窓化データ(110b)を取得するために前記オーディオサンプルのストリームに変換符号化分析窓(204)を適用する窓化器(102)を備えており、
前記変換符号化分析窓は、オーディオサンプルの現在フレーム内のオーディオサンプルと、変換符号化ルックアヘッド部分(206)である、オーディオサンプルの将来フレームの所定部分のオーディオサンプルとに関連づけられており、
前記予測符号化分析窓は、前記現在フレームのオーディオサンプルの少なくとも一部と、予測符号化ルックアヘッド部分(208)である、前記将来フレームの所定部分のオーディオサンプルとに関連づけられており、
前記変換符号化ルックアヘッド部分(206)と前記予測符号化ルックアヘッド部分(208)は互いに一致しているか、又は互いから前記予測符号化ルックアヘッド部分(208)の時間長の20%未満だけ、もしくは前記変換符号化ルックアヘッド部分(206)の時間長の20%未満だけ異なっており、
該装置は、さらに、前記予測分析のための前記窓化データを用いて前記現在フレームのための予測符号化データを生成し、又は、前記変換分析のための前記窓化データを用いて前記現在フレームのための変換符号化データを生成するための符号化プロセッサ(104)を備え、
前記符号化プロセッサ(104)は、
予測分析ための第1の窓化データ(110a)から前記現在フレームのための予測符号化データを得るための予測符号化分析器(302)と、
予測符号化ブランチであって、前記予測符号化データを用いて前記現在フレームのための前記オーディオサンプルからフィルタデータを計算するフィルタステージ(304)、及び前記現在フレームのための前記予測符号化データを生成するために前記符号化プロセッサが動作するときに、前記現在フレームのための予測符号化パラメータを計算する予測符号器パラメータ計算器(306)を含む予測符号化ブランチと、
変換符号化ブランチであって、変換符号化アルゴリズムのための第2の窓化データ(110b)をスペクトル表示へ変換するための時間スペクトル変換器(310)、重み付けされたスペクトルデータを得るために前記予測符号化データから得られた重み付けされた重み付けデータを用いて前記スペクトルデータを重み付けするスペクトル重み付け器(312)、及び前記現在フレームのための前記予測符号化データを生成するために前記符号化プロセッサが動作するときに、前記現在フレームのための変換符号化データを取得するために前記重み付けされたスペクトルデータを処理するスペクトルデータプロセッサ(314)を含む変換符号化ブランチと、を含んでいる装置。 - 前記変換符号化分析窓(204)は前記変換符号化ルックアヘッド部分(206)に隣接する非オーバーラップ部(209)を含む請求項1に記載の装置。
- 前記変換符号化分析窓(204)が前記現在フレームの最初でスタートし前記非オーバーラップ部の最初で終了する更なるオーバーラップ部(210)を含む請求項2に記載の装置。
- 前記窓化器(102)は、1つのフレームから次のフレームへの予測符号化から変換符号化への遷移のためにだけスタート窓(220、222)を使用し、
1つのフレームから次のフレームへの変換符号化から予測符号化への遷移のためには前記スタート窓を使用しないように構成されている請求項1に記載の装置。 - 前記現在フレームのための符号化された信号を出力するための出力インターフェース(106)と、
前記符号化プロセッサ(104)を制御して前記現在フレームのために予測符号化データ又は変換符号化データのいずれかを出力する符号化モード選択器(112)と、をさらに備え、
前記符号化モード選択器(112)は、フレーム全体のために予測符号化又は変換符号化を切り換えるだけで、前記フレーム全体のための前記符号化された信号が予測符号化データ又は変換符号化データのいずれかを含むように構成されている請求項1から4のいずれか一項に記載の装置。 - 前記窓化器(102)は、前記予測符号化分析窓のほかに、前記現在フレームの最初に配置されたオーディオサンプルに関連づけられる更なる予測符号化分析窓(202)を使用し、前記予測符号化分析窓(200)は前記現在フレームの最初に配置されたオーディオサンプルに関連づけられない請求項1から5のいずれか一項に記載の装置。
- 前記現在フレームが複数のサブフレームを含み、前記予測符号化分析窓(200)は1つのサブフレーム中心に中心合わせされ、前記変換符号化分析窓(204)が2つのサブフレームの境界に中心合わせされている請求項1から6のいずれか一項に記載の装置。
- 前記予測符号化分析窓(200)は前記現在フレームの最後のサブフレーム中心に中心合わせされ、更なる予測符号分析窓(202)は前記現在フレームの第2のサブフレーム中心に中心合わせされ、前記変換符号化分析窓は前記現在フレームの第3のサブフレームと第4のサブフレームの境界に中心合わせされ、前記現在フレームが4つのサブフレームに再分割されている請求項7に記載の装置。
- 前記将来フレーム内にルックアヘッド部分をもたず前記現在フレームのサンプルに関連づけられる更なる予測符号化分析窓(202)を使用する請求項1から8のいずれか一項に記載の装置。
- 前記変換符号化分析窓は、前記変換符号化分析窓の全時間長が前記現在フレームの時間長の2倍になるように、前記変換符号化分析窓の始まりの前のゼロ部と、前記変換符号化分析窓の終わりに続くゼロ部をさらに含む請求項1から9のいずれか一項に記載の装置。
- 1つのフレームから次のフレームへの予測符号化モードから変換符号化モードへの遷移に対し、遷移窓が前記窓化器(102)によって使用され、
前記遷移窓は前記現在フレームの最初でスタートする第1の非オーバーラップ部分と、前記第1の非オーバーラップ部分の最後でスタートし前記将来フレームへ広がる第2のオーバーラップ部分とを含み、
前記将来フレームへ広がる前記第2のオーバーラップ部分の長さは前記変換符号化分析窓の前記変換符号化ルックアヘッド部分(206)の長さに一致している請求項10に記載の装置。 - 前記変換符号化分析窓の時間長は前記予測符号化分析窓(200、202)の時間長より大である請求項1から11のいずれか一項に記載の装置。
- 前記現在フレームに対して符号化された信号を出力するための出力インタフェース(106)と、
前記符号化プロセッサ(104)を制御して前記現在フレームに対して予測符号化データ又は変換符号化データのいずれかを出力する符号化モード選択器(112)と、
をさらに含み、
前記窓化器(102)は、前記予測符号化分析窓の前で前記現在フレームに配置されている更なる予測符号化窓を使用するように構成されており、
前記符号化モード選択器(112)は、前記変換符号化データが出力インターフェースへ出力されたとき、前記予測符号化窓から得られた予測符号化分析データのみは転送するが前記更なる予測符号化窓から得られた予測符号化分析データを転送しないように前記符号化プロセッサ(104)を制御するように構成されており、
前記符号化モード選択器(112)は、前記予測符号化データが前記出力インターフェースに出力されたとき、前記予測符号化窓から得られた予測符号化分析データを転送し前記更なる予測符号化窓から得られた前記予測符号化分析データも転送するように前記符号化プロセッサ(104)を制御するように構成されている請求項1から4及び6から12のうちのいずれか一項に記載の装置。 - オーディオサンプル(100)のストリームをもつオーディオ信号を符号化するための方法であって、
予測分析用の第1の窓化データ(110a)を取得するためにオーディオサンプルストリームに予測符号化分析窓(200)を適用し、変換分析用の第2の窓化データ(110b)を取得するために前記オーディオサンプルストリームに変換符号化分析窓(204)を適用するステップ(102)を含み、
前記変換符号化分析窓はオーディオサンプルの現在フレーム内のオーディオサンプルと、変換符号化ルックアヘッド部分(206)である、オーディオサンプルの将来フレームの所定部分のオーディオサンプルに関連づけられ、
前記予測符号化分析窓は前記現在フレームのオーディオサンプルの少なくとも一部と、予測符号化ルックアヘッド部分(208)である、前記将来フレームの所定部分のオーディオサンプルに関連づけられ、
前記変換符号化ルックアヘッド部分(206)と前記予測符号化ルックアヘッド部分(208)は互いに一致しているか、又は互いから前記予測符号化ルックアヘッド部分(208)の時間長の20%未満だけ、もしくは前記変換符号化ルックアヘッド部分(206)の時間長の20%未満だけ異なっており、
該方法は、さらに、前記予測分析用の前記第1の窓化データ(110a)を用いて前記現在フレームのための予測符号化データを生成するか、又は前記変換分析用の前記第2の窓化データ(110b)を用いて前記現在フレームのための変換符号化されたデータを生成するステップ(104)を含み、
前記生成するステップ(104)は、
前記予測分析用の前記第1の窓化データ(110a)から前記現在フレームのための予測符号化データを導出するステップ(302)と、
前記予測符号化データを用いて前記現在フレームのための前記オーディオサンプルからフィルタデータを計算するステップ(304)、及び前記生成するステップ(104)が前記現在フレームのための前記予測符号化データを生成することを含む場合に、前記現在フレームのための予測符号化パラメータを計算するステップ(306)、又は
前記変換分析用の前記第2の前記窓化データ(110b)をスペクトル表示へ変換するステップ(310)、重み付けされたスペクトルデータを得るために前記予測符号化データから得られた重み付けデータを用いて前記スペクトルデータを重み付けするステップ(312)、及び前記生成するステップ(104)が前記現在フレームのための前記変換符号化されたデータを生成することを含む場合に、前記現在フレームのための前記変換符号化されたデータを取得するために重み付けされた前記スペクトルデータを処理するステップ(314)、
を含む方法。 - 符号化されたオーディオ信号を復号するためのオーディオデコーダであって、
前記符号化されたオーディオ信号から予測符号化フレームのためのデータの復号を実行するための予測パラメータデコーダ(180)と、
前記符号化されたオーディオ信号から変換符号化フレームのためのデータの復号を実行するための変換パラメータデコーダ(183)であって、前記変換パラメータデコーダ(183)は、
前記符号化されたオーディオ信号に含まれる予測符号化データを用いてスペクトル重み付けデータを計算するための予測符号化重み付けデータ計算器(183c)、及び
重み付けされた変換スペクトルデータを得るために、前記スペクトル重み付けデータを用いて、前記現在フレームのための復号された変換スペクトルデータを重み付けするためのスペクトル重み付け器(183b)を含み、
前記変換パラメータデコーダ(183)は、変換データを得るために前記重み付けされた変換スペクトルデータのスペクトル時間変換を実行するとともに、前記変換データへ合成窓を適用して現在フレームと将来フレームのためのデータを取得するように構成されており、前記合成窓は第1のオーバーラップ部分、これに隣接する第2の非オーバーラップ部分及びこれに隣接する第3のオーバーラップ部分(206)をもち、前記第3のオーバーラップ部分は前記将来フレームに対するオーディオサンプルに関連づけられ、前記隣接する第2の非オーバーラップ部分(209)は前記現在フレームのデータに関連づけられるものである変換パラメータデコーダ(183)と、
前記現在フレームのための合成窓の前記第3のオーバーラップ部分に関連づけられた合成窓化サンプルと前記将来フレームのための合成窓の前記第1のオーバーラップ部分に関連づけられた合成窓化サンプルとをオーバーラップさせて加算して、前記将来フレームのためのオーディオサンプルの第1の部分を取得するためのオーバーラップ加算器(184)であって、前記現在フレームと前記将来フレームが変換符号化データを含む場合、前記将来フレームに対する前記オーディオサンプルの残りが、オーバーラップ加算せずに得られた前記将来フレームのための前記合成窓の前記第2の非オーバーラップ部分に関連づけられた合成窓化サンプルであるオーバーラップ加算器(184)と、
を備えたオーディオデコーダ。 - 前記符号化されたオーディオ信号の前記現在フレームが変換符号化データを含み、前記将来フレームが予測符号化データを含んでおり、
前記変換パラメータデコーダ(183)は、前記現在フレームための前記合成窓を用いて合成窓化を実行して前記合成窓の前記隣接する第2の非オーバーラップ部分(209)に関連づけられた窓化オーディオサンプルを得るように構成されており、
前記現在フレームための前記合成窓の前記第3のオーバーラップ部分に関連づけられた合成窓化オーディオサンプルが廃棄され、
前記将来フレームのためのオーディオサンプルは前記変換パラメータデコーダ(183)からのデータなしに前記予測パラメータデコーダ(180)によって提供される請求項15に記載のオーディオデコーダ。 - 前記現在フレームが予測符号化データを含んでおり、かつ前記将来フレームが変換符号化データを含んでおり、
前記変換パラメータデコーダ(183)は前記合成窓とは異なる遷移窓を使用するように構成されており、
前記遷移窓(220、222)は、前記将来フレームの最初において第1の非オーバーラップ部分(220)を含み、前記将来フレームの最後でスタートし前記将来フレームに時間的に追従するフレームへ広がる第2のオーバーラップ部分(222)を含んでおり、
前記将来フレームのための前記オーディオサンプルがオーバーラップなしで生成され、前記将来フレームのための前記遷移窓の前記第2のオーバーラップ部分(222)に関連づけられたオーディオデータが前記将来フレームに追従する前記フレームのための前記合成窓の前記第1のオーバーラップ部分を用いて前記オーバーラップ加算器(184)によって計算される請求項15に記載のオーディオデコーダ。 - 前記予測符号化重み付けデータ計算器(183c)は、補間された予測符号化データを前記スペクトル重み付けデータとして得るように過去フレームから得た予測符号化データと前記現在フレームから得た予測符号化データの重み付け和を結合することによって、前記予測符号化データを計算するように構成されている請求項15から17のいずれか一項に記載のオーディオデコーダ。
- 前記予測符号化重み付けデータ計算器(183c)は前記予測符号化データを周波数帯域ごとに重み付け値をもつスペクトル表示へ変換するように構成されており、
前記スペクトル重み付け器(183b)は1つの帯域内の全てのスペクトル値をこの帯域のための同じ重み付け値によって重み付けするように構成されている請求項18に記載のオーディオデコーダ。 - 前記合成窓は全時間長が50msを下回り25msを上回るように構成されており、
前記第1のオーバーラップ部分と前記第3のオーバーラップ部分は同じ時間長をもち、前記第3のオーバーラップ部分は15msを下回る時間長をもつ請求項15から18のいずれか一項に記載のオーディオデコーダ。 - 前記合成窓は時間長が30msであり、ゼロ値の継ぎ足しをもたず、前記第1のオーバーラップ部分と前記第3のオーバーラップ部分の各時間長が10msであり、前記非オーバーラップ部分の時間長が10msである請求項15から20のいずれか一項に記載のオーディオデコーダ。
- 前記変換パラメータデコーダ(183)は、前記スペクトル時間変換のために、フレーム長に対応するサンプル数をもつDCT変換(183d)を行い、前記DCT変換(183d)前の時間数値の2倍の時間数値を生成するための畳み込み解除演算(183e)を行い、かつ、前記畳み込み解除演算の結果に前記合成窓を適用する(183e)ように構成されており、
前記合成窓は、前記第1のオーバーラップ部分の前と前記第3のオーバーラップ部分の後に、前記第1、第3のオーバーラップ部分の長さの半分の長さのゼロ部分を含む請求項15から21のいずれか一項に記載のオーディオデコーダ。 - 符号化されたオーディオ信号を復号する方法であって、
前記符号化されたオーディオ信号から予測符号化フレームのためのデータの復号を実行するステップ(180)と、
前記符号化されたオーディオ信号から変換符号化フレームのためのデータの復号を実行するステップ(183)であって、
変換符号化フレームのためのデータの復号を実行する該ステップ(183)は、前記符号化されたオーディオ信号に含まれる予測符号化データを用いてスペクトル重み付けデータを計算するステップ(183c)、及び重み付けされた変換スペクトルデータを得るために、前記スペクトル重み付けデータを用いて、前記現在フレームのための復号された変換スペクトルデータを重み付けするステップ(183b)を含み、
変換符号化フレームのためのデータの復号を実行する該ステップ(183)は、変換データを得るために前記重み付けされた変換スペクトルデータのスペクトル時間変換を実行すること、及び前記変換データへ合成窓を適用して現在フレームと将来フレームのためのデータを得ることを含み、前記合成窓は第1のオーバーラップ部分、これに隣接する第2の非オーバーラップ部分(209)、及びこれに隣接する第3のオーバーラップ部分(206)を有し、前記隣接する第3のオーバーラップ部分(206)は前記将来フレームのためのオーディオサンプルに関連づけられ、前記隣接する第2の非オーバーラップ部分(209)は前記現在フレームのデータに関連づけられているステップ(183)と、
前記現在フレームのための合成窓の前記第3のオーバーラップ部分に関連づけられた合成窓化サンプルと前記将来フレームのための合成窓の前記第1のオーバーラップ部分に関連づけられた合成窓化サンプルをオーバーラップさせて加算して、前記将来フレームのためのオーディオサンプルの第1の部分を取得するステップ(184)であって、前記現在フレームと前記将来フレームが変換符号化データを含むとき、前記将来フレームのための前記オーディオサンプルの残りは、オーバーラップ加算なしで得られた前記将来フレームのための前記合成窓の第2の非オーバーラップ部分に関連づけられた合成窓化サンプルであるステップ(184)と、
を含む方法。 - コンピュータに請求項14のオーディオ信号を符号化する方法を実行させるためのコンピュータプログラム。
- コンピュータに請求項23のオーディオ信号を復号する方法を実行させるためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052450 WO2012110473A1 (en) | 2011-02-14 | 2012-02-14 | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014510305A JP2014510305A (ja) | 2014-04-24 |
JP6110314B2 true JP6110314B2 (ja) | 2017-04-05 |
Family
ID=71943595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013553900A Active JP6110314B2 (ja) | 2011-02-14 | 2012-02-14 | 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法 |
Country Status (19)
Country | Link |
---|---|
US (1) | US9047859B2 (ja) |
EP (3) | EP2676265B1 (ja) |
JP (1) | JP6110314B2 (ja) |
KR (2) | KR101698905B1 (ja) |
CN (2) | CN103503062B (ja) |
AR (3) | AR085221A1 (ja) |
AU (1) | AU2012217153B2 (ja) |
BR (1) | BR112013020699B1 (ja) |
CA (1) | CA2827272C (ja) |
ES (1) | ES2725305T3 (ja) |
MX (1) | MX2013009306A (ja) |
MY (1) | MY160265A (ja) |
PL (1) | PL2676265T3 (ja) |
PT (1) | PT2676265T (ja) |
SG (1) | SG192721A1 (ja) |
TR (1) | TR201908598T4 (ja) |
TW (2) | TWI479478B (ja) |
WO (1) | WO2012110473A1 (ja) |
ZA (1) | ZA201306839B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
HUE027963T2 (en) * | 2012-09-11 | 2016-11-28 | ERICSSON TELEFON AB L M (publ) | Generating comfort noise |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
JP6086999B2 (ja) * | 2014-07-28 | 2017-03-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法 |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
KR102413692B1 (ko) * | 2015-07-24 | 2022-06-27 | 삼성전자주식회사 | 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치 |
KR102192678B1 (ko) | 2015-10-16 | 2020-12-17 | 삼성전자주식회사 | 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치 |
PL3503097T3 (pl) | 2016-01-22 | 2024-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie oraz sposób do enkodowania lub dekodowania sygnału wielokanałowego z wykorzystaniem ponownego próbkowania w dziedzinie widmowej |
US10249307B2 (en) * | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
JP7167335B2 (ja) * | 2018-10-29 | 2022-11-08 | ドルビー・インターナショナル・アーベー | 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置 |
US11955138B2 (en) * | 2019-03-15 | 2024-04-09 | Advanced Micro Devices, Inc. | Detecting voice regions in a non-stationary noisy environment |
Family Cites Families (126)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69232202T2 (de) | 1991-06-11 | 2002-07-25 | Qualcomm Inc | Vocoder mit veraendlicher bitrate |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
KR100419545B1 (ko) | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
EP0720316B1 (en) | 1994-12-30 | 1999-12-08 | Daewoo Electronics Co., Ltd | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
JPH10276095A (ja) * | 1997-03-28 | 1998-10-13 | Toshiba Corp | 符号化器及び復号化器 |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) * | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE10084675T1 (de) | 1999-06-07 | 2002-06-06 | Ericsson Inc | Verfahren und Vorrichtung zur Erzeugung von künstlichem Geräusch unter Verwendung von parametrischen Geräuschmodell-Masszahlen |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
CN1266674C (zh) | 2000-02-29 | 2006-07-26 | 高通股份有限公司 | 闭环多模混合域线性预测语音编解码器和处理帧的方法 |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US20050130321A1 (en) | 2001-04-23 | 2005-06-16 | Nicholson Jeremy K. | Methods for analysis of spectral data and their applications |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7069212B2 (en) | 2002-09-19 | 2006-06-27 | Matsushita Elecric Industrial Co., Ltd. | Audio decoding apparatus and method for band expansion with aliasing adjustment |
US7343283B2 (en) * | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
JP4191503B2 (ja) * | 2003-02-13 | 2008-12-03 | 日本電信電話株式会社 | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
ATE354160T1 (de) | 2003-10-30 | 2007-03-15 | Koninkl Philips Electronics Nv | Audiosignalcodierung oder -decodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
EP1852851A1 (en) | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
ES2338117T3 (es) | 2004-05-17 | 2010-05-04 | Nokia Corporation | Codificacion de audio con diferentes longitudes de trama de codificacion. |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
US9047860B2 (en) | 2005-01-31 | 2015-06-02 | Skype | Method for concatenating frames in communication system |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
MX2007012187A (es) | 2005-04-01 | 2007-12-11 | Qualcomm Inc | Sistemas, metodos y aparatos para deformacion en tiempo de banda alta. |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
ES2629727T3 (es) | 2005-06-18 | 2017-08-14 | Nokia Technologies Oy | Sistema y método para la transmisión adaptativa de parámetros de ruido de confort durante la transmisión de habla discontinua |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP2009524101A (ja) | 2006-01-18 | 2009-06-25 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
CN101371295B (zh) | 2006-01-18 | 2011-12-21 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) * | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN102592303B (zh) | 2006-07-24 | 2015-03-11 | 索尼株式会社 | 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术 |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101016224B1 (ko) | 2006-12-12 | 2011-02-25 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 |
FR2911227A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) * | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) * | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
ES2658942T3 (es) | 2007-08-27 | 2018-03-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable |
US8566106B2 (en) | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8423852B2 (en) | 2008-04-15 | 2013-04-16 | Qualcomm Incorporated | Channel decoding-based error detection |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
PL2311034T3 (pl) * | 2008-07-11 | 2016-04-29 | Fraunhofer Ges Forschung | Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
EP2301020B1 (en) | 2008-07-11 | 2013-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
EP3002750B1 (en) * | 2008-07-11 | 2017-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding audio samples |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
ATE539433T1 (de) | 2008-07-11 | 2012-01-15 | Fraunhofer Ges Forschung | Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
BRPI0914056B1 (pt) | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
CA2750795C (en) * | 2009-01-28 | 2015-05-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
US8805694B2 (en) | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
WO2010148516A1 (en) | 2009-06-23 | 2010-12-29 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
WO2011048094A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec and celp coding adapted therefore |
PL2473995T3 (pl) * | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
BR122021002104B1 (pt) * | 2010-07-08 | 2021-11-03 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador que utiliza cancelamento de serrilhado futuro |
-
2012
- 2012-02-14 CN CN201280018282.7A patent/CN103503062B/zh active Active
- 2012-02-14 CA CA2827272A patent/CA2827272C/en active Active
- 2012-02-14 TW TW101104674A patent/TWI479478B/zh active
- 2012-02-14 JP JP2013553900A patent/JP6110314B2/ja active Active
- 2012-02-14 TW TW103134393A patent/TWI563498B/zh active
- 2012-02-14 EP EP12707050.6A patent/EP2676265B1/en active Active
- 2012-02-14 MY MYPI2013701417A patent/MY160265A/en unknown
- 2012-02-14 AR ARP120100475A patent/AR085221A1/es active IP Right Grant
- 2012-02-14 PT PT12707050T patent/PT2676265T/pt unknown
- 2012-02-14 MX MX2013009306A patent/MX2013009306A/es active IP Right Grant
- 2012-02-14 SG SG2013060991A patent/SG192721A1/en unknown
- 2012-02-14 AU AU2012217153A patent/AU2012217153B2/en active Active
- 2012-02-14 PL PL12707050T patent/PL2676265T3/pl unknown
- 2012-02-14 CN CN201510490977.0A patent/CN105304090B/zh active Active
- 2012-02-14 TR TR2019/08598T patent/TR201908598T4/tr unknown
- 2012-02-14 BR BR112013020699-3A patent/BR112013020699B1/pt active IP Right Grant
- 2012-02-14 EP EP19157006.8A patent/EP3503098B1/en active Active
- 2012-02-14 EP EP23186418.2A patent/EP4243017A3/en active Pending
- 2012-02-14 WO PCT/EP2012/052450 patent/WO2012110473A1/en active Application Filing
- 2012-02-14 KR KR1020137024191A patent/KR101698905B1/ko active IP Right Grant
- 2012-02-14 ES ES12707050T patent/ES2725305T3/es active Active
- 2012-02-14 KR KR1020167007581A patent/KR101853352B1/ko active IP Right Grant
-
2013
- 2013-08-14 US US13/966,666 patent/US9047859B2/en active Active
- 2013-09-11 ZA ZA2013/06839A patent/ZA201306839B/en unknown
-
2014
- 2014-11-27 AR ARP140104448A patent/AR098557A2/es active IP Right Grant
-
2015
- 2015-11-09 AR ARP150103655A patent/AR102602A2/es active IP Right Grant
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6110314B2 (ja) | 整列したルックアヘッド部分を用いてオーディオ信号を符号化及び復号するための装置並びに方法 | |
US11676611B2 (en) | Audio decoding device and method with decoding branches for decoding audio signal encoded in a plurality of domains | |
US8804970B2 (en) | Low bitrate audio encoding/decoding scheme with common preprocessing | |
KR101325335B1 (ko) | 오디오 샘플 인코드 및 디코드용 오디오 인코더 및 디코더 | |
JP5243661B2 (ja) | オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム | |
KR20110043592A (ko) | 샘플링된 오디오 신호의 프레임들을 인코딩 및 디코딩하기 위한 오디오 인코더 및 디코더 | |
MX2011003824A (es) | Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple. | |
AU2013200679B2 (en) | Audio encoder and decoder for encoding and decoding audio samples | |
RU2574849C2 (ru) | Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра | |
ES2963367T3 (es) | Aparato y procedimiento de decodificación de una señal de audio usando una parte de anticipación alineada |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140826 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20141120 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20141128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150825 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20151118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160223 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160719 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20161108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161118 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20161212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6110314 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |