JP2010538314A - 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 - Google Patents
切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 Download PDFInfo
- Publication number
- JP2010538314A JP2010538314A JP2010522865A JP2010522865A JP2010538314A JP 2010538314 A JP2010538314 A JP 2010538314A JP 2010522865 A JP2010522865 A JP 2010522865A JP 2010522865 A JP2010522865 A JP 2010522865A JP 2010538314 A JP2010538314 A JP 2010538314A
- Authority
- JP
- Japan
- Prior art keywords
- time domain
- frame
- segmentation
- segment
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010183 spectrum analysis Methods 0.000 title claims abstract description 55
- 230000015572 biosynthetic process Effects 0.000 title claims description 5
- 238000003786 synthesis reaction Methods 0.000 title claims description 5
- 230000011218 segmentation Effects 0.000 claims abstract description 70
- 238000012545 processing Methods 0.000 claims abstract description 42
- 230000003595 spectral effect Effects 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims description 57
- 230000001052 transient effect Effects 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000002441 reversible effect Effects 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 14
- 230000006835 compression Effects 0.000 claims description 10
- 238000007906 compression Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000008859 change Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 21
- 230000002123 temporal effect Effects 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000009466 transformation Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000009527 percussion Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000002730 additional effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Spectrometry And Color Measurement (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
Description
この望ましくない歪みを回避するため、幾つかの方法論が提案され、成功裏に応用された。これらの技術の幾つかは標準化され、商業的応用において広がりを見せている。
ビットリザーバ手法の背後にあるアイデアは、周波数領域で符号化するのに“容易”であるフレームから幾つかのビットを省くことである。従って、過渡的フレームのような非常に要求の厳しいフレームに対応するために、省いたビットを使用する。このことは、平均ビットレートが一定であるようにすることが可能な幾つかのチューニングを有する、可変瞬時ビットレートという結果をもたらす。しかしながら、この主な欠点は、ある過渡信号を扱うためには、非常に大きなリザーバが実際には必要であり、これは非常に大きな遅延をもたらすことである。そのためこの技術は会話アプリケーションには殆んど興味を持たれないこととなった。加えて、この方法論はプリエコー歪みをわずかしか緩和しない。
ゲイン修正手法は、スペクトル分析および符号化に先立って、時間領域の過渡的ピークの平滑化を行う。ゲイン修正包絡線はサイド情報として送信され、瞬時符号化雑音を整形する逆変換信号に逆適用する。ゲイン修正手法の主な欠点は、フィルタ・バンク(例えば、MDCT)分析窓のその修正にあり、そのためにフィルタ・バンクの周波数応答の拡大をもたらす。これは、特に帯域幅が臨界帯域のそれを超える場合、低周波数で問題につながる可能性がある。
図3は、窓切換(MPEG−1、レイヤIII“mp3”)を示し、PR(Perfect Reconstruction、完全再構成)特性を維持するため、長い窓および短い窓との間の遷移窓の“開始”および“終了”を必要とする。この技術は、非特許文献1(Elder)で初めて紹介され、特にMDCTに基づく変換符号化アルゴリズムの場合に、プリエコー抑圧用として評判が高い。窓切換は、過渡状態の検出の際、変換の時間分解能を変更するという着想に基づく。典型的には、これは、定常信号の長い持続状態から過渡状態を検出した場合に分析ブロック長を短い期間に変更することを含む。この着想は、次の2つの考察に基づく。
・過渡状態を含む短いフレームに適用する短い窓は、符号化雑音の時間的な拡散を最小にし、継時プレマスキングが効果を奏し、歪みが聴こえない状態にすることが可能になる。
・過渡状態を含む短時間領域に、高いビットレートを配分する。
xw(n)=w(n).x(n)
行列INおよびJNはそれぞれ、次に示すN次元の単位行列および時間反転行列(time reversal matrix)である。
入力信号の時間的コヒーレンスを保持するため、更なる処理の前に、時間領域エイリアシング演算の出力を再順序化する必要がある。得られるフィルタ・バンクの基底関数の順序化がコヒーレントでない時間−周波数応答を持つことがないよう、順序化演算が必要である。再順序化演算の例を図10に示す。再順序化は、TDA出力信号〜x(n)の上半分と下半分とを入れ換えることを含む。この再順序化は概念的なものであり、実際には計算を全く含まない。この再順序化は図10の例に限定されるものではない。もちろん、他のタイプの再順序化を実装することも可能である。
第1の簡単な実施形態は、本発明による時間分解能をいかにして2倍にするかを示す。結果として、ν(n)に時間−周波数分析を適用し、時間分解能を2倍にするため、ν(n)を2個の好ましいオーバラップ・セグメントに分割する。ν(n)は時間制限された信号であるため、ν(n)の開始および終了にゼロパディングを付加する。好ましくは、入力信号は、長さNの、窓掛けされ再順序化された時間領域エイリアス信号である。ゼロパディングの長さは信号ν(n)の長さとセグメントの望ましい数に依存し、この場合では、2個のオーバラップ・セグメントを望むので、ゼロパディング長はν(n)の長さの4分の1に等しく、ν(n)の開始および終了に付加される。このようなゼロパディングを使用することにより、ν(n)の長さと同じ長さの2個の50%オーバラップ・セグメントを得る。
より高い時間分解能は、再順序化された時間領域エイリアス信号をより多くのセグメントに分割することによって得られる。図14および図15は、それぞれ4個および8個のセグメントに対して、これをどのようにして達成するかを示す。図14は、4個のセグメントへの分割による高時間分解能を示し、図15は、8個のセグメントへの分割による高時間分解能を示す。理解すべきであるが、希望の時間分解能に依存して、任意の適当な数の時間セグメントを使用できる。
本発明において、同じ概念により非一様時間セグメンテーションを取得することも可能である。そのような動作を実行するため、少なくとも2つの可能な方法がある。第1の方法は、再順序化した時間エイリアス信号の非一様時間セグメンテーションに基づくものである。それ故、信号をセグメント化するのに使用する窓は、異なる長さを持つ。
プリエコー歪みを緩和するために本発明を使用することができる。この場合、図18に例示するように、過渡状態検出器と最もよく関連する。過渡状態を検出すると、過渡状態検出器はフラグ(IsTransient、過渡信号あり)を設定することができる。次に、過渡状態検出器フラグは切換機能17を使用し、図18に示すように、通常の全周波数分解能処理(非セグメント・スペクトル分析)からより高い時間分解能(セグメント・スペクトル分析)に瞬間的に切り換える。この実施形態で、次に、はるかに精細な時間分解能で、従って、面倒なプリエコー歪みを解消して、過渡信号を分析することが可能である。
また、本発明は、符号化前の信号の分析のため、最適時間−周波数タイリングを見つけ出すための手段としても使用できる。クローズド・ループおよびオープン・ループの2つの典型的動作モードを使用できる。オープン・ループ動作では、外部装置が、所定の信号フレームに対して、(符号化効率の観点から)最良の時間−周波数タイリングについて決定し、本発明により、その最適タイリングに応じた信号の分析を行うことができる。クローズド・ループで動作では、所定のタイリングのセットを使用し、そのタイリングによって、これらのタイリングの各々のために信号を分析し符号化する。各タイリングのために、忠実度の測度が計算される。最良の忠実度につながるタイリングが選択される。このタイリングに対応する符号化係数と一緒に、選択したタイリングがデコーダに送信される。
Claims (44)
- 時間領域の入力信号のオーバラップ・フレームに対して動作する信号処理のための方法であって、
オーバラップ・フレームに基づいて時間領域エイリアシング(TDA)を実行し、対応する時間領域エイリアス・フレームを生成するステップと、
前記時間領域エイリアス・フレームに基づいて時間尺度のセグメンテーションを実行し、少なくとも2つのセグメントを生成するステップと、
前記少なくとも2つのセグメントに基づいてスペクトル分析を実行し、セグメントごとに、当該セグメントの周波数成分を表す係数を取得するステップと、
を有することを特徴とする方法。 - 前記信号処理は、信号分析、信号圧縮、オーディオ符号化のうちの少なくとも1つを含むことを特徴とする請求項1に記載の方法。
- 前記スペクトル分析を実行するステップは、変換符号化に関連するステップであり、前記少なくとも2つのセグメントの各々に変換を適用するステップを有することを特徴とする請求項1に記載の方法。
- 前記変換は、重複変換(LT)、離散コサイン変換(DCT)、修正離散コサイン変換(MDCT)、変調重複変換(MLT)のうちの少なくとも1つを含むことを特徴とする請求項3に記載の方法。
- 前記入力信号における信号過渡状態の検出に依存して、
前記時間領域エイリアス・フレームに基づく非セグメント・スペクトル分析である全周波数分解能処理と、
前記少なくとも2つのセグメントに基づくセグメント・スペクトル分析である高時間分解能処理と、
を切り換えるステップを更に有することを特徴とする請求項1に記載の方法。 - 前記セグメント・スペクトル分析の時間分解能を切り換えるステップを更に有することを特徴とする請求項1に記載の方法。
- 前記セグメンテーションを実行するステップは、非オーバラップ・セグメント、オーバラップ・セグメント、非一様長セグメント、および、一様長セグメント、のうちの少なくとも1つのタイプのセグメントを生成するように実行されることを特徴とする請求項1に記載の方法。
- 前記セグメンテーションを実行するステップは、選択可能な数のオーバラップ・セグメントを生成するべく時間領域エイリアス・フレームに基づいて時間でのセグメンテーションを実行するステップを有し、
前記スペクトル分析を実行するステップは、前記オーバラップ・セグメントの各々に重複変換を適用するステップを有する
ことを特徴とする請求項1に記載の方法。 - 前記時間領域エイリアス・フレームを再順序化して再順序化時間領域エイリアス・フレームを生成するステップを更に有し、
前記セグメンテーションを実行するステップは、前記再順序化時間領域エイリアス・フレームに基づいて行われる
ことを特徴とする請求項1に記載の方法。 - 前記セグメンテーションを実行するステップは、前記再順序化時間領域エイリアス・フレームにゼロパディングを付加し、その結果の信号を比較的短いオーバラップ・セグメントに分割するステップを有することを特徴とする請求項9に記載の方法。
- 前記オーバラップ・フレームに基づいて窓掛けを実行してオーバラップ窓掛けフレームを生成するステップを更に有し、
前記時間領域エイリアシングを実行するステップは、オーバラップ窓掛けフレームに基づいて行われる
ことを特徴とする請求項1に記載の方法。 - 前記セグメンテーションを実行するステップは、非一様セグメンテーションを実行するステップを有することを特徴とする請求項1に記載の方法。
- 前記非一様セグメンテーションを実行するステップは、セグメンテーションのための異なる長さの窓を用いて実行されることを特徴とする請求項12に記載の方法。
- 前記非一様セグメンテーションを実行するステップは、
少なくとも2つのセグメントにする第1のセグメンテーションと、
前記少なくとも2つのセグメントのうちの少なくとも1つを更に複数のセグメントにする第2のセグメンテーションと
を有することを特徴とする請求項12に記載の方法。 - 少なくとも前記セグメンテーションを実行するステップおよび前記スペクトル分析を実行するステップは、前記入力信号の過渡状態を検出に応答して実行されることを特徴とする請求項1に記載の方法。
- 前記信号処理は符号化に使用されるものであり、異なるセグメンテーションに対して符号化効率に関する忠実度を分析し、該分析に基づき適当なセグメンテーションを選択することを特徴とする請求項1に記載の方法。
- 複数の連続するオーバラップ・フレームの各々ごとに、前記時間領域エイリアシングを実行するステップと、前記セグメンテーションを実行するステップと、前記スペクトル分析を実行するステップとを繰り返すことを特徴とする請求項1に記載の方法。
- 入力信号のオーバラップ・フレームに対して動作する信号処理のための装置であって、
オーバラップ・フレームに基づいて時間領域エイリアシング(TDA)を実行して、時間領域エイリアス・フレームを生成する手段と、
前記時間領域エイリアス・フレームに基づいて時間尺度のセグメンテーションを実行し、少なくとも2つのセグメントを生成する手段と、
前記少なくとも2つのセグメントに基づいてセグメント・スペクトル分析を実行し、セグメントごとに、当該セグメントの周波数成分を表す係数を取得するスペクトル分析器と、
を有することを特徴とする装置。 - 前記信号処理のための装置は、信号分析、信号圧縮、オーディオ符号化のうちの少なくとも1つのために構成されることを特徴とする請求項18に記載の装置。
- 前記セグメント・スペクトル分析を実行する前記スペクトル分析器は、変換符号化のために構成され、前記少なくとも2つのセグメントの各々に変換を適用する手段を有することを特徴とする請求項18に記載の装置。
- 前記変換を適用する手段は、重複変換(LT)、離散コサイン変換(DCT)、修正離散コサイン変換(MDCT)、変調重複変換(MLT)のうちの少なくとも1つに基づいて動作することを特徴とする請求項20に記載の装置。
- 前記入力信号における信号過渡状態の検出に依存して、
前記時間領域エイリアス・フレームに基づく非セグメント・スペクトル分析と、
前記少なくとも2つのセグメントに基づくセグメント・スペクトル分析と、
を切り換える手段を更に有することを特徴とする請求項18に記載の装置。 - 前記セグメンテーションを実行する手段と前記スペクトル分析器との時間分解能を切り換える手段を更に有することを特徴とする請求項18に記載の装置。
- 前記セグメンテーションを実行する手段は、非オーバラップ・セグメント、オーバラップ・セグメント、非一様長セグメント、および、一様長セグメント、のうちの少なくとも1つのタイプのセグメントを生成することを特徴とする請求項18に記載の装置。
- 前記セグメンテーションを実行する手段は、選択可能な数のオーバラップ・セグメントを生成するように動作可能であり、
前記セグメント・スペクトル分析を実行する前記スペクトル分析器は、前記オーバラップ・セグメントの各々に重複変換を適用する手段を有する
ことを特徴とする請求項18に記載の装置。 - 前記時間領域エイリアス・フレームを再順序化して再順序化時間領域エイリアス・フレームを生成する手段を更に有し、
前記セグメンテーションを実行する手段は、前記再順序化時間領域エイリアス・フレームに基づいて動作することを特徴とする請求項18に記載の装置。 - 前記セグメンテーションを実行する手段は、
前記再順序化時間領域エイリアス・フレームにゼロパディングを付加する手段と、
その結果の信号フレームを比較的短いオーバラップ・セグメントに分割する手段と、
を有することを特徴とする請求項26に記載の装置。 - 前記オーバラップ・フレームに基づいて窓掛けを実行してオーバラップ窓掛けフレームを生成する手段を更に有し、
前記時間領域エイリアシングを実行する手段は、前記オーバラップ窓掛けフレームに基づいて動作することを特徴とする請求項18に記載の装置。 - 前記セグメンテーションを実行する手段は、非一様セグメンテーションを実行する手段を有することを特徴とする請求項18に記載の装置。
- 前記非一様セグメンテーションを実行する手段は、セグメンテーションのための異なる長さの窓を用いるように動作可能であることを特徴とする請求項29に記載の装置。
- 前記非一様セグメンテーションを実行する手段は、
少なくとも2つのセグメントにする第1のセグメンテーションを実行する手段と、
前記少なくとも2つのセグメントのうちの少なくとも1つを更に複数のセグメントにする第2のセグメンテーションを実行する手段と、
を有することを特徴とする請求項29に記載の装置。 - 前記セグメンテーションを実行する手段および前記セグメント・スペクトル分析は、前記入力信号の過渡状態の検出に応答して実行されることを特徴とする請求項18に記載の装置。
- オーディオ信号のオーバラップ・フレームに対して動作するオーディオ・エンコーダであって、
オーバラップ・フレームに基づいて時間領域エイリアス・フレームを生成する時間領域エイリアシング(TDA)ユニットと、
前記時間領域エイリアス・フレームに基づいて、選択可能なN(N≧2)個のセグメントを生成する時間セグメンテーション・ユニットと、
前記N個のセグメントに基づいてセグメント・スペクトル分析を実行し、セグメントごとに、当該セグメントの周波数成分を表すスペクトル係数を取得する変換符号化器と、
を有することを特徴とするオーディオ・エンコーダ。 - 前記オーディオ信号における信号過渡状態の検出に依存して、
前記時間領域エイリアス・フレームに基づく非セグメント・スペクトル分析と、
前記N個のセグメントに基づくセグメント・スペクトル分析と、
を切り換える手段を更に有することを特徴とする請求項33に記載のオーディオ・エンコーダ。 - 前記変換符号化器は、各セグメントに変換を適用するように構成されることを特徴とする請求項33に記載のオーディオ・エンコーダ。
- 前記セグメントはオーバラップ・セグメントであり、
前記変換は、タイプIV離散コサイン変換(DCT)を用いた修正離散コサイン変換(MDCT)であることを特徴とする請求項35に記載のオーディオ・エンコーダ。 - 前記オーディオ・エンコーダは、前記オーバラップ・フレームに基づいて窓掛けを実行してオーバラップ窓掛けフレームを生成する窓掛けユニットを更に有し、
前記TDAユニットは、前記オーバラップ窓掛けフレームに基づいて時間領域エイリアシングを実行し、
前記オーディオ・エンコーダは、前記時間領域エイリアス・フレームを再順序化して再順序化時間領域エイリアス・フレームを生成する再順序化ユニットを更に有し、
時間セグメンテーション・ユニットは、前記再順序化時間領域エイリアス・フレームに基づいて動作する
ことを特徴とする請求項33に記載のオーディオ・エンコーダ。 - 時間領域信号を表すスペクトル係数に基づいて動作する信号処理の方法であって、
前記スペクトル係数の異なるサブセットに基づく逆スペクトル分析を実行し、前記スペクトル係数のサブセットごとに逆変換サブフレームを生成するステップと、
オーバラップした複数の逆変換サブフレームに基づく逆時間セグメンテーションを実行し、前記複数の逆変換サブフレームを合成して時間領域エイリアス・フレームを得るステップと、
前記時間領域信号の再構成を可能とするために、前記時間領域エイリアス・フレームに基づいて逆時間領域エイリアシングを実行するステップと、
を有することを特徴とする信号処理の方法。 - 前記信号処理は、信号合成およびオーディオ復号化のうちの少なくとも1つを含むことを特徴とする請求項38の信号処理の方法。
- 前記時間領域エイリアス・フレームに基づいて逆時間領域エイリアシングを実行するステップは、第1の時間領域フレームを再構成するために実行され、
前記方法は、前記第1の時間領域フレームと後続の再構成された第2の時間領域フレームとのオーバラップ加算に基づいて、前記時間領域信号を合成するステップを更に有することを特徴とする請求項38の方法。 - 時間領域信号を表すスペクトル係数に基づいて動作するオーディオ・デコーダであって、
前記スペクトル係数の異なるサブセットに基づいて動作し、スペクトル係数のサブセットごとに逆変換サブフレームを生成する逆変換器と、
オーバラップした複数の逆変換サブフレームに基づいて逆時間セグメンテーションを実行し、前記複数の逆変換サブフレームを合成して時間領域エイリアス・フレームを生成する手段と、
前記時間領域信号の再構成を可能とするために、前記時間領域エイリアス・フレームに基づいて逆時間領域エイリアシングを実行する手段と、
を有することを特徴とするオーディオ・デコーダ。 - 前記時間領域エイリアス・フレームに基づいて逆時間領域エイリアシングを実行する手段は、第1の時間領域フレームを再構成するように構成され、
前記オーディオ・デコーダは、前記第1の時間領域フレームと後続の再構成された第2の時間領域フレームとのオーバラップ加算に基づいて、前記時間領域信号を合成する手段を更に有する
ことを特徴とする請求項41のオーディオ・デコーダ。 - 前記逆変換器は、前記スペクトル係数のサブセットごとに逆変換を適用して、対応する逆変換サブフレームを生成することを特徴とする請求項42のオーディオ・デコーダ。
- 前記逆変換器は、逆修正離散コサイン変換(MDCT)であることを特徴とする請求項43のオーディオ・デコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96812507P | 2007-08-27 | 2007-08-27 | |
US60/968,125 | 2007-08-27 | ||
PCT/SE2008/050959 WO2009029032A2 (en) | 2007-08-27 | 2008-08-25 | Low-complexity spectral analysis/synthesis using selectable time resolution |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010538314A true JP2010538314A (ja) | 2010-12-09 |
JP5140730B2 JP5140730B2 (ja) | 2013-02-13 |
Family
ID=40388070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010522865A Active JP5140730B2 (ja) | 2007-08-27 | 2008-08-25 | 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 |
Country Status (11)
Country | Link |
---|---|
US (2) | US8392202B2 (ja) |
EP (3) | EP2186088B1 (ja) |
JP (1) | JP5140730B2 (ja) |
CN (2) | CN101878504B (ja) |
BR (1) | BRPI0816136B1 (ja) |
CA (1) | CA2698039C (ja) |
DK (2) | DK2186088T3 (ja) |
ES (3) | ES2823560T3 (ja) |
MX (1) | MX2010001763A (ja) |
PT (1) | PT3550564T (ja) |
WO (1) | WO2009029032A2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013531820A (ja) * | 2011-02-14 | 2013-08-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
US8825496B2 (en) | 2011-02-14 | 2014-09-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Noise generation in audio codecs |
US9047859B2 (en) | 2011-02-14 | 2015-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
US9153236B2 (en) | 2011-02-14 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
US9384739B2 (en) | 2011-02-14 | 2016-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding |
US9583110B2 (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
US9595262B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
US9595263B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding and decoding of pulse positions of tracks of an audio signal |
US9620129B2 (en) | 2011-02-14 | 2017-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2186090T3 (pl) | 2007-08-27 | 2017-06-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Detektor stanów przejściowych i sposób wspierający kodowanie sygnału audio |
DK2571024T3 (en) | 2007-08-27 | 2015-01-05 | Ericsson Telefon Ab L M | Adaptive transition frequency between the noise filling and bandwidth extension |
US8548815B2 (en) * | 2007-09-19 | 2013-10-01 | Qualcomm Incorporated | Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications |
US9189250B2 (en) * | 2008-01-16 | 2015-11-17 | Honeywell International Inc. | Method and system for re-invoking displays |
BRPI1007528B1 (pt) | 2009-01-28 | 2020-10-13 | Dolby International Ab | Sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento |
RU2493618C2 (ru) | 2009-01-28 | 2013-09-20 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование |
JP5433022B2 (ja) * | 2009-09-18 | 2014-03-05 | ドルビー インターナショナル アーベー | 高調波転換 |
EP2372705A1 (en) * | 2010-03-24 | 2011-10-05 | Thomson Licensing | Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
CN103282958B (zh) * | 2010-10-15 | 2016-03-30 | 华为技术有限公司 | 信号分析器、信号分析方法、信号合成器、信号合成方法、变换器和反向变换器 |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
US20140046670A1 (en) * | 2012-06-04 | 2014-02-13 | Samsung Electronics Co., Ltd. | Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same |
EP2884884A1 (en) | 2012-08-16 | 2015-06-24 | École Polytechnique Fédérale de Lausanne (EPFL) | Method and apparatus for low complexity spectral analysis of bio-signals |
ES2617314T3 (es) | 2013-04-05 | 2017-06-16 | Dolby Laboratories Licensing Corporation | Aparato de compresión y método para reducir un ruido de cuantización utilizando una expansión espectral avanzada |
CN104240697A (zh) * | 2013-06-24 | 2014-12-24 | 浙江大华技术股份有限公司 | 一种音频数据的特征提取方法及装置 |
PT3028275T (pt) | 2013-08-23 | 2017-11-21 | Fraunhofer Ges Forschung | Aparelho e método para processamento de um sinal de áudio utilizando uma combinação numa faixa de sobreposição |
CN103745726B (zh) * | 2013-11-07 | 2016-08-17 | 中国电子科技集团公司第四十一研究所 | 一种自适应的变采样率音频采样方法 |
CN111312278B (zh) | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
KR20240046298A (ko) | 2014-03-24 | 2024-04-08 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
CN106409304B (zh) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN112967727A (zh) * | 2014-12-09 | 2021-06-15 | 杜比国际公司 | Mdct域错误掩盖 |
US11079418B2 (en) | 2015-03-17 | 2021-08-03 | Zynaptiq Gmbh | Methods for extending frequency transforms to resolve features in the spatio-temporal domain |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
EP3276620A1 (en) * | 2016-07-29 | 2018-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
JP6486978B2 (ja) * | 2017-02-10 | 2019-03-20 | 三菱重工業株式会社 | 積層部材、並びに、これを用いた羽根車、圧縮機及びエンジン |
US10699723B2 (en) * | 2017-04-25 | 2020-06-30 | Dts, Inc. | Encoding and decoding of digital audio signals using variable alphabet size |
WO2018201112A1 (en) * | 2017-04-28 | 2018-11-01 | Goodwin Michael M | Audio coder window sizes and time-frequency transformations |
CN112255456B (zh) * | 2020-12-22 | 2021-03-16 | 深圳市鼎阳科技股份有限公司 | 一种用于频谱分析仪的扫频方法和扫频装置 |
WO2022177481A1 (en) * | 2021-02-18 | 2022-08-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and decoding complex data |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002538644A (ja) * | 1999-02-26 | 2002-11-12 | ソニー エレクトロニクス インク | 時間領域エイリアシングを効率的に除去する装置及び方法 |
JP2003005799A (ja) * | 2001-06-21 | 2003-01-08 | Sharp Corp | 符号化装置 |
JP2003195881A (ja) * | 2001-12-28 | 2003-07-09 | Victor Co Of Japan Ltd | 周波数変換ブロック長適応変換装置及びプログラム |
JP2005527851A (ja) * | 2002-04-18 | 2005-09-15 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 |
WO2006030289A1 (en) * | 2004-09-17 | 2006-03-23 | Digital Rise Technology Co., Ltd. | Apparatus and methods for multichannel digital audio coding |
WO2006137425A1 (ja) * | 2005-06-23 | 2006-12-28 | Matsushita Electric Industrial Co., Ltd. | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
AU4218199A (en) * | 1998-05-27 | 1999-12-13 | Microsoft Corporation | System and method for entropy encoding quantized transform coefficients of a signal |
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
US6233549B1 (en) * | 1998-11-23 | 2001-05-15 | Qualcomm, Inc. | Low frequency spectral enhancement system and method |
US6226608B1 (en) * | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US7275036B2 (en) * | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
CN1460992A (zh) * | 2003-07-01 | 2003-12-10 | 北京阜国数字技术有限公司 | 用于感知音频编/解码的低延时、自适应的多分辨率滤波器组 |
US7516064B2 (en) * | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
-
2008
- 2008-08-25 CA CA2698039A patent/CA2698039C/en active Active
- 2008-08-25 JP JP2010522865A patent/JP5140730B2/ja active Active
- 2008-08-25 US US12/675,461 patent/US8392202B2/en active Active
- 2008-08-25 ES ES19175094T patent/ES2823560T3/es active Active
- 2008-08-25 EP EP08828335.3A patent/EP2186088B1/en active Active
- 2008-08-25 WO PCT/SE2008/050959 patent/WO2009029032A2/en active Application Filing
- 2008-08-25 DK DK08828335.3T patent/DK2186088T3/en active
- 2008-08-25 EP EP17194762.5A patent/EP3288028B1/en active Active
- 2008-08-25 CN CN2008801048320A patent/CN101878504B/zh not_active Expired - Fee Related
- 2008-08-25 ES ES08828335.3T patent/ES2658942T3/es active Active
- 2008-08-25 BR BRPI0816136-4A patent/BRPI0816136B1/pt active IP Right Grant
- 2008-08-25 ES ES17194762T patent/ES2748843T3/es active Active
- 2008-08-25 EP EP19175094.2A patent/EP3550564B1/en active Active
- 2008-08-25 MX MX2010001763A patent/MX2010001763A/es active IP Right Grant
- 2008-08-25 DK DK17194762.5T patent/DK3288028T3/da active
- 2008-08-25 CN CN201310553487.1A patent/CN103594090B/zh active Active
- 2008-08-25 PT PT191750942T patent/PT3550564T/pt unknown
-
2013
- 2013-02-05 US US13/759,748 patent/US8706511B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002538644A (ja) * | 1999-02-26 | 2002-11-12 | ソニー エレクトロニクス インク | 時間領域エイリアシングを効率的に除去する装置及び方法 |
JP2003005799A (ja) * | 2001-06-21 | 2003-01-08 | Sharp Corp | 符号化装置 |
JP2003195881A (ja) * | 2001-12-28 | 2003-07-09 | Victor Co Of Japan Ltd | 周波数変換ブロック長適応変換装置及びプログラム |
JP2005527851A (ja) * | 2002-04-18 | 2005-09-15 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 時間離散オーディオ信号を符号化する装置と方法および符号化されたオーディオデータを復号化する装置と方法 |
WO2006030289A1 (en) * | 2004-09-17 | 2006-03-23 | Digital Rise Technology Co., Ltd. | Apparatus and methods for multichannel digital audio coding |
WO2006137425A1 (ja) * | 2005-06-23 | 2006-12-28 | Matsushita Electric Industrial Co., Ltd. | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013531820A (ja) * | 2011-02-14 | 2013-08-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
US8825496B2 (en) | 2011-02-14 | 2014-09-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Noise generation in audio codecs |
JP2014240973A (ja) * | 2011-02-14 | 2014-12-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号変換装置 |
US9047859B2 (en) | 2011-02-14 | 2015-06-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
US9153236B2 (en) | 2011-02-14 | 2015-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
US9384739B2 (en) | 2011-02-14 | 2016-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding |
US9536530B2 (en) | 2011-02-14 | 2017-01-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
US9583110B2 (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
US9595262B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
US9595263B2 (en) | 2011-02-14 | 2017-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding and decoding of pulse positions of tracks of an audio signal |
US9620129B2 (en) | 2011-02-14 | 2017-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
Also Published As
Publication number | Publication date |
---|---|
US8706511B2 (en) | 2014-04-22 |
ES2658942T3 (es) | 2018-03-13 |
MX2010001763A (es) | 2010-03-10 |
PT3550564T (pt) | 2020-08-18 |
ES2748843T3 (es) | 2020-03-18 |
EP3288028A1 (en) | 2018-02-28 |
EP2186088A2 (en) | 2010-05-19 |
JP5140730B2 (ja) | 2013-02-13 |
DK2186088T3 (en) | 2018-01-15 |
CN101878504A (zh) | 2010-11-03 |
EP2186088B1 (en) | 2017-11-15 |
DK3288028T3 (da) | 2019-09-02 |
CN103594090A (zh) | 2014-02-19 |
ES2823560T3 (es) | 2021-05-07 |
CA2698039C (en) | 2016-05-17 |
US8392202B2 (en) | 2013-03-05 |
WO2009029032A3 (en) | 2009-04-23 |
WO2009029032A2 (en) | 2009-03-05 |
US20130246074A1 (en) | 2013-09-19 |
BRPI0816136A2 (pt) | 2015-02-24 |
EP2186088A4 (en) | 2015-05-06 |
US20100250265A1 (en) | 2010-09-30 |
CN103594090B (zh) | 2017-10-10 |
CN101878504B (zh) | 2013-12-04 |
EP3550564A1 (en) | 2019-10-09 |
EP3288028B1 (en) | 2019-07-03 |
BRPI0816136B1 (pt) | 2020-03-03 |
CA2698039A1 (en) | 2009-03-05 |
EP3550564B1 (en) | 2020-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5140730B2 (ja) | 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 | |
KR102151749B1 (ko) | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 | |
JP6346322B2 (ja) | フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置 | |
JP5627843B2 (ja) | スペクトル領域において適応切り替え式時間分解を使用して音声信号を符号化及び復号化する方法及び装置 | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
JP4950210B2 (ja) | オーディオ圧縮 | |
KR102423959B1 (ko) | 다운샘플링 또는 스케일 파라미터의 보간을 사용하여 오디오 신호를 인코딩 및 디코딩하기 위한 장치 및 방법 | |
CN105745703B (zh) | 信号编码方法和装置以及信号解码方法和装置 | |
US20100250260A1 (en) | Encoder | |
US10657976B2 (en) | Signal encoding method and apparatus, and signal decoding method and apparatus | |
AU2015221516A1 (en) | Improved Harmonic Transposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5140730 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151122 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |