JP4787176B2 - Mdct係数から導かれた推定スペクトル強度と位相を使用する改良型コーディングテクニック - Google Patents
Mdct係数から導かれた推定スペクトル強度と位相を使用する改良型コーディングテクニック Download PDFInfo
- Publication number
- JP4787176B2 JP4787176B2 JP2006551194A JP2006551194A JP4787176B2 JP 4787176 B2 JP4787176 B2 JP 4787176B2 JP 2006551194 A JP2006551194 A JP 2006551194A JP 2006551194 A JP2006551194 A JP 2006551194A JP 4787176 B2 JP4787176 B2 JP 4787176B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- spectral component
- source signal
- equation
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 179
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000004044 response Effects 0.000 claims abstract description 67
- 238000004458 analytical method Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 53
- 230000015572 biosynthetic process Effects 0.000 claims description 22
- 238000003786 synthesis reaction Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 8
- 230000006978 adaptation Effects 0.000 claims description 5
- 239000002131 composite material Substances 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000000844 transformation Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims 1
- 238000002955 isolation Methods 0.000 claims 1
- 230000014509 gene expression Effects 0.000 abstract description 12
- 238000009795 derivation Methods 0.000 abstract description 6
- 238000004364 calculation method Methods 0.000 description 21
- 238000013139 quantization Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- Discrete Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
- Optical Communication System (AREA)
- Complex Calculations (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
Description
本発明は、修正型離散コサイン変換と修正型離散サイン変換を実行する解析フィルタバンクを含む様々なタイプの解析フィルタバンクから得られたスペクトル情報からスペクトル強度と位相を正確に推定する効率的なプロセスを提供する。これらの正確な推定はオーディオコード化や画像コード化などの様々な信号処理応用に使用されうる。
多くのコード化応用は、適切にソース信号を表すのに必要な情報量を減少させることを試みている。情報所要量を小さくすることで、表示信号をより小さなバンド幅を持つチャンネルを介して転送でき、あるいは、より少ない空間を使用するメディアに保存することができる。
本発明は、上述の修正型離散コサイン変換(MDCT)などの解析フィルタバンクによって生成したスペクトル成分から得られる強度又は位相の正確な測度を得ることを可能にする。本発明の種々の局面はオーディオコード化と画像コード化を含む多くの応用に使用されうる。図1と2は、それぞれ、本発明の種々の局面を取り入れるコーディングシステムにおける送信機と受信機の略ブロック図を示す。図示の送信機と受信機の特徴について以下のセクションで簡単に説明する。この説明の後に、強度と位相の測度計算に適切な何らかの解析フィルタバンクと合成フィルタバンクの特徴について説明する。
図1に示す送信機は、通信路1から受けたソース信号に解析フィルタバンク3を適用してソース信号のスペクトルコンテントを表すスペクトル成分を生成し、該スペクトル成分にエンコーダ5を適用してコード化された情報を生成し、該コード化された情報にフォーマッタ8を適用して伝送に適した出力信号を生成して通信路9に送り出す。出力信号は直ちに関連受信機に提供されるか、またはその後のデリバリのために記録される。解析フィルタバンク3は、無限インパルス応答(IIR)フィルタ、有限インパルス応答(FIR)フィルタ、格子フィルタ、およびウェーブレット変換を含む多様な方法で実行される。
図2に示す受信機は、通信路21から受けた入力信号にデフォーマッタ23を適用してコード化された情報を得、該コード化された情報にデコーダ25を適用してソース信号のスペクトルコンテントを表すスペクトル成分を得、該スペクトル成分に合成フィルタバンク27を適用してソース信号のレプリカであるが正確なレプリカではない出力信号を生成する。合成フィルタバンク27は解析フィルタバンク3の態様を補足するさまざまな方式による態様とされる。
Odd離散フーリエ変換(ODFT)による1実施の態様では、解析フィルタバンク3は、複素数係数、即ち、実数部と虚数部を持ちニ次元空間で表される「スペクトル成分」を生成する。この変換は以下のように表現される。
このセクションはMDCT係数から正確なMDST係数を計算するための解析表示の誘導について論ずる。この解析表示は以下に式41aと41bで示される。また、2つの特定のウィンドウ関数に関するより簡単な解析表示の誘導についても議論する。誘導についての議論の後に、実際の例についての考察も提示される。
正確なMDST係数は、MDCT係数の単一ブロックにIMDCT合成フィルタバンクを適用することによって回復されるウィンドウ化サンプルの単一セグメントからは計算できない。なぜならば、セグメントが解析ウィンドウ関数によって変調され、かつ、回復されたサンプルが時間領域エイリアシングを含んでいるからである。前後のセグメントのMDCT係数に関する追加知識を持ってして初めて正確なMDST係数を計算できる。例えば、セグメントが互いに半セグメント長重なる場合、任意のセグメントIIに関するウィンドウィング効果と時間領域エイリアシングは、合成フィルタバンクと関連合成ウィンドウ関数をソース信号の3つの連続したオーバラッピングセグメント、即ち、セグメントI、セグメントII、セグメントIIIを表すMDCT係数の3つのブロックに適用することによってキャンセルされる。各セグメントは、隣接するセグメントにセグメント長の半分と等しい量だけ、オーバラップする。セグメントIIの第1半分におけるウィンドウィング効果と時間領域エイリアシングは、セグメントIの第2半分にオーバラップして加えることによりキャンセルされ、セグメントIIの第2半分におけるこれらの効果は、セグメントIIIの第1半分にオーバラップして加えることによってキャンセルされる。
3つのセグメントは等しい同じ長さNを持ち、セグメント長の半分に等しい量互いにオーバラップする。
解析及び合成ウィンドウ関数は互いに同じである。
ソース信号のすべてのセグメントに同じウィンドウ関数が適用される。
ウィンドウ関数はすべて、そのオーバラップ付加性質が以下の基準を満たすものである。この基準はプリンセン論文で説明されるように、ソース信号の完全再構築に必要である。
レクタンギュラウィンドウ関数は比較的拙劣な周波数選択性性質をもつのでコード化応用でしばしば使用されるわけではないが、その簡単さは特定の実行を誘導するのに必要である解析の複雑さを減少させる。この誘導のために、次のレクタンギュラウィンドウ関数が使用される。
サインウィンドウ関数は、レクタンギュラウィンドウ関数よりも良い周波数選択性を持ち、いくつかの実用的なコーディングシステムで使用される。以下の誘導は、次式で定義されるサインウィンドウ関数を用いる。
式41aと41bは任意のウィンドウ関数の場合に、MDCT係数から正確なMDST係数を計算する。式49a、49b、68a及び68bは、レクタンギュラウィンドウ関数とサインウィンドウ関数をそれぞれ使用して、MDCT係数から正確なMDST係数を計算する。これらの計算はインパルス応答の畳込みと同様の演算を含む。インパルス応答の値がゼロであることが知られているものをこの演算から除くことによって、この畳込みのような演算の計算量を減少させることができる。
上に説明した開示は、本発明のほんの少ないいくつかの実施の形態を説明する例を定めるものである。本発明の原理は多種多様な方法で適用されて実施されうる。以下に追加考察を述べる。
上で説明した例示的な形態は、セグメント長の半分の長さだけ互いにオーバラップするソース信号の固定長セグメントに適用されるODFTの項として表されるMDCTから導かれる。上で説明した例の変形例と、以下に説明する代替例の変形例は、ODFTの項として表されるMDCTから形態を導くことのよって得られるであろう。
いくつかの実証的な結果は、特定のレベルの計算量を持つ本発明の形態が単一のシヌソイド又は周波数が互いに分離しているいくつかのシヌソイドを表すスペクトル成分に関してよりもスペクトルエネルギーのバンドを表すスペクトル成分に関してより正確なスペクトル成分強度の測度をしばしば引き出すことができることを示唆する。スペクトル成分強度を推定するプロセスは、隔離したスペクトル成分を持つ信号に関して推定精度を改善するために、少なくとも2つの方法で適合されるであろう。
1984年版の第57頁においてN. Jayant他による「波形のデジタルコード化」で説明されており、信号のパワースペクトル密度のサンプルの幾何平均と算術平均との比であると定義される。
本発明はさまざまな応用で有利に使用されるだろう。本発明の種々の具現を取り入れた送信機と受信機の略ブロック図をそれぞれ図4と、図5に示す。
Claims (19)
- 人間が知覚することを意図するコンテントを伝えるソース信号を表す情報を処理する方法であって:
前記ソース信号に第1解析フィルタバンクを適用して生成した第1スペクトル成分を受け;
前記第1解析フィルタバンクの逆の特性を持つ合成フィルタバンクと、該合成フィルタバンクに結合された第2解析フィルタバンクとを組合せた効果を有することとなる1つ以上のインパルス応答の部分で、2つ以上のセグメントにおける前記第1スペクトル成分の少なくともいくつかから引き出されたものをたたみこむことにより第2スペクトル成分を得;
前記第1スペクトル成分と前記第2スペクトル成分を使用して強度又は位相の推定測度を得;
前記強度又は位相の推定測度に応答する適応過程を前記第1スペクトル成分に適用して処理済情報を生成する:
ことを含んでなる方法。 - 請求項1の方法であって:前記第1スペクトル成分は、前記ソース信号の1つ以上のセグメントに1つ以上の変換を与えることによって生成された1つ以上のブロックの変換係数として配置された変換係数であり;かつ、前記1つ以上のインパルス応答の前記少なくとも一部は前記1つ以上の変換の周波数応答特性に基づく;方法。
- 請求項2の方法であって、前記1つ以上の変換の前記周波数応答特性は、前記1つ以上の変換と共にソース信号の前記1つ以上のセグメントに適用された1つ以上の解析ウィンドウ関数の特性に依存する方法。
- 請求項3の方法であって、 前記1つ以上の変換の前記少なくともいくつかは、時間領域エイリアシングを持つ前記第1スペクトル成分を生成する解析フィルタバンクを実行する方法。
- 請求項3の方法であって、 前記1つ以上の変換の前記少なくともいくつかは実数値を含む第1スペクトル成分を生成し、かつ、前記第2スペクトル値が虚数値を含む方法。
- 請求項5の方法であって、前記実数値を有する前記第1スペクトル成分を生成する前記変換は離散コサイン変換又は修正型離散コサイン変換である方法。
- 請求項1の方法であって:前記1つ以上の第1スペクトル成分の少なくともいくつかから引き出された1つ以上の第3スペクトル成分を使用して強度又は位相の推定測度を得ることをさらに含む方法。
- 請求項7の方法であって:
第1スペクトル成分は、前記ソース信号の1つ以上のセグメントに1つ以上の変換を適用して生成した1つ以上のブロックの変換係数として配置された変換係数であり;
前記第3スペクトル成分は2つ以上の前記第1スペクトル成分の組合せから引き出され;
前記ソース信号のそれぞれのセグメントの強度又は位相の推定測度は、前記第3スペクトル成分、又は、前記第1スペクトル成分及び前記第2スペクトル成分のいずれか一方を用いて適応的に得られる;
方法。 - 請求項7の方法であって:
第1スペクトル成分は、前記ソース信号の1つ以上のセグメントに1つ以上の変換を適用して生成した1つ以上のブロックの変換係数として配置された変換係数であり;
前記第3スペクトル成分は2つ以上の前記第1スペクトル成分の組合せから引き出され;
前記ソース信号のそれぞれのセグメントの少なくともいくつかのスペクトルコンテントの強度又は位相の推定測度は前記第3スペクトル成分を用いて得られ、かつ、前記ソース信号のそれぞれのセグメントの少なくともいくつかのスペクトルコンテントの強度又は位相の推定測度は前記第1及び第2スペクトル成分を用いて得られる;
方法。 - 請求項7又は9の方法であって、前記第3スペクトル成分、又は、前記第1スペクトル成分及び前記第2スペクトル成分のいずれか一方を用いて強度又は位相の測度を適応的に得ることを含む方法。
- 請求項1の方法であって、スペクトル成分重みの測度に応答して、前記1つ以上のインパルス応答の前記部分を適応させることを含む方法。
- 請求項1の方法であって、前記スペクトル成分重みの測度は、前記ソース信号の前記スペクトルコンテントの知覚重みを評価する知覚モデルによって与えられる方法。
- 請求項1の方法であって、前記スペクトル成分重みの測度は1つ以上のスペクトル成分の周波数の孤立を反映する方法。
- 請求項1の方法であって:
前記第1スペクトル成分は、前記ソース信号の1つ以上のセグメントに1つ以上の変換を適用して生成した1つ以上のブロックの変換係数として配置された第1変換係数であり、前記各ブロックは第1数の第1変換係数を含み;
前記第2スペクトル成分は第2変換係数であり;
第2数の第2変換係数が引き出されて前記各ブロックにおける前記第1変換係数のいくつかによって表されるスペクトルコンテントを表し;
前記第2数は前記第1数より少ない;
方法。 - 請求項1、2、8、9または11のいずれか1つに記載の方法であって、前記第1スペクトル成分に適応過程を適用して合成スペクトル成分を生成することを含む方法。
- 請求項15の方法であって、 前記合成スペクトル成分の少なくともいくつかをスペクトル成分再生によって生成する方法。
- 請求項16の方法であって、前記合成スペクトル成分の少なくともいくつかは第1スペクトル成分及び/又は複数のソース信号のスペクトルコンテントの合成を表す第2スペクトル成分の分解によって生成される方法。
- 請求項15の方法であって、前記合成スペクトル成分の少なくともいくつかは、第1スペクトル成分及び/又は第2スペクトル成分を結合することによって生成され、複数のソース信号のスペクトルコンテントの合成表示を提供する方法。
- 請求項1、2、8、9、または11のいずれか1つに記載の方法であって、
前記ソース信号に前記解析フィルタバンクを適用することによって前記第1スペクトル成分を生成し;
前記第1スペクトル成分に前記適応過程を適用して、前記第1スペクトル成分の少なくともいくつかを表すコード化された情報を生成し;
前記コード化された情報を伝える出力信号を生成する;
ことを含んでなる方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/766,681 US6980933B2 (en) | 2004-01-27 | 2004-01-27 | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
US10/766,681 | 2004-01-27 | ||
PCT/US2005/001499 WO2005073960A1 (en) | 2004-01-27 | 2005-01-14 | Improved coding techniques using estimated spectral magnitude and phase derived from mdct coefficients |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007524300A JP2007524300A (ja) | 2007-08-23 |
JP2007524300A5 JP2007524300A5 (ja) | 2008-03-06 |
JP4787176B2 true JP4787176B2 (ja) | 2011-10-05 |
Family
ID=34795716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006551194A Active JP4787176B2 (ja) | 2004-01-27 | 2005-01-14 | Mdct係数から導かれた推定スペクトル強度と位相を使用する改良型コーディングテクニック |
Country Status (15)
Country | Link |
---|---|
US (6) | US6980933B2 (ja) |
EP (1) | EP1709627B1 (ja) |
JP (1) | JP4787176B2 (ja) |
KR (1) | KR101184992B1 (ja) |
CN (1) | CN1918633B (ja) |
AT (1) | ATE532174T1 (ja) |
AU (1) | AU2005208287B2 (ja) |
CA (1) | CA2553784C (ja) |
DK (1) | DK1709627T3 (ja) |
ES (1) | ES2375285T3 (ja) |
HK (1) | HK1091309A1 (ja) |
IL (1) | IL176477A (ja) |
PL (1) | PL1709627T3 (ja) |
TW (1) | TWI374612B (ja) |
WO (1) | WO2005073960A1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6980933B2 (en) | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
US20080249765A1 (en) * | 2004-01-28 | 2008-10-09 | Koninklijke Philips Electronic, N.V. | Audio Signal Decoding Using Complex-Valued Data |
US9055298B2 (en) * | 2005-07-15 | 2015-06-09 | Qualcomm Incorporated | Video encoding method enabling highly efficient partial decoding of H.264 and other transform coded information |
US20070118361A1 (en) * | 2005-10-07 | 2007-05-24 | Deepen Sinha | Window apparatus and method |
US8126706B2 (en) * | 2005-12-09 | 2012-02-28 | Acoustic Technologies, Inc. | Music detector for echo cancellation and noise reduction |
EP4372743A2 (en) * | 2006-01-27 | 2024-05-22 | Dolby International AB | Efficient filtering with a complex modulated filterbank |
KR100882400B1 (ko) * | 2006-06-19 | 2009-02-05 | 파나소닉 주식회사 | 인코더 신호의 위상 보정 회로 |
US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
US8315398B2 (en) | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
CN101552006B (zh) * | 2009-05-12 | 2011-12-28 | 武汉大学 | 加窗信号mdct域的能量及相位调整方法及其装置 |
CN102460574A (zh) * | 2009-05-19 | 2012-05-16 | 韩国电子通信研究院 | 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备 |
CN101958119B (zh) * | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
KR101410312B1 (ko) * | 2009-07-27 | 2014-06-27 | 연세대학교 산학협력단 | 오디오 신호 처리 방법 및 장치 |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
EP3723090B1 (en) | 2009-10-21 | 2021-12-15 | Dolby International AB | Oversampling in a combined transposer filter bank |
EP2372703A1 (en) * | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
RU2683175C2 (ru) | 2010-04-09 | 2019-03-26 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
PL3779979T3 (pl) | 2010-04-13 | 2024-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
EP2702589B1 (en) * | 2011-04-28 | 2017-04-05 | Dolby International AB | Efficient content classification and loudness estimation |
TWI575962B (zh) | 2012-02-24 | 2017-03-21 | 杜比國際公司 | 部份複數處理之重疊濾波器組中的低延遲實數至複數轉換 |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
KR101498113B1 (ko) * | 2013-10-23 | 2015-03-04 | 광주과학기술원 | 사운드 신호의 대역폭 확장 장치 및 방법 |
EP2963649A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
EP3067889A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
US5451954A (en) * | 1993-08-04 | 1995-09-19 | Dolby Laboratories Licensing Corporation | Quantization noise suppression for encoder/decoder system |
WO1996019876A1 (en) * | 1994-12-20 | 1996-06-27 | Dolby Laboratories Licensing Corporation | Method and apparatus for applying waveform prediction to subbands of a perceptual coding system |
US5682463A (en) * | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
US5699479A (en) * | 1995-02-06 | 1997-12-16 | Lucent Technologies Inc. | Tonality for perceptual audio compression based on loudness uncertainty |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
US6035177A (en) * | 1996-02-26 | 2000-03-07 | Donald W. Moses | Simultaneous transmission of ancillary and audio signals by means of perceptual coding |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US5945940A (en) * | 1998-03-12 | 1999-08-31 | Massachusetts Institute Of Technology | Coherent ultra-wideband processing of sparse multi-sensor/multi-spectral radar measurements |
US6847737B1 (en) * | 1998-03-13 | 2005-01-25 | University Of Houston System | Methods for performing DAF data filtering and padding |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
JP4099608B2 (ja) | 1998-07-29 | 2008-06-11 | ソニー株式会社 | 信号処理装置、記録媒体及び信号処理方法 |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
US6182030B1 (en) * | 1998-12-18 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced coding to improve coded communication signals |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6862326B1 (en) * | 2001-02-20 | 2005-03-01 | Comsys Communication & Signal Processing Ltd. | Whitening matched filter for use in a communications receiver |
SE0101175D0 (sv) * | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
DE10234130B3 (de) * | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
CA2399159A1 (en) * | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
US6980933B2 (en) * | 2004-01-27 | 2005-12-27 | Dolby Laboratories Licensing Corporation | Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients |
-
2004
- 2004-01-27 US US10/766,681 patent/US6980933B2/en not_active Ceased
- 2004-11-26 TW TW093136532A patent/TWI374612B/zh active
-
2005
- 2005-01-14 DK DK05711553.7T patent/DK1709627T3/da active
- 2005-01-14 PL PL05711553T patent/PL1709627T3/pl unknown
- 2005-01-14 JP JP2006551194A patent/JP4787176B2/ja active Active
- 2005-01-14 AU AU2005208287A patent/AU2005208287B2/en active Active
- 2005-01-14 CN CN2005800033841A patent/CN1918633B/zh active Active
- 2005-01-14 EP EP05711553A patent/EP1709627B1/en active Active
- 2005-01-14 WO PCT/US2005/001499 patent/WO2005073960A1/en not_active Application Discontinuation
- 2005-01-14 AT AT05711553T patent/ATE532174T1/de active
- 2005-01-14 ES ES05711553T patent/ES2375285T3/es active Active
- 2005-01-14 KR KR1020067013738A patent/KR101184992B1/ko active IP Right Grant
- 2005-01-14 CA CA2553784A patent/CA2553784C/en active Active
-
2006
- 2006-06-21 IL IL176477A patent/IL176477A/en active IP Right Grant
- 2006-10-27 HK HK06111862.6A patent/HK1091309A1/xx unknown
-
2007
- 2007-12-21 US US11/963,680 patent/USRE42935E1/en not_active Expired - Lifetime
-
2011
- 2011-11-15 US US13/297,256 patent/USRE44126E1/en not_active Expired - Lifetime
-
2012
- 2012-11-13 US US13/675,998 patent/USRE46684E1/en not_active Expired - Lifetime
-
2018
- 2018-01-22 US US15/877,345 patent/USRE48210E1/en not_active Expired - Lifetime
- 2018-01-22 US US15/877,343 patent/USRE48271E1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
ATE532174T1 (de) | 2011-11-15 |
USRE46684E1 (en) | 2018-01-23 |
KR101184992B1 (ko) | 2012-10-02 |
AU2005208287A1 (en) | 2005-08-11 |
USRE48271E1 (en) | 2020-10-20 |
IL176477A0 (en) | 2006-10-05 |
JP2007524300A (ja) | 2007-08-23 |
PL1709627T3 (pl) | 2012-03-30 |
US6980933B2 (en) | 2005-12-27 |
US20050165587A1 (en) | 2005-07-28 |
TW200525899A (en) | 2005-08-01 |
TWI374612B (en) | 2012-10-11 |
CA2553784A1 (en) | 2005-08-11 |
WO2005073960A1 (en) | 2005-08-11 |
KR20060131797A (ko) | 2006-12-20 |
DK1709627T3 (da) | 2012-02-13 |
CA2553784C (en) | 2013-07-30 |
CN1918633B (zh) | 2011-01-05 |
EP1709627B1 (en) | 2011-11-02 |
EP1709627A1 (en) | 2006-10-11 |
USRE48210E1 (en) | 2020-09-15 |
ES2375285T3 (es) | 2012-02-28 |
USRE42935E1 (en) | 2011-11-15 |
USRE44126E1 (en) | 2013-04-02 |
CN1918633A (zh) | 2007-02-21 |
AU2005208287B2 (en) | 2010-02-18 |
IL176477A (en) | 2010-04-15 |
HK1091309A1 (en) | 2007-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4787176B2 (ja) | Mdct係数から導かれた推定スペクトル強度と位相を使用する改良型コーディングテクニック | |
US7707030B2 (en) | Device and method for generating a complex spectral representation of a discrete-time signal | |
JP4689625B2 (ja) | 信号解析及び合成のための適応型混合変換 | |
KR100253136B1 (ko) | 저계산 복잡도의 디지탈 필터뱅크 | |
US5727119A (en) | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase | |
US8195730B2 (en) | Apparatus and method for conversion into a transformed representation or for inverse conversion of the transformed representation | |
CN104603873B (zh) | 用于在子带域中能自由选择频移的设备、方法和数字存储介质 | |
US7512539B2 (en) | Method and device for processing time-discrete audio sampled values | |
RU2616863C2 (ru) | Сигнальный процессор, формирователь окон, кодированный медиа-сигнал, способ обработки сигнала и способ формирования окон | |
Britanak et al. | Cosine-/Sine-Modulated Filter Banks | |
CN109863555A (zh) | 部分合成之前使用频谱分析的非均匀滤波器组的时域混叠降低 | |
EP0827647B1 (en) | Analysis/synthesis filtering system with efficient oddly-stacked single-sideband filter bank using time-domain aliasing cancellation | |
KR101411297B1 (ko) | 저주파 효과 채널에 대한 복잡성 감소 변환 | |
MXPA06008474A (es) | Tecnicas de codificacion mejoradas que utilizan magnitud y fase espectrales estimadas derivadas a partir de coeficientes de mdct | |
Hossen et al. | Different approximate cepstra using subband-transforms: Theory and applications | |
Ruan | Lapped transforms in perceptual coding of wideband audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080115 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110228 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110307 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110328 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110628 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4787176 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |