JP2011522291A - オーバーラッピング変換の2つのブロック変換への因数分解 - Google Patents
オーバーラッピング変換の2つのブロック変換への因数分解 Download PDFInfo
- Publication number
- JP2011522291A JP2011522291A JP2011511737A JP2011511737A JP2011522291A JP 2011522291 A JP2011522291 A JP 2011522291A JP 2011511737 A JP2011511737 A JP 2011511737A JP 2011511737 A JP2011511737 A JP 2011511737A JP 2011522291 A JP2011522291 A JP 2011522291A
- Authority
- JP
- Japan
- Prior art keywords
- transform
- subframe
- block
- overlap
- reversible
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002441 reversible effect Effects 0.000 claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 37
- 230000009466 transformation Effects 0.000 claims description 27
- 230000005236 sound signal Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 239000000872 buffer Substances 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims 1
- 238000013139 quantization Methods 0.000 description 39
- 230000006835 compression Effects 0.000 description 15
- 238000007906 compression Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 13
- 230000003595 spectral effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000008447 perception Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000011295 pitch Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Discrete Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
音声の符号化は、人間の聴覚のさまざまな知覚モデルを活用する符号化技法を利用する。例えば、強い音程の近くの多くの弱い音程は、符号化する必要がないようにマスクされる。従来の知覚音声符号化では、これは、異なる周波数データの適応量子化として活用されている。知覚的に重要な周波数データには、より多くのビットが割り当てられ、したがって、よりきめの細かな量子化が割り当てられ、逆に知覚的に重要でない周波数データには、より少ないビットが割り当てられ、したがって、より粗い量子化が割り当てられる。
多くの音声圧縮システムは、変調重複変換(MLT、修正離散コサイン変換、すなわちMDCTとしても知られている)を利用して、音声変換符号化において時間周波数解析を実行する。MLTは、再構成された音声信号に量子化により導入されたブロッキングアーティファクトを低減する。より詳細には、オーバーラップしないブロックが独立に変換符号化されたとき、量子化誤差により、復号器における音声信号の再構成の際にブロック境界に信号の不連続性が生じる。音声の場合、周期的なクリック効果が聞こえる。
オーバーラッピング変換は無損失符号化にも使用することができる。多くの無損失符号化技法は、時間領域の音声信号データに処理を行う。しかしながら、無損失符号化は、量子化することなく重複変換を適用した後、結果として得られた変換係数のエントロピー符号化又は他の無損失符号化を単に実行するだけで周波数領域でも実行することができる。このような周波数領域の無損失符号化によって、音声信号の有損失圧縮バージョン及び無損失圧縮バージョンを同時により容易に導出することが可能になる。しかし、周波数領域の無損失圧縮は、変換が可逆的であることを必要とする。さらに、変換を可逆的にするのに必要とされるような一貫性のある計算について、変換は整数の実施態様を有するべきである。
図1は、説明される実施形態を実施することができる適切なコンピューティング環境100の一般化された例を示す。説明される実施形態は、種々の汎用コンピューティング環境又は専用コンピューティング環境で実施することができるので、コンピューティング環境100は、使用又は機能性の範囲についていかなる限定を示唆することも意図していない。
図2は、説明される1つ又は複数の実施形態を実施することができる第1の音声符号化器200を示す。符号化器200は、変換ベースの知覚音声符号化器200である。図3は、対応する音声復号器300を示す。
符号化器200は、時系列の入力音声サンプル205を或るサンプリング深度及びサンプリングレートで受け取る。入力音声サンプル205は、マルチチャネル音声(例えばステレオ)用又はモノラル音声用である。符号化器200は、音声サンプル205を圧縮し、符号化器200のさまざまなモジュールによって作成された情報を多重化して、WMAフォーマット等の圧縮フォーマット、アドバンストストリーミングフォーマット(「ASF」)等のコンテナフォーマット、又は他の圧縮フォーマット若しくはコンテナフォーマットでビットストリーム295を出力する。
復号器300は、エントロピー符号化されたデータと共にサイド情報も含む圧縮された音声情報のビットストリーム305を受け取り、このビットストリームから、復号器300は、音声サンプル395を再構成する。
図4を参照して、符号化器400は、時系列の入力音声サンプル405を或るサンプリング深度及びサンプリングレートで受け取る。入力音声サンプル405は、マルチチャネル音声(例えばステレオ、サラウンド)用又はモノラル音声用である。符号化器400は、音声サンプル405を圧縮し、符号化器400のさまざまなモジュールによって作成された情報を多重化して、WMA Proフォーマット等の圧縮フォーマット、ASF等のコンテナフォーマット、又は他の圧縮フォーマット若しくはコンテナフォーマットでビットストリーム495を出力する。
図5を参照して、第2の音声復号器500は、圧縮された音声情報のビットストリーム505を受け取る。このビットストリーム505は、エントロピー符号化されたデータと共にサイド情報も含む。これらのデータ及びサイド情報から、復号器500は音声サンプル595を再構成する。
上述したように、代表的符号化器(例えば、タイル構成器422)は、プリエコー効果を回避するために音声の過渡現象により小さなサブフレームサイズを使用することと、符号化効率のためにより大きなサブフレームサイズを使用することとの間をバランスさせる等のために、変化するサブフレームサイズを使用して音声信号を符号化する。符号化器は、Chen他による米国特許出願公開第US−2003−0115052号の“ADAPTIVE WINDOW-SIZE SELECTION IN TRANSFORM CODING”に説明された技法等、さまざまな技法を用いてサブフレームサイズを適応的に選ぶことができる。
次のセクションでは、MLT等の一定の重複直交変換を理解及び実施するための単純な方法を提示する。MLT(MCLTの実部)は、次の直交変換として記述することができるが(負の符号は任意であるが、音声符号で共通に使用される(スケールファクタを除く)変換の定義と整合するように追加される)。
cos(−θ+π)=−cosθであるので、その結果として、
一定の条件下では、隣接したブロック間で50%以下のオーバーラップを有するいずれの変換も、2つのブロック変換に因数分解することができる。正確な必要条件は、以下の導出で説明される。50%以下のオーバーラップを有するブロックに処理を行う重複変換を考えることにする。このような線形変換は、行列として記述することができる。この行列における各ブロックは、N/2×N/2行列である。ここで、Nは(可変ブロックサイズが可能である場合には)変換の最小ブロックサイズである。例えば、重複変換は、512、1024、及び2048のサイズのブロックの使用が可能にされていると仮定する。この場合、ブロックサイズが512、1024、512、及び512である場合、重複変換の変換行列は、次のように記述することができる。
Claims (11)
- 音声信号を符号化する方法であって、
時間領域の音声サンプルのシーケンスを含む音声信号(405)の入力を受け取るステップと、
前記音声信号を、少なくとも2つの異なるサブフレームサイズを有するサブフレーム(611〜615)に区画するステップと、
前記異なるサイズのサブフレームの可逆的整数入力対整数出力を有する重複変換(430)を実行するステップであって、該重複変換は、前記それぞれのサブフレームサイズである前記サブフレームに適用される可逆的ブロック変換とそれぞれの隣接したサブフレームをオーバーラップさせる可逆的ブロック回転変換との組み合わせとして実現され、各可逆的ブロック回転変換は、前記オーバーラップされた隣接したサブフレームの小さい方の最大半分までをオーバーラップさせ、サブフレームの前記可逆的ブロック変換及び隣接したサブフレームとオーバーラップさせる前記可逆的ブロック回転変換は、前記重複変換の因数分解である、重複変換(430)を実行するステップと、
その結果として得られた変換係数を圧縮されたビットストリーム(495)として符号化するステップと
を含む方法。 - 前記重複変換は変調重複変換である、請求項1に記載の方法。
- 前記重複変換は修正離散コサイン変換である、請求項2に記載の方法。
- 前記ブロック変換は、ブロックベースのDCT−IVタイプの変換であり、前記可逆的ブロック回転変換は単一段バッファーフライターイプの変換である、請求項3に記載の方法。
- サブフレームの前記重複変換は、オーバーラップする先行の隣接したサブフレーム及び後続の隣接したサブフレームが異なるサイズである場合には、該先行の隣接したサブフレーム及び該後続の隣接したサブフレームについての異なるサイズの可逆的ブロック回転変換に因数分解される、請求項1に記載の方法。
- 音声信号を復号する方法であって、
異なるサイズのサブフレーム(611〜615)に区画された音声信号(505)の変換係数を復号するステップと、
前記異なるサイズのサブフレームの可逆的整数入力対整数出力を有する重複変換(560)を実行するステップであって、該重複変換は、前記それぞれのサブフレームサイズである前記サブフレームに適用される可逆的ブロック変換とそれぞれの隣接したサブフレームをオーバーラップさせる可逆的ブロック回転変換との組み合わせとして実現され、各可逆的ブロック回転変換は、前記オーバーラップされた隣接したサブフレームの小さい方の最大半分までをオーバーラップさせ、サブフレームの前記可逆的ブロック変換及び隣接したサブフレームとオーバーラップさせる前記可逆的ブロック回転変換は、前記重複変換の因数分解である、重複変換(560)を実行するステップと、
前記逆変換された変換係数から時間領域の音声信号の音声サンプルを作成するステップと、
前記音声信号(595)を出力するステップと、
を含む方法。 - 前記重複変換は変調重複変換である、請求項6に記載の方法。
- 前記重複変換は修正離散コサイン変換である、請求項7に記載の方法。
- 前記ブロック変換は、ブロックベースのDCT−IVタイプの変換であり、前記可逆的ブロック回転変換は単一段バッファーフライターイプの変換である、請求項8に記載の方法。
- サブフレームの前記重複変換は、オーバーラップする先行の隣接したサブフレーム及び後続の隣接したサブフレームが異なるサイズである場合には、該先行の隣接したサブフレーム及び該後続の隣接したサブフレームについての異なるサイズの可逆的ブロック回転変換に因数分解される、請求項9に記載の方法。
- 複数の異なるサイズのサブフレームに区画された入力音声信号を処理するための重複変換の可逆的整数入力/整数出力の実施態様を導出する方法であって、
隣接したサブフレーム(611〜615)をオーバーラップさせるオーバーラップ領域(711〜714)のオーバーラップウィンドウ化変換と前記サブフレームのブロック変換(811〜815)との組み合わせに前記重複変換(430)を因数分解するステップであって、該因数分解するステップは、
所与のサブフレームの前記重複変換の表現を、
前記矩形線形変換行列Aを、
を含む、前記重複変換(430)を因数分解するステップと、
前記サブフレームを有する音声信号(405)の入力を受け取るステップと、
前記オーバーラップウィンドウ化変換行列Cを、前記サブフレーム及びその先行の隣接したサブフレームに適用するステップと、
前記ブロック変換行列Bを前記サブフレームに適用するステップと
を含む方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/130,862 | 2008-05-30 | ||
US12/130,862 US8447591B2 (en) | 2008-05-30 | 2008-05-30 | Factorization of overlapping tranforms into two block transforms |
PCT/US2009/044983 WO2009148858A2 (en) | 2008-05-30 | 2009-05-22 | Factorization of overlapping transforms into two block transforms |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011522291A true JP2011522291A (ja) | 2011-07-28 |
JP2011522291A5 JP2011522291A5 (ja) | 2012-06-07 |
JP5400143B2 JP5400143B2 (ja) | 2014-01-29 |
Family
ID=41380875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011511737A Active JP5400143B2 (ja) | 2008-05-30 | 2009-05-22 | オーバーラッピング変換の2つのブロック変換への因数分解 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8447591B2 (ja) |
EP (1) | EP2279562B1 (ja) |
JP (1) | JP5400143B2 (ja) |
KR (1) | KR101679083B1 (ja) |
CN (1) | CN102047564B (ja) |
WO (1) | WO2009148858A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012032803A (ja) * | 2010-07-01 | 2012-02-16 | Polycom Inc | フルバンド拡張可能なオーディオコーデック |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8036274B2 (en) * | 2005-08-12 | 2011-10-11 | Microsoft Corporation | SIMD lapped transform-based digital media encoding/decoding |
US8369638B2 (en) | 2008-05-27 | 2013-02-05 | Microsoft Corporation | Reducing DC leakage in HD photo transform |
MY160260A (en) | 2008-07-11 | 2017-02-28 | Fraunhofer Ges Forschung | Audio encoder and audio decoder |
US8275209B2 (en) * | 2008-10-10 | 2012-09-25 | Microsoft Corporation | Reduced DC gain mismatch and DC leakage in overlap transform processing |
JP5270006B2 (ja) * | 2008-12-24 | 2013-08-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 周波数領域におけるオーディオ信号ラウドネス決定と修正 |
CN102611883B (zh) * | 2011-01-19 | 2014-07-30 | 华为技术有限公司 | 编码方法、解码方法及装置 |
US20140046670A1 (en) * | 2012-06-04 | 2014-02-13 | Samsung Electronics Co., Ltd. | Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same |
RU2625560C2 (ru) | 2013-02-20 | 2017-07-14 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ кодирования или декодирования аудиосигнала с использованием перекрытия, зависящего от местоположения перехода |
KR20160074540A (ko) | 2013-10-17 | 2016-06-28 | 다우 아그로사이언시즈 엘엘씨 | 살충성 화합물의 제조 방법 |
CN107895580B (zh) * | 2016-09-30 | 2021-06-01 | 华为技术有限公司 | 一种音频信号的重建方法和装置 |
WO2018201113A1 (en) * | 2017-04-28 | 2018-11-01 | Dts, Inc. | Audio coder window and transform implementations |
CN110233626B (zh) * | 2019-07-05 | 2022-10-25 | 重庆邮电大学 | 基于二维自适应量化的机械振动信号边缘数据无损压缩方法 |
CN118571234A (zh) * | 2023-02-28 | 2024-08-30 | 华为技术有限公司 | 音频编解码方法及相关装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004264810A (ja) * | 2002-09-04 | 2004-09-24 | Microsoft Corp | マルチチャネルオーディオのエンコーディングおよびデコーディング |
JP2010537245A (ja) * | 2007-08-17 | 2010-12-02 | オープン・インターフェイス・ノース・アメリカ,インコーポレイテッド | デジタルコンテンツの符号化および/または復号 |
Family Cites Families (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4754492A (en) | 1985-06-03 | 1988-06-28 | Picturetel Corporation | Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts |
US4698672A (en) | 1986-10-27 | 1987-10-06 | Compression Labs, Inc. | Coding system for reducing redundancy |
US5297236A (en) | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
JP2549479B2 (ja) | 1991-12-06 | 1996-10-30 | 日本電信電話株式会社 | 動き補償フレーム間帯域分割符号化処理方法 |
KR0148130B1 (ko) | 1992-05-18 | 1998-09-15 | 강진구 | 블럭킹아티팩트를 억제시키는 부호화/복호화 방법 및 그 장치 |
JP3401823B2 (ja) | 1993-03-31 | 2003-04-28 | ソニー株式会社 | 画像コーデック用プロセッサ |
US5982459A (en) | 1995-05-31 | 1999-11-09 | 8×8, Inc. | Integrated multimedia communications processor and codec |
FR2737931B1 (fr) | 1995-08-17 | 1998-10-02 | Siemens Ag | Procede destine au traitement de blocs d'images decodes d'un procede de codage d'images a base de blocs |
US6026182A (en) | 1995-10-05 | 2000-02-15 | Microsoft Corporation | Feature segmentation |
US6064776A (en) | 1995-10-27 | 2000-05-16 | Kabushiki Kaisha Toshiba | Image processing apparatus |
US5850294A (en) | 1995-12-18 | 1998-12-15 | Lucent Technologies Inc. | Method and apparatus for post-processing images |
KR100196838B1 (ko) | 1995-12-23 | 1999-06-15 | 전주범 | 블럭벌 상관 관계에 의한 부호화 장치 |
US5805739A (en) | 1996-04-02 | 1998-09-08 | Picturetel Corporation | Lapped orthogonal vector quantization |
JPH1070717A (ja) | 1996-06-19 | 1998-03-10 | Matsushita Electric Ind Co Ltd | 画像符号化装置及び画像復号化装置 |
JP2907146B2 (ja) * | 1996-09-11 | 1999-06-21 | 日本電気株式会社 | メモリlsiの特定箇所探索方法および探索装置 |
US6233017B1 (en) | 1996-09-16 | 2001-05-15 | Microsoft Corporation | Multimedia compression system with adaptive block sizes |
US5999656A (en) | 1997-01-17 | 1999-12-07 | Ricoh Co., Ltd. | Overlapped reversible transforms for unified lossless/lossy compression |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US5973755A (en) | 1997-04-04 | 1999-10-26 | Microsoft Corporation | Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms |
US6101279A (en) | 1997-06-05 | 2000-08-08 | Wisconsin Alumni Research Foundation | Image compression system using block transforms and tree-type coefficient truncation |
JP3375539B2 (ja) | 1997-07-14 | 2003-02-10 | ペンタックス株式会社 | 画像圧縮装置および画像伸張装置 |
US5859788A (en) | 1997-08-15 | 1999-01-12 | The Aerospace Corporation | Modulated lapped transform method |
TW364269B (en) | 1998-01-02 | 1999-07-11 | Winbond Electronic Corp | Discreet cosine transform/inverse discreet cosine transform circuit |
US6393156B1 (en) | 1998-01-07 | 2002-05-21 | Truong Q. Nguyen | Enhanced transform compatibility for standardized data compression |
US6393061B1 (en) | 1998-05-15 | 2002-05-21 | Hughes Electronics Corporation | Method for reducing blocking artifacts in digital images |
US6029126A (en) | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
US6073153A (en) | 1998-06-03 | 2000-06-06 | Microsoft Corporation | Fast system and method for computing modulated lapped transforms |
US6154762A (en) | 1998-06-03 | 2000-11-28 | Microsoft Corporation | Fast system and method for computing modulated lapped transforms |
US6253165B1 (en) | 1998-06-30 | 2001-06-26 | Microsoft Corporation | System and method for modeling probability distribution functions of transform coefficients of encoded signal |
US6011625A (en) | 1998-07-08 | 2000-01-04 | Lockheed Martin Corporation | Method for phase unwrapping in imaging systems |
US6421464B1 (en) | 1998-12-16 | 2002-07-16 | Fastvdo Llc | Fast lapped image transforms using lifting steps |
US6487574B1 (en) | 1999-02-26 | 2002-11-26 | Microsoft Corp. | System and method for producing modulated complex lapped transforms |
US6496795B1 (en) | 1999-05-05 | 2002-12-17 | Microsoft Corporation | Modulated complex lapped transform for integrated signal enhancement and coding |
US6370502B1 (en) | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
US6771829B1 (en) | 1999-10-23 | 2004-08-03 | Fastvdo Llc | Method for local zerotree image coding |
US6377916B1 (en) | 1999-11-29 | 2002-04-23 | Digital Voice Systems, Inc. | Multiband harmonic transform coder |
US6865229B1 (en) | 1999-12-14 | 2005-03-08 | Koninklijke Philips Electronics N.V. | Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images |
US6771828B1 (en) | 2000-03-03 | 2004-08-03 | Microsoft Corporation | System and method for progessively transform coding digital data |
US7177358B2 (en) | 2000-06-27 | 2007-02-13 | Mitsubishi Denki Kabushiki Kaisha | Picture coding apparatus, and picture coding method |
US6832232B1 (en) | 2000-07-10 | 2004-12-14 | Advanced Micro Devices, Inc. | Dual-block inverse discrete cosine transform method |
WO2002007438A1 (en) | 2000-07-17 | 2002-01-24 | Trustees Of Boston University | Generalized lapped biorthogonal transform embedded inverse discrete cosine transform and low bit rate video sequence coding artifact removal |
WO2002023475A2 (en) | 2000-09-12 | 2002-03-21 | Koninklijke Philips Electronics N.V. | Video coding method |
EP1202219A1 (en) | 2000-10-30 | 2002-05-02 | Fast Video, LLC | Fast lapped image transforms |
JP2002182693A (ja) | 2000-12-13 | 2002-06-26 | Nec Corp | オーディオ符号化、復号装置及びその方法並びにその制御プログラム記録媒体 |
AU2002236659A1 (en) | 2000-12-19 | 2002-07-01 | Pulsent Corporation | Adaptive transforms |
JP2002304624A (ja) | 2001-04-05 | 2002-10-18 | Canon Inc | フィルタ処理装置及び撮像装置 |
US7027654B1 (en) | 2001-08-16 | 2006-04-11 | On2 Technologies | Video compression system |
US6882685B2 (en) | 2001-09-18 | 2005-04-19 | Microsoft Corporation | Block transform and quantization for image and video coding |
JP2003141562A (ja) | 2001-10-29 | 2003-05-16 | Sony Corp | 非平面画像の画像処理装置及び画像処理方法、記憶媒体、並びにコンピュータ・プログラム |
US7460993B2 (en) | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
CN101448162B (zh) | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
WO2003053066A1 (en) | 2001-12-17 | 2003-06-26 | Microsoft Corporation | Skip macroblock coding |
US6763068B2 (en) | 2001-12-28 | 2004-07-13 | Nokia Corporation | Method and apparatus for selecting macroblock quantization parameters in a video encoder |
JP2003283840A (ja) | 2002-03-25 | 2003-10-03 | Canon Inc | フィルタ処理装置およびフィルタ処理方法 |
US7155065B1 (en) | 2002-03-27 | 2006-12-26 | Microsoft Corporation | System and method for progressively transforming and coding digital data |
US7006699B2 (en) | 2002-03-27 | 2006-02-28 | Microsoft Corporation | System and method for progressively transforming and coding digital data |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
JP3855827B2 (ja) | 2002-04-05 | 2006-12-13 | ソニー株式会社 | 2次元サブバンド符号化装置 |
US7275036B2 (en) | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
US7120297B2 (en) | 2002-04-25 | 2006-10-10 | Microsoft Corporation | Segmented layered image system |
US7242713B2 (en) | 2002-05-02 | 2007-07-10 | Microsoft Corporation | 2-D transforms for image and video coding |
GB2388502A (en) * | 2002-05-10 | 2003-11-12 | Chris Dunn | Compression of frequency domain audio signals |
US7376280B2 (en) | 2002-07-14 | 2008-05-20 | Apple Inc | Video encoding and decoding |
US6728315B2 (en) | 2002-07-24 | 2004-04-27 | Apple Computer, Inc. | Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding with reduced requirements for division operations |
US7031392B2 (en) | 2002-09-20 | 2006-04-18 | Seiko Epson Corporation | Method and apparatus for video deblocking |
US7227901B2 (en) | 2002-11-21 | 2007-06-05 | Ub Video Inc. | Low-complexity deblocking filter |
JP2004201047A (ja) | 2002-12-19 | 2004-07-15 | Ricoh Co Ltd | 画像処理装置、プログラム及び記憶媒体 |
US7542036B2 (en) | 2003-02-19 | 2009-06-02 | California Institute Of Technology | Level set surface editing operators |
US7239990B2 (en) | 2003-02-20 | 2007-07-03 | Robert Struijs | Method for the numerical simulation of a physical phenomenon with a preferential direction |
US7167522B2 (en) | 2003-02-27 | 2007-01-23 | Texas Instruments Incorporated | Video deblocking filter |
US7471726B2 (en) | 2003-07-15 | 2008-12-30 | Microsoft Corporation | Spatial-domain lapped transform in digital media compression |
US20080075377A1 (en) | 2003-07-29 | 2008-03-27 | Topiwala Pankaj N | Fast lapped image transforms using lifting steps |
US7724827B2 (en) | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7315822B2 (en) | 2003-10-20 | 2008-01-01 | Microsoft Corp. | System and method for a media codec employing a reversible transform obtained via matrix lifting |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR101044940B1 (ko) | 2004-06-23 | 2011-06-28 | 삼성전자주식회사 | 에지 플로우 방향성 필터와 커블릿 변환을 이용한 블록현상 제거 방법 및 장치 |
US8374238B2 (en) | 2004-07-13 | 2013-02-12 | Microsoft Corporation | Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video |
WO2006024977A1 (en) * | 2004-08-31 | 2006-03-09 | Koninklijke Philips Electronics N.V. | Method and device for transcoding |
US7428342B2 (en) * | 2004-12-17 | 2008-09-23 | Microsoft Corporation | Reversible overlap operator for efficient lossless data compression |
US7471850B2 (en) | 2004-12-17 | 2008-12-30 | Microsoft Corporation | Reversible transform for lossy and lossless 2-D data compression |
US7305139B2 (en) * | 2004-12-17 | 2007-12-04 | Microsoft Corporation | Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform |
AU2005239628B2 (en) | 2005-01-14 | 2010-08-05 | Microsoft Technology Licensing, Llc | Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform |
US7634525B2 (en) * | 2005-06-27 | 2009-12-15 | The Aerospace Corporation | Haar wavelet transform embedded lossless type IV discrete cosine transform |
US7613761B2 (en) * | 2005-06-27 | 2009-11-03 | The Aerospace Corporation | Haar wavelet transform embedded lossless type II discrete cosine transform |
US7640283B2 (en) * | 2005-06-27 | 2009-12-29 | The Aerospace Corporation | Shared Haar wavelet transform |
US7805476B2 (en) * | 2005-06-27 | 2010-09-28 | The Aerospace Corporation | Extended Haar transform |
US8036274B2 (en) | 2005-08-12 | 2011-10-11 | Microsoft Corporation | SIMD lapped transform-based digital media encoding/decoding |
US7933337B2 (en) | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US20080137982A1 (en) | 2006-12-06 | 2008-06-12 | Ayahiro Nakajima | Blurring determination device, blurring determination method and printing apparatus |
US8054886B2 (en) | 2007-02-21 | 2011-11-08 | Microsoft Corporation | Signaling and use of chroma sample positioning information |
-
2008
- 2008-05-30 US US12/130,862 patent/US8447591B2/en active Active
-
2009
- 2009-05-22 JP JP2011511737A patent/JP5400143B2/ja active Active
- 2009-05-22 KR KR1020107026245A patent/KR101679083B1/ko active IP Right Grant
- 2009-05-22 CN CN2009801209539A patent/CN102047564B/zh active Active
- 2009-05-22 WO PCT/US2009/044983 patent/WO2009148858A2/en active Application Filing
- 2009-05-22 EP EP09759019.4A patent/EP2279562B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004264810A (ja) * | 2002-09-04 | 2004-09-24 | Microsoft Corp | マルチチャネルオーディオのエンコーディングおよびデコーディング |
JP2010537245A (ja) * | 2007-08-17 | 2010-12-02 | オープン・インターフェイス・ノース・アメリカ,インコーポレイテッド | デジタルコンテンツの符号化および/または復号 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012032803A (ja) * | 2010-07-01 | 2012-02-16 | Polycom Inc | フルバンド拡張可能なオーディオコーデック |
Also Published As
Publication number | Publication date |
---|---|
WO2009148858A2 (en) | 2009-12-10 |
JP5400143B2 (ja) | 2014-01-29 |
US8447591B2 (en) | 2013-05-21 |
KR101679083B1 (ko) | 2016-11-23 |
CN102047564A (zh) | 2011-05-04 |
EP2279562A2 (en) | 2011-02-02 |
EP2279562A4 (en) | 2012-07-11 |
CN102047564B (zh) | 2013-08-21 |
US20090299754A1 (en) | 2009-12-03 |
EP2279562B1 (en) | 2015-12-16 |
KR20110021803A (ko) | 2011-03-04 |
WO2009148858A3 (en) | 2010-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5400143B2 (ja) | オーバーラッピング変換の2つのブロック変換への因数分解 | |
US8386269B2 (en) | Multi-channel audio encoding and decoding | |
US7299190B2 (en) | Quantization and inverse quantization for audio | |
US8255234B2 (en) | Quantization and inverse quantization for audio | |
US8386271B2 (en) | Lossless and near lossless scalable audio codec | |
RU2555221C2 (ru) | Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120409 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130925 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131024 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5400143 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |