JP3657517B2 - デジタル・システムにおいて信号を量子化するための方法および装置 - Google Patents
デジタル・システムにおいて信号を量子化するための方法および装置 Download PDFInfo
- Publication number
- JP3657517B2 JP3657517B2 JP2000544070A JP2000544070A JP3657517B2 JP 3657517 B2 JP3657517 B2 JP 3657517B2 JP 2000544070 A JP2000544070 A JP 2000544070A JP 2000544070 A JP2000544070 A JP 2000544070A JP 3657517 B2 JP3657517 B2 JP 3657517B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- centroid
- input data
- levels
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000013139 quantization Methods 0.000 claims description 71
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000005457 optimization Methods 0.000 claims description 18
- 230000005484 gravity Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 3
- 238000009828 non-uniform distribution Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims 1
- 238000009826 distribution Methods 0.000 description 12
- 230000003044 adaptive effect Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 10
- 238000007906 compression Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 8
- 238000000354 decomposition reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013144 data compression Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 238000009827 uniform distribution Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 230000003467 diminishing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/94—Vector quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
Description
本出願は、モトローラ社に譲渡された1997年3月20日にYolanda Prieto出願の米国出願番号第08/822,403号「Adaptive Filtering For Use With Data Compression and Signal Reconstruction」および1997年3月20日にYolanda Prieto出願の米国出願番号第08/822,404号「Data Compression System, Method, and Apparatus」に関連する。
【0001】
(産業上の利用分野)
本発明は、一般にデータ圧縮に関し、さらに詳しくは、デジタル・データの圧縮に関する。とりわけ、本発明は、トレリス符号化量子化器を利用するシステムにおいて改善された量子化を行う方法および装置に関する。
【0002】
(従来の技術)
テレビ会議およびデジタル画像の格納などに関する技術やサービスの出現に伴い、デジタル信号処理の分野では大きな進歩がなされた。当業者には明白であろうが、デジタル信号処理は、通常は、サンプリングされたデータ信号を生成し、格納および/または送信を行うために信号を圧縮し、その後で被圧縮信号から元のデータを再構築するシステム,装置および方法に関する。効率が良く、費用効果が優れたデジタル信号処理システムに重要なことは、圧縮を行うために用いる方法である。
【0003】
当技術においては周知の如く、データ圧縮とは、元のデータ信号をチャネル上での通信や適切な媒体での格納に適したビット・ストリーム内にマッピングする(割り付ける)ために実行されるステップを指す。元のデータを表現し回復するために必要な情報量を最小限に抑えることのできる方法が、演算の複雑性を軽減し、コストを低く抑えるために望ましい。コストに加えて、最小限の遅延をもって品質の良いデータ再生を行うことのできるハードウェアおよびソフトウェア設備は簡単であることが同様に望ましい。
【0004】
量子化とは、データのビット・ストリームを取り出して、後で再生するためにそれを圧縮する技術を指す。データ信号の圧縮を行うために用いることのできるアルゴリズムはいくつか存在する。最も初歩的な方法では、信号サンプルを取り出し、各信号サンプルをより小さい数のレベルの1つに量子化する。周知の量子化器には、最近隣最小二乗誤差の原則(nearest neighbor, minimum square erro (MSE) rules)を用いて入力を指定された数のレベルに分類するロイド−マックス最適量子化器(Lloyd-Max optimal quantizer)がある。
【0005】
量子化は、ベクトル,スカラー,丸め,切り捨ておよび特にトレリス符号化量子化(TCQ: trellis coded quantization)を含む種々の他の方法を用いて実行することができる。ベクトル量子化は、サンプル群を取り出して、ただ1つのシンボルによりその群を表現して、圧縮を改善し、高い信号対雑音比(SNR: signal-to-noise)を生成するので、効率的な量子化手段と考えられる。しかし、ベクトル量子化は、計算が集約的でルックアップ・テーブルを必要とする(すなわちメモリを要する)。スカラー量子化は、1シンボルにつき1サンプルを表現して、ベクトル量子化よりも計算負担が少ない。しかし、スカラー量子化には圧縮速度が遅いという欠点がある。量子化の代替法として出力信号の丸めまたは切り捨てがあるが、これらは分解能の問題を招くことがある。
【0006】
現在のところ、静止画像のためのJPEG2000(Joint Photographic Experts Group)システムの次の標準は、ウェーブレット(wavelet)を用いて入力信号の分解を行うアルゴリズムと、信号圧縮のためのトレリス符号化量子化器とを提案する。
【0007】
トレリス符号化量子化は、最小誤差経路を生成するための検索を行うビタービ・アルゴリズムに基づく。一般に、ビタービは、格子(lattice)量子化器(均一格子)を利用する。格子量子化は、演算効率が良いがその結果は歪みにより最適ではない。圧縮率が高くなると(ビット/サンプルが低い)、SNRが悪くなる。そのため、データ信号圧縮中に発されるノイズ(量子化ノイズ)を低減し、データの再構築の際に達成可能な信号対雑音比(品質)を改善するように動作する改善されたTCQ方法および装置に対する必要性が依然として存在する。
【0008】
従って、特にデジタル信号処理システムに適応される改善されたトレリス符号化量子化(TCQ)法が必要である。
【0009】
(好適な実施例の説明)
本明細書は、新規と見なされる本発明の特徴を定義する請求項を結論とするが、以下の説明と図面とを関連して考察することにより本発明がより良く理解頂けると信ずるものである。図面内では、同様の参照番号が継続して用いられる。
【0010】
ここに開示する本発明は、データ・コデックの一部として実現することのできる量子化段階を改善する。図1を参照して、本発明によるデータ・コデック・ブロック図100が図示される。このデータ・コデック100は、ビデオなどの三次元(3-D)システム,静止画像などの二次元(2-D)システムならびに音声などの一次元(1-D)システムに適応することができる。
【0011】
データ・コデック100は、エンコーダ110とデコーダ120とを具備する。要するに、所定のビット/サンプル分解能を有する入力データ信号S(n)102が分解段112で変換を受ける。被変換信号x(n)113は、次に量子化段114を通過して、本発明によりさらなる圧縮を受ける。本発明により、量子化段114は、重心準拠量子化(centroid based quantization)を行って不均一な間隔の量子化器を生成する。被量子化信号115は、次に好ましくは周知の種々の符号化法の1つを用いる符号化段116で符号化される。被符号化信号118は、次にチャネル130上で通信されるか格納される。受信側において、デコーダ120は逆符号化段132,逆量子化段133および逆分解段134を用いて、入力データ信号S(n)を出力データ信号S'(n)136として再現する。
【0012】
分解段112は、基本的には、ウェーブレット,FFT(Fast Fourier Transform: 高速フーリエ変換),DCT(Discrete Cosine Transform: 離散コサイン変換),DFT(Discrete Fourier Transform: 離散フーリエ変換),DST(Discrete Sine Transform: 離散サイン変換),KLT(Karhunen-Loewe Transform: カールネン−ロエベ変換),WHT(Walsh-Hadamard Transform: ウォルシュ−アダマール変換)など種々の周知の方法の1つによりデータ変換を実行する周波数領域アナライザである。ここで用いる変換とは、いわゆる部分帯域符号化(subband coding)である。部分帯域符号化においては、1-Dであろうと2-Dであろうと3-Dであろうと、入力データ信号102は、反復的に、低域通過および高域通過フィルタのフィルタ・バンクを通じて分割され、且つデシメート(decimate)され、元の信号の部分帯域被選択係数の出力を生成する。被変換信号x(n)113は、このため被変換係数の信号とも呼ばれる。また、被変換信号x(n)113は、デシメートされた信号でもある。本発明の好適な実施例においては、分解段112は、JPEG2000システムの次標準において提案されるようなウェーブレットにより構成されることもある。ウェーブレットは、一定の多重分解能機能を達成することを助け、画像データの場合のブロック効果を最小限に抑える。
【0013】
符号化段116と逆符号化段132は、算術,ハフマン(Huffman)やその他の周知の符号化および解読法などを含む種々の符号化法を通じて動作することができる。
【0014】
チャネル130は、たとえば無線周波数(RF)または光ファイバ伝送経路などのワイヤレス,ワイヤライン,音響または光学的リンク経路を含む。チャネル130は、同様に、周知の、あるいは将来開発される格納媒体とすることもできる。
【0015】
逆量子化段133は、トレリス符号化量子化,スカラー,ベクトルなどの種々の逆量子化法または適応重心準拠量子化器114を逆にしたものを通じて動作することができる。逆分解段134は、好ましくは、逆ウェーブレット変換などの周知の手段またはフィルタ・バンクの集合により制御される。
【0016】
本発明により、量子化段114は、係数の全範囲(部分帯域の全部または一部を表す)を取り、状態内で量子化器レベルの最適不均一割当を生成する重心準拠量子化器である。図2を参照して、本発明の好適な実施例による4状態トレリス符号化量子化(TCQ)段114のブロック図を示す。要するに、本発明により、トレリス経路最適化202が、被変換係数信号x(n)113に関して実行されて、経路行列206として構築される出力が生成され、これに関して重心演算が段208で実行される。重心は、この後で、トレリス経路最適段202に帰還されて、経路行列の別の反復および生成と更新された重心演算のための量子化レベルの新しい適応中心として用いられる。経路行列206は、ベクトル要素「nk,j」で構成され、kはK個の状態の総集合からの量子化状態を表し、jは1状態あたりJ個のレベルの総集合からのレベルを表す。本発明により、トレリス経路最適化202,経路行列構築206および重心の更新208のステップは、適切なSNRまたは他の所望の誤差測定値,エントロピまたはビット速度が達成される210まで適応的に反復される。
【0017】
本発明により、トレリス経路最適化202は、好ましくは、誤差が最小になる経路を得るために量子化器間の移行を選択する「最小平均二乗(LMS:least mean square)」アルゴリズムを通じて行われる。しかし、最小−最大などのその他の最適化法を用いても最小誤差経路を得ることができる。
【0018】
経路最適化202の基本的実行例を好適な実施例209に示す。ただしこのとき、状態(各状態がJ個のレベルを有する。)と呼ばれるK個の量子化器(量子)の集合に関して、量子(状態およびレベル)は、入力データの全範囲をカバーする。状態およびレベルは、より大きな量子化器を、初期に均一に分布する部分集合に分割した後で得られる。各状態の量子化レベルは、中点により、あるいは重心により、レベル間の量子化間隔を定義する。
【0019】
入力データ・サンプルに対応する最も良いレベルと状態とを探す過程で、最適化を行うことにより、データ・サンプルが入力されて、歪み,誤差値,エントロピまたはビット速度を最小限にする状態とレベルの最良のシーケンスが発見される(210)。トレリスは特定のデータ集合または集合群に関して最適化され、いくつかの状態を伴う適応量子化器となる。これらは各々がより小型で最適化される量子化器となる。状態シーケンスと特定のデータ・シーケンスとの間には一致が見られる。最適化の後で異なるデータ集合が入力されると、確率密度関数(pdf:probability density function)またはヒストグラムは同一であっても、歪み削減の多くが消えて、新たな最適化が実行され、適応手順となる。K状態のトレリス量子化器に関して、各着信データ・サンプルにつき使用可能なJレベルのうちから1つだけを選択する。これにより、Mがトレリス内の各状態に関して量子化段階の全体数を表すとすると、M/Kのレベルが割り当てられる。第1入力データ・サンプルに関する第1状態およびレベルは、誤差が最も低くなる状態を発見することにより、独立して決定される。続いて、各着信入力値が図2に示されるテーブル209などの移行テーブルに従い全部でK個の状態の2f状態のうちの1つに割り当てられる。従って、デコーダに対してたどるべき移行経路を伝えるには「f」ビットかかる。たとえば、209に示されるように、f=1であると、Q0から、Q0(またはQ1)により次のサンプル入力を量子化することができ、さらにどのレベルを用いるかをデコーダに伝えるには一定のビットを要する。また、4状態トレリス経路最適化209または他のK状態トレリスを、基本的に鏡像である別の構成で実行することができる。
【0020】
例として、ビタービ・アルゴリズムとして知られるLMSアルゴリズムが説明される最小誤差アルゴリズムとなる。ビタービ・アルゴリズムは、全範囲のデータ、すなわちx(n)113を取り出し(ただしnは0からN-1とする)、このデータを第1回反復の一部として量子化して、データを各状態に関して異なるレベルに割り当てることができる。量子化器間にあるデータであれば、最も近いレベルに割り当てられる。
【0021】
ビタービ・アルゴリズムは、量子化器間のすべての異なる経路に関して最小誤差を発見する「最小平均二乗(LMS)」法である。ビタービ・アルゴリズムは、トレリスを通る経路を最適化する。すなわち量子化器集合{Qi}をもつi番目の反復においては経路Πi(Qi)となり、許容できる移行に従う。たとえば、図2に示すビタービを参照して、t=0のサンプルx(n)がQ0(0)に量子化され次にt=1で移行はQ0(1)またはQ1(1)のいずれか一方にしか進めない。LMSアルゴリズムの最後に、最小誤差を生むためにとられる経路が簡潔に導かれ、三次元経路行列206の形で表現される。
【0022】
経路行列206から、段208で重心が計算され、それを用いて、特定の量子化状態およびレベルに入るデータ・サンプルを表す。重心演算は、以下の等式により決まる平均値に基づく:
【0023】
【数1】
ただし
【数2】
は、ベクトルであり、
【数3】
が空のときは次のようになる:
【0024】
【数4】
新たに計算され更新される重心Ck,j (i+1)がトレリス経路最適化段202に戻され、そこでk番目の状態のj番目のレベルに関する新たな中心として用いられ、次の(i+1)番目の反復が開始される。これを図2の帰還矢印により示す。
【0025】
一例として、x(n)304の入力データ列が10個のサンプルからなるとする:
入力データ= x(n) = [10.0,10.2,0.5,2.18,1.9,13.75,10.40,0.1,11.2,2.5]
また、[0,1,2,3,...9]はそれぞれ特定のデータ・サンプル値を指す指標を表すものとする。(データ・サンプルの実際の値は、被変換係数x(n)であることに注意。)
次に、被変換係数入力x(n)113がトレリス202を用いて量子化される。この例では、トレリス202は4つの状態[Q0,Q1,Q2,Q3]を有し、各状態が4つのレベルを有するよう構築される(従って、16の量子化段階があり、計算すべき重心は16ある)。4状態4レベルのトレリスについて図示および説明されるが、トレリス202は、2つ以上の状態で構築され各状態がいくつかのレベルを持つ様々な構造に形成することができることは当業者には理解頂けよう。しかし、一般にはトレリス量子化器は、最も単純なケースである4状態を利用する。
【0026】
この場合も、トレリス202の4状態は、量子化器Q0,Q1,Q2,Q3であり、各状態に4つのレベルが割り当てられる。第1回反復に関して、ビタービ・アルゴリズムを用いて最小誤差経路を量子化割当において得るものとするが、他のLMSアルゴリズムも同様に利用することができる。第1回反復に関して、レベルの均一な分布が用いられるが、第1回反復は、不均一なレベル分布を用いても同様に実行することができることを当業者には理解頂けよう。たとえば、量子化状態およびレベルを最良に割り当てる入力データの分布を用いる初期量子化器割当の場合、不均一な分布のレベルのほうが、より適している場合がある。たとえば、ラプラシアン型分布(すなわち鋭いピークを持つゼロ平均分布)を有する入力サンプル範囲については、縮小因子(shrink factor)を量子化段階に適用して、不均一な分布のレベルを得ることができる。
【0027】
次に図3を参照して、i=0の第1回反復を行う4量子化状態の各々のレベル分布をグラフに示す。グラフ300は、16個の量子化段階に分かれたデータ入力範囲の4量子化状態Q0,Q1,Q2,Q3対4レベルの第1回反復の可能な例を表す。
【0028】
以下の表は、入力データの様々な範囲と、特定の範囲に関する量子化状態およびレベルの割り当てを示す(ただし”[”は両端の値を含めることを表し、”(”は含めない)。
【0029】
【表1】
図2のビタービ・トレリスに戻って、トレリスはサンプルx(ni)を取り、サンプルが時刻t=tiにおいて状態Q0(またはQ2)の4レベルのいずれかに量子化された場合は、時刻t=ti+1における次のサンプルx(ni+1)だけを、状態Q0またはQ1の4レベルのいずれかに量子化することができる。同様に、サンプルx(ni)が時刻t=tiにおいて状態Q1(またはQ3)の4レベルのいずれかに量子化されると、時刻t=ti+1における次のサンプルx(ni+1)だけが状態Q2またはQ3の4レベルのいずれかに量子化することができる。
【0030】
そのため、上記の入力データx(n)に関しては、データはサンプリングされたデータ値のみならず、以前の量子化器の状態にも基づいてLMS段202を通じて量子化される。経路行列206は、入力データを指示する指標をn(state, level)の種々の行列位置内に格納することによって構築される。次の表は、サンプリングされたデータがどのように量子化され、指標が行列位置に割り当てられるかを示す。
【0031】
【表2】
各行列位置に格納される指標は、元のデータのLMS(最小平均誤差)(すなわち最小誤差の経路)を表す。そのため、(この例では均一分布から始まる)第1回反復を進めると、行列206は以下の被格納指標で構成される:
【0032】
【表3】
格納される指標の図を図4に示し、経路行列206が実際に量子化器状態,レベルおよび指標の3-D構造を表すのを示す。各入力データ点は、サンプル入力点が起こる位置を示す指標により表される。図2の経路行列206において、各要素 は、その要素が状態k,レベルjに量子化された特定の入力データ・サンプルの指標であるベクトルによって構成さる。状態k,レベルjに量子化される入力サンプルがなかった場合、この行列要素
【数5】
は空になる。
【0033】
i=0の第1回反復を進めて、次のステップは重心を計算することである。上記の等式(1),(2)に示されるように、重心の計算は平均値に基づく。このため、この例の第1回反復(t=i)の重心演算により、次が得られる:
n00に関して → c00= x[7] = 0.1
および
c01= 以前の設定通り
c02= 以前の設定通り
n03に関して → c03= x[8] = 11.2
およびn10に関して → c10=1/2[x(3)+x(9)]=1/2(2.18+2.5)=2.34
(この反復(t=i-1)前は、重心c10は1.5であったことに注意)
c11= 以前の設定通り
n12に関して → c12= x[1] = 10.2
n13に関して → c13= x[5] = 13.75
c13= 以前の設定通り
および
n20に関して → c20=1/2[x(2)+x(4)]=1/2(1.5+1.5)=1.2
(この反復(t=i-1)前は、重心c20は2.5であったことに注意)
c21= 以前の設定通り
および
n22に関して → c22=1/2[x(0)+x(6)]=1/2(10.0+10.4)=10.2
(この反復(t=i-1)前は、重心c22は10.5であったことに注意)
c23= 以前の設定通り
c30= 以前の設定通り
c31= 以前の設定通り
c32= 以前の設定通り
c32= 以前の設定通り
c33= 以前の設定通り
かくして、図3の例に示されるように、以前の重心がすべて0.5を中心にある場合、量子化器の各状態およびレベル(現在は不均一な)について新しい重心が得られる。同じ集合のデータx(n)が第2回反復において新たな重心をもって再分類され、この反復プロセスは、特定の入力信号に関する誤差測定値が所定の所望値に達するまで繰り返される。図5は、1回または数回の適応反復の後で、種々の状態およびレベルが均一分布から、入力データに最適に適合する分布に変化する様子の任意の例を示す。本発明により説明される方法は、各反復においてより低い誤差への収束を保証する。
【0034】
このように、最小平均二乗アルゴリズムによるトレリス量子化のステップを通じてサンプリングされたデータ係数x(n)を取り出して行列を形成し、各量子化状態に関して更新された重心を計算することによって、プルーニング(pruning)アルゴリズムがもたらされる。このアルゴリズムは、所望のSNRを生成するのに適した収束が得られるまで再度繰り返される。新しい部分帯域または入力データの新しい集合の場合、前回のデータ実行から計算された重心値を用いて第1回反復を開始するように量子化器を調整することもできる。この方法では、次の入力データ範囲内で同様の入力データが予想される場合は、最適化されるのにはるかに近い重心値で量子化を開始することができ、そのためにSNRを全面的に最適化するのに必要な反復数が少なくなる。
【0035】
従来技術の場合は、量子化法は基本的にはビタービ・アルゴリズム段で停止した。これは、量子化レベル間のデルタが均一であることを前提としたためである。本発明により説明される出願人の量子化法114を適用することにより、重心演算は量子化レベル間の距離が変わるとダイナミックに調整される(図3および図5を比較することでわかる)。このため、従来技術は均一に間隔をとるシステム上で動作したが、本発明の量子化法では、不均一性と入力データに基づく適応が可能になる。
【0036】
本発明の量子化段114は、更新された重心を用いて量子化応対のレベルを適応的に割り当てる。このため、量子化器はデータ分布に最適化されて、SNRを改善する。量子化器の出力115は、段116で符号化され、チャネル130に送信される。これにより量子化器出力115は、着信信号に基づいて適応的に割り当てられる。本発明により説明される適応重心に基づく量子化器は、画像信号などの入力信号を、入力信号に基づいて量子化を適応的に割り当てることにより最適化される。量子化ブロック114は、テレビ会議中の顔の画像などの特定の種類の信号に関して、量子化のステップをある所定の状態およびレベル割当において開始して処理時間を短くするように調整することもできる。
【0037】
以下のステップは、本発明による適応重心準拠量子化法をまとめる:
i) 入力データ範囲が所定数の量子化段階に分割される。上記に説明する例では、4ビットのトレリスについて16の量子化段階がある。
【0038】
ii) 量子化段階が状態の行列に形成される。上記の例では、量子化段階1,5,9,13が状態1に進み、量子化段階2,6,10,14が状態2に進むなど。これが初期状態割当である。
【0039】
iii) 入力データが、ラプラシアン分布など所定の分布をもつと予想される場合は、前述の要領で縮小因子を導入することができる。
【0040】
【数6】
iv) LMSアルゴリズム、好ましくはビタービ・アルゴリズムを伴うトレリスを実行する。
【0041】
v) 平均二乗誤差を計算することにより最初の生SNR値または他の誤差測定値を求める。
【0042】
【数7】
vi) データ・サンプルの重心値を、状態毎に各レベルに1つ計算する。
【0043】
vii) 新たな平均二乗誤差を計算することにより、精密なより高いSNR値を求める。
【0044】
viii) ステップ(iv)からの更新重心値を用いて、LMSアルゴリズムを伴うトレリスの2回目を実行する。
【0045】
viv) 重心を再計算し、SNRの新たな値を求める。
【0046】
SNRの最後の値は最初のものよりも良くなっている。SNRは、重心の更新により各反復サイクル毎に収穫逓減的に増加する。
【0047】
x) 所定のSNR規準が満たされたら反復を停止する。
【0048】
本発明により開示される適応重心準拠量子化法の利点には、収束だけでなく反復処理時間が(傾斜法に比べて)早いことがあげられる。
【0049】
上記のステップで1つのオプション・パラメータ、すなわち縮小因子が導入された。入力データがゼロ平均ラプラシアンなどの鋭い分布を有する場合、最外側レベルにはデータ・サンプルはほとんどない。従って、縮小因子を適用して、すべてのレベルを入力範囲のより活動的な中心に向かって集中させることができる。その結果得られるSNRは、反復のたびに単調に増加して、最適なSNRレベルに収束する。縮小因子の効果は、最適なSNR値を得るための総反復回数を減らすことである。
【0050】
開示されるシステム明細は、さらに、変換段,量子化段,符号化,チャネル,逆符号化および逆分解段を含む。本発明の別の実施例においては、量子化114に先立ってベクトル化(2Dを1Dデータ・ストリームに変換)と閾値段とが実行されて、反復データの長いストリングを1つの符号で表し、非ゼロ1Dデータ・ストリームを得られるようにする。図6には、データx(n)が段602において1-Dにベクトル化されてベクトル係数604を生成する実行例が提案される。ベクトル係数604は、次に量子化に先立って、閾値606と比較される。基本的には、ゼロのデータ・サンプルおよび/またはゼロに近い値は閾値606によって切り捨てられて、非ゼロ要素の修正された一次元入力データ・アレイを適応重心準拠量子化器114の入力として得る。
【0051】
図7は、完全なコデック・システム600の一部としての1-Dデータ・ストリーム変換ステップを示す。量子化されると、好ましくは符号化段116において符号化される反復データがあり、さらに圧縮される。これにより、送信時間と計算時間とが短縮される。この場合も、ダイナミック重心準拠量子化114を通じて得られる利点を、システム700の実施例で実現することができる。これには被符号化信号を通じて反復データの効率的な送信という更なる利点も伴う。
【0052】
本発明の好適な実施例が図示および説明されたが、本発明がそれに制限されないことは明らかである。添付の請求項に定義される本発明の精神および範囲から逸脱せずに数多くの修正,変更,変換,置き換えおよび同等物が当業者には可能であろう。
【図面の簡単な説明】
【図1】 本発明の好適な実施例によるデータ・コデックのブロック図である。
【図2】 本発明による適応重心準拠量子化器である。
【図3】 本発明による図2の量子化器に関して、i=0の第1回反復を行う4つの量子化器状態のうち個々の状態に関するレベル分布例をグラフに示す。
【図4】 本発明による図2の量子化器に関して第1回反復から格納される指標を図に表す例である。
【図5】 本発明による図2の量子化器に関して、任意の反復を行う4つの量子化器状態のうち個々の状態に関するレベル分布例をグラフに示す。
【図6】 本発明の代替実施例による量子化前の一次元データ・ストリーム変換の提案される実行例である。
【図7】 本発明の代替実施例による完全なデータ・コデック・システムの一部としての1-Dデータ・ストリーム変換の段を示す。
Claims (10)
- 信号を量子化する方法であって、
ある入力データ範囲を有する入力データ信号を受信するステップと、
前記入力データ範囲を所定数の量子化段階に分割するステップと、
前記所定数の量子化段階を複数の量子化状態およびレベルに割り当てるステップと、
前記量子化された状態およびレベルに誤差最小化アルゴリズムを実行するステップと、
前記入力データ信号から各量子化状態およびレベルの重心値を適応的に計算するステップと、
前記の計算された重心に基づき前記量子化状態およびレベルを更新するステップと、
重心の所定の最適化が達成されるまで、前記分割するステップから前記更新するステップまでのステップを反復するステップと、
ひとたび重心の所定の最適化が達成されると、前記の更新された重心を量子化出力として送信するステップと
を備える方法。 - 前記量子化された状態およびレベルに誤差最小化アルゴリズムを実行する前記ステップが、
サンプリング・データの各入力に関して前記量子化状態およびレベルを示す指標を格納するステップと、
各量子化状態およびレベルに関して前記の格納された指標位置の行列を形成するステップと
を含む請求項1記載の方法。 - 前記最小誤差アルゴリズムが最小平均二乗(LMS)アルゴリズムから成る請求項1記載の方法。
- 前記重心の所定の最適化が所定の誤差閾値に基づく請求項1記載の方法。
- 信号対雑音比(SNR)値または値の変化が前記の計算された重心に基づいて決定される請求項1記載の方法。
- 前記重心の所定の最適化が前記SNR値を所定の閾値と比較することに基づいており、
前記方法が更にSNR値又は当該値の変化が所定のスレッショルドに到達するまで、最小誤差アルゴリズムを再実行し、重心値を適応的に計算し、前記量子化状態及びレベルを更新し、及びSNR値を獲得する各ステップを繰り返すステップを有する
請求項5記載の方法。 - 前記LMSアルゴリズムがビタービ・アルゴリズムである請求項3記載の方法。
- デジタル処理システムにおいて、ある入力データ範囲を有する入力データ信号を量子化する方法であって、
前記入力データ信号を受信するステップと、
前記入力データ信号にトレリス経路の最適化を実行して、最小誤差経路の履歴を生成するステップと、
前記最小誤差経路に基づき経路行列を形成するステップと、
重心を前記経路行列に基づいて計算するステップと、
前記トレリス経路最適化を再度実行して、前記入力データ範囲のそれぞれの部分が前記量子化状態およびレベルに不均一に割り当てられる量子化状態およびレベルの不均一分布を生成するステップと、
前記の計算された重心を量子化出力として送信するステップと
を備える方法。 - 前記データ信号がデシメートされたデータ信号である請求項8記載の方法。
- 前記トレリス経路の最適化がその鏡像である別の構成で実行される請求項8記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/059,823 US6128346A (en) | 1998-04-14 | 1998-04-14 | Method and apparatus for quantizing a signal in a digital system |
US09/059,823 | 1998-04-14 | ||
PCT/US1999/007986 WO1999053623A1 (en) | 1998-04-14 | 1999-04-12 | Method and apparatus for quantizing a signal in a digital system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002511695A JP2002511695A (ja) | 2002-04-16 |
JP3657517B2 true JP3657517B2 (ja) | 2005-06-08 |
Family
ID=22025502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000544070A Expired - Fee Related JP3657517B2 (ja) | 1998-04-14 | 1999-04-12 | デジタル・システムにおいて信号を量子化するための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6128346A (ja) |
EP (1) | EP1072103A4 (ja) |
JP (1) | JP3657517B2 (ja) |
CN (1) | CN1151611C (ja) |
AU (1) | AU751295B2 (ja) |
WO (1) | WO1999053623A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6260031B1 (en) * | 1998-12-21 | 2001-07-10 | Philips Electronics North America Corp. | Code compaction by evolutionary algorithm |
US6757326B1 (en) * | 1998-12-28 | 2004-06-29 | Motorola, Inc. | Method and apparatus for implementing wavelet filters in a digital system |
US6898582B2 (en) | 1998-12-30 | 2005-05-24 | Algodyne, Ltd. | Method and apparatus for extracting low SNR transient signals from noise |
KR100311473B1 (ko) * | 1999-01-20 | 2001-11-02 | 구자홍 | 트렐리스 기반의 적응적 양자화기에서 최적경로 추적 방법 |
US6798914B1 (en) * | 1999-05-07 | 2004-09-28 | Galaxy Ip Source, Llc | Neural-network-based method of image compression |
KR100364753B1 (ko) | 1999-11-19 | 2002-12-16 | 엘지전자 주식회사 | 칼라 히스토그램의 빈값 양자화 방법 |
US7092457B1 (en) * | 2000-01-18 | 2006-08-15 | University Of Southern California | Adaptive iterative detection |
US6757558B2 (en) | 2000-07-06 | 2004-06-29 | Algodyne, Ltd. | Objective pain measurement system and method |
US6661842B1 (en) * | 2000-09-22 | 2003-12-09 | General Dynamics Decision Systems, Inc. | Methods and apparatus for error-resilient video coding |
WO2002045017A2 (en) * | 2000-12-01 | 2002-06-06 | Lizardtech, Inc. | Method for image compression with optimization parameters |
US7206459B2 (en) * | 2001-07-31 | 2007-04-17 | Ricoh Co., Ltd. | Enhancement of compressed images |
US6987890B2 (en) * | 2002-03-27 | 2006-01-17 | Eastman Kodak Company | Producing and encoding rate-distortion information allowing optimal transcoding of compressed digital image |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
GB0228163D0 (en) * | 2002-12-03 | 2003-01-08 | Qinetiq Ltd | Decorrelation of signals |
KR100529311B1 (ko) * | 2003-01-21 | 2005-11-17 | 삼성전자주식회사 | 신경 회로망을 이용하여 가변 길이 부호화 비트 스트림의길이를 선택하는 장치 및 방법 |
US7098816B2 (en) * | 2004-06-01 | 2006-08-29 | Rich-Tech Hk Limited | Tri-state delta codec method and system |
WO2007070020A1 (en) * | 2005-02-24 | 2007-06-21 | Efficient Spectrum, Inc. | Viterbi-decoder based adaptive array processing method and system |
US20070286277A1 (en) * | 2006-06-13 | 2007-12-13 | Chen Xuemin Sherman | Method and system for video compression using an iterative encoding algorithm |
WO2009004225A1 (fr) * | 2007-06-14 | 2009-01-08 | France Telecom | Post-traitement de reduction du bruit de quantification d'un codeur, au decodage |
EP2059049A1 (en) * | 2007-11-07 | 2009-05-13 | British Telecmmunications public limited campany | Video coding |
JP2012531674A (ja) * | 2009-06-26 | 2012-12-10 | シンプリヴィティ・コーポレーション | ノンユニフォームアクセスメモリにおけるスケーラブルなインデックス付け |
US8635357B2 (en) * | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
US9510019B2 (en) | 2012-08-09 | 2016-11-29 | Google Inc. | Two-step quantization and coding method and apparatus |
US9253483B2 (en) | 2012-09-25 | 2016-02-02 | Google Technology Holdings LLC | Signaling of scaling list |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
US10069519B1 (en) * | 2018-01-23 | 2018-09-04 | Mitsubishi Electric Research Laboratories, Inc. | Partition based distribution matcher for probabilistic constellation shaping |
US11451840B2 (en) * | 2018-06-18 | 2022-09-20 | Qualcomm Incorporated | Trellis coded quantization coefficient coding |
CN115706797A (zh) * | 2021-08-05 | 2023-02-17 | 腾讯科技(深圳)有限公司 | 多媒体数据编码方法、装置、设备以及介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5235420A (en) * | 1991-03-22 | 1993-08-10 | Bell Communications Research, Inc. | Multilayer universal video coder |
AU1996292A (en) * | 1991-05-17 | 1992-12-30 | Analytic Sciences Corporation, The | Continuous-tone image compression |
CA2088082C (en) * | 1992-02-07 | 1999-01-19 | John Hartung | Dynamic bit allocation for three-dimensional subband video coding |
DE69329670T2 (de) * | 1992-09-14 | 2001-03-15 | Thomson Multimedia, Boulogne | Verfahren und Gerät zur Rauschminderung |
FR2697706B1 (fr) * | 1992-11-03 | 1994-11-25 | Thomson Csf | Procédé et dispositif de réduction de débit pour l'enregistrement d'images sur magnétoscope. |
IT1271959B (it) * | 1993-03-03 | 1997-06-10 | Alcatel Italia | Codec per il parlato a predizione lineare eccitato da un libro di codici |
US5675701A (en) * | 1995-04-28 | 1997-10-07 | Lucent Technologies Inc. | Speech coding parameter smoothing method |
KR100442844B1 (ko) * | 1996-03-23 | 2004-10-06 | 삼성전자주식회사 | 중심점을이용한객체의외곽선부호화방법및이를이용한부호화장치 |
US5802481A (en) * | 1997-03-20 | 1998-09-01 | Motorola, Inc. | Adaptive filtering for use with data compression and signal reconstruction |
-
1998
- 1998-04-14 US US09/059,823 patent/US6128346A/en not_active Expired - Fee Related
-
1999
- 1999-04-12 CN CNB998050091A patent/CN1151611C/zh not_active Expired - Fee Related
- 1999-04-12 AU AU36401/99A patent/AU751295B2/en not_active Ceased
- 1999-04-12 WO PCT/US1999/007986 patent/WO1999053623A1/en active IP Right Grant
- 1999-04-12 JP JP2000544070A patent/JP3657517B2/ja not_active Expired - Fee Related
- 1999-04-12 EP EP99918502A patent/EP1072103A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP1072103A4 (en) | 2008-02-06 |
CN1151611C (zh) | 2004-05-26 |
WO1999053623A1 (en) | 1999-10-21 |
AU751295B2 (en) | 2002-08-08 |
AU3640199A (en) | 1999-11-01 |
CN1297623A (zh) | 2001-05-30 |
EP1072103A1 (en) | 2001-01-31 |
US6128346A (en) | 2000-10-03 |
JP2002511695A (ja) | 2002-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3657517B2 (ja) | デジタル・システムにおいて信号を量子化するための方法および装置 | |
US7602982B2 (en) | Method for image coding by rate-distortion adaptive zerotree-based residual vector quantization and system for effecting same | |
KR100657797B1 (ko) | 이미지 압축 복원 장치 및 방법 | |
Cosman et al. | Vector quantization of image subbands: A survey | |
US6671416B2 (en) | Method for transmitting data using an embedded bit stream produced in a hierarchical table-lookup vector quantizer | |
US6801665B1 (en) | Method and apparatus for compressing and decompressing images | |
US6757326B1 (en) | Method and apparatus for implementing wavelet filters in a digital system | |
KR100714903B1 (ko) | 이미지 압축 복원 장치 및 방법 | |
EP0797896A1 (en) | Region-based texture coding method and decoding method, and corresponding systems | |
Kossentini et al. | Image coding using entropy-constrained residual vector quantization | |
US5534930A (en) | Method for constructing a quantization pattern codebook | |
Mahesh et al. | Multiple-rate structured vector quantization of image pyramids | |
JP3299073B2 (ja) | 量子化装置及び量子化方法 | |
CN102801427B (zh) | 源信号变速率格矢量量化的编解码方法和系统 | |
Lin et al. | Wavelet video coding with dependent optimization | |
JP2621109B2 (ja) | 画像符号化装置 | |
Farkash et al. | Transform trellis coding of images at low bit rates | |
Brunk et al. | Design of successively refinable scalar quantizers | |
Ferguson et al. | Efficient video compression codebooks using SOM-based vector quantisation | |
Mehrotra | Optimal overcomplete subband expansions for multiple description coding | |
Zhao | Embedded Image Coding Algorithm Using Wavelet and Vector Quantization | |
Gersho et al. | Variable Rate Vector Quantization | |
Salari et al. | Low complexity sub-band image coding with pseudo QMF and pyramidal lattice VQ | |
Kim et al. | Data Compression | |
Said et al. | A New Fast/Efficient Image Codec Based on Set Partitioning in Hierarchical Trees |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040608 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040907 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050309 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080318 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090318 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100318 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100318 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110318 Year of fee payment: 6 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120318 Year of fee payment: 7 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120318 Year of fee payment: 7 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120318 Year of fee payment: 7 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120318 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130318 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130318 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140318 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |