JP2004260282A - ベクトル量子化処理におけるコードブックの作成方法 - Google Patents

ベクトル量子化処理におけるコードブックの作成方法 Download PDF

Info

Publication number
JP2004260282A
JP2004260282A JP2003045888A JP2003045888A JP2004260282A JP 2004260282 A JP2004260282 A JP 2004260282A JP 2003045888 A JP2003045888 A JP 2003045888A JP 2003045888 A JP2003045888 A JP 2003045888A JP 2004260282 A JP2004260282 A JP 2004260282A
Authority
JP
Japan
Prior art keywords
block
image
codebook
prediction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003045888A
Other languages
English (en)
Inventor
Koji Kinomoto
耕士 木ノ本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HOKUTO SYSTEM KK
Original Assignee
HOKUTO SYSTEM KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HOKUTO SYSTEM KK filed Critical HOKUTO SYSTEM KK
Priority to JP2003045888A priority Critical patent/JP2004260282A/ja
Publication of JP2004260282A publication Critical patent/JP2004260282A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

【課題】画像圧縮または音声圧縮のためのベクトル量子化処理に用いるコードブックを軽くする。
【解決手段】入力画像や音声データの各データブロックに対して複数の予測ブロックを生成し、この予測ブロックをコードブックに格納する一方、近似ブロックと画像等のデータブロックの誤差が予め設定した許容値を超えた場合に、そのデータブロックを量子化してコードブックに格納する。これら二種類のブロックデータによりコードブックを構成する。すなわち、予め膨大なコードブックを用意するのではなく必要に応じてコードブックを作成する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、画像や音声データ等の圧縮技術に係り、とくに演算効率を高めるためにベクトル量子化に用いるコードブックを軽減する技術に関する。
【0002】
【技術の背景】
画像データや音声データの圧縮技術には可逆圧縮と不可逆圧縮とがある。以下、画像データを例にとって説明する。可逆圧縮は元の画像データを完全に復元する技術であるが、圧縮に限界があるため画像の保存や配信においては、完全な画像の復元は出来ないが見た目には差異のない品質を保持するように画像データの圧縮を行う技術(不可逆圧縮)が多用される。
【0003】
とりわけ静止画像の圧縮に適する符号化処理としては、不可逆圧縮ではJPEG、可逆圧縮ではGIFがよく用いられる傾向にあり、その長所短所を考慮して使い分けがなされている。例えば、GIFはエッジ部分が劣化しないという長所があるが、24bitカラーまでしかサポートしていないという短所がある。JPEGは符号化効率が高いが、エッジ部分の劣化が目立つ。また再生速度が遅いなどの短所をもっている。
【0004】
JPEGの圧縮技術は、基本的には、画像を、画像データを構成する低周波の成分に関するデータDC値と、高周波の成分であるAC値とに分離し、DC値とAC値とを伸張時(画像再生時)の劣化が目立たないように適当に間引く(量子化する)ことによって実現する。
【0005】
量子化する際の考え方の相違により、不可逆圧縮技術には特有な長所と短所があらわれる。例えばJPEGは、人間の目の性質である次の二点、すなわち
▲1▼ 輝度の変化については敏感だが、色差の変化にはそれほど敏感ではない
▲2▼ 輝度の変化に敏感ではあるが、それは画像の低周波の部分(DC値)であって、高周波成分(AC値)の変化についてはそれほど敏感ではないという性質を利用して圧縮を行う。画像の高周波成分というのは、輝度(濃度)や色差が劇的に(鮮明に)変化する部分、例えばCGやアニメーションで多用される人物や背景の領域線や風景写真における鮮やかな山の稜線のような部分、つまりエッジの部分がこれに相当する。通常のスナップ写真に写し出される人物の表情、服装、風景等は、劇的で鮮烈な領域線の濃度変化をみせないことが多いため人間の目の性質を利用したJPEG的な処理によって有効な結果を得る。
【0006】
【従来の技術】
従来公知のJPEGやGIFは、短所と長所を十分に理解して使い分けを行うのが好ましいとされるが、実際のところは、多種多様な画像を扱う場合に適切な使い分けが出来ないことが少なくない。例えばCGやアニメーションでも輪郭構造が違う場合も多いし、写真は雑多な輪郭線が複雑に入り組んでいる。
【0007】
このため国際的な規格形式であるJPEGやGIFを超える新しい画像圧縮技術として、近時、さまざまな技術が提案されるようになった。
【0008】
例えば、画像中の自己類似性を利用したフラクタル符号化(例えばLIFS符号化)や適応的直交変換がある。これは、画像中の一部が他の一部に似ていることが多いという性質を利用する。CGやアニメーションの輪郭線、山の稜線を写し
た風景写真などがこういった自己類似性の性質を呈する。
【0009】
なお、拡大、縮小、回転と言った画像の幾何学的変換処理であるアフィン変換に基づくフラクタル符号化は、適応的直交変換を主体とする符号化方式に較べると符号化効率が悪いとされる。
【0010】
従来公知の直交変換(例えばJPEG)が画像周波数の統計的性質に基づいて圧縮を行ったのに対し、適応的直交変換は、画像の幾何学的性質に基づいた直交変換により圧縮を行う。この結果として、統計的仮定が成立する画像はもちろん、妥当な統計的仮定が成立しないCGやアニメーション等人工的に構成された画像データであっても符号化効率が高まるわけである。
【0011】
【発明が解決しようとする課題】
このように、従来の画像圧縮技術として広く知られているJPEGとGIFは、それぞれ長所と短所を併せ持つため、画像の種類に応じた使い分けが非常に難しいという問題を内包する。
【0012】
一方、JPEGに代わりうる新しい圧縮技術である適応的直交変換は、符号化効率あるいは伸張時のクオリティ、とくにエッジ部分(輪郭線等)の再現性という点からみると優れている。しかしながら、符号化効率が悪くないとされる適応的直交変換にしても、またフラクタル符号化にしても問題が残されている。
【0013】
それは、画像圧縮の処理過程であるベクトル量子化において使用するコードブック(ベクトルパターン)が、数千ブロックという大きなサイズになるため、必然的に演算コストを圧迫するという点である。この結果、スペックの限られたハードウェア上のアプリケーションには実用的な動作速度で搭載することが困難となってしまう。
【0014】
この点につき、ベクトル量子化を中心として簡単に述べる。
量子化は、輝度(濃度)や色差の圧縮を行うための手法であって、予測符号化や直交変換の結果である数値を、有限値の離散的な数値(量子化レベル)で代表させる処理である。画像の輝度(濃度)は通常なめらかに変化するが、変化の度合いを離散的な数値に代表させることによって圧縮効率が高まる。
【0015】
量子化は一種の近似操作であるため本質的に誤差の発生を伴う。量子化の手法としては、それぞれの画素を独立して量子化するスカラー量子化もあるが、圧縮効率が悪い。そこで一般には、複数の画素を同時に量子化するベクトル量子化を用いる。
【0016】
ベクトル量子化は、図8に示すように、複数の代表的なベクトルパターン(コードブック)を送・受信側で用意しておき、入力画像のブロックに最も近い量子化ベクトルパターンを選択し、選択したコード番号(インデックス番号)を受信側に伝送する。
【0017】
このように、ベクトル量子化では予め用意したコードブックに基づいてインデックス番号だけを伝送すればよいことから、通信速度や復元処理速度が向上するとされる。しかし、用意しておくべきコードブックのデータ量が膨大(数千ブロック単位)になるという別の問題が生ずるわけである。
【0018】
以上を要約すると、直交変換は滑らかな部分の再現性には優れるがエッジ部分の再現性に難があり、圧縮効率を高めるベクトル量子化はエッジ部分の再現性には優れている。適応的直交変換は直交変換とベクトル量子化の性質を兼ね備えているが、ベクトル量子化においてコードブックが膨大になるという難があって、画像処理の符号化効率という点では改善の余地を残している。
【0019】
そこで本発明の目的は、直交変換に基づく滑らかな部分の再現性の高さと、ベクトル量子化が備えるエッジ部分の再現性の高さの利点を損なうことなく、画像圧縮のために用いるコードブックを格段に軽減させる点にある。なお、本発明に係る画像圧縮の技術は音声データの圧縮にも同じように適用できる。
【0020】
【発明を解決するための手段】
前記目的を達成するため、本発明に係るコードブックの作成方法は、入力画像を重なりのない複数領域の画像ブロックに分割し、コードブック内のブロックデータに基づいて近似ブロックを生成し、これを画像ブロックと置換するベクトル量子化処理を技術的前提として、入力画像の各画像ブロックに対して複数の予測ブロックを生成し、この予測ブロックをコードブックに格納する一方、近似ブロックと画像ブックの誤差が予め設定した許容値を超えた画像ブロックを量子化してコードブックに格納し、これら二種類のブロックデータによってコードブックを構成する。
【0021】
前記予測ブロックは、実際の画像圧縮処理の過程において、入力画像の各画像ブロックに対して画像ブロック毎に生成し、随時コードブック内に登録された予測ブロックデータを更新する場合がある(請求項2)。
【0022】
また、実際の画像圧縮処理の過程において、近似ブロックと画像ブロックの誤差が予め設定した許容値を超えた画像ブロックを量子化し、このブロックデータの発生とともに随時コードブックに追加登録する場合がある(請求項3)。
【0023】
更に、前記予測ブロックは、入力画像の各画像ブロックについて、ブロック平均値で構成されるDC画像に基づく内挿予測によって第一の予測ブロックを生成し、実際の画像圧縮処理の過程における復号画像に基づいて、外挿予測により複数の第二の予測ブロックを生成して、コードブック内の予測ブロックデータを更新する場合がある(請求項4)。
【0024】
また、請求項1記載の方式はそのまま音声データの圧縮に適用することが可能である(請求項5)。音声データの圧縮効果も請求項1記載の画像データの圧縮の場合とほぼ同じであるため、以下の説明でも画像データの圧縮技術を中心として説明する。
【0025】
【作用】
適応的直交変換は、入力画像中のブロックとコードブック内の近似ブロックを置き換えるという点でベクトル量子化の一種と捉えることが出来る。また、適応的直交変換は画像ブロック毎に最適な直交基底系を構成する方式でもあり、直交変換符号化の性質を兼ね備えている。エッジ部分の再現性が高いベクトル量子化と、滑らかな部分の再現性が高い直交変換との中間的な性質を持っており、エッジと滑らかさが混在する画像に対しても安定して高い符号化効率が実現できる。
【0026】
一方、適応的直交変換を前提とする従来のベクトル量子化では、コードブックが肥大化する難点があったが、請求項1に係るコードブックは、
1) 近似ブロックと画像ブロックとの誤差が許容値を超えた画像ブロックを量子化したブロック、
2) 入力画像の各画像ブロックに対して生成した複数の予測ブロック
という二種類のブロックデータによってコードブックを構成するため、最初から用意しておくべきコードブックの数を極端に低減させることが出来る一方、実際に圧縮/伸張処理を行うべき対象ブロックに適用するコードブックは実際の入力画像を基準として処理するため、コードブックの蓄積点数を例えば極端に減らしても処理品質を劣化させる可能性が殆ど生じないという利点をもつ。
【0027】
請求項2では、処理対象の画像ブロック毎にその画像ブロックに対して複数の予測ブロックを生成し、コードブックに登録されている予測ブロックの内容を更新することで、類似する画像パターン(近似ブロック)を予めコードブック内に予想して用意しておかなくても、かなり高い精度で近似パターンをヒットさせる(予想該当させる)ことが出来る。多くの画像(CGや写真画像等)は、微妙な処理が難しい周波数の高い成分も概ね類似した傾向をもっており、無制限にベクトルパターンを想定してコードブックに収めておくよりも、実際の画像圧縮処理の過程で、その画像特有の周波数成分を複数予測してコードブックを更新した方が、処理速度は圧倒的に高まるわけである。またこれによって、予め用意しておくべきコードブックの点数を極度に減らすことが可能となる。
【0028】
また従来のベクトル量子化では、画像全般の特性に対して予想しうる各種のブロックパターンを出来るだけ多く用意して比較する手法をとったが、請求項3に係るコードブックは、近似ブロックの生成時に画像ブロックとの誤差が許容値を超えたものを優先的にコードブックに追加登録(格納)して、爾後の圧縮処理における効率を高めるとともに無用なコードブックの肥大を防止する。
【0029】
請求項4は、予測ブロックの作成に関するものである。
予測ブロックの生成は、対象となる画像ブロックに対して随時行うが、予測の建て方(数式)は本来的には画像パターンの特性や使用目的等に応じて自由に設計することが出来る。
【0030】
しかし符号化処理の効率を高めるためには、ブロック平均値で構成されるDC画像に基づく内挿予測によって第一の予測ブロックと、ベクトル量子化の処理過程における復号画像に基づいて外挿予測により複数の第二の予測ブロックを、処理対象の画像ブロック毎に生成し、コードブックに格納(更新)して、圧縮処理に用いることが望ましい。
【0031】
また、予め内挿予測によって生成した第一の予測ブロックと画像ブロックとの誤差が設定した許容値の範囲内に収まるときは、ベクトル量子化を行うまでもなく、画像ブロックを第一の予測ブロックに置き換えた方が効率がよい。これは、なめらかな部分では第一の予測ブロックが最も画像ブロックと似ている可能性が高いためである。
【0032】
コードブックの登録候補は処理過程で膨大に生じるが、登録候補数が予め設定した最大数を超える場合には、時系列順に古いベクトルパターンから削除することで、常に新しく取得したパターンを保持する。これは画像内で互いに似たブロックは近い位置に出現する傾向がある為である。このような処理を繰り返すことにより、コードブック内に収めるベクトルパターンを可能な限り抑え、圧縮処理の忠実と高速を図る。
【0033】
【発明の実施の形態】
以下、本発明に係るコードブックの作成方法の実施形態を説明する。
なお、図1、図2、図7において同様の処理を行なう部分もしくは同様の情報を格納する部分は、同一符号を附して重複する説明を省略する。
【0034】
図1は本発明にコードブックの作成方法を具体的に実行させるための画像圧縮装置を例示するブロック図である。二重の矢印線は、予め画像全体に対して行われる処理であり、画像ブロックのDC成分を処理する流れを示す。一本の矢印線は、その後に画像ブロック単位で行われる処理であり、画像ブロックのAC成分を処理する流れを示してある。
【0035】
以下に示す画像ブロックの処理においては、原画像(入力画像)を適当数、例えば水平4画素×垂直4画素のブロック単位に分割した16画素からなるブロック単位で行う。
【0036】
11は原画像を格納する原画メモリ、12は縮小画像であるDC値を格納するDCメモリ、13はその時点での復号画像を格納する復号画像メモリである。DCメモリ12と復号画像メモリ13は、画像ブロックを予測するのに必要な近傍情報を格納している。なお、各メモリ(12、13)は何れも左下から右上に向かって処理する。
【0037】
まず原画像から総ての画像ブロック平均値を算出し、適宜手段、例えば2次元DPCMなどを用いて差分予測符号化器23と差分予測復号化器24によって復号
DC画像を生成する。
【0038】
次に、この各DC値を4×4画素のブロックに平坦に拡張し、復号画像メモリ13に格納して復号画像の初期状態とする。ここで予測符号化されたDC情報は別途、エントロピー符号化を行い出力する。
【0039】
一方、AC成分は、画像ブロックからDC値を減算して得る。このACブロックは、候補ブロック選択部41において自乗和誤差が許容値Z以下の候補ブロックと置換され、その候補ブロックを生成するのに必要な情報をエントロピー符号化して出力する。
【0040】
図3は、画像ブロックを圧縮処理する手順の実施形態をフローチャートで示すものである。この実施形態の場合、候補ブロックは4種類ある。しかし、実際には画像ブロック毎に総ての候補ブロックを生成するわけではない。具体的には、例えば図3に示すように、F2、F4、F7、F9で段階的に各候補ブロックとの自乗和誤差と許容値Zを比較して選択すればよい。処理を高速化するためである。選択結果は候補選択コードPとして0〜3の値で区別する。
【0041】
まず、F2で選択される候補ブロックは、DC値を単純に拡張した平坦なブロックである。復号ブロックの初期状態と同一である為、ここでは候補ブロックを生成しない。次にF4で選択される候補ブロックは、内挿予測によって生成した予測ブロックである。F2、F4で選択された候補ブロックは復号DC画像内の情報のみから生成できる為、候補選択コードPのみをエントロピー符号化して出力する。
【0042】
そしてF7で選択される候補ブロックは、コードブックより単一または複数のブロックを選択し、組合せて生成した近似ブロックである。このF7で選択されない場合には、ACブロックをスカラー量子化して候補ブロックとする。ただし、F9でこの量子化誤差が先の近似ブロックの誤差より大きい場合には近似ブロックの方を選択する。
【0043】
近似ブロックを生成する為に必要な情報は、合成ブロック数、各ブロックのインデックス番号とスケール変換係数であり、これがエントロピー符号化される。この様に少ない情報で生成できる候補ブロックから順にACブロックとの自乗和誤差を比較して行く。
【0044】
近似ブロック生成部42では、コードブック内から単一もしくは複数のブロックを選択し、これらに適当なスケール変換係数をかけて(乗算して)、当該ブロックを加算することで近似ブロックを生成する。効率の良いブロック数およびブロックとスケール変換係数の組合せの算出については、例えば適応的直交変換などの技術を用いる。
【0045】
ここでコードブックには、予測ブロック群14と量子化ブロック群15の二つのメモリに格納されたブロック情報をあわせて用いる。これが本発明の特徴である。
【0046】
量子化ブロック群15の初期状態は空であるが、処理過程で必要な量子化ブロックが追加される(F11)。例えば、最大数を24個としたとき、最大数24個を越えた場合に古い量子化ブロックから時系列順に削除すれば、常に最近の24個の量子化ブロックが量子化ブロック群15に格納された状態となる。
【0047】
予測ブロック群14は必要に応じて画像ブロック毎に生成する。
例えば図1では、内挿予測ブロック生成部43で1つ、外挿予測ブロック生成部44で7種の予測ブロックを生成し、予測ブロック群14に格納する。予測ブロック群に格納するブロック数は常に一定数とし、新たな予測ブロックの生成にあわせて更新する。なお、外挿予測ブロック生成部44において生成する予測ブロックの種類(数式パターンの数)は7種前後であればよく、とくに7種に厳密に限定されるわけではない。取り扱う入力画像の特徴的なパターンの傾向や使用するコンピュータの能力に応じて許容できる速度で処理出来ればよいからである。
【0048】
また、スケール変換係数は、近似ブロック生成部42の内部において一定係数で量子化することが望ましい。本実施形態では、量子化誤差のバラツキを減らすため予測ブロック群14と量子化ブロック群15にブロックを格納する時点で、ブロックを例えば16次のベクトルとみなして単位ベクトルに正規化処理するようになっている。
【0049】
図5は、内挿予測に用いるDC値の位置を示すものである。
SはDC値で、U、B、L、Rはその4近傍のDC値、S1〜S4は予測する画素の一部である。この実施形態では、予測式S1=S+(2L+2B−U−R−2S)/8、S2=S+(2B−U−R)/8、S3=S+(2L−U−R)/8、S4=S+(2S−U−R)/8を用いてS1〜S4の画素を予測する場合を例示する。残りの画素に対しても同様に算出する。
【0050】
図6は、外挿予測に用いる復号値の位置を示すものである。
N1〜N10は予測に用いる近接する復号値、Sxは予測する画素、a、b、c、dはSxを予測するのに用いる近傍値である。点線の矢印線はブロックの復号順序を示し、N1〜N10は既に算出済みの値である。画素Sxは、S1、S2から順に左下から右上に向かって予測する。
【0051】
例えば、予測式Sx=aを用いるとN1〜N4を横に平坦に拡張した予測ブロックが生成できる。実施形態では、7種の予測式Sx=a、Sx=(a+b)/2、Sx=b、Sx=(b+c)/2、Sx=c、Sx=(c+d)/2、Sx=dを用いて7種の予測ブロックを生成する。この外挿予測の方法では一方向に平坦に拡張したブロックしか生成されないため、ここでは方向が概ね等角度になる予測式を用いている。
【0052】
図2は本発明に係る画像伸張装置のブロック図である。二重の矢印線は、予め画像全体に対して行われる処理であり、画像ブロックのDC成分を処理する流れを示す。通常の矢印線は、その後に画像ブロック単位で行われる処理であり、画像ブロックのAC成分を処理する流れを示す。
【0053】
最初にエントロピー復号器28と差分予測復号化器24で復号DC画像を生成し、このDC値を4×4画素のブロックに平坦に拡張し、復号画像の初期状態とする。次に候補選択コードP、量子化情報、合成ブロック数、インデックス番号、スケール変換係数を復号する。復号ブロックの生成方法は、候補ブロック選択II46において候補選択コードPで判断する。
【0054】
図4は、画像ブロックを伸張処理する手順の実施形態を示すフローチャートである。F22、F23、F24で候補選択コードPから復号ブロックの生成方法を判断し生成する。そのブロックにDC値を加算して復号画像を更新する。具体的には次の通りである。
【0055】
まず、F22でPが0の場合は、DC値を平坦に拡張したブロックが復号ブロックであり、復号画像の初期状態と同一であるので処理しない。次にF23でPが1の場合は、内挿予測にて復号ブロックを生成する。
【0056】
そしてF24でPが2の場合は、コードブックより近似ブロックを生成する。近似ブロック生成部II47において、インデックス番号を元に必要な予測ブロックを生成し、量子化ブロック群から必要な量子化ブロックを取得する。これらのブロックを指定の係数でスケール変換し加算して復号ブロックとする。またPが3の場合は、復号した量子化ブロックを逆量子化して復号ブロックとする。このとき、この量子化ブロックは量子化ブロック群に格納する。
【0057】
伸張処理においても量子化ブロック群15の初期状態は空であり、F25にて量子化ブロックを追加する。圧縮時と同様に最大数24個を越えた場合に古いブロックから削除する事で、常に最近の24個の量子化ブロックが格納された状態となっている。
【0058】
【実施形態の効果】
この実施形態によれば、コードブックのブロック数は8〜32個であり、従来のベクトル量子化で用いる数千個のコードブックと比べて、100分の1程度と少ない。
【0059】
コードブック内に画像ブロックに似たブロックが含まれているので、コードブックのブロック数が少なくても誤差の少ない近似ブロックを生成しやすい。ただし、実施形態の予測方法では誤差の少ない近似ブロックを生成できない場合も多い為、その場合に画像ブロックのAC値をそのまま量子化保存し、その量子化ブロックを以降のコードブックに含める事でコードブックを補強している。これは、実施形態の予測式で生成したブロックには高周波成分が不足している為、高周波成分の多く残る量子化ブロックを用いて補うという意味がある。
【0060】
このようにコードブックを小さくする事で、圧縮時の検索演算時間を減らす訳だが、代わりに圧縮/伸張時に予測ブロック生成の演算時間を要する。しかし、この実施形態で用いる予測式の様に加減算とビットシフトだけで予測ブロックを生成するならば、その演算時間は従来ベクトル量子化の数千ブロックの検索時間に比べれば僅かである。
【0061】
復号画質についても、コードブック内の複数ブロックを選択する際に適応的直交変換の技術を用いる事で、切立ったエッジ部分と滑らかな部分、その混在する部分においても歪みの少ない圧縮が可能である。この性能は実施形態で用いるコンパクトなコードブックを用いてもほとんど変わらない。
【0062】
【他の実施形態】
図1の実施形態では、DC値による内挿予測と復号値による外挿予測を用いて予測ブロックを生成しているが、他の実施形態では、カラー画像であればYCrCbやRGBコード間での予測、動画であればフレーム間での予測により予測ブロックを生成しても良い。
【0063】
【発明の効果】
以上説明したように、この発明によれば、複数種の予測ブロックを画像ブロックに応じて生成しコードブックに加える事で、コードブックのブロック数が少ない状態でも誤差の少ない近似ブロックを生成しやすくなる。また誤差の少ない近似ブロックを生成できない場合についても、AC値を量子化保存して、その量子化ブロックを以降のコードブックに含める事でコードブックを補強するため、コードブックを構成するブロック数を数十個程度と大幅に削減しても実用に耐える復号画質を取得できる。音声データの場合(請求項5)の場合も同様である。
【0064】
各画像ブロックに対して適応的にコードブックを構成する本発明では、予測ブロックの生成に演算時間を要するが、加減算とビットシフトで構成できる予測式を用いることによって高速化を図ることが出来る。
【図面の簡単な説明】
【図1】本発明に係るコードブック作成方法を例示するブロック図である。
【図2】本発明に係るコードブック作成方法を例示するブロック図である。
【図3】ブロック単位での符号化処理を例示するフローチャートである。
【図4】ブロック単位での復号化処理を例示するローチャートである。
【図5】DC値を用いる内挿予測を例示する図である。
【図6】復号値を用いる外挿予測を例示する図である。
【図7】従来の方法による画像圧縮方法を例示するブロック図である。
【図8】一般的なベクトル量子化処理を例示するブロック図である。
【符号の説明】
11 原画像格納メモリ
12 復号DC画像格納メモリ
13 復号画像格納メモリ
14 予測ブロック・コードブック用メモリ
15 量子化ブロック・コードブック用メモリ
16 候補ブロック・バッファ
17 コードブック用メモリ
21 減算器
22 平均器
23 差分予測符号化器
24 差分予測復号化器
25 量子化器
26 逆量子化器
27 エントロピー符号化器
28 エントロピー復号化器
29 加算器
41 候補ブロック選択部
42 近似ブロック生成部
43 内挿予測ブロック生成部
44 外挿予測ブロック生成部
45 コードブック生成部
46 候補ブロック選択部II
47 近似ブロック生成部II
F1 画像ブロックからDC値を減算(21)
F2 平坦ブロックの誤差と許容値を比較/判断(41)
F3 内挿予測ブロックの生成(43)
F4 内挿予測ブロックの誤差と許容値を比較/判断(41)
F5 外挿予測ブロックの生成(44)と予測コードブックの更新(14)
F6 コードブック(14、15)から近似ブロックを生成(42)
F7 近似ブロックの誤差と許容値を比較/判断(41)
F8 画像ブロックを量子化(25)
F9 量子化誤差を算出し(26)近似ブロックの誤差と比較/判断(41)
F10 候補選択コードを3に決定(41)
F11 量子化コードブックの更新(15)
F12 量子化ブロックをエントロピー符号化(27)
F13 候補ブロックで復号画像を更新(13)
F14 候補選択コードをエントロピー符号化(27)
F15 候補選択コードを0に決定(41)
F16 候補選択コードを1に決定(41)
F17 候補選択コードを2に決定(41)
F18 近似ブロックの構成情報をエントロピー符号化(27)
F21 候補選択コードをエントロピー復号化(28)
F22 候補選択コードが0であるか判断(46)
F23 候補選択コードが1であるか判断(46)
F24 候補選択コードが2であるか判断(46)
F25 量子化ブロックを復号して(28)コードブックに格納(15)
F26 量子化ブロックを逆量子化して画像ブロックを生成(26)
F27 画像ブロックにDC値を加算(29)
F28 復号画像を更新(13)
F29 内挿予測して画像ブロックを生成(43)
F30 近似ブロックの構成情報を復号(28)
F31 予測ブロックの生成(43,44)
F32 予測ブロック、量子化ブロックから画像ブロックを生成(47)
S DC値
U、B、L、R Sの4近傍のDC値
S1、S2、S3、S4、Sx 予測値
N1、N2、・・・、N10 近接する復号値
a、b、c、d Sxの近傍値

Claims (5)

  1. 入力画像を重なりのない複数領域の画像ブロックに分割し、コードブック内のブロックデータに基づいて近似ブロックを生成し、これを画像ブロックと置換するベクトル量子化処理において、
    入力画像の各画像ブロックに対して複数の予測ブロックを生成し、この予測ブロックをコードブックに格納する一方、
    近似ブロックと画像ブックの誤差が予め設定した許容値を超えた画像ブロックを量子化してコードブックに格納し、
    これら二種類のブロックデータによってコードブックを構成することを特徴とするベクトル量子化処理におけるコードブックの作成方法。
  2. 実際の画像圧縮処理の過程において、
    入力画像の各画像ブロックに対して画像ブロック毎に予測ブロックを生成し、随時コードブック内に登録された予測ブロックデータを更新することを特徴とする請求項1記載のベクトル量子化処理におけるコードブックの作成方法。
  3. 実際の画像圧縮処理の過程において、
    近似ブロックと画像ブロックの誤差が予め設定した許容値を超えた画像ブロックを量子化し、このブロックデータの発生とともに随時コードブックに追加登録することを特徴とする請求項1または請求項2記載のベクトル量子化処理におけるコードブックの作成方法。
  4. 予測ブロックは、
    入力画像の各画像ブロックについて、ブロック平均値で構成されるDC画像に基づく内挿予測によって第一の予測ブロックを生成し、
    実際の画像圧縮処理の過程における復号画像に基づいて、外挿予測により複数の第二の予測ブロックを生成して、
    コードブック内の予測ブロックデータを更新することを特徴とする請求項1または請求項2記載のベクトル量子化処理におけるコードブックの作成方法。
  5. 入力データを重なりのない複数のデータブロックに分割し、コードブック内のブロックデータに基づいて近似ブロックを生成し、これをデータブロックと置換するベクトル量子化処理において、
    入力データの各データブロックに対して複数の予測ブロックを生成し、この予測ブロックをコードブックに格納する一方、
    近似ブロックとコードブックの誤差が予め設定した許容値を超えたデータブロックを量子化してコードブックに格納し、
    これら二種類のブロックデータによってコードブックを構成することを特徴とするベクトル量子化処理におけるコードブックの作成方法。
JP2003045888A 2003-02-24 2003-02-24 ベクトル量子化処理におけるコードブックの作成方法 Pending JP2004260282A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003045888A JP2004260282A (ja) 2003-02-24 2003-02-24 ベクトル量子化処理におけるコードブックの作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003045888A JP2004260282A (ja) 2003-02-24 2003-02-24 ベクトル量子化処理におけるコードブックの作成方法

Publications (1)

Publication Number Publication Date
JP2004260282A true JP2004260282A (ja) 2004-09-16

Family

ID=33112583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003045888A Pending JP2004260282A (ja) 2003-02-24 2003-02-24 ベクトル量子化処理におけるコードブックの作成方法

Country Status (1)

Country Link
JP (1) JP2004260282A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006191642A (ja) * 2005-01-06 2006-07-20 Qualcomm Inc 非標準化ビデオ量子化コーダを使用するビデオ規格に準拠した残差コーディング

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006191642A (ja) * 2005-01-06 2006-07-20 Qualcomm Inc 非標準化ビデオ量子化コーダを使用するビデオ規格に準拠した残差コーディング

Similar Documents

Publication Publication Date Title
US11783512B2 (en) Attribute value of reconstructed position associated with plural original points
EP3861755B1 (en) Techniques and apparatus for weighted-median prediction for point-cloud attribute coding
US11568571B2 (en) Techniques and apparatus for lossless lifting for attribute coding
US10904564B2 (en) Method and apparatus for video coding
US20200105025A1 (en) Method and apparatus for video coding
EP2688042B1 (en) Image processing
EP2005393B1 (en) High quality image processing
JP3814637B2 (ja) 画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置
US11580670B2 (en) Method and apparatus for inter-channel prediction and transform for point cloud attribute coding
JP7476432B2 (ja) メッシュ復元のための方法、装置及びコンピュータプログラム
US20230162404A1 (en) Decoding of patch temporal alignment for mesh compression
JP2004260282A (ja) ベクトル量子化処理におけるコードブックの作成方法
Banterle et al. A GPU-friendly method for high dynamic range texture compression using inverse tone mapping
CN113115019A (zh) 视频编解码方法、装置、计算机设备及存储介质
JP7504298B2 (ja) 3次元(3d)メッシュのuv座標を処理するための方法、装置及びコンピュータプログラム
US20220392114A1 (en) Method and apparatus for calculating distance based weighted average for point cloud coding
US12020461B2 (en) Method and apparatus for Haar-based point cloud coding
JP7486883B2 (ja) Haarベースの点群符号化のための方法および装置
WO2023070388A1 (zh) 视频编码方法、装置和计算机可读存储介质
Xu et al. A fast fractal image compression coding method
JP2024512915A (ja) 非マニホールドメッシュにおける境界ループの検出のための方法、装置、およびコンピュータプログラム
JPH09139941A (ja) 画像信号の符号化/復号化装置
JP2024512921A (ja) メッシュ圧縮のためのパッチ時間的位置合わせの符号化
JPH07240920A (ja) ディジタル画像データの圧縮および伸張
Wu et al. DCT basis decomposition coding of biomedical X-ray images using vector quantization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070717

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071113