JP3814637B2 - 画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置 - Google Patents

画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置 Download PDF

Info

Publication number
JP3814637B2
JP3814637B2 JP2000558674A JP2000558674A JP3814637B2 JP 3814637 B2 JP3814637 B2 JP 3814637B2 JP 2000558674 A JP2000558674 A JP 2000558674A JP 2000558674 A JP2000558674 A JP 2000558674A JP 3814637 B2 JP3814637 B2 JP 3814637B2
Authority
JP
Japan
Prior art keywords
vector
image
block
base
nest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000558674A
Other languages
English (en)
Inventor
高志 三浦
史彦 板垣
深雪 川島
Original Assignee
株式会社ハドソン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ハドソン filed Critical 株式会社ハドソン
Application granted granted Critical
Publication of JP3814637B2 publication Critical patent/JP3814637B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/649Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置に関し、更に詳しくはゲーム機等の比較的低性能なハードウェア(CPU,メモリ等)でも高速に良質な画像(CG画像,アニメーション画像,自然画像等)を再生可能な画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置に関する。
【0002】
【従来の技術】
図16,図17は従来技術を説明する図(1),(2)で、図16はJPEGによる画像圧縮処理のイメージを示している。図16(A)において、今日、静止画像圧縮方式の主流となっているJPEGでは、画像を8×8画素のブロックに分割し、それを2次元DCT(離散コサイン変換)によりDC(平均値)及び基本周波数から63倍周波数までの各係数値に変換する。更に、自然画像の周波数成分が低周波領域に集中していることを利用し、画品質が低下しない範囲で各係数値を異なる量子化幅で量子化し、情報量の削減を行ってから可変長符号化(ハフマン符号化)を行う。
【0003】
一方、この様な画像符号データを家庭用ゲーム機等で利用する場合には、CPU性能やメモリ容量に制限があるため、復号演算負荷の大きな画像圧縮法(JPEG等)をソフトウェアで復号すると、様々なデメリットが発生する。例えば、JPEGでは8×8画素のブロックに対して必ず64個の可変長符号化を行うべき符号が生成されるため、復号時の計算負荷の増大を招いている。
【0004】
図16(B)はハフマン符号の一部を示している。ハフマン符号化では、出現頻度の高い係数値H13等は相対的に短い符号長ビットで、また出現頻度の低い係数値H6 等は相対的に長い符号長ビットで夫々符号化されるため、これらの符号は各オクテット(バイト)上で図示の如く不揃いに詰め込まれてしまうことになり、このことが復号時の計算負荷を非常に大きくしている。このため従来のゲームシステムでは、動画として容認出来る程の速度で画像を復元するためには画品質を犠牲にせざる得ない状況であった。
【0005】
また画品質については、高周波成分ほど粗い精度で量子化されるため、輪郭部分の画像情報が失われてモスキートノイズを発生し、文字やアニメーション画像の圧縮には適していない。特にゲームソフトでは人工画像(CG画像,アニメーション画像等)が多用されるため、モスキートノイズによる主観的画品質の劣化は大きな問題である。
【0006】
これに対して、近年は、以下の文献〔1〕〜〔5〕が報告されている。
〔1〕Michael F. Barnsley, Lyman P. Hurd "FRACTAL IMAGE COMPRESSION" AK Peters Ltd., 1993
〔2〕井田 孝,駄竹 建志"反復変換符号化による画像圧縮"第5回 回路とシステム軽井沢ワークショップ論文集,pp.137-142, 1992
〔3〕ユ ヒョンベ,高橋 隆史,河野 裕之,徳永 隆治"グラム・シュミットの直交化を応用したLIFS画像符号化法の画品質改善"電子情報通信学会技術研究報告,vol.NLP-98, no.146, pp.37-42,1998
〔4〕渡邊 敏明,大関 和夫"平均値を用いた交流成分予測方式の一検討"画像符号化シンポジウム(PCSJ89), pp29-30, Oct. 1989
〔5〕高橋 隆史,徳永 隆治"画像のブロック平均値から交流成分を予測する高速演算アルゴリズム"電子情報通信学会論文誌 Vol.J81-D-II No.4, pp.778-780, Apr. 1998
ここで、方式〔1〕,〔2〕は復号演算負荷の小さな圧縮方式としてのフラクタル符号化、方式〔3〕はJPEGと同程度の符号化効率を有する適応的直交変換の改良、そして、方式〔4〕,〔5〕はブロック平均値(DC値)に基づく交流成分予測に関する。
【0007】
中でも方式〔3〕は、画像をK×K画素の正方形ブロックに分割し、全ブロックを許容誤差Zに応じて、交流成分予測法,フラクタル変換法,適応的直交変換の何れかで近似するブロック符号化法である。交流成分予測法は自ブロックを含む周囲のブロック平均値(DC値)から自ブロックの交流成分(加算データ)を求め、対象画像との残差を符号化する平均値分離方式に利用される。また適応的直交変換は、画像が有する自己相似性を利用し、ベクトル量子化のコードブックに相当する画像(ネスト)からブロック画像を近似するための基底ベクトルを抽出し、グラム・シュミット法によって必要最小次元の直交基底系を構成する方式である。
【0008】
しかし、上記方式〔1〕,〔2〕のフラクタル変換は、復号において反復計算を必要とし、かつ画像平面規模のワークスペースを消費するため、ビデオゲーム機等には不向きである。また方式〔3〕の適応的直交変換では、ネストとして対象画像と等しい大きさの加算データを利用するため、復号時に非常に大きなワークスペースを必要とする。更には、復号時に解凍されたブロックを逐次的にネスト上の対応するブロックへ書き戻すため、画品質は改善されるが、アドレス計算及びデータ転送の負荷が重い。更にまた、方式〔3〕
では基底の座標及びサンプリング係数の圧縮にハフマン符号を適用しているが、自然画像ではどの基底の出現頻度にも大きな偏りが無いため、圧縮効率が上がらないのみか、ハフマン復号の計算量のみが消費されている。また適応的直交変換では、画像により必要最小次元の直交基底数が多くなる場合があるが、基底数が多くなると残差ベクトルを直接符号化するよりも多くのビット数が使用され、符号化効率が低下する。
【0009】
また方式〔4〕の交流成分予測法では、画像中の輪郭部分周辺でオーバーシュートやアンダーシュートを発生する傾向があり、輝度の立ち上がりが鋭い人工画像では逆に画品質を劣化させる傾向がある。また方式〔5〕の段階的交流成分予測方式では、CPU負荷が重いばかりか、中間的に生成される補間値の記憶領域が必要となる。
【0010】
図17に段階的交流成分予測方式のイメージを示す。図17(A)において、段階的交流成分予測方では、注目ブロックを含む周囲4ブロックの各DC値(S,U,R,B,L)から注目ブロックS上のサブブロックS1 〜S4 の各DC値を次式により推定する。
【0011】
1 =S+(U+L−B−R)/8
2 =S+(U+R−B−L)/8
3 =S+(B+L−U−R)/8
4 =S+(B+R−U−L)/8
図17(B)において、上記方式を再帰的に適用することで、更にサブブロックS1 上の4画素P1 〜P4 の各画素値を次式により推定できる。
【0012】
1 =S1 +(U3 +L2 −S3 −S2 )/8
2 =S1 +(U3 +S2 −S3 −L2 )/8
3 =S1 +(S3 +L2 −U3 −S2 )/8
4 =S1 +(S3 +S2 −U3 −L2 )/8
また同様にして、サブブロックS2 上の4画素P1 〜P4 の各画素値を次式により推定できる。
【0013】
1 =S2 +(U4 +S1 −S4 −R1 )/8
2 =S2 +(U4 +R1 −S4 −S1 )/8
3 =S2 +(S4 +S1 −U4 −R1 )/8
4 =S2 +(S4 +R1 −U4 −S1 )/8
以下同様にして、サブブロックS,S 上の各4画素P1 〜P4 の各画素値を推定できる。
【0014】
しかし、最初のDC値(S,U,R,B,L)から出発して原画像の全予測値P1 〜P4 を得るには、上記方式を段階的に適用して細分化しなくてはならず、中間値を保持するメモリが必要なばかりか、CPUの演算負荷も増大する。
【発明が解決しようとする課題】
【0015】
本発明は上記従来技術の問題点に鑑み成されたもので、その目的とする所は、コンピュータ利用可能な画像データに対して高い画品質を保持しつつ画像データの圧縮率を高めると共に、符号/復号時の計算負荷を軽減できる画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置を提供することにある。
【0016】
【課題を解決するための手段】
上記の課題は例えば図1(A)の構成により解決される。即ち、本発明(1)の画像符号方法は、画像データを複数画素ブロックに分割して各ブロック平均値からなるDC画像を生成するステップと、前記各画素ブロックからそれぞれのブロック平均値を分離してブロック毎の残差ベクトルを求めると共に、残差ベクトルの大きさが所定の許容値を超えていことにより、前記DC画像の一部を基底ベクトルの巣として使用した適応的直交変換により、前記残差ベクトルを近似するための1又は2以上の正規化直交基底ベクトルと展開係数(α)との積からなる直交基底を求めるステップと、前記求めた直交基底系をこれと等価なスカラー展開係数(β)と基底ベクトルとの積からなる基底系に変換するステップと、前記画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに前記基底ベクトルの巣より基底ベクトルを抽出するための座標情報をそれぞれ符号化して符号データを作成するステップとを備えるものである。
【0017】
本発明(1)におけるネスト(基底ベクトルの巣)は、原画像を1/ブロックサイズに縮小したものであるため、特に、エッジや平坦な輝度成分を多く含むような人工画像(CG画像,アニメーション画像等)への適用例では、比較的小さいDCネストに原画像の特徴的な画像要素が漏れなく含まれると共に、このような原画像と縮小されたネストとの間には強い相関が得られる。
【0018】
従って、本発明(1)によれば、小さいネスト(メモリ)を使用して、原画像に含まれる特徴的な画像要素(基底ベクトル)を漏れなく、かつ能率よく(高速に)探索できる。また、このように縮小されたネストを使用しても、残差ベクトルを許容値以下に近似するための1又は2以上の直交基底を求める構成により、最終的に所要の画品質が得られる。
【0019】
好ましくは上記本発明(1)において、残差ベクトルの大きさが許容値未満の場合は、直交基底を求める代わりに、基底数=0の情報を符号化する。
【0020】
例えば、一般に輝度の立ち上がりが鋭い人工画像に対しては、輪郭部分が近傍に存在しない(即ち、残差ベクトルの大きさが許容値未満の)画素ブロックに対して基底数=0の符号が限定的に生成される。従って、このような画素ブロックについては高い画像圧縮率が得られる。
【0021】
一方、復号側では対応する画素ブロックに対して限定的に段階的交流成分予測法又は本発明による非段階的交流成分予測法を適用することで、少ないCPU及びメモリ負荷で画素ブロックを再生できる。
【0022】
また好ましくは上記本発明(1)において、求めた直交基底系の総符号量が残差ベクトルの総符号量以上となる場合は、直交基底系の符号化に代えて、残差ベクトルそのものを符号化する。従って、画像圧縮率をいたずらに低下させることが無い。
【0023】
また好ましくは上記本発明(1)において、予め求められた基底数nkにより残差ベクトル〈d〉との第1の誤差〈dnk〉が許容値未満となる場合に、前記求められた順にm(0≦m<nk)個の基底を使用した後の第2の誤差ベクトル〈dm 〉を、使用されなかった余基底数yk(=nk−m)に対応して予め定められた量子化係数Qykでスカラー量子化し、かつこれをスカラー逆量子化して、これを前記第2の誤差ベクトル〈dm 〉から引いて得られるnk種類の第3の誤差ベクトル〈d'm 〉と前記第1の誤差〈dnk〉との中で最も誤差が小さいものを選択し、対応する基底及び必要なら第2の誤差ベクトルを併せて符号化するものである。
【0024】
以下、図12(A)の(c),(d)を参照して一例の符号方法を具体的に説明する。図12(A)の(c)において、今、残差ベクトル〈d〉との誤差の大きさ‖〈dnk〉‖を許容値Z未満とするようなnk(例えばnk=3)個の基底からなる線形結合、
〈d〉≒β1 〈v1 〉+β2 〈v2 〉+β3 〈v3 〉 (nk=3)
が求まったとする。但し、〈v〉はvがベクトルであることを表す。
【0025】
上記nk=3個の基底を使用した場合の第1の誤差ベクトル〈d3 〉=〈dnk〉及び前記求められた順にm(0≦m<nk)個の基底を使用した後の第2の誤差ベクトル〈d0 〉〜〈d2 〉については次の関係がある。
【0026】
〈d0 〉=〈d〉 (m=0,yk=3)
〈d1 〉=〈d〉−β1 〈v1 〉 (m=1,yk=2)
〈d2 〉=〈d〉−β1 〈v1 〉−β2 〈v2 〉 (m=2,yk=1)
〈d3 〉=〈d〉−β1 〈v1 〉−β2 〈v2 〉−β3 〈v3
(m=3,yk=0)
図12(A)の(d)において、上記第2の誤差ベクトル〈d0 〉〜〈d2 〉を、使用されなかった余基底数yk=3,2,1に対応して予め定められた量子化係数Qyk(例えばQ3 =6,Q2 =7,Q1 =8)により夫々にスカラー量子化(かつクリッピング)し、かつこれらを同量子化係数Qykで夫々逆量子化して逆量子化後の第2の誤差ベクトル〈d0 Q'〉〜〈d2 Q'〉を求める。
【0027】
〈d0 Q'〉=[〈d0 〉/Q3 ]×Q3
〈d1 Q'〉=[〈d1 〉/Q2 ]×Q2
〈d2 Q'〉=[〈d2 〉/Q1 ]×Q1
但し、記号[ ]は演算結果の整数化を表す。
【0028】
更に、これらを前記第2の誤差ベクトル〈d0 〉,〈d1 〉,〈d2 〉から夫々に差し引いて得られる第3の誤差ベクトル〈d' 0 〉〜〈d' 2 〉を求める。
【0029】
〈d' 0 〉=〈d0 〉−〈d0 Q' 〉
〈d' 1 〉=〈d1 〉−〈d1 Q' 〉
〈d' 2 〉=〈d2 〉−〈d2 Q' 〉
ところで、これらの第3の誤差ベクトル〈d' 0 〉〜〈d' 2 〉の大きさは、必ずしも前記第1の誤差ベクトル〈d3 〉よりも大きいとは限らない。即ち、3個の基底β1 〈v1 〉+β2 〈v2 〉+β3 〈v3 〉を符号化した結果、その復号後の誤差が前記第1の誤差ベクトル=〈d3 〉となるよりも、例えば2個の基底β1 〈v1 〉+β2 〈v2 〉を符号化し、かつその残りの1基底分の符号量を利用して第2の誤差ベクトル〈d2 〉をスカラー量子化した結果、その復号後の誤差が前記第3の誤差ベクトル=〈d' 2 〉となる方が、最終的な復号誤差は小さいかも知れない。
【0030】
そこで第3の誤差ベクトル〈d' 0 〉,〈d' 1 〉,〈d' 2 〉と第1の誤差ベクトル〈d3 〉とのなかで、最も誤差が小さいものを選択して対応する基底及び必要なら第2の誤差ベクトルを符号化するものである。
【0031】
上記の例で言うと、もし第3の誤差ベクトル〈d' 2 〉が最も誤差が小さい場合は、直交基底系として{β1 〈v1 〉+β2 〈v2 〉}を採用し、これらを符号化すると共に、第2の誤差ベクトル〈d2 〉を併せて符号化(スカラー量子化)する。このようにして生成した符号は、基底をnk個使用する場合の総符号量よりも大きくはならない様に量子化係数Qykを定めているので、画素ブロック当たりの符号量を増加させずに画品質のみを向上させることが出来る。
【0032】
この様に、上記においては、適応的直交変換と、必要ならm個の基底を使用した後の第2の誤差ベクトルのスカラー量子化とを併用する構成により、残差ベクトル〈d〉をより高い精度で符号化可能となる。また、その際には、第2の誤差ベクトルを余基底数yk(=nk−m)に応じた量子化係数Qykでスカラー量子化し、かつこれを余基底数yk分の符号量に符号化するので、当該画素ブロックに対する総符号量を増さずに画品質のみを向上させ、かつ当該画素ブロック当たりの符号長を復号容易な形(所定ビット数の倍数)にでき、よって復号時の演算負荷が大幅に軽減される。
【0033】
また図1(B)の構成による画像符号/復号方法は、K×K画素のブロック平均値からなる自ブロックSを含む上下左右U,B,L,Rの計5つのDC画像データに基づき、自ブロックS上の左上の第1のサブブロックS1 の(K/2)×(K/2)の各画素データP1 〜P4 を次式、
1 =S+(2U+2L−2S−B−R)/8
2 =S+(2U−B−R)/8
3 =S+(2L−B−R)/8
4 =S+(2S−B−R)/8
また自ブロックS上の右上の第2のサブブロックS2 の(K/2)×(K/2)の各画素データP1 〜P4 を次式、
1 =S+(2U−B−L)/8
2 =S+(2U+2R−2S−B−L)/8
3 =S+(2S−B−L)/8
4 =S+(2R−B−L)/8
また自ブロックS上の左下の第3のサブブロックS3 の(K/2)×(K/2)の各画素データP1 〜P4 を次式、
1 =S+(2L−U−R)/8
2 =S+(2S−U−R)/8
3 =S+(2B+2L−2S−U−R)/8
4 =S+(2B−U−R)/8
及び又は、自ブロックS上の右下の第4のサブブロックS4 の(K/2)×(K/2)の各画素データP1 〜P4 を次式、
1 =S+(2S−U−L)/8
2 =S+(2R−U−L)/8
3 =S+(2B−U−L)/8
4 =S+(2B+2R−2S−U−L)/8
により求めるものである。
【0034】
上記においては、自ブロックを含む近傍のDC画像データS,U,B,L,Rから無段階で自ブロックS上のK×K画素の画素データを直接に求める構成により、画像符号/復号時のCPU及びメモリ負荷が大幅に軽減される。なおこの方法は、画像符号時には交流成分の予測等に、また画像復号時には交流成分の再生等に利用できる。
【0035】
また本発明()の画像復号方法は、請求項1記載の符号データを入力して画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに基底ベクトルの巣より基底ベクトルを抽出するための座標情報を復号するステップと、前記復号したブロック平均値によりDC画像を再生し、その一部を基底ベクトルの巣となすステップと、前記復号した画素ブロック毎の座標情報により前記基底ベクトルの巣から抽出した基底ベクトルに前記復号したスカラー展開係数を掛けて残差ベクトルを近似した近似ベクトルを再生するステップと、該再生した近似ベクトルに前記復号したブロック平均値を加算して各画素ブロックを復号するステップとを備えるものである。
【0036】
また本発明(3)の記録媒体は、画像データを複数の画素ブロックに分割して各ブロック平均値からなるDC画像を生成するステップと、前記各画素ブロックからそれぞれのブロック平均値を分離してブロック毎の残差ベクトルを求めると共に、該残差ベクトルの大きさが所定の許容値を超えていることにより、前記DC画像の一部を基底ベクトルの巣として使用した適応的直交変換により、前記残差ベクトルを近似するための1又は2以上の正規化直交基底ベクトルと展開係数との積からなる直交基底系を求めるステップと、前記求めた直交基底系をこれと等価なスカラー展開係数と基底ベクトルとの積からなる基底系に変換するステップと、前記画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに前記基底ベクトルの巣より基底ベクトルを抽出するための座標情報をそれぞれ符号化して符号データを作成するステップとをコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体である。
また本発明(4)の記録媒体は、請求項1記載の符号データを入力して画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに基底ベクトルの巣より基底ベクトルを抽出するための座標情報を復号するステップと、前記復号したブロック平均値によりDC画像を再生し、その一部を基底ベクトルの巣となすステップと、前記復号した画素ブロック毎の座標情報により前記基底ベクトルの巣から抽出した基底ベクトルに前記復号したスカラー展開係数を掛けて残差ベクトルを近似した近似ベクトルを再生するステップと、該再生した近似ベクトルに前記復号したブロック平均値を加算して各画素ブロックを復号するステップとをコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体である。
【0037】
また本発明(5)の画像符号装置は、画像データを複数の画素ブロックに分割して各ブロック平均値からなるDC画像を生成するDC画像生成手段と、前記各画素ブロックからそれぞれのブロック平均値を分離してブロック毎の残差ベクトルを求めると共に、該残差ベクトルの大きさが所定の許容値を超えていることにより、前記DC画像の一部を基底ベクトルの巣として使用した適応的直交変換により、前記残差ベクトルを近似するための1又は2以上の正規化直交基底ベクトルと展開係数との積からなる直交基底系を求める演算手段と、前記求めた直交基底系をこれと等価なスカラー展開係数と基底ベクトルとの積からなる基底系に変換する変換手段と、前記画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに前記基底ベクトルの巣より基底ベクトルを抽出するための座標情報をそれぞれ符号化して符号データを作成する符号化手段とを備えるものである。
また本発明(6)の画像復号装置は、請求項1記載の符号データを入力して画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに基底ベクトルの巣より基底ベクトルを抽出するための座標情報を復号する復号手段と、前記復号したブロック平均値によりDC画像を再生し、その一部を基底ベクトルの巣となすネスト生成手段と、前記復号した画素ブロック毎の座標情報により前記基底ベクトルの巣から抽出した基底ベクトルに前記復号したスカラー展開係数を掛けて残差ベクトルを近似した近似ベクトルを再生する近似ベクトル再生手段と、該再生した近似ベクトルに前記復号したブロック平均値を加算して各画素ブロックを復号する画像復号手段とを備えるものである。
【0038】
【発明の実施の形態】
以下、添付図面に従って本発明に好適なる実施の形態を詳細に説明する。なお、全図を通して同一符号は同一又は相当部分を示すものとする。図2は実施の形態による画像符
号/復号方式の構成を示す図で、ゲームシステムへの適用例を示している。
【0039】
図2において、10はゲーム機本体、11はゲーム機の主制御{ゲームプログラム,3DCG及びテクスチャデータTXDの読込制御,ユーザによるゲーム操作データの読込制御等)並びに3DCGアニメーションに係るゲーム処理(ゲームキャラクタの移動処理等)を行うCPU(ゲームプロセッサ)、12はCPU11が使用するRAM,ROM,EEPROM等からなる主メモリ(MM)、13はCPU11のローカル(ホスト)バス、14はデータを高速転送可能なバス、15はバス間の接続(及び競合調停)制御を行うブリッジ、16はユーザがゲーム操作やパラメータ設定等を行うための各種制御キー(スタートキー,選択キー,十字キー等)や、マウス,ジョイスティック等の位置入力手段を備える操作パッド、17は操作パッド16をゲームシステムに収容する周辺インタフェース(PIF)、18はゲームプログラム(処理手順,ゲームパラメータ,3DCGモデルデータ,テクスチャデータ等)をマスクROM等に記録しているROMカートリッジ(ROM−C)、19はROMカートリッジ18をゲームシステムに着脱自在に収容可能なROMカートリッジインタフェース(ROM−CIF)、20は上記ゲームプログラムを記録しているコンパクトディスクROM(CD−ROM)、21はCD−ROM20をゲームシステムに着脱自在に収容し、駆動可能なCD−ROMドライバ、22は、ゲームプログラムのオンラインダウンロードや他のゲーム機との間で対戦ゲームを行うために、本システムを不図示の公衆網に接続する通信制御部(COM)、23は通信線である。
【0040】
更に、30は入力の3DCGモデルデータを2D画面に透視変換するための3Dアクセラレータ、31はジオメトリプロセッサ、32はキャラクタ,背景等の各基準位置データ、及びその形状モデルデータに従って3D空間上の各対応位置にポリゴン等の集合からなる実サイズの3DCGモデルを生成・展開するモデリング変換部、33は前記生成モデルに対して光線(太陽光,照明光等)を考慮した陰影を付ける陰影処理部、34はワールド座標系XYZにおける3DCG画像データをカメラ視点情報に従う視点座標系xyzの3DCG画像データに変換する視点変換部、35はカメラの視点情報(視点座標系xyz)に従って3DCG生成モデルの透視変換を行う透視変換部である。
【0041】
更に、36は表示ラスタに同期した処理を行うレンダリング(ラスタ)プロセッサ、37は透視変換後の各画素データをCRT45の走査線アドレスx,yに従って抽出する走査線分解部、38はZバッファ、39はZバッファ38を使用して画面45Aに見えないはずの部分の画素データを画面45Aに見える部分の画素データで書き換える隠面消去部、40は本発明による入力のテクスチャ圧縮データを解凍(復号)するテクスチャ復号部、41はテクスチャデータを一時的に蓄えるテクスチャバッファ、42は画面45Aに見える部分の各画素データに対してテクスチャバッファ41の各対応するテクスチャデータを貼付けるテクスチャ処理部、43は出力のカラー画像データ(R,G,B)を記憶するフレームメモリ、44はフレームメモリ43のカラー画素データをアナログ画素信号に変換してCRT45にビデオ信号VSを提供するD/A変換部(DAC)、45は表示部としての例えばカラーCRTモニタ、45Aはその表示画面、46はCR45の水平垂直同期信号H,V及び3Dアクセラレータ30のx,y同期信号を発生するCRT制御部(CRTC)である。
【0042】
更に、外部のゲーム作成装置50は、ゲームプログラム(処理手順,ゲームパラメータ,3DCGモデルデータ,テクスチャデータ等)を作成してROMカートリッジ18又はCD−ROM20に記録する。またテクスチャデータの作成時には本発明による画像符号化方式が実行され、画像圧縮されたテクスチャデータTXDがROMカートリッジ18又はCD−ROM20に記録される。そして、この画像圧縮されたテクスチャデータTXDはテクスチャ復号部40で高速に復号され、更に2D透視画像に貼りつけられ、画面45Aに表示される。以下、ゲーム作成装置50における画像符号(圧縮)処理を説明する。
【0043】
図3〜図7は実施の形態による画像符号化処理のフローチャート(1)〜(5)、図8は同画像符号化処理のテーブルを説明する図、図9〜図12は同画像符号化処理のイメージ図(1)〜(4)であり、以下、これらの図を参照して画像符号化処理の詳細を説明する。
【0044】
なお、明細書を通して、記号〈 〉はベクトル、記号‖ ‖はベクトルの大きさ、記号・はベクトルの内積、記号[演算]は演算結果の整数化を夫々表す。但し、記号[演算]を異なる意味で使用する場合はその旨を付記する。また図や[数]中のベクトルを太文字で表す。
【0045】
また、フローチャートにおいて、原画像のサイズを横n,縦m画素とする。また、記号Tm,n は画像Tのm行n列から4×4画素の正方形ブロックを取り出した部分画像データを表し、記号By,x,sy,sx はDC画像のy行,x列から横方向にsx,縦方向にsyのステップで4×4の合計16画素分のデータを取り出したブロックを表すものとする。
【0046】
図3は画像符号化処理のメイン処理を示している。ステップS1では原画像データを読み込む。図9(A)に原画像データTのイメージを示す。RGB系の対象画像をYUV系に変換して読み込む。Yは輝度データ、U,Vは色差データに相当し、U,Vは横2画素の輝度平均を用いてダウンサンプリングされる。一例の輝度データYは縦960×横1280画素から成り、U,Vは夫々縦960×横640画素からなる。Y,U,Vの各画素データには夫々例えば8ビットが割り付けられている。
【0047】
なお、以下は輝度データYの処理を中心に述べるが、U,Vについても同様に処理できる。
【0048】
図3に戻り、ステップS2ではDC画像作成処理を実行する。DC画像作成処理は原画像を4×4画素のブロック毎に分割し、各ブロックの平均値MよりなるDC画像を作成する処理である。図4にDC画像作成処理のフローチャートを示す。ステップS21では原画像のアドレスレジスタi,jを共に「0」に初期化する。ステップS22ではDC画像のアドレスレジスタI,Jにi/4.j/4をセットする。ステップS23では原画像から4×4画素のブロックデータTj,i を取り出す。ステップS24ではブロックデータTj,i に含まれる16画素データの平均値Mを求める。ステップS25では該平均値MをDC画像の記憶位置DCJ,I に格納する。ステップS26ではiに+4し、ステップS27ではi>nか否かを判別する。i>nでない場合はステップS22に戻り、今度は次列のブロックデータTj,i の平均値Mを求め、次列のDCJ,I に格納する。以下同様にして進み、やがてステップS27の判別でi>nになると、ステップS28ではiを「0」に初期化し、かつjに+4する。ステップS29ではj>mか否かを判別し、j>mでない場合はステップS22に戻り、今度は次行のブロックデータTj,i の平均値Mを求め、次行のDCJ,I に格納する。以下同様にして進み、やがてステップS29の判別でj>mになると、この処理を抜ける。
【0049】
図9(B)にDC画像データDCのイメージを示す。1例のDC画像は縦240×横320のDC値から成っている。
【0050】
図3に戻り、ステップS3ではDC画像を2次元DPCMにより符号化して出力する。図10(A)に2次元DPCMの処理イメージを示す。今、DC画像のJ行,I列のDC値をDCJ,I とする時に、該DCJ,I の予測値DC' J,I を例えばDC' J,I =(DCJ,I-1 +DCJ-1,I )/2により求め、その予測誤差ΔDCJ,I =DCJ,I −DC' J,I を量子化係数QS によりスカラー量子化{即ち、[ΔDCJ,I /QS ]}して出力する。但
し、この場合の記号[a]は実数aを四捨五入した結果を表す。なお、予測誤差ΔDCJ,I が「0」の場合のみランレングスを考慮して、予測誤差ΔDCJ,I 及びランレングスを夫々独立にハフマン符号化する。
【0051】
図8(A)に量子化係数QS のテーブルを示す。量子化係数QS の値は複数段階の許容誤差Zと対応付けられている。使用者は、高い画品質を要求する時は許容誤差Zを小の範囲で選び、また低い画品質でも良い時は許容誤差Zを大の範囲で選ぶ。これに応じて量子化係数QS は1〜8の範囲で変化する。
【0052】
図3に戻り、ステップS4では原画像のアドレスレジスタi,jを共に「0」に初期化する。ステップS5ではDC画像のアドレスレジスタI,Jにi/4,j/4をセットする。ステップS6では4×4の画素ブロックに対応する16次元の残差ベクトル〈d〉を、
〈d〉=Tj,i −DCJ,I
により求める。
【0053】
図10(B)に残差ベクトル〈d〉のイメージを示す。残差ベクトル〈d〉の各要素には夫々8ビットが割り付けられている。
【0054】
図3に戻り、ステップS7では残差ベクトル〈d〉の大きさ(2乗)が許容誤差Zより小さいか否かを判別する。小さい場合は、復号側でこの部分のブロック画像データTj,i を後述の非段階的交流成分予測法により高精度に復元できるので、フローはステップS18に進み、基底数「0」を符号F1 として出力する。また小さくない場合は、残差ベクトル〈d〉を近似するための基底ベクトルを探査すべく、ステップS8に進み、適応的直交化処理を実行する。
【0055】
図11に適応的直交化処理のイメージを示す。適応的直交化処理は、残差ベクトル〈d〉を許容近似誤差Z以内に近似するために必要な基底ベクトルの個数nkと、各基底ベクトル〈vnk〉とを求める処理である。本実施の形態では、原画像を縦横とも1:K(例えばK=4)で圧縮したDC画像の一部を切り出してネストとして用い、ネストの軽量化を図っている。
【0056】
図11(A)において、DC画像から例えば縦39×横71のDC値の領域を切り出してネストとする。また基底ベクトル〈vnk〉の探査は、縦横1DC値毎に頂点(x,y)∈[0,63]×[0,31]を設定し、かつそのサブサンプル間隔は(sx,sy)∈{(1,1),(1,2),(2,1),(2,2)}の計4種類とする。なお、これは一例であり、ネストのサイズ、切り出し位置、基底ベクトルのサブサンプル間隔等は任意に設定できる。
【0057】
図11(B)はネストから各種パターンでサンプリングされた各DC値が基底ベクトル〈vnk〉の4×4の記憶領域に集められる状態を示している。即ち、(sx,sy)=(1,1)の時はネスト上の4×4の領域から4×4のDC値が集められ、また(sx,sy)=(1,2)の時はネスト上のy方向に間延びした領域から4×4のDC値が集められ、また(sx,sy)=(2,1)の時はネスト上のx方向に間延びした領域から4×4のDC値が集められ、また(sx,sy)=(2,2)の時はネスト上のx及びy方向に間延びした領域から4×4のDC値が集められ、基底ベクトル〈vnk〉の記憶領域に格納される。これは原画像が有する自己相似性を利用して、ネスト上のDC画像から様々な角度で原画像の画素ブロックに似た画像を探査する処理である。
【0058】
図5,図6は実施の形態による適応的直交化処理のフローチャートである。 図5にお
いて、ステップS31では誤差レジスタErrに大きな値(例えば100000)をセットし、かつ基底数レジスタnkを「1」に初期化する。ステップS32ではネスト画像の開始アドレスレジスタx,yを共に「0」に初期化する。ステップS33ではネスト画像のサブサンプル間隔レジスタsx,syを共に「1」に初期化する。
【0059】
ステップS34ではネスト画像から4×4のDCブロック画像By,x,sy,sx を取り出して基底ベクトル〈vnk〉{後述の図11(C)における基底ベクトル〈unk〉に相当}を作成し、かつnk>1の場合はグラム・シュミットの直交化法により、それ以前の基底ベクトルと直交化する。
【0060】
グラム・シュミットの直交化法とは、n次元内積空間Vの一つの基底{v1 ,…,vn }よりVの正規直交基底{v'1,…,v' n }を構成する方法であり、以下、図11(C)を参照してグラム・シュミットの直交化法を概説する。 第1の基底ベクトル〈v1〉(但し、〈u1〉に相当)とすると、第1の正規化基底ベクトル〈v'1〉は単位ベクトルであるから、
【0061】
【数1】
Figure 0003814637
【0062】
とおける。次にネスト画像から第2の基底ベクトル〈u〉が抽出されたとすると、前記第1の正規化基底ベクトル〈v'1〉と直交するような第2の直交基底ベクトル〈v2 〉は仮に、
【0063】
【数2】
Figure 0003814637
【0064】
と置ける。すると、〈v2 〉・〈v'1〉=0より、
【0065】
【数3】
Figure 0003814637
【0066】
の関係が得られる。この時、スカラー係数kは、
【0067】
【数4】
Figure 0003814637
【0068】
となる。更に係数kを上式に代入すると、第2の直交基底ベクトル〈v2 〉は、
【0069】
【数5】
Figure 0003814637
【0070】
で表せる。そして、第2の正規化基底ベクトル〈v'2〉も単位ベクトルであるから、
【0071】
【数6】
Figure 0003814637
【0072】
となる。以下同様にして、一般に第nの正規化基底ベクトル〈v'n 〉は、
【0073】
【数7】
Figure 0003814637
【0074】
となる。
【0075】
ステップS35では正規化基底ベクトル〈v' nk〉を使用し、残差ベクトル〈d〉との距離が最小となる様な基底ベクトルの展開係数αnkを求める。
【0076】
図12(A)の(a)に正規化基底ベクトル〈v' nk〉を使用して残差ベクトル〈d〉を近似する処理のイメージを示す。図12(A)の(a)において、残差ベクトル〈d〉と展開係数αnkを掛けた基底ベクトルαnk〈v' nk〉との差ベクトル{〈d〉−αnk〈v' nk〉}の大きさが最小となるのは、基底ベクトルαnk〈v' nk〉と差ベクトル{〈d〉−αnk〈v' nk〉}とが直交する時(内積=0)であるから、下式に従い正規化基底ベクトル〈v' nk〉の展開係数αnkが求まる。
【0077】
【数8】
Figure 0003814637
【0078】
図12(A)の(b)については後述する。
【0079】
図5に戻り、ステップS36では残差ベクトル〈d〉を基底ベクトルαnk〈v' nk〉で近似した時の誤差ベクトルの大きさεr を求める。ステップS37ではεr <Errか否かを判別する。εr <Errの場合はステップS38でεr の最小値に係る各種情報を記憶するためのレジスタErr,X,Y,SX,SYにその時のεr ,x,y,sx,syを夫々保持する。また、レジスタαにはその時の展開係数αnk、基底ベクトルの記憶領域〈v〉にはその時の基底ベクトル〈vnk〉,直交化基底ベクトルの記憶領域〈v' 〉にはその時の直交化基底ベクトル〈v' nk〉を夫々記憶する。またεr <Errでない場合は上記ステップS38の処理をスキップする。
【0080】
ステップS39ではサンプル間隔sxに+1し、ステップS40ではsx>2か否かを判別する。sx>2でない場合はステップS34に戻り、今度は異なるサンプル間隔sxで抽出された基底ベクトル〈vnk〉につき上記同様の処理を行う。以下同様にして進み、やがて、ステップS40の判別でsx>2になると、ステップS41ではsxを「1」に初期化し、かつサンプル間隔syに+1する。ステップS42ではsy>2か否かを判別し、sy>2でない場合はステップS34に戻り、今度は異なるサンプル間隔syで抽出された基底ベクトル〈vnk〉につき上記同様の処理を行う。以下同様にして進み、やがて、ステップS41の判別でsy>2になると、まずネスト画像の開始位置(x,y)=(0,0)につき、異なるサンプル間隔(sx,sy)=(1,1),(1,2),(2,1),(2,2)を有する計4種類の各基底ベクトル〈vnk〉が試されたことになる。処理は図6のステップS43に進む。
【0081】
ステップS43ではネスト上の開始位置xに+1し、ステップS44ではx>p(例えばp=63)か否かを判別する。x>pでない場合はステップS33(2))に戻り、今度はx方向に1DC値分シフトさせた開始位置の各基底ベクトル〈vnk〉につき上記同様の処理を行う。以下同様にして進み、やがてステップS44の判別でx>pになると、ステップS45では開始位置xを「0」に初期化し、かつ開始位置yに+1する。ステップS46ではy>q(例えばq=31)か否かを判別する。y>qでない場合はステップS33(2))に戻り、今度はy方向に1DC値分シフトさせた開始位置の各基底ベクトル〈vnk〉につき上記同様の処理を行う。こうして、やがてステップS46の判別でy>qになると、ネスト画像上の全開始位置(x,y)∈[0,63]×[0,31]につき、全サンプル間隔(sx,sy)∈{(1,1),(1,2),(2,1),(2,2)}の各基底ベクトル〈vnk〉が試されたことになる。処理はステップS47に進む。
【0082】
ステップS47では残差ベクトル〈d〉からこの時点で最小の近似誤差εr をもたらした直交基底ベクトルα〈v' 〉を差し引いて、誤差の大きさを求め、該大きさが許容値Zより小さいか否かを判別する。小さくない場合は、ステップS48で残差ベクトル〈d〉を{〈d〉−α〈v' 〉}で置き換え、更新する。またこの時点で最小の近似誤差εr をもたらした展開係数α,基底ベクトル〈v〉,直交化基底ベクトル〈v' 〉の内容をαnk,〈vnk〉,〈v' nk〉として記憶エリアに退避・保持する。因みに、nk=1の時はα1 ,〈v1 〉,〈v' 1 〉が退避・保持される。またnkに+1して、ステップS32(1))に戻る。
【0083】
以下同様にして進み、やがてステップS47の判別で近似残差が許容値Zより小さくなると、ステップS49に進み、各直交化基底ベクトルαnk〈v' nk〉(但し、nk=1,2,…)の1次結合からなるベクトルを各基底ベクトルβnk〈vnk〉{図11(C)の各基底ベクトルに相当}の1次結合からなるベクトルに変換する。以下、係数βを基底ベクトル〈v〉の展開係数と呼ぶ。
【0084】
ここで、上記ステップS49の変換方法を具体的に説明する。今、k=1〜nkとする時に、基底ベクトル {但し、上記図11(C)の基底ベクトルに相当}からなる行列を、スカラー展開計数からなる行列をB、正規化直交基底ベクトル からなる行列を、スカラー係数からなる行列をAとする時に、夫々を、
【0085】
【数9】
Figure 0003814637
【0086】
と置くと、上記ステップS49の変換は、
【0087】
【数10】
Figure 0003814637
【0088】
と置くことにより得られる。これを行列Bについて解くためには、まず行列Vを正方行列に変換すべく、行列Vに行列(はVの転置行列)を左から掛け、
【0089】
【数11】
Figure 0003814637
【0090】
を得る。この行列(VV)は、
【0091】
【数12】
Figure 0003814637
【0092】
の様に展開され、ここで〈v〉・〈v〉は内積を表し、かつ〈v〉・〈v〉=〈v〉・〈v〉であるから、対角要素に対して対称な正方行列が得られ、かつ〈v〉とv〉とが異なるから、逆行列が存在する。そこで、更に左から行列(VV)の逆行列(VV)−1を掛け、
【0093】
【数13】
Figure 0003814637
【0094】
が得られる。
【0095】
このように、本実施の形態では、残差ベクトル〈d〉との誤差を許容値Z未満に近似するのに必要な最小限個数nkの直交化基底ベクトル〈v' nk〉を探索した後、それらを元の基底ベクトル〈vnk〉(=〈unk〉)の線形結合で表し、かつ各基底ベクトル〈vnk〉の展開係数βnkを求めて、これらを符号化する構成により、復号時にはグラム・シュミッ
トの直交化計算が不要となるように配慮している。また、ノルムを1に正規化することも省略している。
【0096】
図12(A)の(b)は基底数nk=3であった場合の残差ベクトル近似のイメージを示している。最初に残差ベクトル〈d〉との誤差εr を最小とするような第1の基底ベクトルα1 〈v'1〉が求まる。次に該ベクトル〈v'1〉に直交し、かつ更新された残りの残差ベクトル〈d' 〉との誤差εr を最小とするような第2の直交化基底ベクトルα2 〈v'2〉が求まる。次に該ベクトル〈v'2〉に直交し、かつ更新された残りの残差ベクトル〈d''〉との誤差εr を最小とするような第3の直交化基底ベクトルα3 〈v'3〉が求まる。
【0097】
図3に戻り、ステップS9では使用した基底数nk>7か否かを判別する 。nk>7(8以上)の場合は、基底ベクトルを使用しても画像圧縮のメリットが出ないので、ステップS19に進み、基底数「8」を符号F1 、使用基底数「0」を符号F2 、また残差ベクトル〈d〉そのものを符号F3 として夫々出力する。またnk≦7の場合は、ステップS10に進み、上記基底ベクトルの使用に併せて以下のスカラー量子化処理を実行する。
【0098】
スカラー量子化処理では、まず選択されたnk個の内の選択された順に各m個(0≦m≦nk)の基底を採用した場合の誤差ベクトル〈dm 〉を、
【0099】
【数14】
Figure 0003814637
【0100】
により求める。なお、m=0の場合の、
【0101】
【数15】
Figure 0003814637
【0102】
はゼロベクトルを表す。更に、この誤差ベクトル〈dm 〉を採用されなかった余基底数yk=nk−mに相当する符号量でスカラー量子化する。即ち、誤差ベクトル〈dm 〉を余基底数ykに対応する量子化係数Qykでスカラー量子化し、その値を[−2yk-1,2yk-1−1]の値域でクリッピングする。
【0103】
ところで、こうしてスカラー量子化・クリッピングされた誤差ベクトル〈d' m 〉がその復号後に元の誤差ベクトル〈dm 〉と同一になるとは限らない。そこで、予め各m(m=1,2,…,nk)につき、各量子化誤差ベクトル〈d' m 〉を各対応する量子化係数Qykで逆量子化して各逆量子化残差ベクトル〈d''m 〉を求め、誤差‖〈dm 〉−〈d''m 〉‖が最小となるようなmを探査し、最終的にはこのm個の基底を採用した場合の符号を生成することとする。
【0104】
図8(B)にスカラー量子化テーブルを示す。nk=8の場合には、基底を1つ使用した時(m=1)の余基底数yk=7であり、以下同様にして進み、基底を7つ使用した時(m=7)の余基底数yk=1である。
【0105】
なお、後述するが、本実施の形態では1つの基底につきその符号に2バイトを使用するので、もし8つの基底を使用するとトータルの符号長は16バイトになる。しかるに、16バイトの容量があれば、16次元の残差ベクトル〈d〉をそのまま符号化できるから、適応的直交変換を行うメリットが無い。そこで、基底を0〜7個の範囲で使用し、これに応じて余基底数ykは7〜1となる。
【0106】
各量子化係数Qykは余基底数ykに対応して予め定められている。好ましくは、各量子化係数Qykは誤差ベクトル〈dm 〉を余基底数yk分の符号量に収められる様に選ばれている。
【0107】
今、余基底数yk=1の場合は、16×1ビットを誤差ベクトル〈dm 〉のスカラー量子化に使用できる。これは誤差ベクトル〈dm 〉の各要素当たり1ビットの符号量である。即ち、この場合は誤差ベクトル〈dm 〉をQyk=8でスカラー量子化し、その値を[−21-1 ,21-1 −1]=[−1,0]にクリッピングする。ここで、例えば符号のビット「0」は大きさ「−1」、ビット「1」は大きさ「0」に対応する。以下同様にして進み、今、余基底数yk=7の場合は、16×7ビットを誤差ベクトル〈dm 〉のスカラー量子化に使用できる。これは誤差ベクトル〈dm 〉の各要素当たり7ビットの符号量であり、この場合は誤差ベクトル〈dm 〉をQyk=2でスカラー量子化し、その値を[−27-1 ,27-1 −1]=[−64,63]にクリッピングする。こうして、m個の基底とスカラー量子化された誤差とを併用することで、符号量を変えずに画品質のみを向上させることができる。また余基底数yk分の展開係数βは不要となるため、若干の符号量が減少する。
【0108】
図7はスカラー量子化処理のフローチャートである。ステップS61では使用基底数カウント用のレジスタmを「0」に初期化する。ステップS62ではm個の基底を採用した後の誤差ベクトル〈dm 〉を求める。なお、m=0の場合のΣの項はゼロベクトルを表す。即ち、誤差ベクトル〈d0 〉=〈d〉(残差ベクトル)となる。ステップS63ではnk(1≦nk≦7)個の内の今回の試行では使用されない余基底数ykを、yk=nk−mにより求める。ステップS64では誤差ベクトル〈dm 〉をQykでスカラー量子化し、結果の誤差ベクトル〈d' m 〉の各要素を[−2yk-1,2yk-1−1]の範囲にクリッピングする。
【0109】
ステップS65では上記量子化(かつクリッピング)後の誤差ベクトル〈d' m 〉を同Qykによりスカラー逆量子化する。ステップS66では元の誤差ベクトル〈dm 〉と前記逆量子化した誤差ベクトル〈d''m 〉とを比較した場合の誤差εrm を求め、これを所定エリアに退避・保持する。ステップS67ではレジスタmに+1する。ステップS68ではm>nk(1≦nk≦7)か否かを判別する。m>nkでない場合はステップS62に戻り、上記同様の処理を行う。
【0110】
やがて、上記ステップS68の判別でm>nkになると、各m(m=0,1,2,3,…,nk)個の基底を採用した場合の誤差εr0 〜εrnkが求まる。ステップS69では誤差εr0 〜εrnkの中から最小の誤差εrmkを抽出する。ステップS70では基底数nkを符号F1として出力する。ステップS71では使用基底数(実効基底数)mkを符号F2として出力する。ステップS72では各使用基底のネスト上の開始位置(x,y)、サブサンプル間隔(sx,sy)及び各使用基底の展開係数βをQ(例えば8)で量子化した乗余を各基底毎に16ビットにつめて符号F4 として出力する。
【0111】
符号F4 の内訳は、ネスト上の開始位置(x,y)に横6ビットと縦5ビットの計11ビット、4種類の内のいずれかのサブサンプル間隔に2ビット、展開係数βの剰余に3ビットの計16ビットとなる。従って、符号F4 は使用基底毎に2バイトを消費する。
【0112】
ステップS73では上記基底の展開係数βをQ(例えば8)で量子化した商を符号F5 として出力する。ステップS74では上記最小の逆量子化誤差εrmkとなる時の誤差ベクトル〈d' mk〉を余基底数yk相当の16×(nk−mk)ビットの領域に割り振り、符号F3 として出力する。そして、この処理を抜ける。
【0113】
図3に戻り、かくして、この時点で原画像の1残差ベクトル〈d〉の符号化が終了した。更に、ステップS11ではアドレスレジスタiに+4し、ステップS12ではi>nか否かを判別する。i>nでない場合はステップS5に戻り、次のi軸方向に4ビットずれた位置からの1残差ベクトル〈d〉につき上記同様の処理を行い、符号化する。以下同様にして進み、やがて上記ステップS12の判別でi>nになると、ステップS13ではiを「0」に初期化し、かつjに+4する。ステップS14ではj>mか否かを判別し、j>mでない場合はステップS5に戻り、次のj軸方向に4ビットずれた各残差ベクトル〈d〉につき上記同様の処理を行い、符号化する。以下同様にして進み、やがて上記ステップS14の判別でj>mになると、全画像の残差ベクトル〈d〉につき上記符号化処理が終了した。
【0114】
なお、図12(B)に画像圧縮符号の表を示す。以下の説明ではこの表も参照されたい。
【0115】
図3に戻り、ステップS15では可変長符号F1 ,F2 ,F5 をハフマン符号化して出力する。但し、符号F1 の基底数「nk」については、nk=0の場合のみランレングスを考慮して、ハフマン符号化を行う。符号F2 の使用基底数「mk」についても同様に考えられる。符号F5 については、展開係数βを定数Q(例えば8)で量子化した商をハフマン符号化する。なお、余基底数yk≠0の場合は、画素ブロックの切り替わりを示すための符号EOBを書き込む。
【0116】
ステップS16では可変長符号F6 をハフマン符号化して出力する。符号F6 はDC値の2次元DPCMによる予測残差△DCJ,I を量子化係数Qs で量子化したものである。但し、予測残差△DCJ,I =0の場合のみランレングスを考慮して、予測残差△DCJ,I 及びランレングスを夫々独立にハフマン符号化する。
【0117】
ステップS17では可変長符号F3 ,固定長符号F4 をハフマン符号化して出力する。符号F3 は、使用基底数mk>0の場合の最終的な誤差ベクトル〈d' mk〉をQykでスカラー量子化[〈d' mk〉/Qyk]したものであり、使用基底数mk=0の場合は元の残差ベクトル〈d〉そのものが符号となる。符号F4 は、1基底当たり、ネストの開始座標(x,y)の11ビットと、サブサンプル係数(sx,sy)の2ビットと、展開係数βの剰余(β/Q)の3ビットとの計16ビット固定から成り、これらは使用基底の出現順に詰めて構成される。
【0118】
また上記符号の全体としては画素ブロック単位で出現順に詰めて符号列を構成する。実際上、大半のブロックでは基底数nkが2個前後となり、少数の可変長符号にするのは基底の展開係数βをQで量子化した商と、DC画像のDPCM符号及び基底数「nk」,使用基底数「mk」のみとなる。
【0119】
図13は実施の形態による画像復号化処理のフローチャートである。ステップS81では画像符号データを読み込む。ステップS82ではY,U,Vの各DC値を解凍(復号)する。因みに、復号結果のDC値DC''J,I は、DC''J,I =DC' J,I +[ΔDCJ,I /Qs ]Qs により得られる。ここで、DC' J,I は復号側におけるDCの予測値であり、DC' J,I =(DC''J,I-1 +DC''J-1,I )/2で与えられる。ステップS83では
Y成分のDC値からネストを生成する。ネストはDC画像上の開始位置及びサイズの情報を別途受け取ることで生成できる。ステップS84では復号(再生)画像のアドレスレジスタi,jを共に「0」に初期化する。
【0120】
ステップS85ではブロック画像(即ち、残差ベクトル)に関する符号データを入力する。ステップS86では基底数nk>0か否かを判別する。nk=0の場合はステップS97で後述する非段階的交流成分予測法により16画素分の輝度データを求める。またnk>0の場合は更にステップS87で使用基底数mk>0か否かを判別する。
【0121】
mk=0の場合は、ステップS96で残差ベクトル〈d〉を逆量子化する。ステップS90では求めた残差ベクトル〈d〉に復号DC値を加算する。
【0122】
またmk>0の場合は、ステップS88で余基底数yk(=nk−mk)を求め、誤差ベクトル〈d' mk〉をQykで逆量子化する。ステップS89では各基底の開始位置(x,y),サブサンプル間隔(sx,sy)に従いネストからmk個の基底ベクトルを作成し、展開係数βとの積をとり、これらの1次結合から成る近似ベクトル(直交基底系)を形成し、これに誤差ベクトル〈d' mk〉を合成して、元の残差ベクトル〈d〉を再生する。ステップS90では求めた残差ベクトル〈d〉に復号DC値を加算する。こうして、上記何れかの方法により4×4のブロック画像Tj,i が再生された。ステップS91では再生画像Tj,i を画像メモリに格納する。
【0123】
ステップS92ではアドレスレジスタiに+4し、ステップS93ではi>nか否かを判別する。i>nでない場合はステップS85に戻り、今度は次列のブロック画像データTj,i を復号し、画像メモリに格納する。以下同様にして進み、やがてステップS93の判別でi>nになると、ステップS94ではiを「0」に初期化し、かつjに+4する。ステップS95ではj>mか否かを判別し、j>mでない場合はステップS85に戻り、今度は次行の各ブロックデータTj,i を復号し、画像メモリに格納する。以下同様にして進み、やがてステップS95の判別でj>mになると、画像復号化処理を終了する。
【0124】
なお、図示しないが、YUV系からRGB系に変換する。この時、U,Vのアップサンプリングには、補間フィルタを利用せず、横2画素に同一の値を代入する。
【0125】
図14は実施の形態による非段階的交流成分予測処理のイメージ図である。本実施の形態では近傍のDC画像から非段階的交流成分予測法により一挙に原画素ブロックの近似画像(AC画像)を生成する。
【0126】
ところで、上記従来の段階的交流成分予測方によれば、注目ブロックを含む周囲4ブロックの各DC値(S,U,R,B,L)から注目ブロックS上のサブブロックS1 〜S4 の各DC値は次式、
1 =S+(U+L−B−R)/8
2 =S+(U+R−B−L)/8
3 =S+(B+L−U−R)/8
4 =S+(B+R−U−L)/8
により推定された。
【0127】
図14(A)に上記図17(B)と同様の図を再度示す。同様にして、この1段階目ではU1 〜U4 ,L1 〜L4 ,R1 〜R4 ,B1 〜B4 等が推定される 。また、上記方法を再帰的に使用することで、S1 上の4画素P1 〜P4 は次式、
1 =S1 +(U3 +L2 −S3 −S2 )/8
2 =S1 +(U3 +S2 −S3 −L2 )/8
3 =S1 +(S3 +L2 −U3 −S2 )/8
4 =S1 +(S3 +S2 −U3 −L2 )/8
2 上の4画素P1 〜P4 は次式、
1 =S2 +(U4 +S1 −S4 −R1 )/8
2 =S2 +(U4 +R1 −S4 −S1 )/8
3 =S2 +(S4 +S1 −U4 −R1 )/8
4 =S2 +(S4 +R1 −U4 −S1 )/8
3 上の4画素P1 〜P4 は次式、
1 =S3 +(S1 +L4 −B1 −S4 )/8
2 =S3 +(S1 +S4 −B1 −L4 )/8
3 =S3 +(B1 +L4 −S1 −S4 )/8
4 =S3 +(B1 +S4 −S1 −L4 )/8
4 上の4画素P1 〜P4 は次式、
1 =S4 +(S2 +S3 −B2 −R3 )/8
2 =S4 +(S2 +R3 −B2 −S3 )/8
3 =S4 +(B2 +S3 −S2 −R3 )/8
4 =S4 +(B2 +R3 −S2 −S3 )/8
により夫々推定される。
【0128】
図14(B)は本実施の形態による非段階的交流成分予測法を示している。なお、以下の説明では図14(A)も参照する。まずS1 上の4画素P1 〜P4 を求める場合は、S2 ≒S3 ≒S,U3 ≒U,L2 ≒Lの各近似を行う。この近似を上記S1 上のP1 の式に適用すると、
1 =S1 +(U3 +L2 −S3 −S2 )/8
=S1 +(U+L−S−S)/8
が得られる。更に、この式に上記S1 の式、S1 =S+(U+L−B−R)/8を代入すると、S1 上のP1 は最終的に、
1 =S+(2U+2L−2S−B−R)/8
で表せる。また上記S1 上のP2 については、
2 =S1 +(U3 +S2 −S3 −L2 )/8
=S1 +(U+S−S−L)/8
が得られる。更に、この式に上記S1 の式、S1 =S+(U+L−B−R)/8を代入すると、S1 上のP2 は最終的に、
2 =S+(2U−B−R)/8
で表せる。また上記S1 上のP3 については、
3 =S1 +(S3 +L2 −U3 −S2 )/8
=S1 +(S+L−U−S)/8
が得られる。更に、この式に上記S1 の式、S1 =S+(U+L−B−R)/8を代入すると、S1 上のP3 は最終的に、
3 =S+(2L−B−R)/8
で表せる。また上記S1 上のP4 については、
4 =S1 +(S3 +S2 −U3 −L2 )/8
=S1 +(S+S−U−L)/8
が得られる。更に、この式に上記S1 の式、S1 =S+(U+L−B−R)/8を代入すると、S1 上のP4 は最終的に、
4 =S+(2S−B−R)/8
で表せる。従って、S1 上のP1 〜P4 は最終的に、
1 =S+(2U+2L−2S−B−R)/8
2 =S+(2U−B−R)/8
3 =S+(2L−B−R)/8
4 =S+(2S−B−R)/8
で表せる。
【0129】
次にS2 上の4画素P1 〜P4 を求める場合は、S1 ≒S4 ≒S,R1 ≒R,U4 ≒U,の近似を行う。この近似を上記S2 上のP1 の式に適用すると、
1 =S2 +(U4 +S1 −S4 −R1 )/8
=S2 +(U+S−S−R)/8
が得られる。更に、この式に上記S2 の式、S2 =S+(U+R−B−L)/8を代入すると、S2 上のP1 は最終的に、
1 =S+(2U−B−L)/8
で表せる。また上記S2 上のP2 については、
2 =S2 +(U4 +R1 −S4 −S1 )/8
=S2 +(U+R−S−S)/8
が得られる。更に、この式に上記S2 の式、S2 =S+(U+R−B−L)/8を代入すると、S2 上のP2 は最終的に、
2 =S+(2U+2R−2S−B−L)/8
で表せる。また上記S2 上のP3 については、
3 =S2 +(S4 +S1 −U4 −R1 )/8
=S2 +(S+S−U−R)/8
が得られる。更に、この式に上記S2 の式、S2 =S+(U+R−B−L)/8を代入すると、S2 上のP3 は最終的に、
3 =S+(2S−B−L)/8
で表せる。また上記S2 上のP4 については、
4 =S2 +(S4 +R1 −U4 −S1 )/8
=S2 +(S+R−U−S)/8
が得られる。更に、この式に上記S2 の式、S2 =S+(U+R−B−L)/8を代入すると、S2 上のP4 は最終的に、
4 =S+(2R−B−L)/8
で表せる。従って、S2 上のP1 〜P4 は最終的に、
1 =S+(2U−B−L)/8
2 =S+(2U+2R−2S−B−L)/8
3 =S+(2S−B−L)/8
4 =S+(2R−B−L)/8
で表せる。
【0130】
次にS3 上の4画素P1 〜P4 を求める場合は、S1 ≒S4 ≒S,L4 ≒L,B1 ≒Bの各近似を行う。この近似を上記S3 上のP1 の式に適用すると、
1 =S3 +(S1 +L4 −B1 −S4 )/8
=S3 +(S+L−B−S)/8
が得られる。更に、この式に上記S3 の式、S3 =S+(B+L−U−R)/8を代入すると、S3 上のP1 は最終的に、
1 =S+(2L−U−R)/8
で表せる。また上記S3 上のP2 については、
2 =S3 +(S1 +S4 −B1 −L4 )/8
=S3 +(S+S−B−L)/8
が得られる。更に、この式に上記S3 の式、S3 =S+(B+L−U−R)/8を代入すると、S3 上のP2 は最終的に、
2 =S+(2S−U−R)/8
で表せる。また上記S3 上のP3 については、
3 =S3 +(B1 +L4 −S1 −S4 )/8
=S3 +(B+L−S−S)/8
が得られる。更に、この式に上記S3 の式、S3 =S+(B+L−U−R)/8を代入すると、S3 上のP3 は最終的に、
3 =S+(2B+2L−2S−U−R)/8
で表せる。また上記S3 上のP4 については、
4 =S3 +(B1 +S4 −S1 −L4 )/8
=S3 +(B+S−S−L)/8
が得られる。更に、この式に上記S3 の式、S3 =S+(B+L−U−R)/8を代入すると、S3 上のP4 は最終的に、
4 =S+(2B−U−R)/8
で表せる。従って、S3 上のP1 〜P4 は最終的に、
1 =S+(2L−U−R)/8
2 =S+(2S−U−R)/8
3 =S+(2B+2L−2S−U−R)/8
4 =S+(2B−U−R)/8
で表せる。
【0131】
次にS4 上の4画素P1 〜P4 を求める場合は、S2 ≒S3 ≒S,R3 ≒R,B2 ≒Bの各近似を行う。この近似を上記S4 上のP1 の式に適用すると、
1 =S4 +(S2 +S3 −B2 −R3 )/8
=S4 +(S+S−B−R)/8
が得られる。更に、この式に上記S4 の式、S4 =S+(B+R−U−L)/8を代入すると、S4 上のP1 は最終的に、
1 =S+(2S−U−L)/8
で表せる。また上記S4 上のP2 については、
2 =S4 +(S2 +R3 −B2 −S3 )/8
=S4 +(S+R−B−S)/8
が得られる。更に、この式に上記S4 の式、S4 =S+(B+R−U−L)/8を代入すると、S4 上のP2 は最終的に、
2 =S+(2R−U−L)/8
で表せる。また上記S4 上のP3 については、
3 =S4 +(B2 +S3 −S2 −R3 )/8
=S4 +(B+S−S−R)/8
が得られる。更に、この式に上記S4 の式、S4 =S+(B+R−U−L)/8を代入すると、S4 上のP3 は最終的に、
3 =S+(2B−U−L)/8
で表せる。また上記S4 上のP4 については、
4 =S4 +(B2 +R3 −S2 −S3 )/8
=S4 +(B+R−S−S)/8
が得られる。更に、この式に上記S4 の式、S4 =S+(B+R−U−L)/8を代入すると、S4 上のP4 は最終的に、
4 =S+(2B+2R−2S−U−L)/8
で表せる。従って、S4 上のP1 〜P4 は最終的に、
1 =S+(2S−U−L)/8
2 =S+(2R−U−L)/8
3 =S+(2B−U−L)/8
4 =S+(2B+2R−2S−U−L)/8
で表せる。かくして、本実施の形態によれば、自己を含む近傍の各DC値(S,U,R,B,L)から4×4画素の近似画像が直接(非段階的)に求められる。
【0132】
図15は実施の形態による符号化効率のグラフ図である。サンプル画像(320×240画素,1画素のRGB各成分8ビット精度)を用い、BPP(Bit Per Pixel )、
BPR=[圧縮後の総データ量(bit) ]/[原画像の画素数]
に対するPSNR(Peak-to-peak Signal-to-Noise Ratio)、
PSNR[dB]=20log10(255/√ε2
により符号化性能を評価した。但し、ε2 は画素当たりの平均二乗誤差を表す。
【0133】
図15(A)はアニメ−ション画像を使用した場合で、実線は本実施の形態、点線はJPEGの場合を夫々示しており、図示の如くJPEGの効率を大きく上回る符号化性能が得られている。図15(B)はCG画像を使用した場合で、上記同様の傾向が得られた。しかも、本方式では直交変換符号法に特有のモスキ−トノイズやブロックノイズが見られず、本方式が人工画像に対し有効であると考えられる。なお、図示しないが、自然画像に対してはJPEGと略同一の性能が得られた。
【0134】
なお、上記実施の形態ではゲームシステムへの適用例を述べたが、本発明は写真画像、アニメーション画像等の通常のフレーム画像の符号/復号にも適用できることは明らかである。
【0135】
また、上記本発明に好適なる実施の形態を述べたが、本発明思想を逸脱しない範囲内で、各部の構成、処理、及びこれらの組合せの様々な変更が行えることは言うまでも無い。
【0136】
【発明の効果】
以上述べた如く本発明によれば、ネストを軽量化し、かつ可変長符号量を削減出来るために、復号時の計算負荷を大幅に軽減でき、比較的低性能のシステムでも動画や静止画の画像データを画品質を落とさずに利用可能となる 。また輪郭部分でもモスキートノイズが発生せず、文字やアニメーション画像等の再現性も良い高圧縮率の画像データを提供できる。
【図面の簡単な説明】
【図1】 本発明の原理を説明する図である。
【図2】 実施の形態による画像符号/復号方式の構成を示す図である。
【図3】 実施の形態による画像符号化処理のフローチャート(1)である。
【図4】 実施の形態による画像符号化処理のフローチャート(2)である。
【図5】 実施の形態による画像符号化処理のフローチャート(3)である。
【図6】 実施の形態による画像符号化処理のフローチャート(4)である。
【図7】 実施の形態による画像符号化処理のフローチャート(5)である。
【図8】 実施の形態による画像符号化処理のテーブルを説明する図である。
【図9】 実施の形態による画像符号化処理のイメージ図(1)である。
【図10】 実施の形態による画像符号化処理のイメージ図(2)である。
【図11】 実施の形態による画像符号化処理のイメージ図(3)である。
【図12】 実施の形態による画像符号化処理のイメージ図(4)である。
【図13】 実施の形態による画像復号化処理のフローチャートである。
【図14】 実施の形態による非段階的交流成分予測処理のイメージ図である。
【図15】 実施の形態による符号化効率のグラフ図である。
【図16】 従来技術を説明する図(1)である。
【図17】 従来技術を説明する図(2)である。
【符号の説明】
【0138】
13 バス
15 ブリッジ
16 摸作パッド
17 周辺インタフェース(PIF)
18 ROMカートリッジ(ROM−C)
19 ROMカートリッジインタフェース(ROM−CIF)
20 コンパクトディスクROM(CD−ROM)
21 CD−ROMドライバ
22 通信制御部(COM)
23 通信線
45 カラーCRTモニタ
46 CRT制御部(CRTC)
50 ゲーム作成装置

Claims (6)

  1. 画像データを複数画素ブロックに分割して各ブロック平均値からなるDC画像を生成するステップと、
    前記各画素ブロックからそれぞれのブロック平均値を分離してブロック毎の残差ベクトルを求めると共に、残差ベクトルの大きさが所定の許容値を超えていことにより、前記DC画像の一部を基底ベクトルの巣として使用した適応的直交変換により、前記残差ベクトルを近似するための1又は2以上の正規化直交基底ベクトルと展開係数との積からなる直交基底を求めるステップと、
    前記求めた直交基底系をこれと等価なスカラー展開係数と基底ベクトルとの積からなる基底系に変換するステップと、
    前記画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに前記基底ベクトルの巣より基底ベクトルを抽出するための座標情報をそれぞれ符号化して符号データを作成するステップとを備えることを特徴とする画像符号方法。
  2. 請求項1記載の符号データを入力して画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに基底ベクトルの巣より基底ベクトルを抽出するための座標情報を復号するステップと、
    前記復号したブロック平均値によりDC画像を再生し、その一部を基底ベクトルの巣となすステップと、
    前記復号した画素ブロック毎の座標情報により前記基底ベクトルの巣から抽出した基底ベクトルに前記復号したスカラー展開係数を掛けて残差ベクトルを近似した近似ベクトルを再生するステップと、
    該再生した近似ベクトルに前記復号したブロック平均値を加算して各画素ブロックを復号するステップとを備えることを特徴とする画像復号方法。
  3. 画像データを複数の画素ブロックに分割して各ブロック平均値からなるDC画像を生成するステップと、
    前記各画素ブロックからそれぞれのブロック平均値を分離してブロック毎の残差ベクトルを求めると共に、該残差ベクトルの大きさが所定の許容値を超えていることにより、前記DC画像の一部を基底ベクトルの巣として使用した適応的直交変換により、前記残差ベクトルを近似するための1又は2以上の正規化直交基底ベクトルと展開係数との積からなる直交基底系を求めるステップと、
    前記求めた直交基底系をこれと等価なスカラー展開係数と基底ベクトルとの積からなる基底系に変換するステップと、
    前記画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに前記基底ベクトルの巣より基底ベクトルを抽出するための座標情報をそれぞれ符号化して符号データを作成するステップとをコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。
  4. 請求項1記載の符号データを入力して画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに基底ベクトルの巣より基底ベクトルを抽出するための座標情報を復号するステップと、
    前記復号したブロック平均値によりDC画像を再生し、その一部を基底ベクトルの巣となすステップと、
    前記復号した画素ブロック毎の座標情報により前記基底ベクトルの巣から抽出した基底ベクトルに前記復号したスカラー展開係数を掛けて残差ベクトルを近似した近似ベクトルを再生するステップと、
    該再生した近似ベクトルに前記復号したブロック平均値を加算して各画素ブロックを復号するステップとをコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。
  5. 画像データを複数の画素ブロックに分割して各ブロック平均値からなるDC画像を生成するDC画像生成手段と、
    前記各画素ブロックからそれぞれのブロック平均値を分離してブロック毎の残差ベクトルを求めると共に、該残差ベクトルの大きさが所定の許容値を超えていることにより、前記DC画像の一部を基底ベクトルの巣として使用した適応的直交変換により、前記残差ベクトルを近似するための1又は2以上の正規化直交基底ベクトルと展開係数との積からなる直交基底系を求める演算手段と、
    前記求めた直交基底系をこれと等価なスカラー展開係数と基底ベクトルとの積からなる基底系に変換する変換手段と、
    前記画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに前記基底ベクトルの巣より基底ベクトルを抽出するための座標情報をそれぞれ符号化して符号データを作成する符号化手段とを備えることを特徴とする画像符号装置
  6. 請求項1記載の符号データを入力して画素ブロック毎のブロック平均値及びその残差ベクトルを近似した基底系のスカラー展開係数並びに基底ベクトルの巣より基底ベクトルを抽出するための座標情報を復号する復号手段と、
    前記復号したブロック平均値によりDC画像を再生し、その一部を基底ベクトルの巣となすネスト生成手段と、
    前記復号した画素ブロック毎の座標情報により前記基底ベクトルの巣から抽出した基底ベクトルに前記復号したスカラー展開係数を掛けて残差ベクトルを近似した近似ベクトルを再生する近似ベクトル再生手段と、
    該再生した近似ベクトルに前記復号したブロック平均値を加算して各画素ブロックを復号する画像復号手段とを備えることを特徴とする画像復号装置。
JP2000558674A 1998-07-03 1999-06-03 画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置 Expired - Lifetime JP3814637B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP18923998 1998-07-03
PCT/JP1999/002962 WO2000002393A1 (en) 1998-07-03 1999-06-03 Image coding/decoding method and recorded medium on which program is recorded

Publications (1)

Publication Number Publication Date
JP3814637B2 true JP3814637B2 (ja) 2006-08-30

Family

ID=16237951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000558674A Expired - Lifetime JP3814637B2 (ja) 1998-07-03 1999-06-03 画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置

Country Status (9)

Country Link
US (1) US6687411B1 (ja)
EP (1) EP1104199A4 (ja)
JP (1) JP3814637B2 (ja)
KR (1) KR100574702B1 (ja)
CN (1) CN1168322C (ja)
CA (1) CA2347383A1 (ja)
HK (1) HK1036377A1 (ja)
TW (1) TW440805B (ja)
WO (1) WO2000002393A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3496559B2 (ja) * 1999-01-06 2004-02-16 日本電気株式会社 画像特徴量生成装置、並びに画像特徴量生成方法
JP3932244B2 (ja) 2000-05-15 2007-06-20 株式会社ハドソン 画像符号/復号方法及びその装置並びにそのプログラムを記録した記録媒体
JP4649760B2 (ja) * 2000-05-31 2011-03-16 ソニー株式会社 コンテンツ・コピー管理システム及び方法、情報処理装置及び方法、並びに、記憶媒体
JP3887178B2 (ja) 2001-04-09 2007-02-28 株式会社エヌ・ティ・ティ・ドコモ 信号符号化方法及び装置並びに復号方法及び装置
JP4570065B2 (ja) * 2001-04-13 2010-10-27 Kddi株式会社 適応直交変換符号化装置
US6944333B2 (en) * 2003-04-30 2005-09-13 Ventana Medical Systems, Inc. Color image compression via spectral decorrelation and elimination of spatial redundancy
US7640370B1 (en) * 2003-11-25 2009-12-29 Marvell International Ltd. Method and apparatus for controlling data transfer between EEPROM and a physical layer device
SE0401850D0 (sv) 2003-12-19 2004-07-08 Ericsson Telefon Ab L M Image processing
SE526226C2 (sv) * 2003-12-19 2005-08-02 Ericsson Telefon Ab L M Bildbehandling
JP4684147B2 (ja) * 2006-03-28 2011-05-18 任天堂株式会社 傾き算出装置、傾き算出プログラム、ゲーム装置およびゲームプログラム
US7787691B2 (en) * 2006-04-11 2010-08-31 Telefonaktiebolaget Lm Ericsson (Publ) High quality image processing
CA2683841A1 (en) * 2007-04-04 2008-10-16 Telefonaktiebolaget Lm Ericsson (Publ) Vector-based image processing
JP5686499B2 (ja) * 2009-01-22 2015-03-18 株式会社Nttドコモ 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
US8787698B2 (en) 2009-09-04 2014-07-22 Adobe Systems Incorporated Methods and apparatus for directional texture generation using image warping
US8619098B2 (en) 2009-09-18 2013-12-31 Adobe Systems Incorporated Methods and apparatuses for generating co-salient thumbnails for digital images
US8599219B2 (en) 2009-09-18 2013-12-03 Adobe Systems Incorporated Methods and apparatuses for generating thumbnail summaries for image collections
WO2011099789A2 (ko) * 2010-02-10 2011-08-18 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US8861868B2 (en) 2011-08-29 2014-10-14 Adobe-Systems Incorporated Patch-based synthesis techniques
US9002126B2 (en) 2012-05-04 2015-04-07 Environmental Systems Research Institute (ESRI) Limited error raster compression
US9819964B2 (en) 2012-05-04 2017-11-14 Environmental Systems Research Institute, Inc. Limited error raster compression
CN103581677B (zh) * 2012-07-20 2017-02-15 中国科学院深圳先进技术研究院 图像加密压缩和解压解密方法及装置
US9256709B2 (en) * 2014-02-13 2016-02-09 Taiwan Semiconductor Manufacturing Company, Ltd. Method for integrated circuit mask patterning

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0738760A (ja) * 1993-06-28 1995-02-07 Nec Corp 直交変換基底生成方式
US6456655B1 (en) * 1994-09-30 2002-09-24 Canon Kabushiki Kaisha Image encoding using activity discrimination and color detection to control quantizing characteristics
US5937098A (en) * 1995-02-06 1999-08-10 Asahi Kogaku Kogyo Kabushiki Kaisha Adaptive quantization of orthogonal transform coefficients for setting a target amount of compression
KR0174453B1 (ko) * 1995-02-28 1999-03-20 배순훈 디지털 영상 복호화 방법
KR0174452B1 (ko) * 1995-02-28 1999-03-20 배순훈 디지털 영상 복호화장치
US6115070A (en) * 1997-06-12 2000-09-05 International Business Machines Corporation System and method for DCT domain inverse motion compensation using shared information
JPH11196262A (ja) * 1997-11-07 1999-07-21 Matsushita Electric Ind Co Ltd デジタル情報埋込み・抽出装置および方法並びに当該方法を実行するためのプログラムを記録した媒体

Also Published As

Publication number Publication date
CN1168322C (zh) 2004-09-22
CN1307782A (zh) 2001-08-08
EP1104199A1 (en) 2001-05-30
KR20010053286A (ko) 2001-06-25
EP1104199A4 (en) 2008-04-02
HK1036377A1 (en) 2001-12-28
TW440805B (en) 2001-06-16
US6687411B1 (en) 2004-02-03
WO2000002393A1 (en) 2000-01-13
KR100574702B1 (ko) 2006-04-27
CA2347383A1 (en) 2000-01-13

Similar Documents

Publication Publication Date Title
JP3814637B2 (ja) 画像符号/復号方法及びそのプログラムを記録した記録媒体並びに装置
EP1762101B1 (en) Methods and apparatus for image encoding/decoding, and extended image compression/expansion
US5903669A (en) Image processing apparatus and method
KR100609614B1 (ko) 화상데이터전송및화상처리를위한방법및장치
US6968092B1 (en) System and method for reduced codebook vector quantization
KR987001186A (ko) 영역기준 텍스쳐 코딩 방법과 디코딩 방법, 및 그 대응 시스템(Region-based Texture Coding and Decoding Method, and Corresponding Systems)
JP2006502604A (ja) 任意形状オブジェクトの画像圧縮方法
JP2014087058A (ja) エンコーダ,デコーダおよびその方法
JP7497486B2 (ja) 画像復号装置、画像復号方法、及びプログラム
KR20210125095A (ko) 화상 부호화 장치, 화상 부호화 방법 및 저장 매체
JP3592168B2 (ja) 画像データの符号化復号化方法及び装置
JPH07177502A (ja) 画像情報圧縮方法、圧縮画像情報記録媒体、圧縮画像情報再生装置
JP2000197054A (ja) 動画像符号方法及びそのプログラムを記録した記録媒体並びに装置
US6714687B2 (en) Image encoding/decoding method, apparatus thereof and recording medium in which program therefor is recorded
KR20210126121A (ko) 화상 복호 장치, 화상 복호 방법 및 프로그램
JP2002369201A (ja) 画像データ圧縮装置、画像データ圧縮方法、記録媒体およびプログラム
TWI856179B (zh) 影像編碼裝置及其控制方法、以及影像解碼裝置及其控制方法
JP3835416B2 (ja) 画像圧縮装置、画像圧縮方法及び画像圧縮プログラム
JP4331992B2 (ja) 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,それらのプログラムおよびそれらのプログラム記録媒体
WO2021054012A1 (ja) 画像符号化装置、画像復号装置及びそれらの制御方法及びプログラム
JP2003134532A (ja) 画像圧縮装置、画像圧縮方法、画像展開装置、プログラム
JPH11136674A (ja) 画像符号化方法及び記憶媒体
JPH11103463A (ja) 画像符号化方法及び記憶媒体
Cosman et al. Combined vector quantization and adaptive histogram equalization
JP2000102009A (ja) 画像符号方法及びそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060410

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3814637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130616

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130616

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130616

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130616

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140616

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term