JP3743384B2 - 画像符号化装置及び方法、並びに画像復号装置及び方法 - Google Patents

画像符号化装置及び方法、並びに画像復号装置及び方法 Download PDF

Info

Publication number
JP3743384B2
JP3743384B2 JP2002118516A JP2002118516A JP3743384B2 JP 3743384 B2 JP3743384 B2 JP 3743384B2 JP 2002118516 A JP2002118516 A JP 2002118516A JP 2002118516 A JP2002118516 A JP 2002118516A JP 3743384 B2 JP3743384 B2 JP 3743384B2
Authority
JP
Japan
Prior art keywords
code
image
subband
encoding
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002118516A
Other languages
English (en)
Other versions
JP2003319185A (ja
Inventor
隆浩 福原
青司 木村
淳哉 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002118516A priority Critical patent/JP3743384B2/ja
Priority to US10/290,405 priority patent/US7127111B2/en
Publication of JP2003319185A publication Critical patent/JP2003319185A/ja
Application granted granted Critical
Publication of JP3743384B2 publication Critical patent/JP3743384B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/645Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Color Television Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えばJPEG−2000のように、ウェーブレット変換とエントロピー符号化とにより画像を圧縮する画像符号化装置及びその方法、並びにその圧縮された画像を復号する画像復号装置及びその方法に関する。
【0002】
【従来の技術】
従来の代表的な画像圧縮方式として、ISO(International Standards Organization)によって標準化されたJPEG(Joint Photographic Experts Group)方式がある。これは、離散コサイン変換(DCT:Descrete Cosine Transform)を用い、比較的高いビットが割り当てられる場合には、良好な符号化画像及び復号画像を供することが知られている。しかし、ある程度以上に符号化ビット数を少なくすると、DCT特有のブロック歪みが顕著になり、主観的に劣化が目立つようになる。
【0003】
一方、近年では画像をフィルタバンクと呼ばれるハイパス・フィルタとローパス・フィルタとを組み合わせたフィルタによって複数の帯域に分割し、各帯域毎に符号化を行う方式の研究が盛んになっている。その中でも、ウェーブレット変換符号化は、DCTのように高圧縮でブロック歪みが顕著になるという欠点がないことから、DCTに代わる新たな技術として有力視されている。
【0004】
【発明が解決しようとする課題】
ところで、2001年1月に国際標準化が完了したJPEG−2000は、このウェーブレット変換に高能率なエントロピー符号化(ビットプレーン単位のビット・モデリングと算術符号化)を組み合わせた方式を採用しており、JPEGに比べて符号化効率の大きな改善を実現している。
【0005】
これらの国際規格ではデコーダ側の規格のみが定められており、エンコーダ側は自由に設計することができる。その反面、一般に負荷が重いエントロピー符号化の処理の軽減手段や、目標の圧縮率を実現するためのレート制御の効果的な手段についての規格が存在しないため、ノウハウの確立が何よりも重要になる。特にJPEGでは、このレート制御が困難であり、目標値を得るまでに複数回の符号化を施す必要も多々あった。しかしながら、これは処理時間の増大に繋がるため、JPEG−2000では、1度の符号化で目標の符号量を得ることが望まれている。
【0006】
また、このJPEG−2000規格は、静止画の規格であり、動画像では頻繁に存在するインタレース画像に対する十分な検討がなされていない。したがって、静止画用の技術をそのまま動画像に応用すると、画質劣化が目立ってしまうという欠点が露呈する。
【0007】
本発明は、このような従来の実情に鑑みて提案されたものであり、例えばJPEG−2000のように、ウェーブレット変換とエントロピー符号化とにより、静止画像のみならず動画像をも高品質に圧縮する画像符号化装置及びその方法、並びにその圧縮された画像を復号する画像復号装置及びその方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る画像符号化装置及びその方法は、入力画像に対して、低域フィルタ及び高域フィルタを垂直方向及び水平方向に施してサブバンドを生成し、低域成分のサブバンドに対して階層的にフィルタリング処理を施すことにより、サブバンド係数を生成し、フィルタリングによって生成されたサブバンドを分割して所定の大きさの符号ブロックを生成し、この符号ブロック単位に最上位ビットから最下位ビットに至るビットプレーンを生成し、このビットプレーン毎に符号化パスを生成し、符号化パス内で算術符号化を行う。そして、生成された算術符号に基づいて、目標の符号量になるように符号量を制御し、符号量制御後の算術符号にヘッダを加えてパケットを生成する。特に、入力画像がインタレース画像の場合、フィルタリングに際しては、水平方向が低域であり且つ垂直方向が高域のサブバンドに対して、さらにフィルタリング処理を施すようにし、符号ブロックを生成するに際しては、上記水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズを他のサブバンドよりも小さく設定する。
【0011】
また、上述した目的を達成するために、本発明に係る画像符号化装置及びその方法は、入力画像に対して、低域フィルタ及び高域フィルタを垂直方向及び水平方向に施してサブバンドを生成し、低域成分のサブバンドに対して階層的にフィルタリング処理を施すことにより、サブバンド係数を生成し、フィルタリングによって生成されたサブバンドを分割して所定の大きさの符号ブロックを生成し、この符号ブロック単位に最上位ビットから最下位ビットに至るビットプレーンを生成し、このビットプレーン毎に符号化パスを生成し、符号化パス内で算術符号化を行う。そして、生成された算術符号に基づいて、目標の符号量になるように符号量を制御し、符号量制御後の算術符号にヘッダを加えてパケットを生成し、符号化コードストリームとして出力する。特に、入力画像がインタレース画像の場合、符号量制御に際しては、水平方向が低域であり且つ垂直方向が高域のサブバンドにおける算術符号が優先的に符号化コードストリームに含められるように符号量を制御する。
【0015】
また、上述した目的を達成するために、本発明に係る画像復号装置及びその方法は、パケットで構成された符号化コードストリームをヘッダと算術符号とに分解して算術符号を復号し、ビットプレーン毎に符号化パスを復号し、最上位ビットから最下位ビットに至るビットプレーンに基づいて符号ブロックを復元し、符号ブロックを集めてサブバンドを生成し、低域成分のサブバンドに対して、階層的に低域フィルタ及び高域フィルタを垂直及び水平方向に施す。特に、符号化コードストリームの元画像がインタレース画像の場合、水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズは、他のサブバンドよりも小さく設定されており、逆フィルタリング処理に際しては、前処理として、水平方向が低域であり且つ垂直方向が高域のサブバンドに対して逆フィルタリング処理を施す。
【0017】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、JPEG−2000方式により入力画像を圧縮符号化する画像符号化装置及びその方法、並びにその圧縮された画像を復号する画像復号装置及びその方法に適用したものである。
【0018】
(1)画像符号化装置の構成及び動作
本実施の形態における画像符号化装置の概略構成を図1に示す。図1に示すように、画像符号化装置1は、DCレベルシフト部10と、ウェーブレット変換部11と、量子化部12と、符号ブロック化部13と、ビットプレーン符号化パス生成部14と、算術符号化部15と、レート制御部17と、ヘッダ生成部18と、パケット生成部19とから構成されている。ここで、ビットプレーン符号化パス生成部14と算術符号化部15とにより、EBCOT(Embedded Coding with
Optimized Truncation)部16が構成される。
【0019】
DCレベルシフト部10は、後段のウェーブレット変換部11におけるウェーブレット変換を効率的に行い圧縮率を向上させるために、原信号のレベルシフトを行う。原理的には、RGB信号は、正の値(符号なしの整数値)を持つため、原信号のダイナミックレンジを半分にするレベルシフトを行うことで、圧縮効率を向上させることができる。これに対して、YCbCr信号におけるCbやCrといった色差信号は、正負両方の整数値を持つため、レベルシフトは行われない。
【0020】
ウェーブレット変換部11は、通常、低域フィルタと高域フィルタとから構成されるフィルタバンクによって実現される。なお、デジタルフィルタは、通常複数タップ長のインパルス応答(フィルタ係数)を持っているため、フィルタリングが行えるだけの入力画像を予めバッファリングしておく必要があるが、簡単のため、図1では図示を省略する。
【0021】
DCレベルシフト部10は、フィルタリングに必要な最低限の画像信号D10を入力し、上述のようにレベルシフトを行う。そして、ウェーブレット変換部11は、DCレベルシフト後の画像信号D11に対して、ウェーブレット変換を行うフィルタリング処理を行い、ウェーブレット変換係数D12を生成する。
【0022】
このウェーブレット変換では、通常図2に示すように低域成分が繰り返し変換されるが、これは画像のエネルギの多くが低域成分に集中しているためである。このことは、図3(A)に示す分割レベル=1から図3(B)に示す分割レベル=3のように、分割レベルを進めていくに従って、同図のようにサブバンドが形成されていくことからも分かる。ここで、図2におけるウェーブレット変換のレベル数は3であり、この結果計10個のサブバンドが形成されている。ここで、図2においてL,Hはそれぞれ低域,高域を表し、L,Hの後の数字は分割レベルを表す。すなわち、例えばLH−1は、水平方向が低域で垂直方向が高域である分割レベル=1のサブバンドを表す。なお、詳しくは後述するが、ウェーブレット変換部11は、画像信号D11の特徴を考慮し、例えばインタレース画像の場合には、例えば水平方向が低域で垂直方向が高域の成分から成るサブバンドをさらに分割する。
【0023】
量子化部12は、ウェーブレット変換部11から供給されたウェーブレット変換係数D12に対して非可逆圧縮を施す。量子化手段としては、ウェーブレット変換係数D12を量子化ステップサイズで除算するスカラ量子化を用いることができる。ここで、JPEG−2000の規格上、上述の非可逆圧縮を行う場合で、非可逆の9×7ウェーブレット変換フィルタを用いる場合には、自動的にスカラ量子化を併用することが決められている。一方、可逆の5×3ウェーブレット変換フィルタを用いる場合には、量子化を行わず、後述のように符号化パスを切り捨てることによって、符号量制御が行われる。したがって、図1の量子化部12が動作するのは、実際には非可逆の9×7ウェーブレット変換フィルタを用いた場合である。以下、この非可逆の9×7ウェーブレット変換フィルタを用いる場合を想定して説明を進める。
【0024】
符号ブロック化部13は、量子化部12で生成された量子化係数D13を、エントロピー符号化の処理単位である所定の大きさの符号ブロックに分割する。ここで、サブバンド中の符号ブロックの位置関係を図4に示す。通常、例えば64×64程度のサイズの符号ブロックが、分割後のすべてのサブバンド中に生成される。したがって、最も分割レベルが小さいHH−1(図2)のサブバンドの大きさが640×320であった場合には、64×64の符号ブロックは水平方向に10個、垂直方向に5個、合計50個存在することになる。符号ブロック化部13は、符号ブロック毎の量子化係数D14をビットプレーン符号化パス生成部14に供給し、後段の符号化処理は、これらの符号ブロック毎に行われる。
【0025】
ビットプレーン符号化パス生成部14は、符号ブロック毎の量子化係数D14に対して、以下のようにして係数ビット・モデリングを行う。ここで、本実施の形態では、特にJPEG−2000規格で定められたEBCOTと呼ばれるエントロピー符号化を例に取りながら説明する。なお、このEBCOTについては、例えば、文献「IS0/IEC 15444-1, Information technology-JPEG 2000, Part 1:Core coding system」等に詳細に記載されている。
【0026】
このEBCOTの説明の前に、ビットプレーンの概念について図5を用いて説明する。図5(A)は、縦4個、横4個の計16個の係数から成る量子化係数を仮定したものである。この16個の係数のうち絶対値が最大のものは13であり、2進数表現では1101となる。したがって、係数の絶対値のビットプレーンは、図5(B)に示すような4つのビットプレーンから構成される。なお、各ビットプレーンの要素は、すべて0又は1の数を取る。一方、量子化係数の符号は、−6が唯一負の値であり、それ以外は0又は正の値である。したがって、符号のビットプレーンは、図5(C)に示すようになる。
【0027】
EBCOTは、所定の大きさのブロック毎にそのブロック内の係数の統計量を測定しながら符号化する手段であり、符号ブロック単位に量子化係数をエントロピー符号化する。符号ブロックは、最上位ビット(MSB)から最下位ビット(LSB)方向にビットプレーン毎に独立して符号化される。また、符号ブロックの縦横のサイズは、4から256までの2の冪乗で、通常は32×32、64×64、128×32等の大きさが使用される。量子化係数は、nビットの符号付き2進数で表されており、bit0からbit(n−2)がLSBからMSBまでのそれぞれのビットを表す。なお、残りの1ビットは符号である。符号ブロックの符号化は、MSB側のビットプレーンから順番に、以下の(a)〜(c)に示す3種類の符号化パスによって行われる。
【0028】
(a) Significant Propagation Pass
(b) Magnitude Refinement Pass
(c) Cleanup Pass
3つの符号化パスの用いられる順序を図6に示す。図6に示すように、先ずビットプレーン(n−2)(MSB)がCleanup Passによって符号化される。続いて、順次LSB側に向かい、各ビットプレーンが、Significant Propagation Pass、Magnitude Refinement Pass、Cleanup Passの順序で用いられて符号化される。
【0029】
但し、実際にはMSB側から何番目のビットプレーンで初めて1が出てくるかをヘッダに書き、オール0のビットプレーンは符号化しない。この順序で3種類の符号化パスを繰返し用いて符号化し、任意のビットプレーンの任意の符号化パスまでで符号化を打ち切ることにより、符号量と画質のトレードオフを取る、すなわちレート制御を行うことができる。
【0030】
ここで、係数の走査(スキャニング)について図7を用いて説明する。符号ブロックは、高さ4個の係数毎にストライプ(stripe)に分けられる。ストライプの幅は、符号ブロックの幅に等しい。スキャン順とは1個の符号ブロック内の全ての係数を辿る順番であり、符号ブロック中では上のストライプから下のストライプへの順序、各ストライプ中では左の列から右の列への順序、各列中では上から下への順序でスキャニングされる。なお、各符号化パスにおいて符号ブロック中のすべての係数がこのスキャン順で処理される。
【0031】
以下、上述した3つの符号化パスについて説明する。
【0032】
(a) Significance Propagation Pass
あるビットプレーンを符号化する Significance Propagation Passでは、8近傍の少なくとも1つの係数が有意(significant)であるようなnon-significant係数のビットプレーンの値が算術符号化される。その符号化したビットプレーンの値が1である場合には、符号の正負が続けて算術符号化される。
【0033】
ここでsignificanceとは、各係数に対して符号化器が持つ状態である。significanceの初期値は、non-significantを表す0であり、その係数で1が符号化されたときにsignificantを表す1に変化し、以降常に1であり続ける。したがって、significanceとは、有効桁の情報を既に符号化したか否かを示すフラグとも言える。あるビットプレーンでSignificance Propagation Pass が発生すれば、以降のビットプレーンではSignificance Propagation Passは発生しない。
【0034】
(b) Magnitude Refinement Pass
ビットプレーンを符号化するMagnitude Refinement Passでは、ビットプレーンを符号化する Significance Propagation Passで符号化していないsignificantな係数のビットプレーンの値が算術符号化される。
【0035】
(c) Cleanup Pass
ビットプレーンを符号化するCleanup Passでは、ビットプレーンを符号化するSignificance Passで符号化していないnon-significantな係数のビットプレーンの値が算術符号化される。その符号化したビットプレーンの値が1である場合には、符号の正負が続けて算術符号化される。
【0036】
なお、以上の3つの符号化パスでの算術符号化では、ケースに応じてZC(Zero Coding)、RLC(Run-Length Coding)、SC(Sign Coding)、MR(Magnitude Refinement)が使い分けられて係数のコンテキストが選択される。そして、MQ符号化と呼ばれる算術符号によって選択されたコンテキストが符号化される。このMQ符号化は、JBIG2で規定された学習型の2値算術符号である。MQ符号化については、例えば、文献「ISO/IEC FDIS 14492, “Lossy/Lossless Coding of Bi-level Images”, March 2000」等に記載されている。JPEG−2000では、すべての符号化パスで合計19種類のコンテキストがある。
【0037】
以上のようにしてビットプレーン符号化パス生成部14は、符号ブロック毎の量子化係数D14をビットプレーンに分解すると共に各ビットプレーンを3つの符号化パスに分解し、符号化パス毎に量子化係数D15を生成する。そして、算術符号化部15は、この符号化パス毎の量子化係数D15に対して算術符号化を施す。
【0038】
レート制御部17は、少なくとも一部の符号化パスの処理を行った後で、算術符号化部15から供給された算術符号D16の符号量をカウントし、目標の符号量に達した時点で、又は達する直前に、それより後の算術符号D16を切り捨てる。このように、符号量をオーバーする直前で切り捨てることにより、確実に目標の符号量に抑えることができる。レート制御部17は、この符号量制御完了後の算術符号D17を、ヘッダ生成部18及びパケット生成部19に供給する。
【0039】
ヘッダ生成部18は、レート制御部17から供給された符号量制御完了後の算術符号D17に基づいて、符号ブロック内での付加情報、例えば符号ブロック内の符号化パスの個数や圧縮コードストリームのデータ長等をヘッダD18として生成し、このヘッダD18をパケット生成部19に供給する。
【0040】
パケット生成部19は、符号量制御完了後の算術符号D17とヘッダD18とを合わせてパケットD19を生成し、符号化コードストリームとして出力する。この際、パケット生成部19は、図8に示すように同一解像度レベルから個々のパケットを生成する。なお、図8から分かるように、最低域であるパケット−1は、LL成分のみを含み、それ以外のパケット−2乃至パケット−4は、LH成分,HL成分及びHH成分を含む。
【0041】
以上のように、本実施の形態における画像符号化装置1は、ウェーブレット変換及びエントロピー符号化を用いて入力画像を高効率に圧縮符号化し、パケット化して符号化コードストリームとして出力することができる。
【0042】
ところで、上述したJPEG−2000規格は、静止画の規格であり、動画像では頻繁に存在するインタレース画像に対する十分な検討がなされていない。したがって、静止画用の技術をそのまま動画像に応用すると、劣化が目立ってしまうという欠点が露呈する。以下、具体的に説明する。
【0043】
あるインタレースの動画シーンの1フレームを図9に示す。これをPCモニタ等のプログレッシブ方式のモニタで見ると、動きのある部分にインタレースの影響が強く出て、横方向に縞模様が見える。
【0044】
すなわち、図10(A)に示すように、丸い物体が画面中を右方向に移動する場合、インタレース画面では問題ないが、プログレッシブ画面では図10(B)のように横方向に縞模様が見えてしまう。これはインタレース画面が奇数フィールドと偶数フィールドとで飛び越し走査を用いていることに起因している。
【0045】
図9に示した画像を5回ウェーブレット変換及び分割した後の各サブバンドの様子を図11に示す。図11から分かるように、明らかにLH−1成分、すなわち最高域のサブバンドで、水平方向が低域で垂直方向が高域の成分から成るサブバンドの成分の係数のエネルギが他のサブバンドに比べて大きくなっている。
【0046】
そこで、本実施の形態におけるウェーブレット変換部11では、入力画像の特徴を利用し、インタレース画像に対しては、図12に示すようにLH−1成分をさらにウェーブレット変換及び分割する。なお、LH−1成分に限定されるものではなく、例えばLH−2成分やその他の成分についても、同様にウェーブレット変換及び分割することが有効であるのは言うまでもない。
【0047】
ここで、入力画像がインタレースであることは通常符号化を行う前に明らかであるため、LH成分を上述のようにさらにウェーブレット変換及び分割することが可能である。またウェーブレット変換及び分割して生成されたサブバンド係数分布を見て、エネルギが大きいサブバンド(インタレース画像の場合は特にLH成分)をさらにウェーブレット変換及び分割するようにしてもよく、これにより圧縮率を向上させることができる。
【0048】
なお、入力画像がカラー画像である場合には、人間の視覚特性が輝度成分と比較して色差成分に対して鈍感である特徴を利用することができる。すなわち、上述したようにサブバンドに対してフィルタリング及び分割処理を施す際に、輝度成分の入力画像と色差成分の入力画像とに対して異なる処理を施すことができる。例えば、輝度成分に対しては、低域成分のサブバンドに対する階層的なフィルタリング及び分割を行い、同時に水平方向が低域で且つ垂直方向が高域のサブバンドに対してもフィルタリング及び分割を行う。一方、色差成分に対しては、低域成分のサブバンドに対する階層的なフィルタリング及び分割だけに限定する。これにより、人間の視覚特性を利用して、画質劣化を抑えながら圧縮率を向上させることができる。
【0049】
(1−2)第1の変形例
上述の実施の形態では、符号ブロック化部13における符号ブロックサイズは、例えば64×64であるとして説明した。しかしJPEG−2000規格では、水平方向のサイズ×垂直方向のサイズが4096以下であり且つサイズが2の冪乗であればよい。
【0050】
ここで、符号ブロックサイズは、図4に示したように全てのサブバンドで同一値を取るため、符号化効率及び画質に影響を与える。一方、JPEG−2000では、復号時にウェーブレット逆変換を行って画像を復元するため、低域成分での歪みやノイズがウェーブレット逆変換時に大きな画質劣化に繋がる。したがって、画質劣化を小さい領域に限定できれば画質向上に寄与する可能性が向上する。
【0051】
そこで、例えばインタレース入力画像の場合には、プログレッシブ画像と比較して、符号ブロックサイズを32×32等の小さいサイズにするのが有効である。特にインタレース画像の場合には垂直方向の相関が低いため、符号ブロックサイズを64×32、或いは128×16等の横長のサイズに設定することが有効である。
【0052】
また、入力画像の輝度成分と色差成分とで符号ブロックサイズを別々なものにすることもできる。例えば、人間の視覚特性上、輝度成分の入力画像は画質劣化が目立ち易いため、符号ブロックサイズを32×32、64×32、或いは128×16等の小さいサイズとし、劣化の目立ちにくい色差成分に対しては符号ブロックサイズを64×64に設定することができる。
【0053】
(1−3)第2の変形例
上述の第1の変形例では、符号ブロックサイズを入力画像の特徴に合わせて可変にするものとして説明したが、以下に説明する第2の変形例では、符号ブロックを包含する矩形領域を決定する。この矩形領域は、JPEG−2000規格では、プリシンクト(Precinct)と呼ばれており、そのサイズは以下のように決定される。ここで、PPx,PPyはマーカで定義されている。
【0054】
Precinct H = 2^PPx (水平方向サイズ)
Precinct V = 2^PPy (垂直方向サイズ)
また、符号ブロックサイズは、以下の式で決定される。
【0055】
符号ブロックサイズ(水平)= 2^xcb’
符号ブロックサイズ(垂直)= 2^ycb’
xcb’= min(xcb, PPx-1), for r>0 ・・・(1)
xcb’= min(xcb, PPx), for r=0 ・・・(2)
ycb’= min(ycb, PPy-1), for r>0 ・・・(3)
ycb’= min(ycb, PPy), for r=0 ・・・(4)
ここで、rはウェーブレット分解後の解像度レベルを示し、xcb, ycbは最初に指定された符号ブロックサイズを示す。例えば、最初に指定された符号ブロックサイズが64×64(=2×2)であれば、xcb=ycb=6となる。
【0056】
上記式(1)〜式(4)に示すように、符号ブロックサイズは、プリシンクトのサイズとの関係で決定され、プリシンクトのサイズよりも大きくなることはできない。この関係を図13に示す。図13の例では、プリシンクトサイズ=(128,32)であり、その中に存在している符号ブロックサイズ=(64,32)となっている。
【0057】
なお、JPEG−2000規格では、SPcodマーカを用いることで、ウェーブレット変換及び分割の過程で生成される解像度レベル毎に、異なるサイズのプリシンクトを定義することができる。
【0058】
この解像度レベルについて図14を用いて説明する。図14は、ウェーブレット変換の分割レベルが3のケースである。この場合、最低域が0−LLであり、次の高域は、1−HL,1−LH,1−HHから構成される。さらに次の高域では、2−HL,2−LH,2−HHとなり、最高域は、3−HL,3−LH,3−HHとなる。なお、解像度レベルについて記述する場合は、例えばN−LHのように、Nで解像度レベルのレベル番号を指定する。
【0059】
図13及び図14を照らし合わせて考えれば、例えば1−LH成分のサブバンドのプリシンクトサイズ=(128,16)とし、2−LH成分のサブバンドのプリシンクトサイズ=(128,32)とすることができる。
【0060】
これにより、サブバンド毎に係数のエネルギ分布が異なった場合であっても、プリシンクトサイズ、さらに結果として符号ブロックサイズを可変に設定することができ、符号化画質を向上することができる。
【0061】
ここで、インタレース入力画像の場合には、上述したようにLH成分にエネルギが集まり易いことから、水平方向が低域で且つ垂直方向が高域のサブバンド内のプリシンクトサイズを他のサブバンド内よりも小さいサイズにするのが効果的である。このとき、1個のプリシンクト=1個の符号ブロックとすれば、結果的にそのサブバンド内の矩形領域は、符号ブロックに他ならなくなる。
【0062】
また、輝度成分の入力画像と色差成分の入力画像とで、プリシンクトサイズを可変にすることもできる。一般には、画質劣化が目立ちにくい色差成分の入力画像に対してプリシンクトサイズを大きめに設定しておくことが効果的である。
【0063】
(1−4)第3の変形例
以下の第3の変形例では、先ずレート制御部17(図1)の動作について詳細に説明する。上述の実施の形態では、目標符号量に達した際に、又は達する直前に符号化パスを切り捨てる、又はそれ以上の符号化パスを選択せず打ち切ることで、レート制御を行うものとして説明したが、ここでは図15を用いてレート制御部17の内部処理についてさらに詳しく説明する。
【0064】
図15に示すように、符号化パス符号量算出部20及び符号化パス歪み削減量算出部21は、算術符号化後の算術符号D16を入力する。そして、符号化パス符号量算出部20は、符号ブロック内に生成される符号化パスで実際に発生する符号量Rを、全ての符号ブロックの全ての符号化パスに対して求め、この全ての符号ブロックの符号化パスの符号量Rを示す情報D20をRD特性算出部22に供給する。
【0065】
同様に、符号化パス歪み削減量算出部21は、その符号化パスを含めた場合にどの程度歪みが低減されるかを示す歪み削減量Dを、全ての符号ブロックの全ての符号化パスに対して求め、この全ての符号ブロックの符号化パスの歪み削減量Dを示す情報D21をRD特性算出部22に供給する。
【0066】
RD特性算出部22は、各符号化パスのRD特性、通常はRD特性の傾きを算出する。そしてRD特性算出部22は、この結果得られたRD特性値及び各符号化パスの情報D22を全符号化パス分記憶保持しておき、また、このRD特性値及び各符号化パスの情報D22を符号化パス選択部23に供給する。
【0067】
符号化パス選択部23は、RD特性算出部22から供給されたRD特性値及び各符号化パスの情報D22に基づいて、画像全体の目標符号量に最も近くなるように、各符号化パスを含めるか切り捨てるかの選択を行う。この際、符号化パス選択部23は、図16に示すようなRD特性を利用する。図16において黒丸のポイントは切り捨ての候補となる符号化パスであり、白丸のポイントは切り捨ての対象外となる符号化パスであることを示している。したがって、符号化パス選択部23は、目標符号量に最も近くなるように、これらの白丸の符号化パスを選択する動作を行う。以上の動作によって最終的に選択された符号化パスの情報である算術符号D17が図1に示したヘッダ生成部18及びパケット生成部19に供給される。
【0068】
ここで、JPEG−2000符号化の技術としてビジュアル・ウェイティング(Visual Weighting)法がある。これは、人間の視覚システムを巧みに利用した手法であり、画像の空間周波数に対して人間の視覚システムの変動感受性をモデル化し、これをコントラスト感受性機能(Contrast Sensitivity Function: CSF)として体系付けたものである。CSFの重みは、実際には画像の変換係数の視覚周波数によって決定されるものであり、ウェーブレット変換後の個々のサブバンドに対してCSFの重みが別個に用意される。なお、このCSFの重みは、符号化側で設計され、復号画像がどのような条件下で視覚されるかに依存している。
【0069】
上述した図15では、VW係数出力部24は、符号化パス歪み削減量算出部21にVW係数値D23を供給する。そして、符号化パス歪み削減量算出部21は、VW係数値D23を加味した歪み削減量Dを算出する。具体的には、図17に示すように、ウェーブレット変換及び分割で生成されるサブバンド毎にVW係数値D23を設定しておく。VW係数出力部24は、これらの係数値を記憶保持する。
【0070】
このVW係数値D23の実際の値としては、例えば図18のように各分割レベルのサブバンド毎に決めておくことができる。図18に示すように、輝度(Y)と色差(Cb、Cr)とで別々に係数値が決められており、分割レベルが大きいほど、すなわち、より低域成分ほど、係数値も大きくなっていることが分かる。ここで、係数値が大きいことは、レート制御の際に符号化パスの切り捨てが行われにくいことを意味する。なお、図18において、Y、Cb、Cr全て低域ほど(分割レベルが大きい程)係数値が大きくなっているのは、上述したように、画像のエネルギが低域に集中していることを利用しているためである。
【0071】
符号化パス歪み削減量算出部21は、VW係数値D23を各符号化パスの歪み削減量Dに乗算した結果を新たな歪み削減量Dとする。これは、サブバンド毎の優先的な重み付けをしたことと等価であり、レート制御の際に低域のサブバンドに存在する符号化パスほど切り捨てられにくくなり、逆に高域のサブバンドに存在する符号化パスほど切り捨てられやすくなる。
【0072】
ここで、入力画像の特徴を利用して、ある特定のサブバンドの係数値を大きい値又は小さい値に設定するようにしてもよい。例えば入力画像がインタレース画像であった場合、上述したようにLH成分のエネルギが大きくなる傾向にあるため、図19に示すようにLH成分に相当する係数の重み値を大きくすることが有効である。これにより、インタレース成分の画像が保持され、高画質化に繋がる効果がある。
【0073】
なお、図18、図19共に、YよりもCb又はCrの重み係数値の方が小さい値に設定されている。これは、輝度成分よりも色差成分に対する人間の視覚特性が鋭敏でない特徴を生かしたものである。
【0074】
(2)画像復号装置の構成及び動作
本実施の形態における画像復号装置の概略構成を図20に示す。図20に示すように、画像復号装置2は、パケット分解部30と、ヘッダ解析部31と、復号ブロック化部32と、算術復号部34と、ビットプレーン復号パス生成部35と、逆量子化部36と、ウェーブレット逆変換部37と、DCレベル逆シフト部38とから構成されている。ここで、算術復号部34とビットプレーン復号パス生成部35とにより、EBCOT復号部33が構成される。
【0075】
パケット分解部30は、符号化コードストリームD30を入力し、パケットヘッダD31と中身のパケット本体D32とに分解する。なお、パケット本体D32には、実際の符号化コードストリームが書き込まれている。パケット分解部30は、パケットヘッダD31をヘッダ解析部31に供給し、パケット本体D32を復号ブロック化部32に供給する。
【0076】
ヘッダ解析部31は、パケットヘッダD31を解析し、例えば符号ブロック内の符号化パスの個数や符号化パスの発生符号量等の符号化パスの情報D33をビットプレーン復号パス生成部35に供給する。また、ヘッダ解析部31は、符号ブロックの位置情報D34を復号ブロック化部32に供給する。
【0077】
復号ブロック化部32は、符号ブロック毎の符号化コードストリームD35を算術復号部34に供給する。
【0078】
算術復号部34は、符号ブロック毎の符号化コードストリームD35を算術復号して係数情報D36を生成し、ビットデモデリング処理を行うビットプレーン復号パス生成部35は、係数情報D36からビットプレーン単位のバイナリデータを復元する。これは、実際には量子化係数D37になっている。ビットプレーン復号パス生成部35は、この量子化係数D37を逆量子化部36に供給する。
【0079】
逆量子化部36は、ビットプレーン復号パス生成部35から供給された量子化係数D37を逆量子化してウェーブレット変換係数D38に変換する。なお、上述したように、画像符号化装置1において非可逆の9×7ウェーブレット変換フィルタが用いられた場合には量子化されるため、逆量子化部36で逆量子化される。これに対して、画像符号化装置1において可逆の5×3ウェーブレット変換フィルタが用いられた場合には量子化が省略されるため、ビットプレーン単位のバイナリデータは、ビットプレーン復号パス生成部35から直接ウェーブレット逆変換部37に供給される。この画像符号化装置1における量子化の有無は、JPEG−2000規格では符号化コードストリームD30中のマーカによって判別可能である。
【0080】
ウェーブレット逆変換部37は、ウェーブレット変換係数D38を逆変換して復号画像D39を生成し、この復号画像D39をDCレベル逆シフト部38に供給する。
【0081】
DCレベル逆シフト部38は、画像符号化装置1においてDCレベルシフト処理が施されていた場合に復号画像D39に対して逆シフト処理を行い、最終的な復号画像D40を出力する。
【0082】
ここで、例えばインタレース入力画像に対して、最高域のサブバンドで、且つ水平方向が低域で垂直方向が高域の成分から成るサブバンドをさらにウェーブレット変換及び分割している場合には、低域成分のサブバンドに対して階層的にウェーブレット逆変換及び合成する際に、水平方向が低域で且つ垂直方向が高域のサブバンドに対しては、さらにウェーブレット逆変換及び合成する。
【0083】
また、画像符号化装置1において、サブバンドに対してフィルタリング及び分割処理を施す際に、入力画像の輝度成分と色差成分とで異なる処理を施している場合には、ウェーブレット逆変換及び合成処理を施す際にも、輝度成分の符号化コードストリームと色差成分の符号化コードストリームとで異なる処理を施す。
【0084】
また、上述した第2の変形例で述べたプリシンクト手段を用いて符号化が行われた場合には、複数個の符号ブロックを集めてプリシンクトを形成し、これらのプリシンクトを複数個集めてサブバンドを形成し、サブバンドの係数に対してウェーブレット逆変換及び合成を行う。この際、画像符号化装置1において、輝度成分と色差成分とで異なるプリシンクトサイズで符号化が行われた場合には、符号化コードストリームを復号する際にも、輝度成分と色差成分とで異なるサイズのプリシンクトを形成する。
【0085】
(3)その他
以上説明したように、本実施の形態における画像符号化装置1では、入力画像の特徴を考慮し、例えばインタレース画像の場合には、最高域のサブバンドで、水平方向が低域で垂直方向が高域の成分から成るサブバンドの成分の係数のエネルギが他のサブバンドに比べて大きくなることを利用して、このサブバンドに対してさらにウェーブレット変換を施す。また、入力画像の特徴を考慮し、例えばインタレース画像の場合には、水平方向が低域で垂直方向が高域の成分から成るサブバンドにおける符号ブロックの大きさや符号ブロックを包含するプリシンクトの大きさを小さくなるように設定する。さらに、ビジュアル・ウェイティング法におけるサブバンド毎の重み係数を導入し、例えばインタレース画像の場合には、水平方向が低域で垂直方向が高域の成分から成るサブバンドにおける重み係数値を大きくし、レート制御の際に符号化パスの切り捨てが行われにくくする。画像符号化装置1は、以上のような技術を用いることにより、インタレース画像で問題となる奇数フィールドと偶数フィールドとの歪みによる対象物のぎこちない動きを抑制又は回避し、主観的な画質を向上させることができる。
【0086】
また、以上の技術を輝度成分と色差成分とで使い分けることにより、人間の視覚特性を利用して、画質劣化を抑えながら圧縮率を向上させることができる。
【0087】
また、本実施の形態における画像復号装置2では、画像符号化装置1に対応する処理を行うことで、入力した符号化コードストリームを復号することができる。
【0088】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0089】
例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、画像符号化装置1及び画像復号装置2における処理を、それぞれCPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
【0092】
【発明の効果】
以上詳細に説明したように、本発明に係る画像符号化装置及びその方法は、入力画像に対して、低域フィルタ及び高域フィルタを垂直方向及び水平方向に施してサブバンドを生成し、低域成分のサブバンドに対して階層的にフィルタリング処理を施すことにより、サブバンド係数を生成し、フィルタリングによって生成されたサブバンドを分割して所定の大きさの符号ブロックを生成し、この符号ブロック単位に最上位ビットから最下位ビットに至るビットプレーンを生成し、このビットプレーン毎に符号化パスを生成し、符号化パス内で算術符号化を行う。そして、生成された算術符号に基づいて、目標の符号量になるように符号量を制御し、符号量制御後の算術符号にヘッダを加えてパケットを生成する。特に、入力画像がインタレース画像の場合、フィルタリングに際しては、水平方向が低域であり且つ垂直方向が高域のサブバンドに対して、さらにフィルタリング処理を施すようにし、符号ブロックを生成するに際しては、上記水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズを他のサブバンドよりも小さく設定する。
【0093】
また、本発明に係る画像符号化装置及びその方法は、入力画像に対して、低域フィルタ及び高域フィルタを垂直方向及び水平方向に施してサブバンドを生成し、低域成分のサブバンドに対して階層的にフィルタリング処理を施すことにより、サブバンド係数を生成し、フィルタリングによって生成されたサブバンドを分割して所定の大きさの符号ブロックを生成し、この符号ブロック単位に最上位ビットから最下位ビットに至るビットプレーンを生成し、このビットプレーン毎に符号化パスを生成し、符号化パス内で算術符号化を行う。そして、生成された算術符号に基づいて、目標の符号量になるように符号量を制御し、符号量制御後の算術符号にヘッダを加えてパケットを生成し、符号化コードストリームとして出力する。特に、入力画像がインタレース画像の場合、符号量制御に際しては、水平方向が低域であり且つ垂直方向が高域のサブバンドにおける算術符号が優先的に符号化コードストリームに含められるように符号量を制御する。
【0097】
以上のような画像符号化装置及びその方法によれば、インタレース画像で問題となる奇数フィールドと偶数フィールドとの歪みによる対象物のぎこちない動きを抑制又は回避し、主観的な画質を向上させることができる。
【0098】
また、本発明に係る画像復号装置及びその方法は、パケットで構成された符号化コードストリームをヘッダと算術符号とに分解して算術符号を復号し、ビットプレーン毎に符号化パスを復号し、最上位ビットから最下位ビットに至るビットプレーンに基づいて符号ブロックを復元し、符号ブロックを集めてサブバンドを生成し、低域成分のサブバンドに対して、階層的に低域フィルタ及び高域フィルタを垂直及び水平方向に施す。特に、符号化コードストリームの元画像がインタレース画像の場合、水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズは、他のサブバンドよりも小さく設定されており、逆フィルタリング処理に際しては、前処理として、水平方向が低域であり且つ垂直方向が高域のサブバンドに対して逆フィルタリング処理を施す。
【0099】
このような画像復号装置及びその方法によれば、インタレース画像で問題となる奇数フィールドと偶数フィールドとの歪みによる対象物のぎこちない動きを抑制又は回避するようにして符号化された符号化コードストリームを復号することができる。
【図面の簡単な説明】
【図1】本実施の形態における画像符号化装置の概略構成を説明する図である。
【図2】 第3レベルまでウェーブレット変換・分割した場合のサブバンドを説明する図である。
【図3】 実際の画像をウェーブレット変換・分割した場合のサブバンドを説明する図である。
【図4】 符号ブロックとサブバンドとの関係を説明する図である。
【図5】 ビットプレーンを説明する図であり、同図(A)は、計16個の係数から成る量子化係数を示し、同図(B)は、係数の絶対値のビットプレーンを示し、同図(C)は、符号のビットプレーンを示す。
【図6】 符号ブロック内の符号化パスの処理手順を説明する図である。
【図7】 符号ブロック内の係数のスキャン順序を説明する図である。
【図8】 同画像符号化装置で生成されるパケットを説明する図である。
【図9】 インタレース動画像の一例を説明する図である。
【図10】 インタレース画像における被写体画像の見え方を説明する図であり、同図(A)は、物体が画面中を右方向に移動する場合を示し、同図(B)は、プログレッシブ画面における当該物体の見え方を示す。
【図11】 インタレース画像をウェーブレット変換・分割した場合のサブバンドを説明する図である。
【図12】 LL成分とLH成分とを階層的にウェーブレット変換・分割した場合のサブバンドを説明する図である。
【図13】 プリシンクトを使った場合の符号ブロックサイズを説明する図である。
【図14】 解像度レベルの番号を説明する図である。
【図15】 RD特性を利用したレート制御部を説明する図である。
【図16】 RD特性を説明する図である。
【図17】 ビジュアル・ウェイティング法における重み係数の概念を説明する図である。
【図18】 ビジュアル・ウェイティング法における実際の重み係数を説明する図である。
【図19】 インタレース画像用のビジュアル・ウェイティングの重み係数を説明する図である。
【図20】 本実施の形態における画像復号装置の概略構成を説明する図である。
【符号の説明】
1 画像符号化装置、2 画像復号装置、10 DCレベルシフト部、11 ウェーブレット変換部、12 量子化部、13 符号ブロック化部、14 ビットプレーン符号化パス生成部、15 算術符号化部、16 EBCOT部、17レート制御部、18 ヘッダ生成部、19 パケット生成部、20 符号化パス符号量算出部、21 符号化パス歪み削減量算出部、22 RD特性算出部、23 符号化パス選択部、24 VW係数出力部、30 パケット分解部、31ヘッダ解析部、32 復号ブロック化部、33 EBCOT復号部、34 算術復号部、35 ビットプレーン復号パス生成部、36 逆量子化部、37 ウェーブレット逆変換部、38 DCレベル逆シフト部

Claims (6)

  1. 入力画像に対して、低域フィルタ及び高域フィルタを垂直方向及び水平方向に施してサブバンドを生成し、低域成分のサブバンドに対して階層的にフィルタリング処理を施すことにより、サブバンド係数を生成するフィルタリング手段と、
    上記フィルタリング手段によって生成されたサブバンドを分割して所定の大きさの符号ブロックを生成する符号ブロック生成手段と、
    上記符号ブロック単位に最上位ビットから最下位ビットに至るビットプレーンを生成するビットプレーン生成手段と、
    上記ビットプレーン毎に符号化パスを生成する符号化パス生成手段と、
    上記符号化パス内で算術符号化を行う算術符号化手段と、
    生成された算術符号に基づいて、目標の符号量になるように符号量を制御する符号量制御手段と、
    符号量制御後の算術符号にヘッダを加えてパケットを生成するパケット生成手段とを備え、
    上記入力画像がインタレース画像の場合、
    上記フィルタリング手段は、水平方向が低域であり且つ垂直方向が高域のサブバンドに対して、さらにフィルタリング処理を施し、
    上記符号ブロック生成手段は、上記水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズを他のサブバンドよりも小さく設定する
    ことを特徴とする画像符号化装置。
  2. 上記入力画像がインタレース画像の場合、上記符号量制御手段は、水平方向が低域であり且つ垂直方向が高域のサブバンドにおける算術符号が優先的に上記符号化コードストリームに含められるように符号量を制御することを特徴とする請求項1記載の画像符号化装置。
  3. 入力画像に対して、低域フィルタ及び高域フィルタを垂直方向及び水平方向に施してサブバンドを生成し、低域成分のサブバンドに対して階層的にフィルタリング処理を施すことにより、サブバンド係数を生成するフィルタリング工程と、
    上記フィルタリング工程にて生成されたサブバンドを分割して所定の大きさの符号ブロックを生成する符号ブロック生成工程と、
    上記符号ブロック単位に最上位ビットから最下位ビットに至るビットプレーンを生成するビットプレーン生成工程と、
    上記ビットプレーン毎に符号化パスを生成する符号化パス生成工程と、
    上記符号化パス内で算術符号化を行う算術符号化工程と、
    生成された算術符号に基づいて、目標の符号量になるように符号量を制御する符号量制御工程と、
    符号量制御後の算術符号にヘッダを加えてパケットを生成するパケット生成工程とを有し、
    上記入力画像がインタレース画像の場合、
    上記フィルタリング工程では、水平方向が低域であり且つ垂直方向が高域のサブバンドに対して、さらにフィルタリング処理を施し、
    上記符号ブロック生成工程では、上記水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズを他のサブバンドよりも小さく設定する
    ことを特徴とする画像符号化方法。
  4. 上記入力画像がインタレース画像の場合、上記符号量制御工程では、水平方向が低域であり且つ垂直方向が高域のサブバンドにおける算術符号が優先的に上記符号化コードストリームに含められるように符号量を制御することを特徴とする請求項3記載の画像符号化方法。
  5. パケットで構成された符号化コードストリームをヘッダと算術符号とに分解するパケット分解手段と、
    上記算術符号を復号する復号手段と、
    ビットプレーン毎に符号化パスを復号する符号化パス復号手段と、
    最上位ビットから最下位ビットに至る上記ビットプレーンに基づいて符号ブロックを復元する符号ブロック復元手段と、
    上記符号ブロックを集めてサブバンドを生成するサブバンド生成手段と、
    低域成分の上記サブバンドに対して、階層的に低域フィルタ及び高域フィルタを垂直及び水平方向に施す逆フィルタリング手段とを備え、
    上記符号化コードストリームの元画像がインタレース画像の場合、
    水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズは、他のサブバンドよりも小さく設定されており、
    上記逆フィルタリング手段は、前処理として、上記水平方向が低域であり且つ垂直方向が高域のサブバンドに対して逆フィルタリング処理を施す
    ことを特徴とする画像復号装置。
  6. パケットで構成された符号化コードストリームをヘッダと算術符号とに分解するパケット分解工程と、
    上記算術符号を復号する復号工程と、
    ビットプレーン毎に符号化パスを復号する符号化パス復号工程と、
    最上位ビットから最下位ビットに至る上記ビットプレーンに基づいて符号ブロックを復元する符号ブロック復元工程と、
    上記符号ブロックを集めてサブバンドを生成するサブバンド生成工程と、
    低域成分の上記サブバンドに対して、階層的に低域フィルタ及び高域フィルタを垂直及び水平方向に施す逆フィルタリング工程とを有し、
    上記符号化コードストリームの元画像がインタレース画像の場合、
    水平方向が低域であり且つ垂直方向が高域のサブバンドにおける上記符号ブロックのサイズは、他のサブバンドよりも小さく設定されており、
    上記逆フィルタリング工程では、前処理として、上記水平方向が低域であり且つ垂直方向が高域のサブバンドに対して逆フィルタリング処理を施す
    ことを特徴とする画像復号方法。
JP2002118516A 2002-04-19 2002-04-19 画像符号化装置及び方法、並びに画像復号装置及び方法 Expired - Fee Related JP3743384B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002118516A JP3743384B2 (ja) 2002-04-19 2002-04-19 画像符号化装置及び方法、並びに画像復号装置及び方法
US10/290,405 US7127111B2 (en) 2002-04-19 2002-11-08 Image coding apparatus and method, image decoding apparatus and method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002118516A JP3743384B2 (ja) 2002-04-19 2002-04-19 画像符号化装置及び方法、並びに画像復号装置及び方法

Publications (2)

Publication Number Publication Date
JP2003319185A JP2003319185A (ja) 2003-11-07
JP3743384B2 true JP3743384B2 (ja) 2006-02-08

Family

ID=29207866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002118516A Expired - Fee Related JP3743384B2 (ja) 2002-04-19 2002-04-19 画像符号化装置及び方法、並びに画像復号装置及び方法

Country Status (2)

Country Link
US (1) US7127111B2 (ja)
JP (1) JP3743384B2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483575B2 (en) * 2002-10-25 2009-01-27 Sony Corporation Picture encoding apparatus and method, program and recording medium
JP2004221633A (ja) * 2003-01-09 2004-08-05 Ricoh Co Ltd 画像処理装置、画像処理用プログラム及び記憶媒体
US9264736B2 (en) * 2003-01-14 2016-02-16 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, and decoding device
JP2004297772A (ja) * 2003-03-12 2004-10-21 Ricoh Co Ltd 画像処理システム、画像形成装置、画像処理方法、プログラム及び記憶媒体
US9171577B1 (en) * 2003-04-25 2015-10-27 Gopro, Inc. Encoding and decoding selectively retrievable representations of video content
US7200277B2 (en) * 2003-07-01 2007-04-03 Eastman Kodak Company Method for transcoding a JPEG2000 compressed image
JP4135617B2 (ja) * 2003-09-08 2008-08-20 ソニー株式会社 画像符号化装置及び方法
JP4090975B2 (ja) * 2003-09-30 2008-05-28 株式会社リコー 画像処理装置
US7565022B2 (en) * 2003-12-19 2009-07-21 Intel Corporation Bit-plane formatting including zero bit-plane detection
JP2006013766A (ja) * 2004-06-24 2006-01-12 Matsushita Electric Ind Co Ltd 動画記録方法、動画記録装置、動画再生方法および動画再生装置
KR100677446B1 (ko) * 2005-03-31 2007-02-02 엘지전자 주식회사 휴대단말기의 영상신호 압축 코딩장치 및 방법
US7916961B2 (en) * 2005-09-06 2011-03-29 Megachips Corporation Compression encoder, compression encoding method and program
JPWO2007066710A1 (ja) * 2005-12-07 2009-05-21 ソニー株式会社 符号化装置、符号化方法および符号化プログラム、ならびに、復号装置、復号方法および復号プログラム
WO2007066709A1 (ja) * 2005-12-07 2007-06-14 Sony Corporation 符号化装置、符号化方法および符号化プログラム、ならびに、復号装置、復号方法および復号プログラム
US8463061B2 (en) * 2006-07-13 2013-06-11 Nec Corporation Encoding and decoding two-dimensional signal using a wavelet transform
JP5162939B2 (ja) * 2007-03-30 2013-03-13 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4793320B2 (ja) * 2007-05-17 2011-10-12 ソニー株式会社 情報処理装置および方法
JP4517306B2 (ja) 2007-05-17 2010-08-04 ソニー株式会社 情報処理装置および方法
JP4525704B2 (ja) * 2007-05-17 2010-08-18 ソニー株式会社 符号化装置および方法、記録媒体、並びにプログラム。
JP4841504B2 (ja) * 2007-05-31 2011-12-21 三洋電機株式会社 画像符号化装置および方法
JP5098081B2 (ja) * 2007-07-19 2012-12-12 オリンパス株式会社 画像処理方法および画像処理装置
CN101874408A (zh) * 2007-11-22 2010-10-27 日本电气株式会社 图像捕获设备、编码方法及程序
JP5359302B2 (ja) * 2008-03-18 2013-12-04 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4670947B2 (ja) * 2008-12-05 2011-04-13 ソニー株式会社 情報処理装置および方法
JP5235813B2 (ja) * 2009-07-31 2013-07-10 キヤノン株式会社 動画像符号化装置、動画像符号化方法及びコンピュータプログラム
CA2815817C (en) * 2010-12-07 2019-01-15 Sony Corporation Image processing device and image processing method
US9363522B2 (en) * 2011-04-28 2016-06-07 Warner Bros. Entertainment, Inc. Region-of-interest encoding enhancements for variable-bitrate mezzanine compression
JP2013106333A (ja) * 2011-11-17 2013-05-30 Sony Corp 画像処理装置および方法
JP5950157B2 (ja) * 2012-05-18 2016-07-13 ソニー株式会社 画像処理装置および方法、並びに、プログラム
AU2017204643B2 (en) * 2017-07-07 2020-05-14 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
WO2020073098A1 (en) * 2018-10-12 2020-04-16 Kakadu R & D Pty Ltd A method and apparatus for image compression
WO2020168520A1 (zh) * 2019-02-21 2020-08-27 深圳市大疆创新科技有限公司 编码器、编码系统和编码方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2262854B (en) * 1991-12-24 1995-05-24 Sony Broadcast & Communication Image processing apparatus
JP3534465B2 (ja) * 1994-12-28 2004-06-07 パイオニア株式会社 サブバンド符号化方法
JPH08186815A (ja) * 1994-12-28 1996-07-16 Pioneer Electron Corp サブバンド符号化方法
JP3855286B2 (ja) * 1995-10-26 2006-12-06 ソニー株式会社 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法、並びに記録媒体
US6229926B1 (en) * 1998-07-24 2001-05-08 Picsurf, Inc. Memory saving wavelet-like image transform system and method for digital camera and other memory conservative applications
JP2000184204A (ja) * 1998-12-11 2000-06-30 Canon Inc 画像処理装置及び方法及び記憶媒体
KR100284027B1 (ko) * 1998-12-22 2001-03-02 서평원 웨이블릿 패킷 계수의 재배치방법
US6477280B1 (en) * 1999-03-26 2002-11-05 Microsoft Corporation Lossless adaptive encoding of finite alphabet data
AUPQ618500A0 (en) * 2000-03-13 2000-04-06 Canon Kabushiki Kaisha Memory management of compressed images data
JP3702778B2 (ja) * 2000-11-27 2005-10-05 ソニー株式会社 画像符号化装置及び方法
US6898323B2 (en) * 2001-02-15 2005-05-24 Ricoh Company, Ltd. Memory usage scheme for performing wavelet processing

Also Published As

Publication number Publication date
JP2003319185A (ja) 2003-11-07
US20030198391A1 (en) 2003-10-23
US7127111B2 (en) 2006-10-24

Similar Documents

Publication Publication Date Title
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
JP4273996B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
US6519284B1 (en) Encoding method for the compression of a video sequence
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
JP4124792B2 (ja) 符号化方法及び復号化方法及び符号化装置及び復号化装置
US9077960B2 (en) Non-zero coefficient block pattern coding
US5737448A (en) Method and apparatus for low bit rate image compression
JP2004336254A (ja) 画像符号化装置及び方法
US7065252B1 (en) System and method providing improved data compression via wavelet coefficient encoding
JP4449400B2 (ja) 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP2005515729A (ja) ビデオ符号化方法
JP2004528791A (ja) インターフレーム符号化方法および装置
US20090034624A1 (en) Method and Apparatus For a Multidimensional Discrete Multiwavelet Transform
JP4003628B2 (ja) 画像符号化装置及び方法、並びにプログラム
Singh et al. JPEG2000: A review and its performance comparison with JPEG
Suruliandi et al. Empirical evaluation of EZW and other encoding techniques in the wavelet-based image compression domain
JP2004350034A (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
JP4372327B2 (ja) 画像符号化装置および画像符号化方法並びに復号化装置および復号化方法
JP4379527B2 (ja) 符号化装置及び方法
JP4367113B2 (ja) 画像符号化装置及び方法
Morris et al. Intra-frame wavelet video coding
Surabhi et al. A robust perceptual colour image compression with watermarking
Wasilewski Adaptive segmentation of wavelet transform coefficients for video compression
Hsieh et al. Application of grey polynomial interpolation to reduce the block effect in low bit rate coding
Zhang et al. Wavelet Based Image Compression System

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050829

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091125

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091125

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101125

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101125

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111125

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111125

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121125

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121125

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131125

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees