JP4045913B2 - 画像符号化装置、画像符号化方法、および画像処理装置 - Google Patents

画像符号化装置、画像符号化方法、および画像処理装置 Download PDF

Info

Publication number
JP4045913B2
JP4045913B2 JP2002282402A JP2002282402A JP4045913B2 JP 4045913 B2 JP4045913 B2 JP 4045913B2 JP 2002282402 A JP2002282402 A JP 2002282402A JP 2002282402 A JP2002282402 A JP 2002282402A JP 4045913 B2 JP4045913 B2 JP 4045913B2
Authority
JP
Japan
Prior art keywords
tile
distortion
complex
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002282402A
Other languages
English (en)
Other versions
JP2004120466A (ja
Inventor
利至 高橋
雅之 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2002282402A priority Critical patent/JP4045913B2/ja
Priority to TW92117535A priority patent/TWI222327B/zh
Priority to US10/489,180 priority patent/US7333661B2/en
Priority to PCT/JP2003/008901 priority patent/WO2004030343A1/ja
Priority to KR20047007959A priority patent/KR100611705B1/ko
Priority to EP03741377A priority patent/EP1545121A4/en
Priority to CNB03801629XA priority patent/CN1287584C/zh
Publication of JP2004120466A publication Critical patent/JP2004120466A/ja
Application granted granted Critical
Publication of JP4045913B2 publication Critical patent/JP4045913B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/645Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、入力画像を所定サイズのタイルに分割し、個々のタイルに含まれる画像信号を周波数成分へ変換し、得られた変換係数を量子化し、その量子化係数をエントロピー符号化する共に、その量子化歪を演算し、この量子化歪を用いて上記エントロピー符号化された符号化データの符号量を制御する画像符号化装置、画像符号化方法、および画像処理装置に関するものである。
【0002】
【従来の技術】
現在インターネットを中心に静止画像符号化アルゴリズムJPEGが広く普及しているが、一方で次世代の符号化方式としてさらなる性能改善、機能付加の要求を背景として、1997年より新たにJPEG2000プロジェクトがISOとITUの合同機関によりスタートした。2000年12月には同JPEG2000アルゴリズムの基本方式を定めるパート1についてその主要な技術内容が確定した。
【0003】
このJPEG2000の符号化アルゴリズムでは、入力画像信号に対し色座標変換を行い、タイル分割を行ってウェーブレット変換しているために、符号化レートを低くしていくと、そのタイル境界部に線状の歪(画質劣化)を生じ、滑らかさが損なわれた画像になってしまう。
【0004】
そのため、例えば、従来の画像処理装置では、このようなタイル境界に発生する歪を抑制するため、ウェーブレット変換処理においてタイル境界部で不足するデータを拡張する際にJPEG2000で定義されている対象拡張方法以外に、点対象拡張方法をも併用することでタイル境界部に存在する線状の歪を抑制しているものがある(例えば、特許文献1参照。)。
【特許文献1】
特開2001−217718号公報
【0005】
【発明が解決しようとする課題】
しかしながら、この従来の画像処理装置の場合、2つの拡張方法を切り替え制御しているため、どちらの拡張方法を使っているかを符号化データの中に埋め込む必要がある。これは、符号化データ量の増加という問題につながるだけでなく、JPEG2000の規格の範囲を超えているため、互換性が保てないという問題がある。
【0006】
また、このようなタイル境界の歪は、特に、背景領域などオブジェクトがない領域やテクスチャが少ない領域で目立つ。もともと背景領域には、ノイズに近いレベルの小さな揺らぎ信号がテクスチャ(揺らぎテクスチャと称す)としてわずかに含まれているものの、オブジェクトが存在するような複雑な領域に比べると、ウェーブレット変換時のハイパス成分が極端に少ない傾向にある。この背景領域のハイパス成分は、最終的な符号データを形成するレート制御機能によりそのほとんどが取り除かれてしまうために、より歪が目立ってしまうと考えられる。従って、この揺らぎテクスチャに該当するサブバンドを見つけ出し、周波数重み付け処理(frequency Weighting)によりそのサブバンドに高い重みを設定して、わずかに存在するテクスチャを再現することで、ディザリングの効果でタイル境界を抑制できると考えられる。しかしながら、この方法は、全てのタイルに対して同一の処理を施してしまうため、本来高い重みを設定しなくても良いタイルにまで高い重みを設定することになる。反対に、今まで視覚的に重要だった領域が相対的に低い重みが設定されてしまい、その部分の画質が低下してしまうことが考えられる。つまり、タイル境界に発生する歪を抑制するために、全タイルに均一の周波数重み付け処理を施すと、タイル境界は抑制できるかもしれないが、他の視覚的に重要な領域に画質劣化が発生してしまうという問題がある。
【0007】
この点を実際に実験で確認してみたところ、ウェーブレット変換回数を「n」とした時、背景領域のテクスチャについては、分解レベル「n−1」のサブバンドが画質的大きくに寄与していることがわかった。ここで分解レベル「n」は最高解像度のサブバンドを表すこととする。この時、周波数重み付け処理により、分解レベル「n−1」のサブバンドの強調処理を行ったところ、このテクスチャが再現されることによりディザリングに似た効果を発揮し、タイル境界に発生していた歪が抑制できるものの、一方で、特に解像度の高い斜めの方向性をもつエッジ部分でギザギザ(ジャギー)が目立ってしまうという問題が生じた。これは、分解レベル「n−1」のサブバンドの情報を優先することにより、高い解像度を持つ分解レベル「n」の情報が削られていることに他ならない。
【0008】
また、JPEG2000には最終的な符号データ量を一定の範囲内に収め、かつその範囲内で平均二乗誤差を基準にした最高画質を提供するレート制御機能が用意されている。しかしながら、実際の再生画像を見ると、誤差が低いからといって、必ずしも視覚的に良好な画像を再現できない場合があるという問題がある。例えば、人の顔の画像を符号化しようとすると、肌のきめ細かなテクスチャが取り除かれ、ツルツルとした精細度を欠いた画像となってしまう。これは、ウェーブレット変換係数の高域成分が低域成分に比べ画質に影響しにくいため、レート制御機能によりこの部分の情報が優先的に削除されてしまうためと考えられる。このような問題に対しては、先に説明した周波数重み付け処理が有効である。例えば、人の肌のテクスチャを再現するには、そのテクスチャに該当するウェーブレット変換領域でのサブバンドを見つけ出し、そのサブバンドの重みを高く設定することで、そのテクスチャを良好に再現することができる。しかしながら、全てのタイルに対して同一の処理を施してしまうため、本来高い重みを設定しなくても良いタイルにまで高い重みを設定することになる。反対に、今まで視覚的に重要だった領域が相対的に低い重みが設定されてしまい、その部分の画質が低下してしまうことが考えられる。つまり、人の肌のようなきめ細かなテクスチャの再現性を向上させるために、全タイルに統一した周波数重み付け処理を施すと、人の肌の部分では高品質化できるかもしれないが、他の視覚的に重要な領域に画質劣化が発生してしまうという問題がある。
【0009】
この点を実際に実験で確認してみたところ、ウェーブレット変換回数を「n」とした時、人物の顔(肌)のテクスチャについては、分解レベル「n−1」のサブバンドが画質的大きくに寄与していることがわかった。そこで、周波数重み付け処理により、分解レベル「n−1」のサブバンドの強調処理を行ったところ、肌の再現性は良好になったものの、特に斜めの方向性をもつ髪の毛の部分でギザギザ(ジャギー)が目立ってしまうという問題を生じた。これは、分解レベル「n−1」のサブバンドの情報を優先することにより、髪の毛などの高い解像度を持つ分解レベル「n」の情報が削られていることに他ならない。
【0010】
そこで、この発明は上記のような問題点を解決するためになされたもので、入力画像をタイル分割して符号化する場合でも、タイルに応じて画像信号の符号化レートを弾力的に制御することにより、各タイルの性質に応じより細かな画質調整を可能にして、画像全体として良好な再生画像を得ることのできる画像符号化装置、画像符号化方法、および画像処理装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するため、本発明の画像符号化装置は、入力画像を所定サイズのタイルに分割し、個々のタイルに含まれる画像信号を周波数成分へ変換することで帯域分割された複数のサブバンドに対応した変換係数を得て、得られた変換係数を量子化し、得られた量子化係数をエントロピー符号化すると共に、上記量子化係数から量子化歪を演算し、この量子化歪を用いて上記エントロピー符号化された符号化データの符号量を制御する画像符号化装置であって、上記変換係数を参照して、当該タイルが複雑なテクスチャにより構成される複雑タイルか、複雑なテクスチャが存在しない単純タイルかを判定する複雑タイル判定部と、上記変換係数を参照して、当該タイルが斜め方向に相関が強い斜めタイルであるか否かを判定する斜めタイル判定部と、この斜めタイル判定部および上記複雑タイル判定部による判定に基づいて、タイルカテゴリに適したように当該タイルの所定のサブバンドに対して所定の重みを設定して、上記所定のサブバンドの量子化歪に上記設定された重みを付ける重み付け部と、この重み付け部により重み付けられた量子化歪に基づいて、上記エントロピー符号化された符号データの符号量を制御するレート制御部とを有する画像符号化装置である。
また、本発明の画像符号化方法は、入力画像を所定サイズのタイルに分割し、個々のタイルに含まれる画像信号を周波数成分へ変換することで帯域分割された複数のサブバンドに対応した変換係数を得て、得られた変換係数を量子化し、得られた量子化係数をエントロピー符号化すると共に、上記量子化係数から量子化歪を演算し、この量子化歪を用いて上記エントロピー符号化された符号化データの符号量を制御する際の画像符号化方法であって、上記変換係数を参照して、当該タイルが複雑なテクスチャにより構成される複雑タイルか、複雑なテクスチャが存在しない単純タイルかを判定する複雑タイル判定を行い、上記変換係数を参照して、当該タイルが斜め方向に相関が強い斜めタイルであるか否かを判定する斜めタイル判定を行い、この斜めタイル判定および上記複雑タイル判定による判定に基づいて、タイルカテゴリに適したように当該タイルの所定のサブバンドに対して所定の重みを設定して、上記所定のサブバンドの量子化歪に上記設定された重みを付け、この重み付けられた量子化歪に基づいて、上記エントロピー符号化された符号化データの符号量を制御する画像符号化方法である。
また、本発明の画像処理装置は、上記画像符号化装置を備え、この画像符号化装置により符号量を制御された符号化データを処理する画像処理装置である。
【0012】
【発明の実施の形態】
実施の形態1.
図1に、本実施の形態1の画像符号化装置のブロック構成図を示す。図1において、101は必要に応じてRGB信号からYCbCr等への色空間座標の変換を行う色座標変換部、102は各色成分信号をタイルと呼ばれる複数の矩形に分割するタイル分割部、103は2次元のウェーブレット変換を行うウェーブレット変換部、104はウェーブレット変換部で生成された変換係数を設定された量子化ステップサイズで量子化を行う量子化処理部、105は量子化されたウェーブレット変換係数を2値算術符号化するためのモデリングを行う係数モデリング部、106は算術符号化によりエントロピー符号化を行うエントロピー符号化部、107はエントロピー符号化された符号データを格納する符号メモリ、108はエントロピー符号化する単位に歪を計算する歪計算部、109は該歪計算部108で計算された歪データを格納する歪メモリ、110は歪メモリ109から出力される歪データに対して所望の重み係数を乗じる乗算器、111は各タイルのウェーブレット変換係数からそのタイルが複雑なテクスチャを多く含む複雑タイルであるか否かを判定する複雑タイル判定部、112は該複雑タイル判定部111の出力を格納するタイル種別メモリ、113は該タイル種別メモリ112の出力を受けて予め格納されている複数の重み係数から対応する重み係数を選択する重み係数選択部、114は乗算器110から出力される重み付けされた歪データを考慮して符号メモリ107に格納されている符号データから必要なデータを選択し、設定された目標符号量に収まるようレート制御するレート制御部、301は複雑タイル判定部111を有するタイル分類部である。なお、図1の構成では、重み係数選択部113と乗算器110とにより本発明の重み付け部を構成している。
【0013】
次に動作について説明する。
不図示の画像入力装置、例えば、イメージスキャナやデジタルカメラ、もしくはネットワークや記憶媒体等から入力された画像信号は、必要に応じて、色座標変換部101で色空間座標の変換を行う。一般には、カラーのRGB信号が入力された場合には、非可逆圧縮の場合は輝度信号(Y)と色差信号(Cb、Cr)への変換が、可逆圧縮の場合には損失のないRCT変換が行われる。また、モノクロの画像信号が入力された場合には本色座標変換部はバイパスされる。
【0014】
タイル分割部102では、色座標変換部101から入力される各色成分信号に対して、タイルと呼ばれる複数の矩形領域に分割する。以降の処理ではこのタイルをあたかも一つの画像のように扱うこととする。
【0015】
ウェーブレット変換部103では、1つのタイルを1つの画像とみなして2次元のウェーブレット変換を施し、複数のサブバンドに帯域分割する。ここで2次元のウェーブレット変換は1次元のウェーブレット変換の組み合わせとして実現される。つまり、水平方向の一次元ウェーブレット変換をライン毎に順次行う処理と、垂直方向の一次元ウェーブレット変換を列毎に順次行う処理である。
【0016】
図2に、ウェーブレット変換部103の構成や動作の概略例を示す。図2(a)は、ウェーブレット変換部103における1次元のウェーブレット変換部分の構成例を示すもので、1次元のウェーブレット変換は所定の特性を持つローパスフィルタと、ハイパスフィルタと、ダウンサンプラとから構成されており、2次元のウェーブレット変換は1次元のウェーブレット変換の組み合わせとして実現される。ところで、これらのフィルタ処理のタップ(係数)の数は、非可逆圧縮ローパスフィルタで9、ハイパスフィルタで7、可逆圧縮ローパスフィルタで5、ハイパスフィルタで3が用いられるため、画像の端、またはタイルの端部分ではデータが不足することになり、それを補う拡張処理が必要である。このため、JPEG2000では、図2(b)に示すような鏡のように折り返す拡張方法(対象拡張)が用いられている。こうして生成された2次元のウェーブレット変換係数は、低域成分をL、高域成分をHとし、主走査方向の変換を1文字目、副走査方向の変換を2文字目で表現することで、図2(c)に示すようにLL、HL、LH、HHと表現される。また、これらの帯域分割された成分はサブバンドと呼ばれている。ここで、水平、垂直方向の低域成分(LL成分)は再帰的にウェーブレット変換が施される。再帰的に施される各ウェーブレット変換によって生成される各サブバンドを分解レベルと称し、図中LL、HL、LH、HHの前に記載された数字がこれにあたる。即ち、最低解像度のLL成分は常に分解レベル0となり、反対に最高解像度の高域成分HL,LH,HHの分解レベルはウェーブレット変換の回数と同一値になる。この図の例ではウェーブレット変換を2回行っているので、最高解像度成分の分解レベルは2となる。
【0017】
量子化処理部104では、サブバンド毎に設定された量子化ステップサイズによりウェーブレット変換係数を量子化する。
【0018】
係数モデリング部105では、各サブバンドのウェーブレット変換係数を符号ブロックと呼ばれる固定サイズの領域に分割した後、それぞれの符号ブロックの多値データを2値のビットプレーンに変換する。さらに、各ビットプレーンを3通りの符号化パス(Significance pass, Refinement pass, cleanup pass)に分割し、それぞれの符号化パス毎にエントロピー符号化するためのコンテクストモデリングを行う。
【0019】
3つの符号化パスから出力される2値信号はエントロピー符号化部106によって算術符号化が行われる。
【0020】
エントロピー符号化部106で生成された符号化データは一旦符号メモリ107に格納される。
【0021】
これらの符号化処理と並行して、歪計算部108では、各符号ブロックの各符号化パス単位に、歪を計算する。算出された歪データは、色成分、タイル番号、サブバンド、符号ブロック、符号化パスが特定できるようなインデックスが付与された後、歪メモリ109に格納される。
【0022】
タイル分離部301の複雑タイル判定部111では、複雑度を表す指標として、輝度成分おける各タイルのHH成分に対して、以下の(式1)を使って平均電力Ptを計算する。
【0023】
Figure 0004045913
【0024】
ここで、添字tはタイル番号、C(i,j)は位置(i,j)のHH成分の変換係数、JmaxはHH成分の主走査方向のサンプル数、Imaxは副走査方向のサンプル数を表している。
【0025】
次に、ある閾値Tpを設定し、以下の判定式に従って複雑タイルであるか、単純タイルであるか当該タイルのカテゴリを判定する。
【0026】
If(Pt>Tp) ・・・ 複雑タイル
Else ・・・ 単純タイル
【0027】
複雑タイル判定部111の出力は、いったんタイル種別メモリ112に格納される。
【0028】
以上の処理により、符号メモリ107には符号データが、歪メモリ109に歪データが、タイル種別メモリ112にはタイルカテゴリが、全タイルにわたり格納されることになる。これらの情報を利用して、レート制御部114でレート制御を行うことになる。
【0029】
ここで、レート制御方法について説明する。
歪メモリ109から読み出した歪の総和が最小になり、かつトータルの符号量が目標符号量以下になるという2つの条件を同時に満足させながら、符号化パス毎に符号データを抽出する。この2つの条件を同時に満足させる最適化演算には、ラグランジェの未定乗数法を利用することで解決することができる。今、符号化パス毎の歪をDi、符号化パス毎の符号量をRiとした時、ある値λに対して、
【0030】
Figure 0004045913
【0031】
が最小となるような符号化パスの位置iを計算する。この時の総符号量R
【0032】
Figure 0004045913
【0033】
が目標符号量になるようにλを繰り返し調整する。なお、ここで添字iは符号化パスと記されているが、これは、全色成分、全タイル、全分解レベルの符号化パスを表している。
【0034】
図1に戻り、歪メモリ109からはレート制御部114から出力される符号化パス、符号ブロック、サブバンド、タイル番号、色成分のインデックスに応じて各符号化パス単位の歪データDiが出力され、乗算器110では、各符号化パス単位の歪データDiに重み係数選択部113で選択された重み係数を乗じることになる。
【0035】
ここで重み係数選択部113について、図3を使って詳しく説明する。
【0036】
図3は、図1に示す重み係数選択部113の詳細構成を示す図である。図3において、201は複数の重み係数をそれぞれ格納した複数のレジスタを表す重み係数レジスタ群、202は重み係数レジスタ群201の出力である複数の重み係数から選択信号をもとに所望の重み係数を選択する選択部である。以下動作について説明する。
【0037】
重み係数レジスタ群201の各レジスタには、先に述べた2つのタイルカテゴリ毎に各サブバンドの重み係数を設定しておくものとする。従って、色成分3、分解レベル3の場合には、3色成分×(3分解レベル×3サブバンド+1サブバンド)×2タイルカテゴリ=60の重み係数を設定することになる。まず、レート制御部114からタイル種別メモリ112に、現在処理しようとしている符号化パスが所属するタイルの番号が入力されると、そのタイル番号に該当するタイルカテゴリ信号が出力され、重み係数選択部113に入力される。重み係数選択部113の選択部202へは、タイル種別メモリ112からタイルカテゴリが、レート制御部114から現在処理しようとしている符号化パスが所属する色成分、サブバンドを示すインデックスが選択信号として入力されるので、選択部202では、これらの入力選択信号に基づき該当する重み係数を選択し、乗算器110へ出力する。乗算器110では、上述したように各符号化パス単位の歪データDiに重み係数選択部113で選択された重み係数を乗じて出力する。なお、図4(a)、(b)、(c)には、それぞれ歪メモリ109、タイル種別メモリ112、重み係数レジスタ群201におけるデータの格納方法の一例を示しておく。
【0038】
こうして、図1の乗算器110からは重み付けされた符号化パス毎の歪Diがレート制御部114へ出力され、レート制御部114では、乗算器110から入力する重み付けされた符号化パス毎の歪Diに基づいて、符号メモリ107からの符号データのデータが、目標とする符号サイズ以下になるように符号化データのレート制御、すなわち符号量を調整し、かつその目標符号サイズ内で再現できる最高の画質を提供するようにする。
【0039】
つまり、本実施の形態1では、上述したようにエントロピー符号化部106におけるエントロピー符号化処理と並行して、歪み計算部108にて符号化パス単位に量子化時の誤差の二乗平均を歪として計算しておき、かつ、その歪みにタイルカテゴリ毎の重み係数が乗じられるので、レート制御部114では、この重み係数が乗じられた歪が最小になるように、符号化パス単位に符号化データを選択的に取得し、トータルの符号量が目標とする符号サイズ内に収まるようにすることで、目標符号量における最高の画質を提供する。なお、この歪最小、目標符号量以下、という2つの条件を同時に満足させるには最適化演算が必要になるが、これには上述したようにラグランジェの未定乗数法等を利用している。
【0040】
以上のように、本実施の形態1においては、各タイルをその性質から複雑タイル、単純タイルの2つのカテゴリに分類し、それぞれのタイルカテゴリに適したようにサブバンド毎に重みを設定することできる。これにより、全タイルにわたり均一の重み設定だった従来方式に比べ、画質設定の自由度が広がったことにより、より細かな画質調整が可能になるという効果がある。
【0041】
その結果、例えば、タイル境界に発生する線状の歪を抑制したい場合には、背景領域に存在する細かな揺らぎテクスチャを残すために、背景領域と識別される単純タイルに対しては、揺らぎテクスチャに該当するサブバンド成分に高い重みを設定する。その一方、背景領域と識別されない複雑タイルにおいては必要以上に情報量が割り当てられている可能性が高いので、複雑タイルにおいて比較的重要度の低い高域成分に低い重みを設定する。このように、複雑タイルで稼いだ情報量を単純タイルの揺らぎテクスチャに相当するサブバンドに割り当てることにより、タイル境界を抑制できるという効果がある。
【0042】
実施の形態2.
図5に、本実施の形態2の画像符号化装置のブロック構成図を示す。図5において、図1と同一符号のブロックが存在するが、これは実施の形態1で説明した動作と全く同一の動作をするものとする。図5が図1と異なっているのはタイル分類部301、及び重み係数選択部302である。このタイル分類部301は各タイルの性質から3つのカテゴリに分類するものであり、重み係数選択部302は3つのカテゴリに応じた重み係数から所望の重み係数を選択するものである。
【0043】
ここで、図6を使ってタイル分類部301について詳しく説明する。
図6は、タイル分類部301の詳細構成を示す図である。同図において、111は図1に示す複雑タイル判定部111と全く同一で、当該タイルが複雑タイルであるか否かを判定する複雑タイル判定部、401は当該タイルが斜めタイルであるか否かを判定する斜めタイル判定部、402は複雑タイル判定部111と斜めタイル判定部401の出力を受けて当該タイルが複雑タイル、単純タイル、斜めタイルのいずれのタイルカテゴリに該当するかを判定する総合判定部である。
【0044】
次に動作について説明する。
複雑タイル判定部111は、実施の形態1で説明した動作と全く同一の動作を行う。
【0045】
次に、斜めタイル判定部401について図7を使って説明する。
図7は、斜めタイル判定部401の詳細構成を示す図である。図7において、501は所望のサブバンドの自己相関係数を計算する自己相関演算部、502は自己相関演算部501の出力である自己相関係数から当該タイルが斜めタイルであるか否かを判定する判定部である。
【0046】
次に動作について説明する。自己相関演算部501では各タイルにおける最高解像度の分解レベルn(最高解像度)のHH成分に対して自己相関係数Atを以下の式(4)を使って計算する。
【0047】
Figure 0004045913
【0048】
ここで、x、yは自己相関係数の位置を表しており、それぞれ−2≦x≦2、−2≦y≦2を満たす整数である。具体的には、At(x,y)は図8に示す位置の自己相関係数を表している。
【0049】
判定部502では、自己相関係数At(x,y)を利用して当該タイルが斜め方向に相関が強い斜めタイルであるか否かを判定する。最初に25個の自己相関係数At(x,y)に対して負の値を持つものは0になるように補正する。補正された係数At(x,y)に対して、以下の判定式(5),(6)によりそれぞれsum1及びsum2を求め、
【0050】
Figure 0004045913
【0051】
Figure 0004045913
【0052】
次のようにsum1とsum2との比と、実験やシミュレーション等の経験により求めた閾値Taと比較して、例えば以下に示すようにsum1とsum2との比が閾値Taより大きい場合には当該タイルが斜めタイル、sum1とsum2との比が閾値Taより小さい場合には非斜めタイルであると判定する。
If(sum1/sum2>Ta) or (sum2/sum1>Ta) ・・・ 斜めタイル
Else ・・・ 非斜めタイル
【0053】
図9は、sum1及びsum2が、それぞれどの自己相関係数の和をとったものかをわかりやすく説明する図である。図9(a)の網掛けで示している右下がりの自己相関係数の和がsum1を、図9(b)の網掛けで示している右上がりの自己相関係数の和がsum2を表している。本判定では、sum1とsum2のいずれかに偏りがある場合に斜めタイルと判定するようにしている。
【0054】
ここで図6に戻り、総合判定部402では、複雑タイル判定部111、及び斜めタイル部401の判定出力を受けて、例えば以下に示すように複雑タイルの判定出力の入力が無しであれば単純タイルのカテゴリ、複雑タイルの判定出力の入力が有れば、斜めタイルの判定出力の入力の有無により無しであれば複雑タイルのカテゴリ、あれば斜めタイルのカテゴリと判定し、当該タイルが複雑タイル、単純タイル、斜めタイルのいずれのタイルカテゴリであるかを判定する。
【0055】
if(複雑タイル) {
if(斜めタイル) ・・・ 斜めタイル
else ・・・ 複雑タイル

else ・・・ 単純タイル
【0056】
ここで、最終的に斜めタイルと判定されるタイルはある程度HH成分の平均電力が高いことが条件となっていることがわかる。
【0057】
以上の構成により、注目タイルが複雑タイル、単純タイル、斜めタイルのいずれのカテゴリに属するか分類できたら、その信号は一旦タイル種別メモリ112に格納される。
【0058】
本実施の形態2の重み係数選択部302は、複雑タイル、単純タイル、斜めタイルに対応したサブバンド毎の重み係数を予め格納しており、タイル種別メモリ112からの注目タイルのタイルカテゴリや、レート制御部114からの現在処理しようとしている符号化パスが所属する色成分、およびサブバンドを示すインデックスを選択信号として、これらの選択信号に基づきサブバンド毎の重み係数を選択する。
【0059】
こうして歪メモリ109から出力される歪データに対応する重み係数が重み係数選択部302から選択されて乗算器110へ出力され、乗算器110にて歪データとそれに対応する重み係数が乗じられた後、レート制御部114では、上記実施の形態1の場合と同様に、符号化データでの符号量制御、すなわちレート制御を行う。
【0060】
以上のように、本実施の形態2においては、各タイルをその性質から複雑タイル、単純タイル、斜めタイルの3つのカテゴリに分類し、それぞれのタイルカテゴリに適したようにサブバンド毎に重みを設定することできる。これにより、実施の形態1の場合と同様に、全タイルにわたり均一の重み設定だった従来方式に比べ、さらに画質設定の自由度が広がったことにより、より細かな画質調整が可能になるという効果がある。
【0061】
特に、実施の形態1に比べタイルカテゴリが複雑タイル、単純タイル、斜めタイルの3種類に増えたことにより、画質設定の自由度が広がり、より細かな画質調整が可能になるという効果がある。例えば、原画像に斜線や斜めエッジが多く存在するような画像をタイル分割して符号化する場合には、例えば単純タイルには背景領域の揺らぎテクスチャに相当するサブバンドに高い重みを設定し、複雑タイルには関連するサブバンドの重みを低く設定、さらに斜めタイルについては斜め成分、つまりHH成分を中心に高い重みを設定するようにする。こうすることで、タイル境界部に発生する線状の歪を抑制できるだけでなく、斜めエッジが多く存在するタイルでもジャギーが発生することなく良好な画像を再現できるという効果がある。
【0062】
実施の形態3.
基本的なブロック構成図は、実施の形態2で説明した図5と同一である。本実施の形態3では、図5におけるタイル分類部301の構成が異なっており、具体的には新たに肌色タイルの検出処理が付加されている。以下、本実施の形態3におけるタイル分類部の構成、動作について図10を使って説明する。
【0063】
図10は、本実施の形態3のタイル判定部301の詳細構成を示している。図10において、111は図1や図6に示すものと同じ複雑タイル判定部、401は図6に示すものと同じ斜めタイル判定部である。801は当該タイルが肌色の多いタイルであるか否かを検出する肌色タイル判定部、802は複雑タイル判定部111と斜めタイル判定部401と肌色タイル判定部801の出力を受けて、当該タイルが後述する4つタイルカテゴリのいずれに該当するかを判定する総合判定部である。
【0064】
次に動作について説明する。
まず、肌色タイル判定部801では、各係数が肌色であるか否かを検出する。具体的には、色座標変換部101でRGB信号をHSL表色系の信号に変換し、そのウェーブレット変換後の0LL成分が、H(色相)、S(彩度)、L(明度)全ての色成分に対してある閾値の範囲にある場合に肌色と判定する。それぞれのの色成分の上限、下限の閾値を、添え字max、minで表すと、この判定は次のように示すことができる。
【0065】
Figure 0004045913
【0066】
肌色タイル判定部801は、こうして検出された肌色の係数をカウントし、そのカウント値が所定の閾値よりも大きければ、肌色タイルと判定して出力する。
【0067】
なお、複雑タイル判定部111および斜めタイル判定部401は、上述の実施の形態1や実施の形態2の場合と同様に動作する。
【0068】
総合判定部802では、複雑タイル判定部111、斜めタイル判定部401、肌色タイル判定部801の判定出力を入力して、当該タイルが複雑タイル、単純タイル、斜めタイル、肌色タイルのいずれに属するかを、例えば以下に示すように判定する。つまり、肌色タイルの判定出力が入力していれば肌色タイルのカテゴリと判定し、肌色タイルの判定出力が入力していなければ、複雑タイルの判定出力の入力の有無により無しであれば単純タイルのカテゴリ、複雑タイルの判定出力の入力が有れば、斜めタイルの判定出力の入力の有無により無しであれば複雑タイルのカテゴリ、あれば斜めタイルのカテゴリと判定する。
【0069】
if(肌色タイル) ・・・ 肌色タイル
else if(複雑タイル) {
if(斜めタイル) ・・・ 斜めタイル
else ・・・ 複雑タイル

else ・・・ 単純タイル
【0070】
以上の構成により、注目タイルが複雑タイル、単純タイル、斜めタイル、肌色タイルのいずれのカテゴリに属するか分類できたら、その信号は一旦タイル種別メモリ112に格納される。
【0071】
ところで、本実施の形態3の重み係数選択部302には、複雑タイル、単純タイル、斜めタイル、肌色タイルに対応した各サブバンドの重み係数が格納されており、実施の形態1,2等の場合と同様に、タイルカテゴリやサブバンドを示す選択信号等によって選択される。なお、上述の実施の形態2の重み係数選択部302には、複雑タイル、単純タイル、斜めタイルの3種類のタイルに対応した重み係数が格納されているが、本実施の形態3では複雑タイル、単純タイル、斜めタイル、肌色タイルの4種類のタイルに対応した重み係数を格納されているものとする。
【0072】
こうして歪メモリ109から出力される歪データに対応する重み係数が重み係数選択部302から選択されて乗算器110へ出力され、乗算器110にて歪データとそれに対応する重み係数が乗じられた後、レート制御部114でレート制御が行われる。
【0073】
以上のように、本実施の形態3においては、各タイルをその性質から複雑タイル、単純タイル、斜めタイル、肌色タイルの4つのカテゴリに分類し、それぞれのタイル種別に適したようにサブバンド毎に重みを設定することできる。これにより、実施の形態1,2の場合と同様に、全タイルにわたり均一の重み設定だった従来方式に比べ、さらに画質設定の自由度が広がったことにより、より細かな画質調整が可能になるという効果がある。
【0074】
特に、実施の形態2の場合に比べ、タイルカテゴリが複雑タイル、単純タイル、斜めタイル、肌色タイルの4種類に増えたことにより、画質設定の自由度が広がり、より細かな画質調整が可能になるという効果がある。例えば、人物画像があげられる。従来方式では、人物画像において、人の肌(特に顔)に存在する細かなテクスチャと斜め方向の髪の毛は、ウェーブレット変換した際にはそれぞれ異なるサブバンドにその特徴が現れるため、両者の画質を同時に満足させることが難しかったが、本実施の形態3では、まず、肌色タイルに対してはそこに存在するテクスチャに該当するサブバンドに高い重みを設定し、斜めの髪の毛が該当する斜めタイルについても同様に関連するサブバンドに高い重みを設定し、背景領域と識別される単純タイルや、背景領域と識別されない複雑タイルには実施の形態1、2で説明した場合と同様に重みを設定する。こうすることで、肌色のテクスチャ、斜めの髪の毛の両方の画質を同時に満足させ、かつタイル境界に発生する線状の歪も抑制することができるという効果がある。
【0075】
実施の形態4.
実施の形態2で述べた斜めタイル判定部401では、図8に示すように周囲24画素を参照する構成としたが、本実施の形態4では、例えば図11に示すように周囲8画素を参照して斜め方向を検出することを特徴とする。この場合、斜めタイル判定部401の判定部502での判定処理は、実施の形態2の場合と同様に、まず9個の自己相関係数At(x,y)に対して負の値を持つものは0になるように補正し、補正された係数At(x,y)に対して、以下の判定式(式7),(式8)によりそれぞれsum1及びsum2を求め、sum1とsum2との比と、実験やシミュレーション等の経験により求めた閾値Taと比較して、例えば以下に示すようにsum1とsum2との比が閾値Taより大きい場合には当該タイルが斜めタイル、sum1とsum2との比が閾値Taより小さい場合には非斜めタイルであると判定する。
【0076】
sum1= At(-1,-1)+At(1,1); …(式7)
【0077】
sum2= At(1,-1)+At(1,-1); …(式8)
【0078】
If(sum1/sum2>Ta) or (sum2/sum1>Ta) ・・・ 斜めタイル
Else ・・・ 非斜めタイル
【0079】
図11からもわかるように、本実施の形態4では、45°の斜め方向の検出のみとなるため、若干斜めタイルの検出精度が低くなるものの、実施の形態2とほぼ同様の効果を奏することができる。さらに、参照するウェーブレット変換係数を減らすことで自己相関係数を計算する(式4)の演算量を少なくできるため、回路規模を削減でき、判定処理のスピードも向上できるという効果がある。
【0080】
実施の形態5.
本実施の形態5は、実施の形態2で述べた斜めタイル判定方法とは異なる方法で斜めタイルを検出するものである。以下、図12を使って、本実施の形態5における斜めタイル判定部401を説明する。
【0081】
図12は、本実施の形態5の斜めタイル判定部401の詳細構成を示す図である。図12において、1001は入力されてくるウェーブレット変換係数を2値化処理する2値化部、1002は予め定めた斜め方向の2値パターンを記憶する斜めパターン記憶部、1003は該2値化部1001と斜めパターン記憶部1002の出力を照合して注目している係数が斜めの方向性を持つか否かを識別するマッチング部、1004は斜め方向の2値パターンとマッチングした係数の数をカウントするカウンタ部、1005は最終的な斜めパターンの係数の数から当該タイルが斜めタイルか否かを判定する判定部である。
【0082】
次に具体的な動作について説明する。
2値化部1001では、各タイルにおける例えば最高解像度の分解レベルn(最高解像度)のHH成分Ct(x,y)を、次に示すようにある閾値Tcと比較して、2値化処理する。
【0083】
If(Ct(x,y) > Tc) Bt(x,y) = 1;
Else Bt(x,y) = 0;
【0084】
マッチング部1003では、この2値化処理結果Bt(x、y)に対して、斜めパターン記憶部1002にあらかじめ格納されている斜め方向の2値パターンとのマッチングを行い、これに合致すれば1を、そうでなければ0を出力する。
【0085】
図13に、斜めパターン記憶部1002にあらかじめ格納されている斜め方向の2値パターンの一例を幾つか示す。これら図13に示す各斜め方向の2値パターン例中“x”は、参照しない2値化結果(Don‘t Care)を表している。
【0086】
カウンタ部1004では、該マッチング部1003の出力が1の場合にはカウント値Ntに+1を加算し、そうでなければなにも加算しない。こうして、斜めパターンとマッチングする係数の数Ntをタイル単位にカウントし、判定部1005では、以下に示すように最終的なカウント値Ntを閾値Tnと比較することによって、当該タイルが斜めタイルか否かを判定する。
【0087】
If(Nt > Tn) ・・・ 斜めタイル
Else ・・・ 非斜めタイル
【0088】
以上のように、本実施の形態5によれば、各タイルにおける最高解像度の分解レベルn(最高解像度)のHH成分の2値化処理して、事前に登録しておいた斜め方向の2値パターンとマッチングをとることにより、斜めタイルを検出することができ、実施の形態2と同様の効果を奏することができる。
【0089】
特に、実施の形態2では、自己相関係数を演算するために25回の乗算を行う必要があったが、本実施の形態5で説明した構成によれば、予め定められた斜めパターンを記憶しておき、それとのパターンマッチングの処理だけで斜めタイルを判定することができるため、実施の形態2の場合と較べ、少ないH/W規模で実装でき、かつ、高速判定が可能であるという効果がある。
【0090】
実施の形態6.
実施の形態5で述べた斜めタイル判定部401では、図13に示すように周囲24画素を参照する構成としたが、本実施の形態6では、実施の形態4と同様に、図14に示すように周囲8画素を参照して斜め方向を検出することを特徴とする。
【0091】
このようにすれば、実施の形態4の場合と同様、同図からもわかるように、本実施の形態6では45°の斜め方向の検出のみとなるため、若干斜めタイルの検出精度が低くなるものの、実施の形態5とほぼ同様の効果を奏することができる。さらに、参照画素を小さくすることで不図示のラインメモリの容量や、斜めパターンを記憶する容量などを削減できると共に、高速に判定できるという効果もある。
【0092】
なお、上記実施の形態1〜6では、複雑タイル判定部111の複雑度の計算を、HH成分の平均電力として説明したが、これに限るものではない。参照するサブバンドをHH成分に限定させず、HL,LH,HH全ての高域成分を利用しても良い。また複雑度も平均電力ではなく、例えば係数の絶対値や分散などによって計算しても良い。特に、絶対値を用いれば二乗計算を行わなくてすむためH/W規模も少なくてすむ。
【0093】
また、上記実施の形態2〜6等では、斜めタイル判定部401では、最高解像度の分解レベルのHH成分を参照して計算を行うものとして説明したが、これに限るものではなく、他のHL,LH等のサブバンドを参照して斜めタイルの検出を行っても良い。
【0094】
また、上記実施の形態5,6等で説明した図13、14に示した斜めパターンは一例であり、これに限ったものではない。特に、同図は1ドットの線幅の斜線(または斜めエッジ)であるが、例えばこれを線幅2ドットのものも検出できるようにしても良い。
【0095】
また、上記実施の形態1〜6では、画質を制御するための方法として周波数重み付け技術(Frequency Weighting)を利用して、サブバンド毎に設定された重みを歪みに乗じるように説明したが、これに限らず、サブバンド毎に設定された重みを、ウェーブレット変換部103の出力であるウェーブレット変換係数に乗じることにより、所望のサブバンドを強調した画質制御を可能にしても良い。このようにする場合には、歪みメモリ109の出力である歪はそのまま直接レート制御部114に入力し、重み係数選択部113からの重み係数はウェーブレット変換部103と量子化部104の間でタイル分類部301への分岐点より量子化部104側に新たに設けた乗算器に入力するように構成すればよい。これにより、例えば、必ずある程度の距離を離れて再生画像を見る環境では、細かな解像度が必要ないため、ウェーブレット変換係数の最高解像度成分に低い重みを設定し、その分他の低解像度の変換係数に有効に情報量を割り当てることができるようになる。
【0096】
また、上記実施の形態1〜6では、画像信号を周波数成分へ変換する変換部を、JPEG2000等で規格化されているウエーブレット変換部103を一例として説明したが、本発明では、ウエーブレット変換部103に限定されるものではなく、画像信号を周波数成分へ変換することが可能な変換方式であれば何でも良い。
【0097】
また、上記実施の形態1〜6で説明した画像符号化装置をLSIとして、またその画像符号化方法をソフトウエアとして、静止画像を入力画像として処理するディジタルカメラや監視カメラ、イメージスキャナ等の画像処理装置に実装されることは言うまでもない。このような画像処理装置では、この画像符号化装置により符号量を制御された符号化データを各種画像処理したり、さらには通信処理部を介して送受信することができる。
【0098】
【発明の効果】
以上説明したように、本発明によれば、変換係数を参照して各タイルをその性質に応じ複数のカテゴリに分類すると共に、その複数のカテゴリ毎に上記量子化歪に重みを付け、重み係数が付けられた量子化歪に基づいてエントロピー符号化された符号データの符号量を制御するようにしたので、入力画像をタイル分割して符号化する場合でも、タイルに応じて画像信号の符号化レートを弾力的に制御することができる。
【0099】
その結果、全タイルにわたり均一の重み設定だった従来方式に比べると、画質設定の自由度が広がったことにより、各タイルの性質に応じより細かな画質調整が可能になり、画像全体の符号化レートを下げるようなことがあっても良好な再生画像を得ることができることになる。例えば、タイル境界に発生する線状の歪を抑制したい場合には、背景領域に存在する細かな揺らぎテクスチャを残すために、背景領域と識別される単純タイルに対しては、揺らぎテクスチャに該当するサブバンド成分に高い重みを設定する。その一方、背景領域と識別されない複雑タイルにおいては必要以上に情報量が割り当てられている可能性が高いので、複雑タイルにおいて比較的重要度の低い高域成分に低い重みを設定する。このように、複雑タイルで稼いだ情報量を単純タイルの揺らぎテクスチャに相当するサブバンドに割り当てることにより、タイル境界を抑制できるという効果がある。
【図面の簡単な説明】
【図1】 実施の形態1の画像符号化装置を示すブロック構成図。
【図2】 ウェーブレット変換部103の構成や動作の概略例を示す図。
【図3】 図1に示す重み係数選択部113の詳細構成を示す図。
【図4】歪メモリ109、タイル種別メモリ112、重み係数選択部113にデータを格納する一例を示す図。
【図5】 実施の形態2の画像符号化装置を示すブロック構成図。
【図6】 実施の形態2のタイル分類部301の詳細構成を示す図。
【図7】 実施の形態2の斜めタイル判定部401の詳細構成を示す図。
【図8】 自己相関演算部501における自己相関係数の一例を示す図。
【図9】 sum1及びsum2が、それぞれどの自己相関係数の和をとったものかをわかりやすく説明する図。
【図10】 実施の形態3のタイル判定部301の詳細構成を示を示す図。
【図11】 実施の形態4において斜め方向を検出する際の参照画素を示す図。
【図12】 実施の形態5の斜めタイル判定部401の詳細構成を示す図。
【図13】 実施の形態5における斜めパターン記憶部1002にあらかじめ格納されている斜め方向の2値パターンの一例を示す図。
【図14】 実施の形態6における斜めパターン記憶部1002にあらかじめ格納されている斜め方向の2値パターンの一例を示す図。
【符合の説明】
101 色座標変換部、102 タイル分割部、103 ウェーブレット変換部、104 量子化処理部、105 係数モデリング部、106 エントロピー符号化部、107 符号メモリ、108 歪計算部、109 歪メモリ、110乗算器、111 複雑タイル判定部、112 タイル種別メモリ、113 重み係数選択部、114 レート制御部、301 タイル分類部。

Claims (6)

  1. 入力画像を所定サイズのタイルに分割し、個々のタイルに含まれる画像信号を周波数成分へ変換することで帯域分割された複数のサブバンドに対応した変換係数を得て、得られた変換係数を量子化し、得られた量子化係数をエントロピー符号化すると共に、上記量子化係数から量子化歪を演算し、この量子化歪を用いて上記エントロピー符号化された符号化データの符号量を制御する画像符号化装置であって、
    上記変換係数を参照して、当該タイルが複雑なテクスチャにより構成される複雑タイルか、複雑なテクスチャが存在しない単純タイルかを判定する複雑タイル判定部と、
    上記変換係数を参照して、当該タイルが斜め方向に相関が強い斜めタイルであるか否かを判定する斜めタイル判定部と、
    この斜めタイル判定部および上記複雑タイル判定部による判定に基づいて、タイルカテゴリに適したように当該タイルの所定のサブバンドに対して所定の重みを設定して、上記所定のサブバンドの量子化歪に上記設定された重みを付ける重み付け部と、
    この重み付け部により重み付けられた量子化歪に基づいて、上記エントロピー符号化された符号化データの符号量を制御するレート制御部と
    を有する画像符号化装置。
  2. 請求項記載の画像符号化装置において、
    上記変換係数を参照して、当該タイルが肌色を多く含む肌色タイルであるか否かを判定する肌色タイル判定部
    を有し、
    上記重み付け部は、上記複雑タイル判定部と上記斜めタイル判定部と上記肌色タイル判定部による判定に基づいて、タイルカテゴリに適したように当該タイルの所定のサブバンドに対して所定の重みを設定して、上記所定のサブバンドの量子化歪に上記設定された重みを付ける
    ことを特徴とする画像符号化装置。
  3. 請求項または請求項記載の画像符号化装置において、
    上記タイル分類部が上記斜めタイル判定する斜め方向は、45度の右上がりまたは45度の右下がりの方向である
    ことを特徴とする画像符号化装置。
  4. 請求項1乃至請求項のいずれかに記載の画像符号化装置において、
    上記重み付け部は、量子化歪に重みを付ける際、各タイルカテゴリに対するサブバンド毎の重み係数を予め記憶しておき、当該タイルのカテゴリ及びサブバンドに応じて所望の重み係数を選択し、選択した重み係数を量子化歪みに乗算することより量子化歪に重みを付ける
    ことを特徴とする画像符号化装置。
  5. 入力画像を所定サイズのタイルに分割し、個々のタイルに含まれる画像信号を周波数成分へ変換することで帯域分割された複数のサブバンドに対応した変換係数を得て、得られた変換係数を量子化し、得られた量子化係数をエントロピー符号化すると共に、上記量子化係数から量子化歪を演算し、この量子化歪を用いて上記エントロピー符号化された符号化データの符号量を制御する際の画像符号化方法であって、
    上記変換係数を参照して、当該タイルが複雑なテクスチャにより構成される複雑タイルか、複雑なテクスチャが存在しない単純タイルかを判定する複雑タイル判定を行い、
    上記変換係数を参照して、当該タイルが斜め方向に相関が強い斜めタイルであるか否かを判定する斜めタイル判定を行い、
    この斜めタイル判定および上記複雑タイル判定による判定に基づいて、タイルカテゴリに適したように当該タイルの所定のサブバンドに対して所定の重みを設定して、上記所定のサブバンドの量子化歪に上記設定された重みを付け、
    この重み付けられた量子化歪に基づいて、上記エントロピー符号化された符号化データの符号量を制御する画像符号化方法。
  6. 請求項1乃至請求項のいずれかに記載の画像符号化装置を備え、この画像符号化装置により符号量を制御された符号化データを処理する画像処理装置。
JP2002282402A 2002-09-27 2002-09-27 画像符号化装置、画像符号化方法、および画像処理装置 Expired - Fee Related JP4045913B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2002282402A JP4045913B2 (ja) 2002-09-27 2002-09-27 画像符号化装置、画像符号化方法、および画像処理装置
TW92117535A TWI222327B (en) 2002-09-27 2003-06-27 Image encoding device, image encoding method, and image processing device
PCT/JP2003/008901 WO2004030343A1 (ja) 2002-09-27 2003-07-14 画像符号化装置、画像符号化方法、および画像処理装置
KR20047007959A KR100611705B1 (ko) 2002-09-27 2003-07-14 화상 부호화 장치, 화상 부호화 방법, 및 화상 처리 장치
US10/489,180 US7333661B2 (en) 2002-09-27 2003-07-14 Image coding device image coding method and image processing device
EP03741377A EP1545121A4 (en) 2002-09-27 2003-07-14 DEVICE, IMAGE ENCODING METHOD, AND IMAGE PROCESSING DEVICE
CNB03801629XA CN1287584C (zh) 2002-09-27 2003-07-14 图像编码装置、图像编码方法及图像处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002282402A JP4045913B2 (ja) 2002-09-27 2002-09-27 画像符号化装置、画像符号化方法、および画像処理装置

Publications (2)

Publication Number Publication Date
JP2004120466A JP2004120466A (ja) 2004-04-15
JP4045913B2 true JP4045913B2 (ja) 2008-02-13

Family

ID=32040537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002282402A Expired - Fee Related JP4045913B2 (ja) 2002-09-27 2002-09-27 画像符号化装置、画像符号化方法、および画像処理装置

Country Status (7)

Country Link
US (1) US7333661B2 (ja)
EP (1) EP1545121A4 (ja)
JP (1) JP4045913B2 (ja)
KR (1) KR100611705B1 (ja)
CN (1) CN1287584C (ja)
TW (1) TWI222327B (ja)
WO (1) WO2004030343A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8351024B2 (en) 2009-03-13 2013-01-08 Asml Netherlands B.V. Lithographic apparatus and device manufacturing method involving a level sensor having a detection grating including three or more segments
US8488107B2 (en) 2009-03-13 2013-07-16 Asml Netherlands B.V. Lithographic apparatus and device manufacturing method involving a level sensor having multiple projection units and detection units
US8675210B2 (en) 2009-03-13 2014-03-18 Asml Netherlands B.V. Level sensor, lithographic apparatus, and substrate surface positioning method

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7574063B2 (en) * 2003-07-23 2009-08-11 Canon Kabushiki Kaisha Image coding method and apparatus
DE10354226B4 (de) * 2003-11-20 2006-04-06 Siemens Ag Verfahren und Vorrichtung zum Laden eines in einem Archiv befindlichen Bildes mittels Pipeline Verarbeitung des in Chunks zerlegten Bildes mit Darstellung von Zwischenergebnissen in inkrementell erhöhter Auflösung
JP2005184511A (ja) 2003-12-19 2005-07-07 Nec Access Technica Ltd デジタル画像符号化装置及びその方法並びにデジタル画像復号化装置及びその方法
JP2006121645A (ja) * 2004-09-24 2006-05-11 Fuji Photo Film Co Ltd 画像圧縮装置および画像圧縮プログラム
CN1917645B (zh) * 2005-08-15 2012-12-19 华为技术有限公司 对系数块进行编码的方法
MX2008012382A (es) 2006-03-29 2008-11-18 Thomson Licensing Metodos y aparatos para usarse en un sistema de codificacion de video de multiples vistas.
KR100809301B1 (ko) * 2006-07-20 2008-03-04 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치
TWI323128B (en) 2006-10-03 2010-04-01 Quanta Comp Inc Image processing apparatus and method
CN101569170B (zh) * 2007-05-17 2011-11-16 索尼株式会社 编码设备和编码方法以及解码设备和解码方法
JP4569840B2 (ja) * 2007-09-12 2010-10-27 ソニー株式会社 画像符号化装置、画像符号化方法
CN101335892B (zh) * 2008-04-25 2010-06-09 太原科技大学 基于帧内模式决策的混合分布式视频编码方法
US8218633B2 (en) * 2008-06-18 2012-07-10 Kiu Sha Management Limited Liability Company Bidirectionally decodable Wyner-Ziv video coding
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5469127B2 (ja) * 2011-05-30 2014-04-09 富士フイルム株式会社 画像データ符号化装置ならびにその動作制御方法およびそのプログラム
WO2014203248A1 (en) * 2013-06-17 2014-12-24 Quantumrgb Ltd. System and method for biometric identification
US10405002B2 (en) * 2015-10-03 2019-09-03 Tektronix, Inc. Low complexity perceptual visual quality evaluation for JPEG2000 compressed streams
JP6857973B2 (ja) * 2016-06-14 2021-04-14 キヤノン株式会社 画像符号化装置及びその制御方法
JP7001383B2 (ja) 2017-07-28 2022-01-19 キヤノン株式会社 符号化装置、符号化方法、及び、プログラム
US11423582B2 (en) * 2019-03-01 2022-08-23 Tencent America LLC Method and apparatus for point cloud compression
CN113840145B (zh) * 2021-09-23 2023-06-09 鹏城实验室 一种面向人眼观看和视觉分析联合优化的图像压缩方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0834432B2 (ja) 1989-01-31 1996-03-29 三菱電機株式会社 符号化装置及び符号化方法
USRE35781E (en) 1989-01-31 1998-05-05 Mitsubishi Denki Kabushiki Kaisha Coding method of image information
JPH02308672A (ja) 1989-05-23 1990-12-21 Fujitsu Ltd カラー画像データ符号化方式
JP2545302B2 (ja) * 1989-12-25 1996-10-16 三菱電機株式会社 高能率符号化装置
EP0435163B1 (en) 1989-12-25 1998-03-25 Mitsubishi Denki Kabushiki Kaisha Coding apparatus
JPH0834434B2 (ja) 1990-02-26 1996-03-29 三菱電機株式会社 符号化装置及び符号化方法
JPH07154798A (ja) 1993-05-31 1995-06-16 Canon Inc 画像符号化装置および画像符号化方法
JP3115199B2 (ja) 1994-12-16 2000-12-04 松下電器産業株式会社 画像圧縮符号化装置
JP3213584B2 (ja) * 1997-09-19 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
JP2001217718A (ja) 2000-02-02 2001-08-10 Canon Inc 画像処理装置及び方法及び記憶媒体
JP4254017B2 (ja) * 2000-03-10 2009-04-15 ソニー株式会社 画像符号化装置及び方法
US6549674B1 (en) * 2000-10-12 2003-04-15 Picsurf, Inc. Image compression based on tiled wavelet-like transform using edge and non-edge filters
US6668090B1 (en) 2000-05-26 2003-12-23 Eastman Kodak Company Producing a compressed digital image organized into layers corresponding to increasing visual quality levels and providing rate-control of such compressed digital image
JP2002064719A (ja) * 2000-08-17 2002-02-28 Canon Inc 画像処理装置およびその方法
JP2002101311A (ja) 2000-09-25 2002-04-05 Jiro Adachi 色毎に圧縮率を変える画像データ非可逆圧縮装置。
JP3702778B2 (ja) 2000-11-27 2005-10-05 ソニー株式会社 画像符号化装置及び方法
US6895121B2 (en) * 2001-07-03 2005-05-17 Eastman Kodak Company Method for utilizing subject content analysis for producing a compressed bit stream from a digital image
JP3615162B2 (ja) * 2001-07-10 2005-01-26 日本電気株式会社 画像符号化方法及び画像符号化装置
JP2003101794A (ja) * 2001-09-25 2003-04-04 Canon Inc 画像符号化装置、及び画像符号化方法、並びにプログラム、記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8351024B2 (en) 2009-03-13 2013-01-08 Asml Netherlands B.V. Lithographic apparatus and device manufacturing method involving a level sensor having a detection grating including three or more segments
US8488107B2 (en) 2009-03-13 2013-07-16 Asml Netherlands B.V. Lithographic apparatus and device manufacturing method involving a level sensor having multiple projection units and detection units
US8675210B2 (en) 2009-03-13 2014-03-18 Asml Netherlands B.V. Level sensor, lithographic apparatus, and substrate surface positioning method

Also Published As

Publication number Publication date
JP2004120466A (ja) 2004-04-15
CN1596536A (zh) 2005-03-16
KR100611705B1 (ko) 2006-08-11
US7333661B2 (en) 2008-02-19
EP1545121A1 (en) 2005-06-22
TW200405730A (en) 2004-04-01
WO2004030343A1 (ja) 2004-04-08
US20040240742A1 (en) 2004-12-02
CN1287584C (zh) 2006-11-29
TWI222327B (en) 2004-10-11
KR20040058323A (ko) 2004-07-03
EP1545121A4 (en) 2009-03-04

Similar Documents

Publication Publication Date Title
JP4045913B2 (ja) 画像符号化装置、画像符号化方法、および画像処理装置
EP0785669B1 (en) Image processing method and apparatus
JP3196906B2 (ja) 画像信号の符号化装置
KR100880039B1 (ko) 웨이블릿 기반 이미지 코덱에서의 부호화 이득을 달성하는방법 및 시스템
JP3293920B2 (ja) 画像処理装置およびその方法
EP0863484B1 (en) Image processing method and apparatus
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
JP2006074770A (ja) 多重解像度セグメンテーションおよび充填
WO1999017257A2 (en) System and method for compressing images using multi-threshold wavelet coding
US8050506B2 (en) Image enhancement device
JPH0556282A (ja) 画像符号化装置
JP2004533181A (ja) デジタルイメージに対する選択的なクロミナンスデシメーション
EP0555095B1 (en) Method for compressing and extending an image by transforming orthogonally and encoding the image
JP2003047024A (ja) 画像圧縮装置および画像圧縮プログラム
JPH08322041A (ja) ブロック歪み除去装置
JP2003204439A (ja) 画像符号化装置及び画像符号化方法
JP5267140B2 (ja) 画像圧縮装置及び画像圧縮方法
JPH08331391A (ja) 画像処理装置およびその方法
JP5560172B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
Deng et al. Low-bit-rate image coding using sketch image and JBIG
JP5078199B2 (ja) 画像符号化装置及びその方法並びにプログラムコード、記憶媒体
JP4424672B2 (ja) 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP4006276B2 (ja) 画像認識方法、画像認識装置及びコンピュータプログラム
JP4047207B2 (ja) 画像符号化装置、画像符号化方法及びプログラム
JP3230122B2 (ja) 二値画像のデータ圧縮方法及び装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070906

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20071015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071112

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4045913

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131130

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees