JP5351093B2 - 画像符号化方法,画像符号化装置および画像符号化プログラム - Google Patents

画像符号化方法,画像符号化装置および画像符号化プログラム Download PDF

Info

Publication number
JP5351093B2
JP5351093B2 JP2010125764A JP2010125764A JP5351093B2 JP 5351093 B2 JP5351093 B2 JP 5351093B2 JP 2010125764 A JP2010125764 A JP 2010125764A JP 2010125764 A JP2010125764 A JP 2010125764A JP 5351093 B2 JP5351093 B2 JP 5351093B2
Authority
JP
Japan
Prior art keywords
signal
bit
image
texture analysis
bit depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010125764A
Other languages
English (en)
Other versions
JP2011254215A (ja
Inventor
幸浩 坂東
誠之 高村
裕尚 如澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010125764A priority Critical patent/JP5351093B2/ja
Publication of JP2011254215A publication Critical patent/JP2011254215A/ja
Application granted granted Critical
Publication of JP5351093B2 publication Critical patent/JP5351093B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は,高能率画像信号符号化方法に関する。
H.264/AVCに代表される現行の符号化方式においては,フレーム内予測,フレーム間予測および階層間予測によって予測信号を生成し,予測信号と原信号の残差信号を符号化対象としている。このような従来技術は,原信号波形の正確な再現を目的としている。しかし,こうした従来手法では,波形再現の枠組みのもと,量子化により符号量を制御していたため,低レートでは,ブロック歪み,リンギングといった画質劣化が顕在化する。
また,その予測処理は復号信号を参照するため,低レートでは,劣化した復号信号を参照することになり,ある一定以上の高周波成分を予測することは不可能となる。このため,高周波成分を多く含む画像に対しては,予測性能は低下する。例えば,こうした低レートにおける画質劣化は,フレーム間予測の場合,剛体移動モデルの成立しない水面等のシーンにおいて顕著であり,フレーム内予測・階層間予測の場合,精細な絵柄のテクスチャ領域において顕著となる。
これに対し,テクスチャ合成と呼ばれる手法が検討されている。付与されたデータ(シードと呼ぶ)を用いて,予め定められた生成規則に基づき,画像を合成する技術である。テクスチャ合成では,原信号の正確な波形再現を追求するのではなく,原信号内のテクスチャの特徴量を再現対象とする点が,従来の一般的な符号化方式と異なる。
テクスチャ合成の方法としては,例えば,非特許文献1に記載されている方法がある。この方法では,テクスチャ合成処理の入力として,方向性フィルタバンクの出力として得られた係数のヒストグラムをテクスチャの特徴量として用いる。
D.Heeger, and J. Bergen,"Pyramid-Based Texture Analysis/Synthesis", Proc ACM SIGGRAPH 95, 1995.
一般に,テクスチャ合成で使用するシードのデータ量は,原信号のデータ量に比べて,極めて少なく抑えることが可能である。このため,テクスチャ合成の画像符号化への適用が期待される。
一方,テクスチャ合成によって生成された信号は,波形再現という観点からは原信号との類似度は保証されない。これは,画像中の位相情報を保持する保証がないためである。このため,原画像との比較を前提として,主観的に原信号に近い画質の信号を得ることが求められる場合には,単純に画像符号化にテクスチャ合成の手法を適用しても,その要求に応えることができない。
本発明はかかる事情に鑑みてなされたものであって,低レートの符号化方式として,従来の波形再現ベースの符号化方式に変わる手法として,テクスチャ合成技術に基づき主観的に原信号に近い画質の信号を生成する処理を確立することを目的とする。
テクスチャ合成のみでの波形再現は,その処理の構造上,限界があった。これは,テクスチャ合成では,画像内の位相情報が保持されないためである。本発明では,従来の波形再現ベースの符号化方式とテクスチャ合成とを組み合わせ,両者の苦手とした部分を互いの長所で補い合うアプローチを取る。そのために,画像信号を波形の概形を表す成分(構造成分)とそれ以外の成分(テクスチャ成分)に分割し,構造成分に対して波形再現ベースの符号化を適用し,テクスチャ成分に対してテクスチャ分析・テクスチャ合成による符号化を適用する。
すなわち,本発明は,主観画質を保持しつつ符号量の削減を図るため,符号化対象の画像信号を構造成分とテクスチャ成分とに分割し,構造成分については,波形符号化に基づく符号化処理を行い,テクスチャ成分に対して,テクスチャ合成に基づく符号化処理を行う。画像信号を構造成分とテクスチャ成分とに分割する際には,例えば画像信号の上位ビットを構造情報とし,下位ビットをテクスチャ情報とする。下位ビットの劣化が視覚的に検知しにくい情報の場合,大きな符号量削減効果が期待できる。
詳しくは本発明の画像符号化装置は,まず,原信号のビット深度変換により,少ないビット深度で表現された信号に対して波形符号化に基づく符号化処理を行い,符号化データを生成する。その符号化データを復号し,さらに,逆ビット深度変換により原信号と同じビット深度の信号を復元する。その復元信号と原信号との差分信号を算出し,差分信号に対してビット深度の制限を行い,ビット深度の制限された差分信号に対してテクスチャ分析を行うことにより,その信号を画素値のヒストグラム,変換フィルタ係数のヒストグラム群により表現して,テクスチャ分析による符号化データを生成する。以上の波形符号化処理による符号化データとテクスチャ分析による符号化データとを符号化ストリームとして統合して出力する。特に,テクスチャ分析では,差分信号に対するビット深度の制限量に応じて,制限量が大きいときにテクスチャ分析で得られるヒストグラムのビン数が小さくなるように表現精度を制御する。
または,本発明の画像符号化装置は,入力画像の上位ビットと下位ビットを分離し,上位ビットに対しては,ビットシフトにより,原信号よりも少ないビット深度の信号として表現し,波形符号化に基づく符号化処理を行い,符号化データを生成する。また,下位ビット信号に対してビット深度の制限を行い,ビット深度の制限された信号に対してテクスチャ分析を行うことにより,その信号を画素値のヒストグラム,変換フィルタ係数のヒストグラム群により表現して,テクスチャ分析による符号化データを生成する。以上の波形符号化処理による符号化データとテクスチャ分析による符号化データとを符号化ストリームとして統合して出力する。特に,テクスチャ分析では,下位ビット信号に対するビット深度の制限量に応じて,制限量が大きいときにテクスチャ分析で得られるヒストグラムのビン数が小さくなるように表現精度を制御する。
上記画像符号化において,変換フィルタ係数を生成する変換処理における全分解レベルの全方向成分に対する近似誤差和が付与の閾値以下に抑えられるように前記変換フィルタ係数のヒストグラムのビン数を設定することも好適である。また,前記変換フィルタ係数としてsteerablepyramid 変換のフィルタ係数を用いることができる。
本発明により,主観画質は保持しつつ,符号量を削減する符号化を実現することができる。
本発明の実施形態の一部に関連する画像符号化装置の構成例を示す図である。 Steerable pyramid の分析フィルタの構成例を示す図である。 画像符号化装置の構成例を示す図である。 画像符号化装置の他の構成例を示す図である。 画像符号化装置の他の構成例を示す図である。 画像復号装置の構成例を示す図である。 Steerable pyramid の合成フィルタの構成例を示す図である。 画像復号装置の他の構成例を示す図である。 符号化処理のフローチャートである。 テクスチャ分析処理のフローチャートである。 復号処理のフローチャートである。 テクスチャ合成処理のフローチャートである。
以下,本実施形態で行う処理の概要について説明する。
図1は,本発明の実施形態の一部に関連する画像符号化装置の構成例を示す。符号化処理の流れを図1を用いて説明する。まず,画像符号化装置1は,符号化対象の画像信号(Nビット信号) を入力する。ビット深度変換部10は,この画像信号(Nビット信号) を入力として,ビット深度変換処理により,N−Δビット信号へ変換する。ここで,Δは1≦Δ≦Nを満たす整数である。ビット深度変換処理としては,各画素値を右へΔビットシフトする方法が挙げられる。なお,この演算結果は,もとの画素値を1/(2のΔ乗)倍して小数点以下を切り捨てた値と一致する。また,二乗誤差最小化の規範に基づき,量子化の考え方を利用して,Nビット信号における2N 種類の画素値を「2の(N−Δ)乗」種類の画素値で近似する方法もある。
ビット深度変換処理の出力として得られたN−Δビット信号が,本手法における構造成分である。そこで,構造成分であるN−Δビット信号に対して,波形符号化処理部11は波形符号化処理を行い,符号化ストリームを出力する。波形符号化処理としては,H.264/AVC準拠の符号化方式を用いる。なお,本発明は,波形符号化処理をH.264/AVCに限定するものではなく,例えば,JPEG,JPEG2000,MPEG−2といった方法を用いることも可能である。
次に,復号処理部12は,波形符号化処理の出力として得られた符号化ストリームに対して,H.264/AVCが規定する復号処理を行い,復号信号を得る。符号化方式としてH.264/AVC以外の方法(JPEG,JPEG2000,MPEG−2等)を用いた場合には,対応する復号処理を行う。
逆ビット深度変換部13は,復号処理の出力として得られた復号信号(N−Δビット信号)に対して,逆ビット深度変換処理を行い,Nビット信号としての構造成分の復号信号を得る。
差分信号生成部14は,原信号と構造成分の復号信号(Nビット信号)との差分信号を算出する。この差分信号が,本手法におけるテクスチャ成分となる。テクスチャ分析処理部15は,テクスチャ成分に対して,テクスチャ分析処理を行い,復号時のテクスチャ合成において必要となる情報として,以下の2種類のヒストグラムを抽出する。一つが,差分信号のヒストグラムである。もう一つが,差分信号に対するSteerable pyramid 変換〔参考文献1参照〕により得られる変換係数に対するヒストグラムである。
〔参考文献1〕:E. P. Simoncelli and W. T. Freeman, “The Steerable Pyramid: A Flexible Architecture for Multi-Scale Derivative Computation ”,IEEE Int'l Conf. on Image Processing. Washington DC, October 1995 .
Steerable pyramid 変換は,方向性フィルタバンクの一種であり,方向数と分解レベルにより出力が規定される。原信号を2J ×2J 画素として,方向数Mと分解レベルJmax のSteerable pyramid 変換を行う場合,第j分解レベル(0≦j≦Jmax −1)においては,M種類の方向成分を有し,各方向成分が2J-J ×2J-j 個の変換係数を有する。なお,最上位の分解レベルj=Jmax においては,方向成分に関する分割はなく,2J-Jmax×2J-Jmax個の変換係数を有する。また,上記とは別に,高周波成分として,2J ×2J 個の変換係数を有する。
また,変換係数は実数値で表現されているため,分解レベル毎の各方向成分を予め与えられた量子化幅Kで量子化し,量子化後の変換係数に対するヒストグラムをテクスチャ分析情報とする。
例として,図2に,M=2, Jmax =1とした場合のsteerable pyramid 変換の分析フィルタの構成例を示す。高域通過フィルタ21および低域通過フィルタ22の入力は,画像信号(差分信号)である。この分析フィルタは,入力された画像信号に対して,指定されたレベル分解および方向分解を行い,高域成分,低域成分としてのフィルタ係数を算出する。高域通過フィルタ21から,高域通過フィルタの係数が出力され,第一方向成分通過フィルタ231から低域通過フィルタ+第一方向成分通過フィルタの係数が出力され,第二方向成分通過フィルタ232から低域通過フィルタ+第一方向成分通過フィルタの係数が出力され,低域通過フィルタ233とダウンサンプリング部234から,低域通過フィルタ+ダウンサンプリング後の係数が出力される。
分解レベルを増やす場合には,ダウンサンプリング部234の出力するダウンサンプリング後の信号に対して,破線で囲んだ部分23の処理を再帰的に繰り返す。
図3は,本発明の実施形態に係る画像符号化装置の構成例を示す。図3に示す画像符号化装置1−1では,図1に示す画像符号化装置1に対して,差分信号生成部14とテクスチャ分析処理部15との間に,ビット深度制限処理部16が設けられている。他の構成部分は,図1に示す画像符号化装置1と同様である。ビット深度制限処理部16は,差分信号の下位δビットを抽出し,テクスチャ分析処理の対象をδビット信号に制限する。この場合,δはΔと同一の値とすることもできるが,Δとは独立に設定することも可能である。このδをビット深度制限パラメータと呼ぶ。
ここで,ヒストグラムの表現方法について整理する。ヒストグラムをhB [i](i=0,1,…,B−1)と表した場合,hB [i]は,対象となる信号値がiとなるサンプルの個数を格納する。このとき,Bをヒストグラムのbin数と呼び,hB [i]を第ibinの頻度値と呼ぶ。
前記のように,テクスチャ合成処理の対象のビット深度を制限することで,前記差分信号は「2のδ乗」種類の画素値に制限される。このとき,対応するヒストグラムに格納されるのは,「2のδ乗」種類の画素値となり,ヒストグラムのbin数を2N+1 から「2のδ乗」に抑えることができる。この結果,ビット制限前に比べて,同ヒストグラムを表現する情報量を低減することが可能となる。
Steerable pyramid 変換の変換係数に対するヒストグラムに対しても,ビット深度制限パラメータδに基づき,ヒストグラムのbin数を制限する。具体的には,ビット深度制限パラメータδが小さくなるにつれて,ヒストグラムのbin数を小さく設定する。これは,変換前の信号のビット深度に応じて,変換係数に必要なビット深度も変化することを考慮すると,変換係数のヒストグラムのbin数を常に一定に保つことは,δが小さな場合,変換係数に対して冗長な表現を与える可能性があるためである。
Steerable pyramid 変換における第j分解レベル(0 ≦j≦Jmax −1)における第m(m=0,1,…,M−1)方向成分の変換係数に対するヒストグラムをLx (j,m) [i](i=0,…,22(J-j)−1)〔ここで,下添字XはBδ(δは下添字)の代わりの表記,以下同様〕とする。なお,前述の通り,最上位の分解レベルj=Jmax においては,方向成分に関する分割はなく,m=0に対応するヒストグラムに限定される。また,上記とは別に,高周波成分として,2J ×2J 個の変換係数を有するため,この高周波成分を格納するヒストグラムを,HJ [i](i=0,…,22J−1)とする。
第j分解レベル(0≦j≦Jmax −1)における第m(m=0,1,…,M−1)方向成分の変換係数に対するヒストグラムをLx (j,m) [i](i=0,…,22(J-j)−1)とすることは,実数値で表現された変換係数をBδ種類の離散値で近似することになる。この離散化の際,用いる量子化幅をqj,m ,第j分解レベル(0≦j≦Jmax −1)における第m(m=0,1,…,M−1)方向成分の変換係数cj,m [k](k=0,…,22(J-j)−1)とすると,この離散化に伴う近似誤差Ex (j,m) は,次式のように表される。
Figure 0005351093
この式中,「L字型の記号」と「左右反転L字型の記号」で挟まれる値xは,実数xに対する少数点以下の切捨てを意味する。また,高周波成分に対する近似誤差を,便宜上,以下のように表す。
Figure 0005351093
なお,ここで用いたm=Mは方向成分を同定するためではなく,高周波成分を表すインデックスとして用いている。
全分解レベルの全方向成分に対する近似誤差の和として,次式を定義する。
Figure 0005351093
bin数の増加に対して,近似誤差和Etotal (Bδ,δ)は単調減少となる。そこで,bin数の設定の際には,式(1)に対する閾値Tを設定し,bin数の候補となる値を複数用意し,同候補に含まれる値の中で次式を満たす最大の値をbin数とする。
total (Bδ,δ)≦T
図4は,画像符号化装置の他の構成例を示す。図4に示す画像符号化装置1−2では,図1に示す画像符号化装置1に対して,テクスチャ分析処理部15の後に,ビット深度制限処理部17が設けられている。他の構成部分は,図1に示す画像符号化装置1と同様である。ビット深度制限処理部17は,テクスチャ分析処理部15の出力をδビット信号に制限する。δビット信号に制限することにより,テクスチャ分析処理による符号化データの符号量をさらに圧縮することができる。
また,図5は,画像符号化装置のさらに他の構成例を示す。図5に示す画像符号化装置1−3では,ビットシフト処理部101が,入力したNビットの画像信号から上位N−Δビットの画像信号(Δ>0)を抽出する。波形符号化処理部102は,N−Δビットの画像信号に対して,波形符号化に基づく符号化処理を行い,符号化データを出力する。
一方,下位ビット抽出処理部103は,入力したNビットの画像信号から下位Δビットの画像信号を抽出し,テクスチャ分析処理部104は,下位Δビットの画像信号に対するテクスチャ分析により,下位Δビットの画像信号を画素値のヒストグラムおよび変換フィルタ係数のヒストグラム群により表現したテクスチャ分析情報の符号化データを生成する。これらの波形符号化処理による符号化データとテクスチャ分析による符号化データを符号化ストリームとして統合する。
以上のように,ビット深度変換処理として,ビットシフトを用いる場合には,図5に示す形式で,図1,図3,図4の符号化処理が実現できる。図5の構成の利点は,テクスチャ分析処理と波形符号化処理を並列に処理できる点にある。このため,図1,図3,図4に示す符号化処理では,波形符号化処理・復号処理が完了するまで,テクスチャ合成処理が実行できないのに対して,図5の構成では,両者を並列に処理できるため,並列処理可能な環境では,処理速度の向上が期待できる。
復号処理について,図6を用いて説明する。図6は,画像復号装置の構成例を示す。画像復号装置3は,テクスチャ合成処理部30と,復号処理部31と,逆ビット深度変換部32と,復号信号生成部33とを備える。
復号処理では,2種類の符号化情報を入力とする。まず,波形符号化処理の出力として得られた符号化ストリームに対して,復号処理部31は,対応する復号処理を行い,復号信号を得る。復号処理の出力として得られた復号信号(N−Δビット信号)に対して,逆ビット深度変換部32は,逆ビット深度変換処理を行い,Nビット信号としての構造成分の復号信号を得る。
次に,テクスチャ合成処理部30は,テクスチャ分析情報を入力として,以下のテクスチャ合成の方法に基づき,テクスチャ情報を復号する。符号化処理において,図3,図4に示すようなビット深度制限処理が加わっている場合には,復号されるテクスチャ情報は,δビットに制限されている。
テクスチャ合成の方法は,非特許文献1の方法を使用する。この方法では,テクスチャ合成処理の入力として,Steerable pyramid と呼ぶ方向性フィルタバンクの出力として得られた係数のヒストグラムを用いる。同方法の概要を以下に示す。
同方法の入力は,適当な初期画像(上記非特許文献1では,白色雑音画像),および目標とするテクスチャ画像(以後,目標テクスチャ画像と呼ぶ)に対する各々の画素値ヒストグラム,前記両画像に対する各々の各サブバンドのヒストグラムとする。サブバンド分解には,Steerable pyramid を用いる。テクスチャ合成の出力として得られる画像を合成画像と呼ぶ。なお,以下の処理の開始時点では,合成画像は上記の初期画像で初期化されている。
〔テクスチャ合成の方法〕
(1)処理対象画像の初期画像としての白色雑音画像,および目標テクスチャ画像に対する各々の画素値ヒストグラム,前記両画像に対する各々の各サブバンド毎の変換係数のヒストグラム(サブバンドヒストグラムと呼ぶ)を入力する。
(2)合成画像(最初は初期画像)の画素値ヒストグラム,目標テクスチャ画像の画素値ヒストグラムをもとに,合成画像の画素値ヒストグラムを目標テクスチャ画像のそれに近づける。
(3)上記(2)で得られた合成画像の画素値ヒストグラムを用いて,合成画像を生成する。
(4)上記(3)で得られた合成画像を入力として,同画像に対する方向性フィルタバンクの順変換を行い,変換係数を算出する。各サブバンド毎に変換係数のヒストグラムを生成する。
(5)合成画像および目標テクスチャ画像の両画像のサブバンドヒストグラムを入力として,合成画像の各サブバンドのヒストグラムを目標テクスチャ画像の同一帯域のサブバンドのヒストグラムに近づける。
(6)上記(5)で修正した合成画像のサブバンド係数を入力として,方向性フィルタバンクの逆変換を行い,合成画像を出力する。
(7)上記(2)〜(6)の処理を一定回数,繰り返す。
テクスチャ合成においてサブバンド係数を得る手法としては,例えばwavelet のような上記以外のフィルタバンクの適用も検討されている。本発明におけるテクスチャ特徴量の予測機構は,上記の方向性フィルタバンクに限らず,それ以外のフィルタバンクに対しても同様に適用することができる。
例として,図7に,M=2, Jmax =1とした場合のsteerable pyramid 変換の合成フィルタの構成例を示す。この合成フィルタは,入力されたフィルタ係数から画像信号を合成する。高域合成フィルタ42は,図2に示す高域通過フィルタ21が出力したフィルタ係数を入力し,画像信号を合成する。第一方向成分合成フィルタ401は,図2に示す第一方向成分通過フィルタ231が出力した低域通過フィルタと第一方向成分通過フィルタの係数を入力する。第二方向成分合成フィルタ402は,図2に示す第二方向成分通過フィルタ232が出力した低域通過フィルタと第二方向成分通過フィルタの係数を入力する。アップサンプリング部403は,図2に示すダウンサンプリング部234が出力した低域通過フィルタとダウンサンプリング後の係数を入力してアップサンプリングし,低域成分合成フィルタ404はアップサンプリング後の係数から画像信号を合成する。低域合成フィルタ41は,第一方向成分合成フィルタ401,第二方向成分合成フィルタ402,低域成分合成フィルタ404の出力を合成する。高域合成フィルタ42および低域合成フィルタ41の出力から,最終的な差分信号の画像信号が合成される。
分解レベルを増やす場合には,破線で囲んだ部分40の処理を,再帰的に繰り返す。
図8に示す画像復号装置3−1は,図5に示す画像符号化装置1−3に対応する復号処理を行う復号装置である。図8に示す画像復号装置3−1では,図6の画像復号装置3における逆ビット深度変換部32として,逆ビットシフト処理部34が用いられている。逆ビットシフト処理部34は,復号処理部31が復号したN−Δビット信号を,Δビット分だけ逆ビットシフトすることにより,Nビット信号に変換する。復号信号生成部33は,このNビット信号と,テクスチャ合成処理部30の出力であるΔビット信号とを加算し,Nビット信号の復号画像を生成する。
以下,本実施形態の具体的な処理の流れについて説明する。
〔フローチャート(符号化処理)〕
図9は,図3に示す画像符号化装置1−1の処理フローチャートである。他の実施形態についても同様に処理できる。
(1)画像信号(Nビット信号)を入力とし,同信号に含まれる2N 種類の画素値を「2の(N−Δ)乗」種類の画素値に割り当て,N−Δビットの信号として出力する(ステップS10)。
(2)N−Δビットの信号を入力として,予め定められた符号化方法に従い,波形符号化処理を行い,その符号化データを出力する。波形符号化処理としては,例えば,H.264/AVCの標準規格に準拠した符号化方法がある(ステップS11)。
(3)上記(2)で生成された符号化データを復号し,N−Δビットの信号としての復号信号を得る(ステップS12)。
(4)N−Δビットの復号信号を入力として,同信号に含まれる「2の(N−Δ)乗」種類の画素値を2N 種類の画素値に割り当てる逆ビット深度変換の処理を行い,Nビットの復号信号として出力する(ステップS13)。
(5)上記(4)で生成した逆ビット深度変換後の復号信号と原信号との差分を算出し,差分信号として出力する(ステップS14)。
(6)同差分信号を入力として,ビット深度をδビットに制限し,δビット信号として出力する(ステップS15)。
(7)上記(6)で生成したδビット信号を入力として,テクスチャ分析処理を行い,画素値のヒストグラム,方向性フィルタバンクの各バンド毎のフィルタ係数のヒストグラムを出力する(ステップS16)。このステップS16の処理を「テクスチャ分析処理」と呼ぶ。
〔フローチャート(テクスチャ分析処理)〕
図10は,テクスチャ分析処理(ステップS16)の詳細な処理フローチャートである。
(1)入力信号を読み込み,入力信号の画素値のヒストグラムを出力する(ステップS161)。
(2) Steerable pyramid変換を規定するパラメータ方向数M,分解レベルJmax を読み込む(ステップS162)。
(3)入力信号に対して,方向数M,分解レベルJmax で定まるSteerable pyramid 変換を行い,変換係数を出力する(ステップS163)。
(4)高周波成分に属する2J ×2J 個の変換係数に対してヒストグラムを求め,HJ [i](i=0,…,22J−1)として出力する(ステップS164)。
(5)j=0,1,…,Jmax −1に対して,以下の処理を繰り返す(ステップS165〜S170)。
(6)m=0,1,…,M−1に対して,以下の処理を繰り返す(ステップS166〜S168)。
(7)第j分解レベルにおける第m方向成分に属する22(J-j)個の変換係数に対するヒストグラムを求め,Lx (j,m) [i](i=0,…,22(J-j)−1)として出力する(ステップS166)。
(8)最上位の分解レベルj=Jmax に属する「2の2(J−Jmax )乗」個の変換係数に対するヒストグラムを求め,Lx Y [i](i=0,…,2の2(J−Jmax )乗−1)として出力する。なお,ここでYは(Jmax ,0)である。最上位の分解レベルでは,方向成分に関する分割はなく,m=0に対応するヒストグラムに限定される(ステップS171)。
〔フローチャート(復号処理)〕
図11は,図6に示す画像復号装置3の処理フローチャートである。他の実施形態についても同様に処理できる。
(1)波形符号化処理の出力として得られた符号化データを入力として,波形符号化処理に対応する復号処理を行い,復号信号を出力する(ステップS20)。
(2)復号処理の出力として得られた復号信号(N−Δビット信号)を入力として,逆ビット深度変換処理を行い,Nビット信号としての構造成分の復号信号を得る(ステップS21)。
(3)テクスチャ分析情報を入力として,テクスチャ合成処理を行い,復号されたテクスチャ信号を出力する(ステップS22)。この処理の詳細については,図12を用いて後述する。
(4)Nビット信号としての構造成分の復号信号,復号されたテクスチャ信号を入力として,二つの信号を加算し,加算後の信号を復号信号として出力する(ステップS23)。
〔フローチャート(テクスチャ合成処理)〕
図12は,テクスチャ合成処理(ステップS22)の詳細な処理フローチャートである。
テクスチャ合成処理では,Steerable pyramid 変換の変換係数のヒストグラムを入力として,サブバンド分解には,Steerable pyramid を用いる。テクスチャ合成の出力として得られる画像を合成画像と呼ぶ。なお,以下の処理の開始時点では,合成画像は上記の初期画像で初期化されている。
(1)入力として,処理対象画像の初期画像としての白色雑音画像,および目標とするテクスチャ画像(以後,目標テクスチャ画像と呼ぶ)に対する各々の画素値ヒストグラム,前記両画像に対する各々の各サブバンドのヒストグラムを読み込む。このヒストグラムをサブバンドヒストグラムと呼ぶ(ステップS221)。
(2)合成画像の画素値ヒストグラム,目標テクスチャ画像の画素値ヒストグラムを入力として,合成画像の画素値ヒストグラムを目標テクスチャ画像のそれに近づける処理を行い,処理後の合成画像の画素値ヒストグラムを出力する(ステップS222)。
(3)上記(2)で得られた合成画像の画素値ヒストグラムを用いて,処理対象画像の画素値を修正し,合成画像を生成する(ステップS223)。
(4)上記(3)で得られた合成画像を入力として,同画像に対する方向性フィルタバンクの順変換を行い,変換係数を算出する(ステップS224)。
(5)各サブバンドの変換係数を入力として,同変換係数のヒストグラムを出力する(ステップS225)。
(6)合成画像と目標テクスチャ画像の両画像のサブバンドヒストグラムを入力として,合成画像の各サブバンドのヒストグラムを目標テクスチャ画像の同一帯域のサブバンドのヒストグラムに近づける処理を行い,処理後のヒストグラムを出力する(ステップS226)。
(7)上記(6)で得られたサブバンドのヒストグラムを用いて,変換係数の値を修正し,修正後の値を生成する(ステップS227)。
(8)上記(7)で修正した合成画像のサブバンド係数を入力として,方向性フィルタバンクの逆変換を行い,合成画像を出力する(ステップS228)。
(9)以上の処理を一定回数,繰り返す(ステップS222〜S229)。
以上説明した画像符号化および画像復号の処理は,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。
1 画像符号化装置
10 ビット深度変換部
11 波形符号化処理部
12 復号処理部
13 逆ビット深度変換部
14 差分信号生成部
15 テクスチャ分析処理部
16,17 ビット深度制限処理部
3 画像復号装置
30 テクスチャ合成処理部
31 復号処理部
32 逆ビット深度変換部
33 復号信号生成部
34 逆ビットシフト処理部

Claims (9)

  1. Nビットの画像信号を入力し,N−Δビット信号(Δ>0)にビット深度変換する過程と,
    ビット深度変換後のN−Δビット信号の画像信号に対して,波形符号化に基づく符号化処理を行い,符号化データを生成する波形符号化処理過程と,
    前記符号化データを復号する過程と,
    前記復号されたN−Δビット信号の復号信号を逆ビット深度変換し,Nビットの復号信号を生成する過程と,
    入力した前記Nビットの画像信号と,前記逆ビット深度変換後のNビットの復号信号との差分信号を算出する過程と,
    前記差分信号に対して,設定されたビット深度制限パラメータに基づきビット深度の制限を行うビット深度制限処理過程と,
    前記ビット深度制限処理過程により制限された差分信号に対するテクスチャ分析により,前記制限された差分信号を画素値のヒストグラムおよび変換フィルタ係数のヒストグラム群により表現したテクスチャ分析情報の符号化データを生成するテクスチャ分析処理過程と,
    符号化ストリームとして,前記波形符号化処理過程による符号化データと前記テクスチャ分析処理過程による符号化データを符号化ストリームに統合する過程とを有し,
    前記テクスチャ分析処理過程では,前記差分信号に対するビット深度の制限量に応じて,制限量が大きいときに前記テクスチャ分析で得られるヒストグラムのビン数が小さくなるように表現精度を制御する
    ことを特徴とする画像符号化方法。
  2. 入力したNビットの画像信号からビットシフトにより上位N−Δビットの画像信号(Δ>0)を抽出する過程と,
    抽出したN−Δビットの画像信号に対して,波形符号化に基づく符号化処理を行い,符号化データを生成する波形符号化処理過程と,
    前記Nビットの画像信号から下位Δビットの画像信号を抽出する過程と,
    前記下位Δビットの画像信号に対して,設定されたビット深度制限パラメータに基づきビット深度の制限を行うビット深度制限処理過程と,
    前記ビット深度制限処理過程により制限された画像信号に対するテクスチャ分析により,前記制限された画像信号を画素値のヒストグラムおよび変換フィルタ係数のヒストグラム群により表現したテクスチャ分析情報の符号化データを生成するテクスチャ分析処理過程と,
    符号化ストリームとして,前記波形符号化処理過程による符号化データと前記テクスチャ分析処理過程による符号化データを符号化ストリームに統合する過程とを有し,
    前記テクスチャ分析処理過程では,前記画像信号に対するビット深度の制限量に応じて,制限量が大きいときに前記テクスチャ分析で得られるヒストグラムのビン数が小さくなるように表現精度を制御する
    ことを特徴とする画像符号化方法。
  3. 請求項1または請求項2記載の画像符号化方法において,
    前記テクスチャ分析処理過程では,変換フィルタ係数を生成する変換処理における全分解レベルの全方向成分に対する近似誤差和が付与の閾値以下に抑えられるように前記変換フィルタ係数のヒストグラムのビン数を設定する
    ことを特徴とする画像符号化方法。
  4. 請求項1または請求項2記載の画像符号化方法において,
    前記変換フィルタ係数は,steerablepyramid 変換のフィルタ係数であり,
    前記テクスチャ分析処理過程では,前記steerablepyramid 変換における全分解レベルの全方向成分に対する近似誤差和が付与の閾値以下に抑えられるように前記変換フィルタ係数のヒストグラムのビン数を設定する
    ことを特徴とする画像符号化方法。
  5. Nビットの画像信号を入力し,N−Δビット信号(Δ>0)に変換するビット深度変換部と,
    ビット深度変換後のN−Δビット信号の画像信号に対して,波形符号化に基づく符号化処理を行い,符号化データを生成する波形符号化処理部と,
    前記符号化データを復号する復号処理部と,
    前記復号処理部の出力であるN−Δビット信号の復号信号を逆ビット深度変換し,Nビットの復号信号を生成する逆ビット深度変換部と,
    入力した前記Nビットの画像信号と,前記逆ビット深度変換後のNビットの復号信号との差分信号を算出する差分信号生成部と,
    前記差分信号に対して,設定されたビット深度制限パラメータに基づきビット深度の制限を行うビット深度制限処理部と,
    前記ビット深度制限処理部により制限された差分信号に対するテクスチャ分析により,前記制限された差分信号を画素値のヒストグラムおよび変換フィルタ係数のヒストグラム群により表現したテクスチャ分析情報の符号化データを生成するテクスチャ分析処理部とを備え,
    前記テクスチャ分析処理部は,前記差分信号に対するビット深度の制限量に応じて,制限量が大きいときに前記テクスチャ分析で得られるヒストグラムのビン数が小さくなるように表現精度を制御し,
    符号化ストリームとして,波形符号化処理による符号化データとテクスチャ分析による符号化データを符号化ストリームに統合する
    ことを特徴とする画像符号化装置。
  6. 入力したNビットの画像信号から上位N−Δビットの画像信号(Δ>0)を抽出するビットシフト処理部と,
    前記N−Δビットの画像信号に対して,波形符号化に基づく符号化処理を行い,符号化データを生成する波形符号化処理部と,
    前記Nビットの画像信号から下位Δビットの画像信号を抽出する下位ビット抽出処理部と,
    前記下位Δビットの画像信号に対して,設定されたビット深度制限パラメータに基づきビット深度の制限を行うビット深度制限処理部と,
    前記ビット深度制限処理部により制限された画像信号に対するテクスチャ分析により,前記制限された画像信号を画素値のヒストグラムおよび変換フィルタ係数のヒストグラム群により表現したテクスチャ分析情報の符号化データを生成するテクスチャ分析処理部とを備え,
    前記テクスチャ分析処理部は,前記画像信号に対するビット深度の制限量に応じて,制限量が大きいときに前記テクスチャ分析で得られるヒストグラムのビン数が小さくなるように表現精度を制御し,
    符号化ストリームとして,波形符号化処理による符号化データとテクスチャ分析による符号化データを符号化ストリームに統合する
    ことを特徴とする画像符号化装置。
  7. 請求項5または請求項6記載の画像符号化装置において,
    前記テクスチャ分析処理部は,変換フィルタ係数を生成する変換処理における全分解レベルの全方向成分に対する近似誤差和が付与の閾値以下に抑えられるように前記変換フィルタ係数のヒストグラムのビン数を設定する
    ことを特徴とする画像符号化装置。
  8. 請求項5または請求項6記載の画像符号化装置において,
    前記変換フィルタ係数は,steerablepyramid 変換のフィルタ係数であり,
    前記テクスチャ分析処理部は,前記steerablepyramid 変換における全分解レベルの全方向成分に対する近似誤差和が付与の閾値以下に抑えられるように前記変換フィルタ係数のヒストグラムのビン数を設定する
    ことを特徴とする画像符号化装置。
  9. 請求項1から請求項までのいずれか1項に記載の画像符号化方法をコンピュータに実行させるための画像符号化プログラム。
JP2010125764A 2010-06-01 2010-06-01 画像符号化方法,画像符号化装置および画像符号化プログラム Expired - Fee Related JP5351093B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010125764A JP5351093B2 (ja) 2010-06-01 2010-06-01 画像符号化方法,画像符号化装置および画像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010125764A JP5351093B2 (ja) 2010-06-01 2010-06-01 画像符号化方法,画像符号化装置および画像符号化プログラム

Publications (2)

Publication Number Publication Date
JP2011254215A JP2011254215A (ja) 2011-12-15
JP5351093B2 true JP5351093B2 (ja) 2013-11-27

Family

ID=45417804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010125764A Expired - Fee Related JP5351093B2 (ja) 2010-06-01 2010-06-01 画像符号化方法,画像符号化装置および画像符号化プログラム

Country Status (1)

Country Link
JP (1) JP5351093B2 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6501397B1 (en) * 2000-05-25 2002-12-31 Koninklijke Philips Electronics N.V. Bit-plane dependent signal compression
JP2002315004A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 画像符号化方法及び装置、画像復号方法及び装置、並びに画像処理システム
US8014445B2 (en) * 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
EP1926321A1 (en) * 2006-11-27 2008-05-28 Matsushita Electric Industrial Co., Ltd. Hybrid texture representation
JP4690371B2 (ja) * 2007-08-17 2011-06-01 日本電信電話株式会社 スケーラブル画像符号化方法,復号方法,符号化装置,復号装置およびそれらのプログラムとその記録媒体
US8155184B2 (en) * 2008-01-16 2012-04-10 Sony Corporation Video coding system using texture analysis and synthesis in a scalable coding framework
US8204325B2 (en) * 2008-01-18 2012-06-19 Sharp Laboratories Of America, Inc. Systems and methods for texture synthesis for video coding with side information

Also Published As

Publication number Publication date
JP2011254215A (ja) 2011-12-15

Similar Documents

Publication Publication Date Title
AU711488B2 (en) Hybrid waveform and model-based encoding and decoding of image signals
Secker et al. Highly scalable video compression with scalable motion coding
US8223837B2 (en) Learning-based image compression
JP4966669B2 (ja) マッチング追跡を用いたデータ圧縮
US6597739B1 (en) Three-dimensional shape-adaptive wavelet transform for efficient object-based video coding
CN109996073B (zh) 一种图像压缩方法、系统、可读存储介质及计算机设备
RU2335803C2 (ru) Способ и устройство покадрового кодирования остаточного движения на основании сверхполного базисного преобразования для уплотнения видеоизображения
CN116939226A (zh) 一种面向低码率图像压缩的生成式残差修复方法及装置
Kountchev et al. Inverse pyramidal decomposition with multiple DCT
Kabir et al. Edge-based transformation and entropy coding for lossless image compression
US8989278B2 (en) Method and device for coding a multi dimensional digital signal comprising original samples to form coded stream
JP5351094B2 (ja) 画像符号化方法,画像符号化装置および画像符号化プログラム
CN113079377B (zh) 一种深度图像/视频压缩网络的训练方法
JP5351093B2 (ja) 画像符号化方法,画像符号化装置および画像符号化プログラム
JP2009049627A (ja) スケーラブル画像符号化方法,復号方法,符号化装置,復号装置およびそれらのプログラムとその記録媒体
Gray et al. Image compression and tree-structured vector quantization
Kumari et al. Image quality estimation by entropy and redundancy calculation for various wavelet families
Wu et al. Comparisons of Threshold EZW and SPIHT Wavelets Based Image Compression Methods
Annalakshmi Lossy image compression techniques
Chen et al. A two-part predictive coder for multitask signal compression
Hussain et al. A pixel based method for image compression
JP4255071B2 (ja) 注目画素値選択型符号化装置および復号装置
JP4000589B2 (ja) 復号装置および復号方法、並びにプログラムおよび記録媒体
Basha et al. A robust approach for qualitative compression in JPEG 2000 standard
Ho et al. A variable-rate image coding scheme with vector quantization and clustering interpolation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130822

R150 Certificate of patent or registration of utility model

Ref document number: 5351093

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees