JP2012089964A - 画像符号化方法,画像符号化装置および画像符号化プログラム - Google Patents
画像符号化方法,画像符号化装置および画像符号化プログラム Download PDFInfo
- Publication number
- JP2012089964A JP2012089964A JP2010233230A JP2010233230A JP2012089964A JP 2012089964 A JP2012089964 A JP 2012089964A JP 2010233230 A JP2010233230 A JP 2010233230A JP 2010233230 A JP2010233230 A JP 2010233230A JP 2012089964 A JP2012089964 A JP 2012089964A
- Authority
- JP
- Japan
- Prior art keywords
- division
- area
- coefficients
- region
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】係数選択処理部20は,画像の領域を分割する複数の分割候補となる位置のそれぞれについて分割位置を設定し,設定された分割位置で画像の領域を分割する。その領域分割の候補の中で,全分割領域の係数の総数が一定という条件下で,全領域の歪み量の総和またはさらに分割領域の境界部の不連続性を最小化する最適な領域分割を選択し,その各分割領域に対する変換係数の選択を行う。
【選択図】図1
Description
一方,変換係数から信号領域での値を復号する処理は,過完備な基底系からなる変換の逆変換を表す行列をΦとすると,次式のように表わされる。
DTCWTの場合,xがn次元ベクトルであるとすると,変換により得られる変換係数yは2n次元ベクトルとなる。このため,同変換を画像符号化へ応用する場合,データ数の削減の観点から,変換係数を適切に選択する必要がある。この変換係数の選択は,以下の制約条件付き最小化問題として定式化できる。
ここで,‖・‖0 は,L0 ノルムであり,非ゼロ係数の個数を表している。上記の制約条件付きの最小化問題は,ラグランジュの未定乗数法により以下の最小化問題に帰着される。
ここでλは,外部から与えられる重みパラメータである。第一項は,選択された変換係数の個数であり,変換係数の情報量を近似した値である。第二項は変換係数の選択に伴う再構成誤差を表しており,符号化歪みを表している。‖・‖2 2 は,L2 ノルムの二乗値であり,二乗和を表す。しかし,上記の最小化問題はNP困難であるため,従来,以下のようなL1 ノルムに最小化問題として近似する方法がとられてきた。
ここで,‖・‖は,L1 ノルムであり,ベクトルの要素の絶対値和を表している。
yLS=ΦT [ΦΦT ]-1x
により求められた係数ベクトルである。また,S(Φ,x)からC(K)への直交射影は,ht(y,K)により与えられる。ここで,ht(y,K)は,C(K)へのユークリッド距離を最小にする射影であり,最も大きい値からK個の係数を選択する操作に相当する。
このような過完備系を用いた変換は,画像信号にsparsenessを仮定し,少数の変換係数で画像を表現するsparse representationの一種である。
画面内の係数総数が一定(全分割領域の係数総数が一定)という条件下で全領域の歪み量の総和を最小化するための分割を考える。さらに,垂直に2分割する場合と水平に2分割する場合の結果を比較し,上記歪み量最小化の規範に基づき,垂直分割・水平分割のいずれかを選択する。
上式は,領域0≦s≦W,0≦t≦Hを,上側領域0≦s≦W,0≦t≦h−1と,下側領域0≦s≦W,h≦t≦Hに分割し,上側領域および下側領域を各々,kh 個の係数およびk−kh 個の係数で表現した場合の近似誤差和を表している。
上式は,領域0≦s≦W,0≦t≦Hを,左側領域0≦s≦w−1,0≦t≦Hと,右側領域w≦s≦W,0≦t≦Hに分割し,左側領域および右側領域を各々,kw 個の係数およびk−kw 個の係数で表現した場合の近似誤差和を表している。
Ξhor [x,0,h0 ,W,H,k0,h ,k−k0,h ,Cu ,Cd ]
≦Ξver [x,w0 ,0,W,H,k0,w ,k−k0,w ,Cl ,Cr ]
となる場合には,t=h0 の位置で垂直方向に分割を行うこととし,それ以外の場合には,s=w0 の位置で水平方向に分割を行うこととする。なお,h0 =0あるいはw0 =0となる場合,分割を行わないほうが最適であるので分割は行われない。
2つの分割領域において画素当りの係数の個数が一定という条件下で,各領域の歪み量を最小化するための分割を考える。さらに,垂直に2分割する場合と水平に2分割する場合の結果を比較し,上記加重和最小化の規範に基づき,垂直分割・水平分割のいずれかを選択する。
画面内の係数総数が一定(全分割領域の係数総数が一定)という条件下で分割後の歪み量の総和および分割境界の不連続性の評価尺度(後述)の加重和(分割コストと呼ぶ)を最小化する分割を考える。さらに,垂直に2分割する場合と水平に2分割する場合の結果を比較し,上記分割コスト最小化の規範に基づき,垂直分割・水平分割のいずれかを選択する。
[参考文献1]:Z. Wang and E. P. Simoncelli, “Translation insensitive image similarity in complex wavelet domain”, IEEE International Conference on Acoustics, Speech & Signal Processing, vol. II, pp. 573-576, Philadelphia, PA, March 2005。
Ξhor [x,0,h0 ,W,H,k0,h ,k−k0,h ,Cu ,Cd ]+
λΘhor [x,0,W,h0 −L,2L+1,k0,h ,k−k0,h ,Cu ,Cd ]
≦ Ξver [x,w0 ,0,W,H,k0,w ,k−k0,w ,Cl ,Cr ]+
λΘver [x,0,H,w0 −L,2L+1,k0,w ,k−k0,w ,Cl ,Cr ]
となる場合には,t=h0 の位置で垂直方向に分割を行うこととし,それ以外の場合には,s=w0 の位置で水平方向に分割を行うこととする。なお,h0 =0あるいはw0 =0となる場合,分割を行わないほうが最適であるので分割は行われない。
2つの分割領域において画素当りの係数の個数が一定という条件下で,分割後の歪み量の総和および分割境界の不連続性の評価尺度(後述)の加重和(分割コストと呼ぶ)を最小化する分割を考える。さらに,垂直に2分割する場合と水平に2分割する場合の結果を比較し,上記加重和最小化の規範に基づき,垂直分割・水平分割のいずれかを選択する。前記[領域分割方法3]との違いは,分割領域への係数割当てを分割領域内の画素数に応じて設定している点にある。このため,分割コスト最小化という観点から見た場合,[領域分割方法3]で求まる解を最適解とすれば,本方法で求まる方法は準最適解であるが,解を求める演算コストを低減することができる。
図1は,本発明の実施形態に係る画像符号化装置の構成例を示す。画像符号化装置10は映像信号を入力すると,予測部14により予測された予測信号との差分から予測残差信号を求め,その予測残差信号を変換部11により冗長系の変換基底を用いて変換する。係数選択処理部20は,変換部11の出力である変換係数の絞り込みを行うために,画面内を性質の類似した領域に分割し,分割領域ごとにコストが小さくなる変換係数を符号化対象として選択する。エントロピ符号化部15は,選択された変換係数を可変長符号化し,符号化ストリームとして出力する。
図2は,係数選択処理部20が実行する係数選択処理フローを示す図である。ここでは,主に[領域分割方法4]により領域分割を行う場合の実施例を説明するが,この方法は,[領域分割方法1]〜[領域分割方法3]の方法を包含しており,以下の説明から[領域分割方法1]〜[領域分割方法3]の領域分割による係数選択処理についても同様に実施することができることは明らかである。
[ステップS1]:領域を領域1と領域2とに分割するとした場合の領域1の係数の個数k1をループインデックスとして,初期値をk1=0,増分を1とし,k1<Kの間,ステップS1〜S3の処理を繰り返す。なお,領域2の係数の個数k2は,k2=K−k1となる。
[ステップS2]:領域1の係数の個数k1と,領域2の係数の個数k2(=K−k1)と,入力領域とを引数として,Opt_sub_div関数(最適分割処理関数)を呼び出す。この関数によって,最適分割処理部22により,図3,図4に示す最適分割処理が実行される。
[ステップS3]:ループインデックスk1に1を加算し,ステップS1以降の処理を繰り返す。k1がK以上になったならばループを終了する。
[ステップS4]:ステップS2の処理結果から領域1,領域2の最適な係数個数を算出する。
[ステップS5]:分割無しラベルを持たない領域の有無を判定し,分割無しラベルを持たない領域がある場合には,ステップS6へ進む。すべての領域が分割無しラベルを持つ領域になった場合には,ステップS8へ進む。
[ステップS6]:コスト関数値が最大の領域を同定する。この領域の係数の個数をK′とする。
[ステップS7]:係数の個数K′とコスト関数値が最大となる領域とを引数とするSegment関数を呼び出し,係数選択処理部20による処理を,分割無しラベルを持つ領域が無くなるまで,再帰的に繰り返す。
[ステップS8]:コスト関数値が最大の領域を同定し,Segment関数の呼び出し元へ戻る。
図3および図4に,最適分割処理部22が実行する最適分割処理フローを示す。最適分割処理部22は,図2に示すステップS2におけるOpt_sub_div関数(最適分割処理関数)によって呼び出される。入力は,領域1の係数の個数k1と,領域2の係数の個数k2と,最適分割対象の領域である。
[ステップS10]:縦分割位置(領域を垂直方向に2分割する位置)をループインデックスとして,初期値を0,増分をMとし,縦分割位置<画面縦幅の間,ステップS10〜S12の処理を繰り返す。
[ステップS11]:係数の個数k1,k2および縦分割位置を引数として,コスト関数算出関数を呼び出す。この関数によって,コスト算出部222により,図5に示すコスト関数算出処理が実行される。
[ステップS12]:ループインデックスの縦分割位置にMを加算し,ステップS10以降の処理を繰り返す。縦分割位置が画面縦幅以上になったならばループを終了する。
[ステップS13]:コスト関数算出の処理結果から最適縦分割位置を算出し,図4のステップS20へ進む。
[ステップS14]:横分割位置(領域を水平方向に2分割する位置)をループインデックスとして,初期値を0,増分をMとし,横分割位置<画面横幅の間,ステップS14〜S16の処理を繰り返す。
[ステップS15]:係数の個数k1,k2および横分割位置を引数として,コスト関数算出関数を呼び出す。この関数によって,コスト算出部222により,図5に示すコスト関数算出処理が実行される。
[ステップS16]:ループインデックスの横分割位置にMを加算し,ステップS14以降の処理を繰り返す。横分割位置が画面横幅以上になったならばループを終了する。
[ステップS17]:コスト関数算出の処理結果から最適横分割位置を算出し,図4のステップS20へ進む。なお,ステップS10〜S13とステップS14〜S17の処理は,パラレルに実行してもシリアルに実行してもどちらでもよい。
[ステップS20]:最適縦分割位置を用いたコストと最適横分割位置を用いたコストとの大小を比較し,最適縦分割位置を用いたコストのほうが小さい場合には,ステップS21へ進み,そうでない場合には,ステップS25へ進む。
[ステップS21]:一方の分割領域の画素数が0か,または一方の分割領域の変換係数の個数が0の場合,ステップS22へ進み,そうでない場合には,ステップS24へ進む。
[ステップS22]:入力された領域に対して,領域の分割は行わないことを示す分割無しラベルを付与する。
[ステップS23]:Opt_sub_div関数の呼び出し元へ分割無しラベルを返し,処理を終了する。
[ステップS24]:最適縦分割位置の情報,各分割領域の変換係数,各分割領域の近似誤差,コスト関数値を,Opt_sub_div関数の呼び出し元へ返し,処理を終了する。
[ステップS25]:一方の分割領域の画素数が0か,または一方の分割領域の変換係数の個数が0の場合,ステップS26へ進み,そうでない場合には,ステップS28へ進む。
[ステップS26]:入力された領域に対して,領域の分割は行わないことを示す分割無しラベルを付与する。
[ステップS27]:Opt_sub_div関数の呼び出し元へ分割無しラベルを返し,処理を終了する。
[ステップS28]:最適横分割位置の情報,各分割領域の変換係数,各分割領域の近似誤差,コスト関数値を,Opt_sub_div関数の呼び出し元へ返し,処理を終了する。
図5に,コスト算出部222が実行するコスト関数算出処理フローを示す。コスト算出部222は,図3に示すステップS11およびS15におけるコスト関数算出関数によって呼び出される。入力は,領域1の係数の個数k1,領域2の係数の個数k2,縦分割位置または横分割位置である。
[ステップS30]:領域1に対して,k1個の係数を選択する係数選択処理を行う。
[ステップS31]:領域1に対して,上記の係数選択処理により選択されたk1個の係数で近似した場合の近似誤差を算出する。
[ステップS32]:領域1に対して,上記の係数選択処理により選択されたk1個の係数で近似した場合の復号信号を得る。その後,ステップS36へ進む。
[ステップS33]:領域2に対して,k2個の係数を選択する係数選択処理を行う。
[ステップS34]:領域2に対して,上記の係数選択処理により選択されたk2個の係数で近似した場合の近似誤差を算出する。
[ステップS35]:領域2に対して,上記の係数選択処理により選択されたk2個の係数で近似した場合の復号信号を得る。なお,ステップS30〜S32とステップS33〜S35とは,パラレルに実行してもシリアルに実行してもどちらでもよい。
[ステップS36]:領域1,2の復号信号の境界領域に対して,不連続尺度を算出する。
[ステップS37]:領域1,2の近似誤差和にλ×不連続尺度を加算して,コスト関数値を算出する。算出したコスト関数値を,関数の呼び出し元へ返し,処理を終了する。
11 変換部
12 逆変換部
13 歪除去フィルタ
14 予測部
15 エントロピ符号化部
20 係数選択処理部
21 領域分割形状設定部
22 最適分割処理部
221 係数選択部
222 コスト算出部
Claims (8)
- 入力された画像信号に対して冗長系の変換基底を用いた変換を行い,得られた変換係数を絞り込み,絞り込んだ結果の変換係数を符号化する画像符号化方法において,
画像の領域を分割する複数の分割候補となる位置のそれぞれについて,分割位置を設定する過程と,
前記設定された分割位置で画像の領域を分割し,全分割領域の係数の総数が一定という条件下で各分割領域の変換係数を選択する過程と,
前記複数の分割候補となる位置でそれぞれ分割したすべての領域分割の中で,全領域の変換係数の選択による歪み量の総和が最小となる領域分割を選択するとともに,各分割領域における符号化に用いる変換係数を選択する過程とを有する
ことを特徴とする画像符号化方法。 - 入力された画像信号に対して冗長系の変換基底を用いた変換を行い,得られた変換係数を絞り込み,絞り込んだ結果の変換係数を符号化する画像符号化方法において,
画像の領域を分割する複数の分割候補となる位置のそれぞれについて,分割位置を設定する過程と,
前記設定された分割位置で画像の領域を分割し,全分割領域の係数の総数が一定という条件下で各分割領域の変換係数を選択する過程と,
前記複数の分割候補となる位置でそれぞれ分割したすべての領域分割の中で,全領域の変換係数の選択による歪み量の総和および分割領域の境界部の不連続性を最小化する領域分割を選択するとともに,各分割領域における符号化に用いる変換係数を選択する過程とを有する
ことを特徴とする画像符号化方法。 - 請求項1または請求項2記載の画像符号化方法において,
分割領域の係数の個数を,分割領域の画素数に応じて設定する
ことを特徴とする画像符号化方法。 - 請求項1から請求項3までのいずれか1項に記載の画像符号化方法において,
前記選択された領域分割における各分割領域に対して,所定の分割の終了条件が満たされるまで,前記領域分割および変換係数を選択する処理を再帰的に繰り返す
ことを特徴とする画像符号化方法。 - 入力された画像信号に対して冗長系の変換基底を用いた変換を行い,得られた変換係数を絞り込み,絞り込んだ結果の変換係数を符号化する画像符号化装置において,
画像の領域を分割する複数の分割候補となる位置のそれぞれについて,分割位置を設定する手段と,
前記設定された分割位置で画像の領域を分割し,全分割領域の係数の総数が一定という条件下で各分割領域の変換係数を選択する手段と,
前記複数の分割候補となる位置でそれぞれ分割したすべての領域分割の中で,全領域の変換係数の選択による歪み量の総和が最小となる領域分割を選択するとともに,各分割領域における符号化に用いる変換係数を選択する手段とを備える
ことを特徴とする画像符号化装置。 - 入力された画像信号に対して冗長系の変換基底を用いた変換を行い,得られた変換係数を絞り込み,絞り込んだ結果の変換係数を符号化する画像符号化装置において,
画像の領域を分割する複数の分割候補となる位置のそれぞれについて,分割位置を設定する手段と,
前記設定された分割位置で画像の領域を分割し,全分割領域の係数の総数が一定という条件下で各分割領域の変換係数を選択する手段と,
前記複数の分割候補となる位置でそれぞれ分割したすべての領域分割の中で,全領域の変換係数の選択による歪み量の総和および分割領域の境界部の不連続性を最小化する領域分割を選択するとともに,各分割領域における符号化に用いる変換係数を選択する手段とを備える
ことを特徴とする画像符号化装置。 - 請求項5または請求項6記載の画像符号化装置において,
分割領域の係数の個数を,分割領域の画素数に応じて設定する
ことを特徴とする画像符号化装置。 - 請求項1から請求項4までのいずれか1項に記載の画像符号化方法を,コンピュータに実行させるための画像符号化プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010233230A JP5626728B2 (ja) | 2010-10-18 | 2010-10-18 | 画像符号化方法,画像符号化装置および画像符号化プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010233230A JP5626728B2 (ja) | 2010-10-18 | 2010-10-18 | 画像符号化方法,画像符号化装置および画像符号化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012089964A true JP2012089964A (ja) | 2012-05-10 |
JP5626728B2 JP5626728B2 (ja) | 2014-11-19 |
Family
ID=46261140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010233230A Expired - Fee Related JP5626728B2 (ja) | 2010-10-18 | 2010-10-18 | 画像符号化方法,画像符号化装置および画像符号化プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5626728B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06178118A (ja) * | 1992-12-09 | 1994-06-24 | Hitachi Denshi Ltd | 画像データ圧縮符号化方法及び装置 |
JP2010199959A (ja) * | 2009-02-25 | 2010-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 画像符号化装置,画像符号化方法および画像符号化プログラム |
-
2010
- 2010-10-18 JP JP2010233230A patent/JP5626728B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06178118A (ja) * | 1992-12-09 | 1994-06-24 | Hitachi Denshi Ltd | 画像データ圧縮符号化方法及び装置 |
JP2010199959A (ja) * | 2009-02-25 | 2010-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 画像符号化装置,画像符号化方法および画像符号化プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5626728B2 (ja) | 2014-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7134200B2 (ja) | デジタルイメージ再圧縮 | |
RU2612612C2 (ru) | Способ и устройство для выполнения интерполяции на основе преобразования и обратного преобразования | |
US20200021856A1 (en) | Hierarchical point cloud compression | |
JP5076150B2 (ja) | 画像符号化装置,画像符号化方法および画像符号化プログラム | |
US20180242011A1 (en) | Method and apparatus for encoding/decoding images using adaptive motion vector resolution | |
CN108028941B (zh) | 用于通过超像素编码和解码数字图像的方法和装置 | |
RU2510945C1 (ru) | Способ и устройство для кодирования и декодирования изображения с использованием крупной единицы преобразования | |
US9204154B2 (en) | Image encoding device and image decoding device | |
CN107743239B (zh) | 一种视频数据编码、解码的方法及装置 | |
JP2020522182A (ja) | ビデオ圧縮におけるエントロピーコーディングのための選択的ミキシング | |
KR20100058646A (ko) | 화상 부호화 방법 및 복호 방법, 그들의 장치, 그들의 프로그램과 프로그램을 기록한 기록매체 | |
JP3959039B2 (ja) | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム | |
WO2014138633A2 (en) | Systems and methods for digital media compression and recompression | |
CN105474642A (zh) | 使用频域差对图像集合进行重新编码 | |
Hassaballah et al. | A Fast Fractal Image Compression Method Based on Entropy | |
Zhang et al. | Lossless image compression using a multi-scale progressive statistical model | |
Chen et al. | CNN-optimized image compression with uncertainty based resource allocation | |
JP5561611B2 (ja) | 画像符号化方法,画像符号化装置および画像符号化プログラム | |
JP5626728B2 (ja) | 画像符号化方法,画像符号化装置および画像符号化プログラム | |
JP6564315B2 (ja) | 符号化装置、復号装置、及びプログラム | |
JP2013017128A (ja) | イントラ予測モード推定装置、画像符号化装置、画像復号装置、及びプログラム | |
JP5809574B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、符号化プログラム及び復号プログラム | |
JP2015035788A (ja) | 画像符号化装置、画像符号化方法及びプログラム | |
CN105706447A (zh) | 动画图像编码设备、动画图像解码设备、动画图像编码方法、动画图像解码方法以及程序 | |
JP5035926B2 (ja) | 画像符号化装置,画像符号化方法および画像符号化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130722 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130722 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140715 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140916 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140922 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5626728 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |