JP2012531075A - 代表的なパッチを使用したテクスチャリファインメントによる画像符号化 - Google Patents

代表的なパッチを使用したテクスチャリファインメントによる画像符号化 Download PDF

Info

Publication number
JP2012531075A
JP2012531075A JP2012515520A JP2012515520A JP2012531075A JP 2012531075 A JP2012531075 A JP 2012531075A JP 2012515520 A JP2012515520 A JP 2012515520A JP 2012515520 A JP2012515520 A JP 2012515520A JP 2012531075 A JP2012531075 A JP 2012531075A
Authority
JP
Japan
Prior art keywords
sub
region
regions
decoded
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012515520A
Other languages
English (en)
Other versions
JP5583762B2 (ja
Inventor
ラカプ,ファビアン
トロ,ドミニク
ヴィロン,ジェローム
フランソワ,エドゥアール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2012531075A publication Critical patent/JP2012531075A/ja
Application granted granted Critical
Publication of JP5583762B2 publication Critical patent/JP5583762B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本発明は、複数のサブ領域に分割される画像を符号化する方法に関する。本符号化方法は、画像の他のサブ領域を代表するサブ領域を画像から抽出するステップ10、他のサブ領域を代表するサブ領域を第一の品質Q0で符号化し、他のサブ領域を第一の品質Q0よりも低い第二の品質Q1で符号化するステップ12を含む。

Description

本発明は、画像符号化の分野に関する。
本発明は、画像の符号化方法及び復号化方法に関する。
H.264規格に従う符号化方法を使用するために画像系列を効率的に符号化することが当該技術分野において知られている。このH.264規格は、2006年8月15日に発表された“Information technology -Coding of audio-visual objects - Part 10: Advanced Video Coding”と題されたISO/IEC14496-10文献で特に定義されている。しかし、係る符号化方法は、画像のテクスチャ領域において特にアーチファクトを引き起こす。
本発明の目的は、従来技術の問題点の少なくとも1つを解消することにある。
有利なことに、本発明は、画像のテクスチャ領域がより効率的に、すなわち一定のビットレートで良好な品質レベルで、又は所与の品質レベルで低いビットレートで符号化されるのを可能にする。この目的のために、パッチと呼ばれる、符号化されるべき画像の領域は、符号化されるべき画像の他のパッチよりも高い品質でストリームFにおいて識別及び符号化される。次いで、より高い品質で符号化されるこれらのパッチは、低い品質で符号化されるパッチのテクスチャを改善するため、復号化方法により使用される。本発明に係る符号化方法は、知覚の冗長度の観点でストリームFにおける情報の良好な分散を可能にする。
本発明は、限定するものではない添付図面を参照して、実施の形態及び有利な実現により良好に理解及び例示される。
本発明に係る符号化方法及び復号化方法を示す図である。 本発明の第一の実施の形態に係る符号化方法の抽出のステップを示す図である。 第一の実施の形態の変形例を示す図である。 本発明の第二の実施の形態に係る符号化方法の抽出のステップを示す図である。 本発明に係る符号化装置を示す図である。 本発明に係る復号化装置を示す図である。
本発明は、図1と共に記載される原画像Iを符号化する方法に関する。本方法は、代表的なサブ領域(Representative Sub-Region)の抽出のステップ10及び符号化のステップ12を含む。
ステップ10の間、代表的なサブ領域(RSR)は、原画像の残りの部分の代表であり、すなわち原画像の残りの部分との強い冗長度を有しており、符号化されるべき原画像Iから抽出される。以下、原画像は、単に画像と呼ばれる。抽出のステップは、所与のサブ領域と画像の残りの部分との間の冗長度の評価に基づく。所与のサブ領域が画像の多数のサブ領域と高い冗長度を有するとき、このサブ領域は、RSRであると宣言され、「ディクショナリ“dictionary”」に配置される。
図2を参照して記載される第一の実施の形態によれば、RSRのサブ領域は、事前に抽出され、すなわちRSRサブ領域の選択で使用される演算及び/又は基準は、デコーダで実現される冗長性の理由の正確なプロセスを考慮しない。従って、演算はデコーダで実現される演算と対称的ではないため、RSRサブ領域を抽出するために様々なソリューションが可能である。画像の可能なサブ領域のセット{SRii∈{0,M-1}は、画像のパーティションを形成するサブ領域のセットであるとして定義される。言い換えれば、画像Iは、M個のサブ領域に分割される。サブ領域は、たとえば任意のサイズ又は形状のブロック又はゾーンである。
ステップ92の間、画像の可能性のあるサブ領域{SRii∈{0,M-1}のセットのそれぞれのサブ領域について、SRiと画像の残りの部分との間の基準Dが計算される。問題となる基準は、あるサブ領域の別のサブ領域又は他の複数のサブ領域との類似性が特徴付けられるのを可能にする。たとえば基準は、数学的な意味での相互情報量又はSAD(Sum of Absolute Difference)又はSSE(Sum of Squared Difference)のような歪みである。相互情報量は、条件付きエントロピーの計算の形を表す。別の変形例によれば、基準は、位相の相関の測度である。たとえば、
Figure 2012531075
である、ここでsad(SRi,SRj)は、SRi領域とSRj領域との間で計算されるSADである。
ステップ94の間、基準が相互情報量である場合に最大の基準値Dj(基準がある歪みである場合にそれぞれ最小の基準値)を有するサブ領域SRj、又は基準が相互情報量である場合に最も高い基準値(基準がある歪みである場合に最も低い基準値)を有するN個のサブ領域SRjは、画像の最も代表的なN個のRSRサブ領域を抽出するのを望むとき、RSRサブ領域として保持される。基準Diが数学的な意味での相互情報量又は位相の相関の測度である場合、最も高い基準値を有するN個のサブ領域SRjは、RSRサブ領域として保持される。対照的に、基準が歪みである場合、最も低い基準値を有するN個のサブ領域SRjは、RSRサブ領域として保持される。
図3を参照して記載される第一の実施の形態の変形例によれば、画像のM個の可能性のあるサブ領域SRiのセットについて、以下のステップが実行される。
所与の品質Q0でSRiを符号化するステップ(102)。
SRiを復号化するステップ(104)。
所与の品質Q1(Q1<Q0)で、画像の残り、すなわち他のサブ領域I\{SRi}を符号化するステップ(106)。
画像の残りを復号化するステップ(108)。
Q0で復号化されたSRiとQ1で復号化された画像の残りとの間の基準Diを計算するステップ(110)。
従って、画像I\{SRi}の残りは、画像の他のサブ領域に対応する。
初期化のステップ100の間、インデックスiは、ゼロi=0にリセットされる。
ステップ102の間、領域SRiは、品質Q0で符号化される。領域SRiは、例えばH.264又はMPEG-2規格に従って符号化される。しかし、本発明は、ステップ102で実現される符号化方法によって限定されるものではない。従って、実施の形態の変形例によれば、領域SRiは、M-JPEG又はJPEG2000規格に従って符号化される。特定の実施の形態によれば、領域SRiは、画素のブロックである。符号化ステップ102は、予測ブロックの決定を含む。たとえば、予測ブロックは、領域SRiに空間的に隣接するブロックから決定されるか(モードINTRA)、係るブロックの線形結合によるか、係るブロックの画素の線形結合によるか、或いは他の画像のブロックの線形結合により決定される(モードINTER)。次いで、予測ブロックは、重み付けの有無に係らず、たとえば画素毎の減算により、領域SRiから抽出される。
このように得られる残差ブロックは、たとえばDCT(離散コサイン変換)により変換され、次いで量子化ステップQPminにより係数のブロックに量子化される。変換は、残差ブロックの幾つかのサブブロックに連続して適用される。これは、サブ領域SRiがサイズ16×16のマクロブロックであって、且つDCT変換が8×8変換である場合に特に当てはまる。この符号化ステップ102は、エントロピー符号化ステップの実現を必要としない。ステップ104の間、領域SRiが復号化される。このため、ステップ102で得られた係数のブロックに逆量子化が適用され、続いて、たとえばIDCT(逆離散コサイン変換)といった逆変換が適用されて復号化された残差ブロックが取得される。次いで、この復号化された残差ブロックは、重み付けの有無に係らず、例えば画素毎の加算により予測ブロックとマージされる。この復号化ステップ104は、符号化ステップ102自身が係数のブロックのエントロピー符号化を含む場合を除いて、エントロピー復号化ステップの実現を必要としない。
ステップ106の間、画像の残りの部分、すなわちI\{SRi}は、所与の品質Q1(Q1<Q0)で符号化される。領域SRiを符号化するためにステップ104で使用された符号化方法と同じ符号化方法は、画像の残りの部分を符号化するために使用される。簡単な例では、画像の残りの部分は、ステップ104で使用される符号化方法が必要とする場合に、複数のブロックに分割される。符号化ステップ106は、符号化されるべき画像の残りのそれぞれのブロックについて、予測ブロックの決定を含む。例えば、予測ブロックは、符号化されるべきブロックに空間的に隣接するブロックから決定されるか(モードINTRA)、係るブロック線形結合によるか、係るブロックの所定の画素の線形結合によるか、或いは他の画像のブロックの線形結合により決定される(モードINTER)。次いで、予測ブロックは、重み付けの有無に係らず、例えば画素毎の減算により、符号化されるべきブロックから抽出される。このように取得された残差ブロックは、例えばDCT(離散コサイン変換)により変換され、次いで量子化ステップQPmax>QPminにより係数のブロックに量子化される。変換は、残差ブロックの幾つかのサブブロックに連続して適用される。これは、残差ブロックが16×16のサイズからなる場合であって、DCT変換が8×8変換である場合に特に当てはまる。この符号化ステップは、エントロピー符号化ステップの実現を必要としない。
ステップ108で、画像の残りの部分が復号化される。画像の残りの部分のそれぞれのブロックは、ブロック当たりの符号化方法がステップ106で使用された場合に復号化される。このため、復号化されるべきそれぞれのブロックについて、ステップ106で得られた係数の対応するブロックに対して逆量子化、次いで例えばIDCT(逆離散コサイン変換)逆変換が適用され、復号化された残差ブロックが得られる。この復号化された残差ブロックは、次いで、例えば重み付けの有無に係らず、画素毎の加算により、予測ブロックと結合される。この復号化ステップは、符号化ステップ自身が係数のブロックのエントロピー符号化を含む場合を除いてエントロピー復号化ステップの実現を必要としない。
ステップ110の間、Q0で復号化されたSRiとQ1で復号化された画像の残りの部分との間で基準Diが計算される。問題となる基準は、たとえば数学的な意味で相互情報量又はSAD(Sum of Absolute Difference)又はSSE(Sum of Squared Difference)のような歪みである。相互情報量は、条件付きエントロピー計算の形を表す。別の変形例によれば、基準は、位相の相関の測度である。
セット{SRi}i∈{0,M-1}の領域SRiの全体について、基準Diがステップ102〜110に従って計算された場合、本方法はステップ112に進み、基準Diがステップ102〜110に従って計算されていない場合、本方法は、インデックスiを1だけインクリメントして、ステップ102を繰り返す。
ステップ112の間、サブ領域RSRとして保持し、すなわち、M個の可能性のあるサブ領域のセット{SRii∈{0,M-1}から、基準が相互情報量又は位相の相関である場合に最大の基準値Dj(基準がある歪みである場合にそれぞれの最小の基準値)を有するサブ領域SRjを抽出するか、又は、基準が相互情報量又は位相の相関である場合に最も高い基準値(基準が歪みである場合にそれぞれ最も低い基準値)を有するN個のサブ領域SRjを抽出する。
別の変形例によれば、ステップ102は、量子化ステップQPminにより領域SRiの量子化を含む。
ステップ104は、領域SRiの逆量子化を含む。
ステップ106は、量子化ステップQPmax>QPminによる画像の残りの部分の量子化を含む。実際に、画像の残りの部分は、より表面的に量子化され、すなわちより低い品質で符号化される。
ステップ108は、画像の残りの部分の逆量子化を含む。
他のステップは、この第二の実施の形態の第一の変形例のステップと同一である。
図4を参照して記載される第二の実施の形態によれば、RSRサブ領域が、事前に抽出され、すなわち、RSRサブ領域の選択で使用された演算及び/又は基準は、デコーダで実現される冗長さの利用の正確なプロセスを考慮する。第二の実施の形態によれば、画像のM個の可能性のあるSRiサブ領域について以下のステップが実行される。
所与の品質Q0でSRiを符号化するステップ(202)。
SRiを復号化するステップ(204)。
所与の品質Q1で、画像の残りの部分I\{SRi}、すなわち他のサブ領域を符号化するステップ(206)。
画像の残りの部分、すなわち他のサブ領域を復号化するステップ(208)。
画像の残りの部分の領域のテクスチャをリファインし(209)、品質Q0でSRiテクスチャを利用するステップ。
リファインされた画像とその基準バージョン、すなわち原画像との間の基準Diを計算するステップ(210)。
テクスチャをリファインすることは、その品質を改善すること、すなわち原画像において有していたテクスチャに近づけること、言い換えれば詳細を高めることを意味する。
初期化ステップ200の間、インデックスiはゼロi=0にリセットされる。
ステップ202の間、領域SRiは、品質Q0で符号化される。領域SRiは、例えばH.264又はMPEG-2規格に従って符号化される。しかし、本発明は、ステップ202で実現される符号化方法に限定されるものではない。従って、実施の形態の変形例によれば、領域SRiは、M-JPEG又はJPEG2000規格に従って符号化される。特定の実施の形態によれば、領域SRiは、画素のブロックである。符号化ステップ202は、予測ブロックの決定を含む。たとえば、予測ブロックは、符号化すべきブロックに空間的に隣接するブロックから決定されるか(モードINTRA)、係るブロックの線形結合により、係るブロックの所定の画素の線形結合により、或いは他の画像のブロックの線形結合により決定される(モードINTER)。
次いで、予測ブロックは、重み付けの有無に係らず、例えば画素毎の減算により領域SRiから抽出される。このように得られた残差ブロックは、例えばDCT(離散コサイン変換)により変換され、次いで量子化ステップQPminにより係数のブロックに量子化される。残差ブロックの幾つかのサブブロックに対して変換が連続して適用される。これは、サブ領域SRiが16×16サイズのマクロブロックであって、且つDCT変換が8×8変換である場合に特に当てはまる。この符号化ステップ202は、エントロピー符号化ステップの実現を必要としない。
ステップ204の間、領域SRiが復号化される。このため、ステップ202で得られた係数のブロックに逆量子化が適用され、続いて例えばIDCT(逆離散コサイン変換)といった逆変換が適用され、復号化された残差ブロックが得られる。この復号化された残差ブロックは、重みの有無に係らず、たとえば画素毎の加算により、予測ブロックと結合される。この復号化ステップ204は、符号化ステップ202自身が係数のブロックのエントロピー符号化を含む場合を除いて、エントロピー復号化ステップの実現を必要としない。
ステップ206の間、画像の残りの部分、すなわちI\{SRi}は、所与の品質Q1(Q1<Q0)で符号化される。領域SRiを符号化するためにステップ204で使用された符号化方法と同じ符号化方法は、画像の残りを符号化するために使用される。簡単な例として、画像の残りの部分は、ステップ204で使用された符号化方法が必要とする場合に、複数のブロックに分割される。符号化ステップ206は、符号化すべき画像の残りの部分のそれぞれのブロックについて、予測ブロックの決定を含む。例えば、予測ブロックは、符号化すべきブロックに空間的に隣接するブロックから決定され(モードINTRA)、係るブロックの線形結合により、係るブロックの所定の画素の線形結合により、或いは他の画像のブロックの線形結合により決定される(モードINTRA)。次いで、予測ブロックは、例えば重み付けの有無に係らず、画素毎の減算により、符号化すべきブロックから抽出される。このように得られた残差ブロックは、例えばDCT(離散コサイン変換)により変換され、次いで量子化ステップQPmax>QPminにより係数のブロックに量子化される。変換は、残差ブロックの幾つかのサブブロックに連続的に適用される。これは、残差ブロックが16×16サイズからなる場合であって、且つDCT変換が8×8変換である場合に特に当てはまる。この符号化ステップは、エントロピー符号化ステップの実現を必要としない。
ステップ208の間、画像の残りの部分が復号化される。画像の残りの部分のそれぞれのブロックは、ブロック当たりの符号化方法がステップ206で使用された場合に復号化される。このため、復号化すべきそれぞれのブロックについて、ステップ206で得られた係数の対応するブロックに対して逆量子化、次いで例えばIDCT(逆離散コサイン変換)といった逆変換が適用され、復号化された残差ブロックが得られる。次いで、この復号化された残差ブロックは、重みの有無に係らず、例えば画素毎の加算により、予測ブロックと結合される。この復号化ステップは、符号化ステップ206が係数のブロックのエントロピー符号化を含む場合を除いて、エントロピー復号化ステップの実現を必要としない。
ステップ209の間、画像の残りの部分の領域のテクスチャは、品質Q0でSRiを利用することでリファインされる。リファインメントステップ209は、復号化方法に関連して記載される(ステップ16)。このリファインメントステップ209は、品質Q1(Q1<Q0)で符号化された領域のテクスチャを改善するため、品質Q0で符号化されたデータからの情報を使用する。これを行うため、幾つかのリファインメントアルゴリズムが可能である。
SRiによる現在のサブ領域のリファインメントアルゴリズムの例は、例えばDCT係数といった、変換領域で動作する。このため、SRiに存在するが、符号化の間に量子化により現在のサブ領域で破壊された高周波は、現在のサブ領域に加えられる。画像の残りの部分のサイズa2のそれぞれのブロックについて、以下の式が計算される。
Figure 2012531075
ここでlast_coefはブロックの最後のDCT係数のインデックスであり、DCT(n)はジグザグの順序、すなわちブロックのスキャニング順序で位置nでのブロックbのDCT係数を表す。DCTmerged(n)は、リファインされたブロックのインデックスnのDCT係数を表し、DCTQPmin(n)は、RSRiの対応するブロックのインデックスnのDCT係数を表し、DCTQPmax(n)は、リファインされるべき現在のサブ領域のブロックbのインデックスnのDCT係数を表す。
α及びKは、2つの自由度であり、αは付加される情報の重みα={0.1;0.2;...;1}であり、Kは、結合される第一のDCT係数を示す整数であり、K∈[0;a2-1]である。
ステップ210の間、基準D1は、リファインされた画像とその基準バージョン、すなわち原画像との間で計算される。変形例によれば、基準Diは、Q0で復号化されたSRiとリファインされた画像の残り、すなわち他のリファインされたサブ領域との間で計算される。問題となる基準は、例えば数学的な意味における相互情報量、又はSAD(Sum of Absolute Difference)又はSSE(Sum of Squared Differences)のような歪みである。相互情報量は、条件付きエントロピーの計算の形を表す。別の変形例によれば、基準は、位相の相関の測度である。
セット{SRi}i∈{0,M-1}の領域SRiの全体について、基準Diがステップ202〜210に従って計算された場合、本方法はステップ212に進み、基準Diがステップ202〜210に従って計算されていない場合、本方法は、インデックスiが1だけインクリメントされ、ステップ202を繰り返す。ステップ212の間、サブ領域RSRとして保持され、すなわち、M個の可能性のあるサブ領域のセット{SRi}i∈{0,M-1}から、基準が相互情報量又は位相の相関である場合には最大の基準値Dj(基準が歪みである場合にはそれぞれの最小の基準値)を有するサブ領域SRj、又は基準が相互情報量又は位相の相関である場合には最も高い基準値(基準が歪みである場合にはそれぞれ最も低い基準値)を有するN個のサブ領域SRjが抽出される。
本実施の形態の変形によれば、ステップ202は、量子化ステップQPminによる領域SRiの量子化を含む。
ステップ204は、領域SRiの逆量子化を含む。
ステップ206は、量子化ステップQPmix>QPminによる画像の残りの量子化を含む。実際、画像の残りは、より表明的に量子化され、すなわち低い品質で符号化される。
ステップ208は、画像の残りの逆量子化を含む。
他のステップは、第二の実施の形態の第一の変形例のステップと同じである。
ステップ10の有利な実施の形態によれば、符号化すべき画像Iは、複数の領域に分割される。単一のサブ領域RSRは、領域毎に画像Iから抽出され、すなわちディクショナリは、領域当たりで単一のサブ領域RSRを含む。ある領域は、たとえば画像の4分の1である。
マクロブロック(16×16サイズのブロック)による符号化及びブロック(8×8又は4×4サイズ)による符号化に基づいた、MPEG-2, H.264のようなビデオ符号化規格に従う符号化方法の特定の場合、RSRサブ領域は、マクロブロックであり、テクスチャリファインメントは、ブロックにより動作される。
図1に戻り、ステップ12の間、RSRサブ領域のテクスチャ、すなわち輝度/色度値は、画像の残りのテクスチャ、及びRSRサブ領域の位置を指定する品質マップ(QM:Quality Map)は、ストリームFで符号化される。テクスチャの符号化の間、品質マップQMは、画像の異なる領域が符号化される品質Q0又はQ1を決定するために使用される。サブ領域RSRは、画像の残りのQ1の品質よりも高い品質Q0で符号化される。
限定されるものではない例として、ブロック毎の符号化方法が使用される。画像のそれぞれのブロックは、画像のラスタスキャンに従って連続して符号化される。符号化されるべき現在のブロックについて、予測ブロックが決定される。たとえば、予測ブロックは、前に符号化及び復号化された現在のブロックの隣接しているブロックから決定され、例えば係るブロックの線形結合により、又は係るブロックの幾つかの画素の線形結合により決定される(モードINTRA)。変形例に拠れば、予測ブロックは、前に復号化された画像と動きベクトルとから決定され、例えば動きベクトルの座標が整数ではない場合には特に補間により決定される(モードINTER)。
動きベクトルは、例えばブロックマッチングタイプの動き予測から生成される。次いで、予測ブロックは、例えば重み付けの有無に係らず、画素毎の減算により、現在のブロックから抽出される。このように得られた残差ブロックは、例えばDCT(離散コサイン変換)により変換され、次いで係数のブロックに量子化される。変換された残差ブロックは、符号化されるべき品質Q0又はQ1と、品質マップにより提供される情報とに依存する量子化ステップで量子化される。現在のブロックがRSRサブ領域である場合、QPminのステップで量子化され、現在のブロックがRSRサブ領域でない場合、QPmax>QPminのステップで量子化される。係数のブロック及び動きベクトルは、VLC(可変長符号化)又はCABACタイプのエントロピー符号化により符号化される。
品質マップは、例えばSEI(Supplemental Enhancement Information)メッセージを使用して符号化されるか、又は、ユーザデータのために予約されるフィールドを使用して更に頻繁に符号化される。
マクロブロック(16×16サイズのブロック)による符号化又はブロック(8×8又は4×4サイズ)による符号化に基づいた、MPEG-2,H.264のようなビデオ符号化規格に従う符号化方法の特別の場合、RSRサブ領域がマクロブロックである。従って、品質マップは、RSR又は非RSRマクロブロックの量子化ステップ(QP)が適合されるのを可能にする。RSRサブ領域を量子化するために使用されるQPminの品質よりも高いQPmaxの量子化ステップは、非RSRサブ領域を量子化するために使用される。これは、それぞれの品質Q0及びQ1が取得されるのを可能にする。このフレームにおいて、品質マップは、量子化ステップがストリームで符号化されているとき、ストリームFにおいて明示的に符号化される必要がない。従って、復号化方法の間、あるブロックについて復号化された量子化ステップの値は、そのRSRサブ領域の品質又は非RSRサブ領域の品質を表す。実際に、あるブロックについて復号化された量子化ステップがQPmaxである場合、このブロックは、必然的に非RSRサブ領域であり、あるブロックについて復号された量子化ステップがQPminである場合、このブロックは、必然的にRSRサブ領域である。
復号化方法は、図1に関連して記載される。
ステップ14の間、RSRサブ領域及び非RSRサブ領域のテクスチャが復号化される。たとえば、H.264規格に従う復号化方法は、対応する符号化方法はステップ12で使用された場合に使用される。限定されることなしに、ブロック毎の復号化方法が使用される。画像のそれぞれのブロックは、画像のラスタスキャンに従って連続的に復号化される。
復号化されるべき現在のブロックについて、予測ブロックが決定される。例えば、予測ブロックは、例えば係るブロックの線形結合によるか又は係るブロックの幾つかの画素の線形結合により、前に復号化された現在のブロックの隣接しているブロックから決定される(モードINTRA)。変形例によれば、予測ブロックは、前に復号化された画像及び動きベクトルとかた決定され(モードINTER)、おそらく動きベクトルの座標が整数でない場合には補間により決定される。現在のブロックについて、残差ブロックは、可変長符号化(VLC)又はCABAC型のエントロピー復号化によりストリームFから復号化される。次いで、予測ブロックは、重み付けの有無に係らず、画素毎の加算により、復号化された残差ブロックと結合される。次いで、逆量子化、次いで例えばIDCT(逆離散コサイン変換)が結合されたブロックに適用される。逆量子化により使用される量子化ステップは、現在のブロックがステップ12で符号化された品質Q0及びQ1に依存する。現在のブロックがRSRサブ領域である場合、QPminのステップで逆量子化され、現在のブロックがRSRサブ領域でない場合、QPmax>QPminのステップで逆量子化される。量子化ステップは、ストリームで一般に符号化されており、必ずしも品質マップを復号化する必要はない。しかし、変形例によれば、量子化ステップがストリームFで符号化されていない場合、品質マップが復号化される。
ステップ16の間、非RSR領域のテクスチャがリファインされる。このステップは、品質Q1(Q1<Q0)で符号化された領域を改善するため、品質Q0で符号化されたデータからの使用の使用を含む(すなわちRSRサブ領域)。このため、幾つかのリファインメントアルゴリズムが可能である。
RSRサブ領域による現在のサブ領域のリファインメントアルゴリズムの例は、DCT係数に関して変換領域で動作する。このため、RSRiに存在するが、符号化の間に量子化により現在のサブ領域で破壊されていない高周波は、現在のサブ領域に加えられる。DCTが8×8DCTである場合、現在のサブ領域の例えばa=8であるa2のサイズのそれぞれのブロックbについて、以下の式が計算される。
Figure 2012531075
Last_coefは、ブロックの最後のDCT係数のインデックスであり、DCT(n)は、ジグザグの順序、すなわちブロックの走査順序における位置nでのブロックのDCT係数を表し、DCTmerged(n)は、リファインされたブロックのインデックスnのDCT係数を表し、DCTmin(n)は、RSRiの対応するブロックのインデックスnのDCT係数を表し、DCTmax(n)は、リファインすべき現在のサブ領域のブロックbのインデックスnのDCT係数を表す。現在のサブ領域をリファインするために使用されるRSRiは、たとえばリファインすべき現在のサブ領域に空間的に最も近いか、又はリファインすべき現在のサブ領域に最も相関するものとして、「ディクショナリ」で選択される。別の変形例によれば、復号化すべき画像は、複数の領域に分割され、ディクショナリは、領域当たりで単一のサブ領域RSRiを含む。この場合、現在のサブ領域は、画像の同じ領域に属するディクショナリのRSRiを使用してリファインされる。例えば、画像の4分の1である。
α及びKは、2つの自由度であり、αは付加される情報の重みα={0.1;0.2;...;1}であり、Kは結合される第一のDCT係数K∈[0;a2-1]である。
他のアプローチは、このリファインメントステップ16で使用することができる。従って、“Synthesizing natural textures”と題され、“ACM Symposium on Interactive 3D Graphics”の手続きにおいて公表されたAshikhminによる文献に記載された“guided texture synthesis ”アルゴリズムが引用される。この場合、RSRiは、ディクショナリとしての役割を果たし、リファインすべき現在の領域の低品質のバージョンQ1は、ガイド“guide”としての役割を果たす。
他の反復的な発展されたテクスチャの合成アプローチは、“Texture optimization for example-based synthesis”と題され、“ACM Symposium on Interactive 3D Graphics”(2005)において公表されたKwatra等による文献で記載されるように、最初の繰返しとして低品質のバージョンQ1を使用し、従ってRSRiの使用によりリファインされる。
図5を参照して、本発明は、符号化装置2に関する。符号化装置2は、第一の入力20において画像Iを受け、第二の入力26で品質の値Q0及びQ1(Q0>Q1)を受ける。
符号化装置2は、符号化方法のステップ12に従ってRSRサブ領域の画像Iを抽出することができる抽出モジュール22を備える。より詳細には、抽出モジュール22は、符号化方法のステップ92〜94又は100〜112又は200〜212を実現する。
また、符号化装置は、ストリームFにおける、品質Q0で抽出モジュール22により抽出されたRSRサブ領域を符号化し、品質Q1で他の非RSRサブ領域を符号化する符号化モジュール24を備える。ストリームFは、出力28を介して送信される。
図6を参照して、本発明は、復号化装置3に関する。復号化装置は、例えば符号化装置2から、入力30でストリームFを受ける。復号化装置3は、画像Iを復号化する復号化モジュール32を備える。より詳細には、復号化装置3は、ストリームFから復号化された品質マップ自身を使用するか又はストリームFから復号化された量子化ステップQmin及びQmaxをダイレクトに使用して、品質Q0でRSRサブ領域を一方で復号化し、品質Q1で非RSRサブ領域を他方で復号化する。復号化モジュール32は、復号化方法のステップ14を実現する。
復号化装置3は、リファインメントモジュール34を備える。リファインメントモジュールは、復号化方法のステップ16を実現するため、復号化モジュール32により復号化された非RSRサブ領域のテクスチャを、復号化モジュール32により復号化されたRSRサブ領域のテクスチャでリファインする。このように復号化された画像Idecは、出力36を介して送信される。
当然、本発明は、上述された実施の形態の例に限定されるものではない。
特に、当業者であれば、任意の変形例を説明された実施の形態に適用し、それらを組み合わせて様々な利点を得ることができる。特に、符号化12及び復号化14のステップは、H.264又はMPEG-2規格に従うか、又は他のタイプの規格に従う場合がある。本発明は、静止画像の符号化に適用され、又は画像系列の符号化に適用される。
また、基準Diは、異なるやり方で計算される。例えばDiは、ピーク信号対雑音比(PSNR)の値又は例えば構造的類似度(SSIM: Structural SIMilarity)又は位相の相関、相互情報量、SAD又はSSEのような客観的なテクスチャの品質の基準である。

Claims (8)

  1. 複数のサブ領域に分割される原画像を符号化する方法であって、
    前記原画像の他のサブ領域を代表するサブ領域を前記原画像から抽出するステップと、
    前記他のサブ領域を代表するサブ領域を第一の品質で符号化するステップと、
    前記他のサブ領域を前記第一の品質よりも低い第二の品質で符号化するステップとを含み、
    前記原画像の他のサブ領域を代表するサブ領域を抽出するステップは、現在のサブ領域と呼ばれる前記原画像のそれぞれのサブ領域について、
    前記現在のサブ領域を前記第一の品質で符号化するステップと、
    符号化された現在のサブ領域を復号化して、復号化された現在のサブ領域を得るステップと、
    前記現在のサブ領域とは異なる前記他のサブ領域を前記第二の品質で符号化するステップと、
    符号化された他のサブ領域を復号化して、復号された他のサブ領域を得るステップと、
    前記復号化された現在のサブ領域と前記復号化された他のサブ領域との間の基準を計算するステップと、
    前記抽出するステップは、Nを整数として、前記基準が最も高いN個のサブ領域を抽出するか、又は前記基準が最も低いN個のサブ領域を抽出する、
    ことを特徴とする符号化方法。
  2. 前記第一の品質と前記第二の品質との間の符号化品質を、前記原画像のそれぞれのサブ領域と関連付ける品質マップを符号化するステップを更に含む、
    請求項1記載の符号化方法。
  3. 前記原画像の他のサブ領域を代表するサブ領域を抽出するステップは、
    前記復号化された現在のサブ領域のテクスチャを使用することで、前記復号化された他のサブ領域のテクスチャを改善するステップを含み、
    前記基準は、前記復号化現在のサブ領域と、改善された他のサブ領域との間で計算される、
    請求項1又は2記載の符号化方法。
  4. 前記原画像の他のサブ領域を代表するサブ領域を抽出するステップは、
    前記復号化された現在のサブ領域のテクスチャを使用して、前記復号化された他のサブ領域のテクスチャを改善するステップを含み、
    前記基準は、改善された他のサブ領域を含む改善された画像と前記原画像との間で計算される、
    請求項1又は2記載の符号化方法。
  5. 前記基準は、相互情報量であり、
    前記抽出するステップは、前記基準が最も高いN個のサブ領域を前記原画像から抽出することを含む、
    請求項1乃至4の何れか記載の符号化方法。
  6. 前記基準は、歪みであり、
    前記抽出するステップは、前記基準が最も低いN個のサブ領域を前記原画像から抽出することを含む、
    請求項1乃至4の何れか記載の符号化方法。
  7. 前記改善するステップは、
    前記復号化された他のサブ領域のうちのK個の最も高い周波数のうちの1つに対応するそれぞれのDCT係数を、前記復号化された他のサブ領域の前記DCT係数と前記復号化された現在のサブ領域に対応するDCT係数との線形結合により、DCT周波数領域において置き換えるステップを含む、
    請求項3乃至6の何れか記載の符号化方法。
  8. 第一のサブ領域と第二のサブ領域とに分割される少なくとも1つの原画像を復号化する方法であって、前記第一のサブ領域は、第二のサブ領域を代表する領域であり、
    当該方法は、
    前記第一のサブ領域と前記第二のサブ領域とを復号化するステップと、
    前記第一のサブ領域のテクスチャから前記第二のサブ領域のテクスチャを改善するステップとを含み、
    前記改善するステップは、
    前記第二のサブ領域のうちのK個の最も高い周波数のうちの1つに対応するそれぞれのDCT係数を、前記第二のサブ領域の前記DCT係数と前記第一のサブ領域に対応するDCT係数との線形結合により、DCT周波数領域において置き換えるステップを含む、
    ことを特徴とする方法。

JP2012515520A 2009-06-22 2010-06-21 原画像を符号化する方法及び装置並びに復号化する方法及び装置 Expired - Fee Related JP5583762B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP09305583.8 2009-06-22
EP09305583A EP2268030A1 (fr) 2009-06-22 2009-06-22 Codage d'image avec raffinement de la texture en utilisant des sous-régions représentatives
PCT/EP2010/058738 WO2010149626A1 (en) 2009-06-22 2010-06-21 Image coding with texture refinement using representative patches

Publications (2)

Publication Number Publication Date
JP2012531075A true JP2012531075A (ja) 2012-12-06
JP5583762B2 JP5583762B2 (ja) 2014-09-03

Family

ID=41667486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012515520A Expired - Fee Related JP5583762B2 (ja) 2009-06-22 2010-06-21 原画像を符号化する方法及び装置並びに復号化する方法及び装置

Country Status (6)

Country Link
US (1) US20120243607A1 (ja)
EP (2) EP2268030A1 (ja)
JP (1) JP5583762B2 (ja)
KR (1) KR101711680B1 (ja)
CN (1) CN102804770B (ja)
WO (1) WO2010149626A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5706264B2 (ja) * 2011-08-01 2015-04-22 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
US9674543B2 (en) 2012-11-14 2017-06-06 Samsung Electronics Co., Ltd. Method for selecting a matching block

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006080933A (ja) * 2004-09-10 2006-03-23 Kyushu Institute Of Technology 画像信号処理装置及びその方法
EP2018070A1 (en) * 2007-07-17 2009-01-21 Thomson Licensing Method for processing images and the corresponding electronic device
JP2009077176A (ja) * 2007-09-20 2009-04-09 Canon Inc 画像符号化装置及び画像復号装置並びにそれらの制御方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005005844A (ja) * 2003-06-10 2005-01-06 Hitachi Ltd 計算装置及び符号化処理プログラム
CN101222636B (zh) * 2008-01-24 2011-05-11 杭州华三通信技术有限公司 图像编解码方法和图像编解码装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006080933A (ja) * 2004-09-10 2006-03-23 Kyushu Institute Of Technology 画像信号処理装置及びその方法
EP2018070A1 (en) * 2007-07-17 2009-01-21 Thomson Licensing Method for processing images and the corresponding electronic device
JP2010534015A (ja) * 2007-07-17 2010-10-28 トムソン ライセンシング 画像処理方法及び対応する電子装置
JP2009077176A (ja) * 2007-09-20 2009-04-09 Canon Inc 画像符号化装置及び画像復号装置並びにそれらの制御方法

Also Published As

Publication number Publication date
JP5583762B2 (ja) 2014-09-03
CN102804770A (zh) 2012-11-28
KR101711680B1 (ko) 2017-03-02
EP2446626A1 (en) 2012-05-02
WO2010149626A1 (en) 2010-12-29
US20120243607A1 (en) 2012-09-27
CN102804770B (zh) 2015-11-25
EP2268030A1 (fr) 2010-12-29
KR20120030102A (ko) 2012-03-27

Similar Documents

Publication Publication Date Title
JP6675289B2 (ja) 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
RU2739729C1 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы
JP6667609B2 (ja) 画像符号化装置、画像符号化方法、画像復号装置および画像復号方法
CN111819852B (zh) 用于变换域中残差符号预测的方法及装置
JP2020065277A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及び符号化ビットストリームを記録した記録媒体
JP5128443B2 (ja) 映像の符号化、復号化の方法及びその装置
KR101228020B1 (ko) 사이드 매칭을 이용한 영상의 부호화 방법 및 장치, 그복호화 방법 및 장치
RU2697929C1 (ru) Устройство декодирования изображения и способ декодирования изображения
WO2013108684A1 (ja) 動画像復号装置、動画像符号化装置、動画像復号方法及び動画像符号化方法
JP2015130684A (ja) 映像復号化装置
WO2012081162A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
KR20190091236A (ko) 복원 블록을 생성하는 방법 및 장치
KR20220074835A (ko) 초고해상도 영상을 부호화하는 장치 및 방법, 그리고 복호화 장치 및 방법
JP5583762B2 (ja) 原画像を符号化する方法及び装置並びに復号化する方法及び装置
KR101529903B1 (ko) 블록기반 깊이정보 맵의 코딩 방법과 장치, 및 이를 이용한 3차원 비디오 코딩 방법
CN112740691A (zh) 用于编码和解码表示至少一个图像的数据流的方法和设备
Naccari et al. Perceptually optimized video compression
Son et al. Enhanced Prediction Algorithm for Near-lossless Image Compression with Low Complexity and Low Latency
CN112352435A (zh) 用于视频编解码的环内去块滤波器设备和方法
KR20110095119A (ko) 초고해상도 영상을 부호화하는 장치 및 방법, 그리고 복호화 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130527

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140617

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140716

R150 Certificate of patent or registration of utility model

Ref document number: 5583762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees