JP5456907B2 - テクスチャー・パターン適応式の分割ブロック変換 - Google Patents

テクスチャー・パターン適応式の分割ブロック変換 Download PDF

Info

Publication number
JP5456907B2
JP5456907B2 JP2012541293A JP2012541293A JP5456907B2 JP 5456907 B2 JP5456907 B2 JP 5456907B2 JP 2012541293 A JP2012541293 A JP 2012541293A JP 2012541293 A JP2012541293 A JP 2012541293A JP 5456907 B2 JP5456907 B2 JP 5456907B2
Authority
JP
Japan
Prior art keywords
texture pattern
pixels
sequence
pixel
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012541293A
Other languages
English (en)
Other versions
JP2013512627A (ja
Inventor
チェン,ジ・ボ
スー,シャオチョン
チェン,クチン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013512627A publication Critical patent/JP2013512627A/ja
Application granted granted Critical
Publication of JP5456907B2 publication Critical patent/JP5456907B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は画像のエンコードの技術分野でなされるものである。より詳細には、本発明は分割ブロック変換(partitioned block transform)を使って画像の画像ブロックをエンコードすることに関する。
画像をエンコードするためには、離散コサイン変換(DCT: discrete cosine transforms)または離散ウェーブレット変換(DWT: discrete wavelet transform)を使って画像の画像ブロックを変換することが当技術分野においてよく知られている。
たとえば、ハイブリッド・ビデオ符号化において一般的に使われるDCTは、空間領域における冗長性を活用し、相関の高い信号について優れたエネルギー圧縮を示すとともに、分離可能(separable)、対称的(symmetric)かつ直交(orthogonal)という属性を示す。
現行の画像/ビデオ符号化規格は通例二次元の分離可能なDCTまたはDWTを符号化に使い、その基底関数は水平配向の1D基底関数に垂直配向の同じ関数の集合をかけることによって生成できる。
たとえば、例示的なN×Nブロックについて、第一に、N個のN点1D DCT演算(第一の1D変換)がもとのピクセルに対して縦方向に実行されてN×Nの中間係数を生成し;第二に、N個のN点1D DCT演算(第二の1D変換)が中間係数に対して横方向に実行されて、さらに変換された係数を生成する。この種の方式は厳密に水平方向または垂直方向に配向された画像テクスチャー詳細についてはよく機能する傾向がある一方、他のエッジ配向のまわりにはリンギング・アーチファクトが現れる傾向がある。これは視覚的な品質を有意に劣化させる。
この問題は、非特許文献1によって識別され、対処されている。この論文において、著者らは方向適応式の分割ブロック変換(DA-PBT: direction-adaptive partitioned block transform)を提案している。それによれば、画像ブロックは方向性のパーティションに分割される。パーティション境界は第一の1D変換の方向に揃えられ、第二の1D変換の長さはパーティション境界をまたいで延在しないよう制限される。これにより、1D変換の必要とされる最大長さはNに等しくなることが保証される。
C. L. Chang and B. Girod, "Directional-Adaptive Partitioned Block Transform for Image Coding", ICIP 2008
1D変換の必要とされる最大長さを制限するものの、非特許文献1によって提案されるDA-PBTは、N個より多くの第一の1D変換またはN個より多くの第二の1D変換を必要とすることがある。さらに、DA-PBTの適用のためには、画像ブロック中に方向が存在する必要がある。
本発明の発明者は、第一のパーティションのピクセルにテクスチャー・パターンに関連した反転可能な(invertible)マッピングを適用することによって画像ブロックの少なくとも一部分の前記第一のパーティションのピクセルを累積し、前記第一のパーティションは前記画像ブロックを、前記テクスチャー・パターンに関連した反転可能なマッピングが関連している現在テクスチャー・パターンに従って分割することから帰結するものとすることによって、必要とされる第一の1D変換の最大数をNに制限するとともに、必要とされる第二の1D変換の最大数もNに制限することができることを認識した。
この最大の必要とされる1D変換の限定はハードウェア上でのより効率的な実装および改善されたエンコード・パフォーマンスを可能にするが、ピクセルの累積はこの限定を達成するのみならず、複数ストリップ、高度に非対称的なピクセル分布をもつテクスチャー・パターンおよび非方向性のテクスチャー・パターンのうちの少なくとも一つを有するテクスチャー・パターンに基づくさらなるパーティションをも許容する。
したがって、画像の画像ブロックをエンコードする方法および装置が提案される。本方法は、第一のパーティションのピクセルにテクスチャー・パターンに関連した反転可能なマッピングを適用することによって画像ブロックの少なくとも一部分の前記第一のパーティションのピクセルを累積し、前記第一のパーティションは前記画像ブロックを、前記テクスチャー・パターンに関連した反転可能なマッピングが関連している現在テクスチャー・パターンに従って分割することから帰結するものであり、前記現在テクスチャー・パターンの再構成または取得を許容するデータのエントロピー・エンコードを行う段階を含む。
前記画像ブロックがNかけるMのピクセルを含み、NはM以上である実施形態では、提案されるエンコード方法は、前記画像ブロックの前記少なくとも一部分を、現在テクスチャー・パターンに関連する現在テクスチャー・パターン適応パーティションに従って、第一の部分集合のピクセルおよび少なくとも第二の部分集合のピクセルにパーティション分割する段階と、テクスチャー・パターンに関連するスキャン順を使って前記第一の部分集合のピクセルを、ピクセル・シーケンスのメタシーケンスに配列する段階であって、前記テクスチャー・パターンに関連するスキャン順は前記現在テクスチャー・パターンに関連し、前記ピクセル・シーケンスのそれぞれは高々N個のピクセルを含む、段階と、高々M個のさらなるピクセル・シーケンスのさらなるメタシーケンスを生成する段階であって、前記さらなるピクセル・シーケンスのそれぞれは前記ピクセル・シーケンスの一つまたは前記メタシーケンスのサブシーケンスのピクセル・シーケンスを連結したもののいずれかを含み、前記さらなるピクセル・シーケンスのそれぞれは高々N個のピクセルを含む、段階と、前記さらなるピクセル・シーケンスを変換することによって係数シーケンスを生成する段階と、前記係数シーケンスを横断する一次元変換によりさらなる係数シーケンスを生成する段階と、前記さらなる係数シーケンスに含まれる係数を量子化およびスキャンすることによって一層さらなる係数シーケンスを生成する段階であって、スキャンはエンコード・スキャン順に従って行われる、段階と前記一層さらなる係数シーケンスをエントロピー・エンコードする段階と、前記現在テクスチャー・パターンに関連する指標をエントロピー・エンコードする段階であって、前記指標は前記現在テクスチャー・パターンの取得または再構成を許容する参照である、段階とを含む。
前記例示的な実施形態において、本方法は、前記現在テクスチャー・パターン適応パーティションが複数ストリップ、非対称的なテクスチャー・パターンまたは非方向性のテクスチャーを含むテクスチャー・パターンに関連していてもよいよう適応される。
前記少なくとも第二の部分集合のピクセルは、前記第一の部分集合のピクセルと同様に扱われてもよいが、エンコード・スキャン順は異なっていてもよい。さらに、前記第一の部分集合と前記少なくとも第二の部分集合の間の係数予測が適用されてもよい。
前記パーティション分割が行われる前記少なくとも一部分は、エッジ検出、セグメンテーションまたは強度分布分類の結果であってもよい。
本発明はさらに、画像のエンコードされた画像ブロックをデコードする方法を提案する。前記画像ブロックはNかけるMのピクセルを含み、NはM以上である。本方法は、前記画像ブロックの少なくとも一部分の第一の部分集合をデコードすることを、(a)第一の係数のエンコードされたシーケンスをエントロピー・デコードし、(b)現在テクスチャー・パターンに関連するエンコードされた指標をエントロピー・デコードし、該指標を使って、該指標に基づくメモリからの取得または再構成のいずれかによって前記現在テクスチャー・パターンを生成し、(c)デコード・スキャン順を使って前記第一の係数を、高々M個の係数シーケンスのメタシーケンスに配列し、前記高々M個の係数シーケンスのそれぞれは高々N個の第一の係数を含み、(d)ステップ(c)において前記第一の係数を配列する前、配列している間または配列したあとに、前記第一の係数を逆量子化し、(e)前記高々M個の逆量子化された係数シーケンスを横断する一次元変換によって高々M個のさらなる係数シーケンスを生成し、(f)前記高々M個のさらなる係数シーケンスを変換することによって高々M個の第一のピクセル・シーケンスを生成し、(g)前記現在テクスチャー・パターンに関連する分布パターンを使って前記画像ブロックに前記生成されたピクセルを分布させるステップを実行することによって行う。
ある実施形態では、前記デコード方法はさらに、第二の係数のシーケンスにステップ(a)、(b)、(c)、(d)、(e)および(f)を適用することを通じて高々M個の第二のピクセル・シーケンスを生成することによって、前記エンコードされた画像ブロックの前記少なくとも一部分の第二の部分集合をデコードし、前記分布パターンを使って、前記画像ブロックの前記少なくとも一部分の残りを、前記高々M個の生成された第二のピクセル・シーケンスのピクセルで充填することを含む。前記残りは、前記第一の部分集合の生成後に、前記画像ブロックの前記少なくとも一部分の、空の残っている部分である。
そして、画像のエンコードされた画像ブロックの少なくとも一部分の第一の部分集合をデコードする対応する装置が提案される。前記少なくとも一部分は、テクスチャー・パターン適応式分割ブロック変換を使ってエンコードされており、前記画像ブロックはNかけるMのピクセルを含み、NはM以上である。本デコード装置は、第一の係数のエンコードされたシーケンスをエントロピー・デコードするデコード手段であって、前記デコード手段は、現在テクスチャー・パターンに関連するエンコードされた指標をエントロピー・デコードし、該指標を使って、該指標に基づくメモリからの取得または再構成のいずれかによって前記現在テクスチャー・パターンを生成するよう適応されている、手段と、デコード・スキャン順を使って前記第一の係数を、高々M個の係数シーケンスのメタシーケンスに配列するよう適応された第一配列手段であって、前記高々M個の係数シーケンスのそれぞれは高々N個の第一の係数を含む、手段と、前記第一の係数を逆量子化する逆量子化手段と、前記高々M個の逆量子化された係数シーケンスを通じて一次元変換によって高々M個のさらなる係数シーケンスを生成する手段と、前記高々M個のさらなる係数シーケンスを変換することによって高々M個の第一のピクセル・シーケンスを生成する手段と、前記現在テクスチャー・パターンに関連する分布パターンを使って前記画像ブロックに前記生成された第一のピクセル・シーケンスのピクセルを分布させることによって、前記画像ブロックの前記少なくとも一部分に含まれるピクセルの部分集合を生成する第二配列手段とを有する。
本発明はさらに、エンコードされた係数およびエンコードされたマスク情報を含むビットストリームを担持する、光ディスク、半導体メモリまたはハードディスクのような物理的な記憶媒体であって、前記エンコードされた係数からは、デコードおよび逆変換によってピクセル・シーケンスが生成でき、前記マスク情報は画像ブロックのピクセルを選択するために使われるマスクを再構成することおよび該マスクに関連する分布パターンを決定することを許容し、前記分布パターンは前記画像ブロック上にピクセル・シーケンスのピクセルを分配することを許容する、記憶媒体を提案する。
さらなる有利な実施形態の特徴は従属請求項において特定される。
本発明の例示的な実施形態は、図面に示され、以下の記述においてより詳細に説明される。例示的な実施形態は本発明を解き明かすために説明されるのみであって、請求項において定義される本発明の開示、範囲または精神を限定するためではない。
テクスチャー・パターンを示す例示的な画像ブロックを示す図である。 例示的な二値パーティション・マスクを示す図である。 ブロックのサブブロックへのパーティション分割および該サブブロックのピクセルを累積する(accumulating)ことによる該サブブロックの修正の第一の例を示す図である。 ブロックのサブブロックへのパーティション分割および該サブブロックのピクセルを累積することによる該サブブロックの修正の異なる第二の例を示す図である。 4a〜4cは、反転可能な二段階のテクスチャー・パターン依存のマッピングを使った、ブロックの部分集合のピクセルの累積の第一の例を示す図である。 5a〜5cは、反転可能な二段階のテクスチャー・パターン依存のマッピングを使った、ブロックの部分集合のピクセルの累積の異なる第二の例を示す図である。 テクスチャー・パターンに関連するスキャン原理の例示的な実施形態を示す図である。 第一および第二の変換後のDC係数(単数または複数)が四角によって示される、変換手順の例を示す図である。 エンコードおよびデコード・プロセスにおける情報の流れの例を、両プロセスにおける対応マッピングを示しつつ、示す図である。 例示的な二値マスクを使って例示的な画像ブロックが分割された例示的な二つのパーティションについて異なっている、例示的なエンコード・スキャン順を示す図である。 エンコーダ側でのエンコードのための例示的なテクスチャー・パターン適応式分割ブロック変換を使ったエンコードを示す図である。 デコーダ側での対応する画像ブロック・デコードの例示的なフローチャートである。
本発明は、相応して適応された処理装置を有する任意の電子装置で実現されうる。たとえば、本発明は、テレビジョン、携帯電話、パーソナル・コンピュータ、デジタル・スチール・カメラまたはデジタル・ビデオ・カメラにおいて実現されてもよい。
画像の画像ブロックをエンコードする方法の例示的な実施形態において、画像ブロックはある数の行とある数の列を有し、当該方法は、前記画像ブロックの少なくとも一部分を、現在テクスチャー・パターンに関連する現在テクスチャー・パターン適応式パーティションに従って第一の部分集合のピクセルおよび少なくとも第二の部分集合のピクセルに分割した結果として生じる前記第一の部分集合のピクセルをエンコードするステップを含む。前記例示的な実施形態では、前記第一の部分集合をエンコードするステップは、第一および第二の、テクスチャー・パターンに関連する反転可能なマッピングを使って、複数のピクセル・シーケンスからなるメタシーケンスを生成することを含む。ここで、前記メタシーケンス中のピクセル・シーケンスの数は前記行の数を超えず、各ピクセル・シーケンスにおいてピクセルの数は前記列の数を超えない、あるいは、前記メタシーケンス中のピクセル・シーケンスの数は前記列の数を超えず、各ピクセル・シーケンスにおいてピクセルの数は前記行の数を超えない。前記第一の部分集合をエンコードするステップはまた、第一のおよび第二の一次元変換を生成されたピクセル・シーケンスに適用して、係数のシーケンスを生成し、係数のシーケンスに含まれる係数を量子化およびスキャンし、スキャンはエントロピー・スキャン順に行われ、量子化およびスキャンされた係数をエントロピー・エンコードし、現在テクスチャー・パターンの再構成または取得を許容するデータをエントロピー・エンコードすることを含む。前記第一のテクスチャー・パターンに関連する反転可能なマッピングおよび第二のテクスチャー・パターンに関連する反転可能なマッピングは、前記現在テクスチャー・パターンに関連付けられている。
より詳細には、ピクチャ中の例示的な長方形のブロックは、いくつかのビデオ・オブジェクトまたは何らかのテクスチャーを含んでいてもよい。この現象は、特に垂直/水平以外の方向に沿って複数のストリップまたはエッジをもって現れるとき、伝統的なDCT変換後に多数の0でない係数を生じさせる。よって、符号化効率は低い。複数のストリップをもつ方向性のテクスチャーの典型例が図1に示されている。
パーティション規則が与えられると、例示的な画像ブロックにおける各ピクセルは二つ以上のサブグループのうちの一つに割り当てられる。以下では、サブグループの数は例示的に2に設定されるが、当業者は、パーティションが二つより多くのサブグループを許容する場合にパーティションおよび累積の原理をいかにして拡張するかをすぐ理解するであろう。
パーティション分割手順は、ブロックと同じサイズをもつ一つまたは複数の二値マスクによって実現されてもよい。たとえば、図2におけるマスクは、ブロックの上半分の部分のピクセルが一方のパーティションに属し、下半分のピクセルが他のパーティションに属することを意味する。すると、したがって、n個のサブグループを許容するパーティション規則は、n値マスクと一対一のマッピング関係をもつ。よって、以下で論じる例示的な二値パーティション規則は二値マスクと一対一のマッピング関係をもつ。2より大きなnについて、n値マスクは一組の二値マスクによって表現されてもよい。
各パーティション(サブブロック)におけるピクセルの数は等しくなくてもよい。これは、非対称的なパーティション分割が許容されることを意味する。そうすることによって、ブロック内のパーティション境界がより正確に検出でき、各パーティション(サブブロック)内でのエネルギー集中(concentration)を改善できる。
ある例示的な実施形態では、マスクはエンコーダにおいておよびデコーダ側においてあらかじめ定義されている。たとえば、本稿末尾の表に含まれる例示的な二値マスクは、一つまたは複数のストリップをもつ、水平方向、垂直方向、対角線方向および他のパターン配向の考慮を表現しており、エンコードから帰結するエンコードされたデータにおいて、たとえばエンコードされたマスク番号によって参照されてもよい。
さらに、ブロック内のパターンを解析することによって新しいマスクが導出されてもよい。可能な方法は、これに限られないが、エッジ検出、統計解析、変換領域解析などを含む。次いで、そのようにして導出された新しいマスクが、初めて使われるときにエンコードされ、その後、該新しいマスクに割り当てられた新しい参照符号または参照番号によって指定されうる。
あらかじめ定義されたパターンのリストからのインデックス指定によるか、画像属性の局所的な解析から得られるマスク情報は、記憶され、正しいデコードのためにデコーダに伝送されるべきである。前者のアプローチについては、マスクのインデックスを送るだけでよい。後者については、少なくとも初めて使われる場合には、採用されるマスクの形自身も伝送されるべきである。これら二つのアプローチは図8において簡単に説明される。
パーティション分割後、各サブグループ中のピクセルは、シフトされて、それにより累積される。それにより、その後の変換は、0でない係数の数が減る点で恩恵を受ける。シフトは、適用されるパーティション規則に固有であってもよいし、あるいは適用されるパーティション規則とは独立なデフォルトの反転可能なマッピングであってもよい反転可能なマッピングによって達成される。たとえば、各サブパーティション(サブグループ)内のピクセルはブロックの上限に向けてシフトされる(空の列はスキップされる)。これを行うことにより、ブロック内のパターンはある程度除去され、同様の強度をもつピクセルが一緒にマージされる。これは、エネルギー集中のためによい。ブロック・マージの例が図3aおよび図3bに示されている。
ここで例示的に記載されるパーティション分割およびマージ動作は、より一般的な枠組みであり、実際に単一のブロックから二つ以上の補助(adjuvant)ブロックを生成し、各補助ブロック内部ではピクセル強度分布がより均一になる。
以下では、パーティション規則固有の反転可能なマッピングの例が記載される。この例は、二つのステップを含み、ある配向または方向(垂直、水平、対角線、曲がった、など)を示すテクスチャー・パターンに関係するすべてのパーティションまたはマスクに適用可能である。
例示的な、非デフォルト反転可能マッピングの第一ステップでは、サブブロック中のピクセルが、マスクのパターン配向によって示される方向に沿ってシフトされる。このステップの例は、図4のaおよび図5のaにおいて与えられる。マスクの方向は垂直方向、水平方向、対角線方向またはその他であってもよい。
前記第一ステップ後、一連のパターン・ストリップ(互いに長さが異なっていてもよい)の系列が取得され、図4のbおよび図5のbに示されるように、中間アレイにおいて組織化される。所与のマスクについて、中間アレイの列におけるそれらのストリップの順序(左から右)は、固定パターン・スキャン原理によって決定される(たとえば、平均で最小のx座標によって示されるパターンの最も左側のストリップから最も右側のストリップへ;加えて、平均で最も小さなy座標によって示されるパターンの最も上のストリップから最も下のストリップへ)。スキャン原理の例は図6に示される。
例示的な非デフォルト反転可能マッピングのこの第一ステップの結果として、一連の中間ピクセル・シーケンス(ストリップの中間アレイとも呼ばれる)が生じる。各中間ピクセル・シーケンスまたはストリップは――画像ブロックがN×Nのピクセルを含む場合――高々N個のピクセルを含むが、上記系列(中間アレイ)に含まれる中間ピクセル・シーケンス(ストリップ)の数は必ずしも高々Nには制限されない。
したがって、例示的な非デフォルト反転可能マッピングは、第二のステップを含み、該第二のステップ後に、前記第二のステップの結果として生じるさらなる系列に含まれるピクセル・シーケンスの数がNより大きくないことが保証される。
前記第二のステップ内では、前記系列に含まれる中間ピクセル・シーケンスの部分系列が、前記部分系列に含まれる中間ピクセル・シーケンスの連結によって一緒にマージされる。連結は、該連結の結果として生じる各ピクセル・シーケンスが相変わらずN個より多くのピクセルを含まないという制約のもとで行われる。換言すれば、前記第二のステップでは、前記中間アレイの一方の側から他の側へ、前記中間アレイにおける各ストリップが、一つの列中に逐次的に挿入される。次のストリップを現在の列のシーケンスの末尾に加えたらのシーケンスの長さがNより大きくなる場合には、このストリップは新しい列を開始するために使われる。次いで、その後のストリップは再びこの新しい列の末尾に逐次的に追加されることが、さらなるその後のストリップを追加すればこの新しい列に含まれるピクセルの数がNより大きくなってしまうようになるまで行われる。この動作は、中間アレイにおけるすべてのストリップが充填されるまで継続する。この動作の出力は、高々Nの列長をもつ2Dブロックである。第二ステップの結果の例が図4のcおよび図5のcに示されている。
パーティション分割の結果生じるすべてのサブブロックが少なくともN×N/4個のピクセルを含むことを保証するパーティション規則については、第二ステップの結果として高々N個のピクセル・シーケンスを含むさらなる系列が生じ、前記N個のピクセル・シーケンスのそれぞれが高々N個の再配列されたピクセルを含むことを保証できる。
マスク中に明瞭な方向がない場合には、デフォルトのシフト動作(上限に向かうシフト)が実行される。
ブロック集積(block assembling)動作後、2D変換、たとえば2D DCT変換が集積された諸サブブロックに別個に適用される。2D変換の第一の1D変換は垂直方向に実行される。これは、第一の1D変換がパターン方向に沿って実行されることに対応する。ピクセル集積(pixel assembling)の第一ステップのシフト動作がパターン方向に従って行われるからである。第一の1D変換後、結果として得られる中間係数がブロックの左側に向けてシフトされ、次いで第二の1D変換が水平方向に実行される。変換手順の例が図7に示されている。図7では、第一および第二の変換後のDC係数(単数または複数)が、別個に、四角によって示されている。
二段階変換後のこれら二つのサブブロック間の相関をさらに探求するため、該サブブロック間のDC(AC)係数予測が使用されてもよい。すなわち、第一のパーティションの係数値が第二のパーティションにおける同様の位置における係数値のための予測として使われてもよく、第一のパーティションの前記予測に対する第二のパーティションの残差がさらに処理される、たとえば量子化され、ジグザグ・スキャンされ、エントロピー・エンコードされる。
ジグザグ・スキャンおよびエントロピー符号化は、別個に、諸サブブロック――または諸残差――において処理される。たとえば、図9におけるマスクが使用される場合、パーティション1および2における変換された係数のためのスキャン順は、図9に示されるように異なる仕方で設計されることができる。これら二つのパーティションに対するエントロピー符号化方法は、これに限られないが、たとえばハフマン符号化、CAVLC、CABACなどの任意のエントロピー符号化方式を含み、結果として出力ビットストリームを与え、それが物理的な記憶媒体、たとえばDVDもしくはBDのような光ディスク、フラッシュのような半導体記憶媒体またはハードディスク・ドライブに記録され、無線または有線で送信もしくは放送される。出力ビットストリームは、あらかじめ定義されたパーティション規則もしくはパーティション・マスクの再構成を許容するデータと、集積ステップにおける累積のために使われた反転可能なマッピングの対応する逆マッピングを参照するデータのコードを含む。
集積動作および変換およびそれらの逆動作のフローチャートが図11に示されている。デコード・プロセスは次のセクションにおいて述べる。
このステップへの入力は圧縮されたビットストリームである。このステップからの出力はスキャンされ、量子化された係数、マスク・インデックス(あらかじめ定義されたパターンを使う場合)/マスク(局所的解析を使う場合)および他の副情報を含む。
デコードのために、デコード装置は、入力ビットストリームを、光記憶媒体から読むことによって、あるいは無線もしくは有線で受信することによって、受け取る。受け取られた入力ビットストリームから、パーティション・マスクおよび反転可能なマッピングの対応する逆マッピングの再構成もしくは取得を許容するデータのコードが分離され、デコードされる。受け取られたビットストリームの残りは逆スキャンされ(reverse scanned)、逆量子化されて、逆変換の準備ができた累積された係数サブブロックを達成する。逆1D変換が水平方向に適用され、結果として得られる中間係数が次いで右にシフトされてもよい。ここで、直接係数のどれがどのくらいシフトされるかは、パーティション・マスク情報を使って決定される。
次いで、前記直接係数が垂直方向に逆1D変換され、結果として、サブブロックの一つのエッジにおいて累積されたピクセルのサブブロックを生じる。
マスク情報を使って、累積されたピクセルのそれぞれのもとの位置が決定できる。すなわち、第一ステップの集積に関連する固定したパターンのスキャン原理を使って、サブブロックにおいて累積されているピクセルを、ブロック中に再分配することができ、その後、それぞれのパーティションが復元される。同様にして、他のパーティション(一つまたは複数)を復元することができ、すべてのパーティションを組み合わせて画像ブロック全体を再現することができる。
マスク情報に従って、もとのピクセルと第一の変換のためのピクセルの一対一マッピングが確立されることができる(マッピング1と称される)。第一の変換後の中間係数は、第二の変換のために左側にシフトされる。次いで、第一の変換後の中間係数から第二の変換のための中間係数へのもう一つの一対一マッピングが確立されることができる(マッピング2と称される)。これら二つのマッピング関係は、ひとたびデコーダがマスク情報を知れば、取得できる。二つのマッピング動作は反転可能なので、デコーダは逆マッピング・プロセスを実装して再構成されたピクセルと変換された係数の間の位置関係を確立することができる。デコーダにおける逆マッピング動作のフローチャートは図8に示されている。
本発明のテクスチャー・パターン適応式分割ブロック変換の図およびエンコード・フレームワークが図10に示されている。「マスク生成」モジュールにおいて、マスクが、付録が記載するようなあらかじめ定義されたパターンによって生成されることができる。マスクは局所的な内容解析結果によって生成されることもできる。たとえば、あるブロック内のピクセルは、強度分布に従って二つ(またはそれ以上)のクラスに分類されることができ、あるいはエッジまたはセグメンテーション検出結果に基づいて分類されることができる。
Figure 0005456907
Figure 0005456907
Figure 0005456907
Figure 0005456907
Figure 0005456907

Claims (9)

  1. テクスチャー・パターン適応式の分割ブロック変換を使って画像の画像ブロックをエンコードする方法であって、前記画像ブロックがNかけるMのピクセルを含み、NはM以上であり、当該方法は、
    a)前記画像ブロックを、現在テクスチャー・パターンに関連する現在テクスチャー・パターン適応パーティションに従って、第一の部分集合のピクセルおよび少なくとも第二の部分集合のピクセルにパーティション分割する段階と、
    b)テクスチャー・パターンに関連するスキャン順を使って前記第一の部分集合のピクセルを、ピクセル・シーケンスのメタシーケンスに配列する段階であって、前記テクスチャー・パターンに関連するスキャン順は前記現在テクスチャー・パターンに関連し、前記ピクセル・シーケンスのそれぞれは高々N個のピクセルを含む、段階と、
    c)高々M個のさらなるピクセル・シーケンスのさらなるメタシーケンスを生成する段階であって、前記さらなるピクセル・シーケンスのそれぞれは前記ピクセル・シーケンスの一つまたは前記メタシーケンスのサブシーケンスのピクセル・シーケンスを連結したもののいずれかを含み、前記さらなるピクセル・シーケンスのそれぞれは高々N個のピクセルを含む、段階と、
    d)前記さらなるピクセル・シーケンスを変換することによって係数シーケンスを生成する段階と、
    e)前記係数シーケンスを横断する一次元変換によりさらなる係数シーケンスを生成する段階と、
    f)前記さらなる係数シーケンスに含まれる係数を量子化およびスキャンすることによって一層さらなる係数シーケンスを生成する段階であって、スキャンはエンコード・スキャン順に従って行われる、段階と、
    g)前記一層さらなる係数シーケンスをエントロピー・エンコードする段階と、
    h)前記現在テクスチャー・パターンに関連する指標をエントロピー・エンコードする段階とを含む、
    方法。
  2. 前記現在テクスチャー・パターン適応パーティションが、
    ・複数ストリップを含むテクスチャー・パターン、
    ・非対称的なテクスチャー・パターンおよび
    ・非方向性のテクスチャーを含むテクスチャーのあるパターン
    のうちの一つに関連する、請求項1記載の方法。
  3. 段階b)、c)、d)、e)、f)およびg)を前記少なくとも第二の部分集合のピクセルに適用することをさらに含む、請求項1または2記載の方法。
  4. 前記少なくとも第二の部分集合について、段階f)において、異なるさらなるエンコード・スキャン順が使われる、請求項3記載の方法。
  5. 前記第一の部分集合と前記少なくとも第二の部分集合との間の係数予測をさらに含む、請求項3または4記載の方法。
  6. テクスチャー・パターン適応式の分割ブロック変換を使って画像の画像ブロックをエンコードする装置であって、前記画像ブロックがNかけるMのピクセルを含み、NはM以上であり、当該装置は、
    前記画像ブロックを、現在テクスチャー・パターンに関連する現在テクスチャー・パターン適応パーティションに従って、第一の部分集合のピクセルおよび少なくとも第二の部分集合のピクセルにパーティション分割する手段と、
    テクスチャー・パターンに関連するスキャン順を使って前記第一の部分集合のピクセルを、ピクセル・シーケンスのメタシーケンスに配列する段階であって、前記テクスチャー・パターンに関連するスキャン順は前記現在テクスチャー・パターンに関連し、前記ピクセル・シーケンスのそれぞれは高々N個のピクセルを含む、段階と、
    高々M個のさらなるピクセル・シーケンスのさらなるメタシーケンスを生成する手段であって、前記さらなるピクセル・シーケンスのそれぞれは前記ピクセル・シーケンスの一つまたは前記メタシーケンスのサブシーケンスのピクセル・シーケンスを連結したもののいずれかを含み、前記さらなるピクセル・シーケンスのそれぞれは高々N個のピクセルを含む、手段と、
    前記さらなるピクセル・シーケンスを変換することによって係数シーケンスを生成する手段と、
    前記係数シーケンスを横断する一次元変換によりさらなる係数シーケンスを生成する手段と、
    前記さらなる係数シーケンスに含まれる係数を量子化およびスキャンすることによって一層さらなる係数シーケンスを生成する手段であって、スキャンはエンコード・スキャン順に従って行われる、手段と、
    前記一層さらなる係数シーケンスをエントロピー・エンコードする手段と、
    前記現在テクスチャー・パターンに関連する指標をエントロピー・エンコードする手段とを有する、
    装置。
  7. 画像のエンコードされた画像ブロックを表すビットストリームをデコードする方法であって、前記画像ブロックは、テクスチャー・パターン適応式の分割ブロック変換を使ってエンコードされており、NかけるMのピクセルを含み、NはM以上であり、当該方法は、
    a)前記ビットストリームに含まれる第一の係数シーケンスをエントロピー・デコードし、
    b)現在テクスチャー・パターンに関連する、前記ビットストリームに含まれる指標をエントロピー・デコードし、前記現在テキスト・パターンに関連する逆テクスチャー・パターン適応スキャン順を決定し、
    c)前記第一の係数シーケンスの係数を逆量子化し、
    d)逆エンコード・スキャン順を使って、逆量子化された第一の係数を、二つ以上のさらなる第一の係数シーケンスに配列し、
    e)前記さらなる第一の係数シーケンスを横断する逆一次元変換によって一層さらなる第一の係数シーケンスを生成し、
    f)前記一層さらなる第一の係数シーケンスの逆変換によってピクセル・シーケンスを生成し、
    g)前記決定された逆テクスチャー・パターン適応スキャン順を使って、前記画像ブロックにわたって前記ピクセル・シーケンスのピクセルを分配する段階を含む、
    方法。
  8. 前記ビットストリームに含まれる第二の係数シーケンスをエントロピー・デコードし、前記第二の係数シーケンスに段階c)、d)、e)、f)およびg)を適用することをさらに含む、請求項7記載の方法。
  9. 画像のエンコードされた画像ブロックを表すビットストリームをデコードする装置であって、前記画像ブロックは、テクスチャー・パターン適応式の分割ブロック変換を使ってエンコードされており、NかけるMのピクセルを含み、NはM以上であり、当該装置は、
    前記ビットストリームに含まれる係数シーケンスをエントロピー・デコードする手段と、
    現在テクスチャー・パターンに関連する、前記ビットストリームに含まれる指標をエントロピー・デコードし、前記現在テキスト・パターンに関連する逆テクスチャー・パターン適応スキャン順を決定する手段と、
    前記第一の係数シーケンスの係数を逆量子化する手段と、
    逆エンコード・スキャン順を使って、逆量子化された第一の係数を、二つ以上のさらなる係数シーケンスに配列する手段と、
    前記さらなる第一の係数シーケンスを横断する逆一次元変換によって一層さらなる第一の係数シーケンスを生成する手段と、
    前記一層さらなる第一の係数シーケンスの逆変換によってピクセル・シーケンスを生成する手段と、
    前記決定された逆テクスチャー・パターン適応スキャン順を使って、前記画像ブロックにわたって前記ピクセル・シーケンスのピクセルを分配する手段とを有する、
    装置。
JP2012541293A 2009-12-04 2009-12-04 テクスチャー・パターン適応式の分割ブロック変換 Expired - Fee Related JP5456907B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2009/001369 WO2011066672A1 (en) 2009-12-04 2009-12-04 Texture-pattern-adaptive partitioned block transform

Publications (2)

Publication Number Publication Date
JP2013512627A JP2013512627A (ja) 2013-04-11
JP5456907B2 true JP5456907B2 (ja) 2014-04-02

Family

ID=44114588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012541293A Expired - Fee Related JP5456907B2 (ja) 2009-12-04 2009-12-04 テクスチャー・パターン適応式の分割ブロック変換

Country Status (7)

Country Link
US (1) US8666177B2 (ja)
EP (1) EP2508001A4 (ja)
JP (1) JP5456907B2 (ja)
KR (1) KR101630006B1 (ja)
CN (1) CN102640498B (ja)
BR (1) BR112012013479A2 (ja)
WO (1) WO2011066672A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105959688B (zh) * 2009-12-01 2019-01-29 数码士有限公司 用于解码高分辨率图像的方法
US9058637B2 (en) 2011-05-05 2015-06-16 Arm Limited Method of and apparatus for encoding and decoding data
EP2729917A4 (en) * 2011-07-08 2016-03-30 Ericsson Telefon Ab L M MULTI-MODE PROCESSING OF TEXTURE BLOCKS
GB2495301B (en) * 2011-09-30 2018-01-17 Advanced Risc Mach Ltd Method of and apparatus for encoding data
WO2013068566A1 (en) 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptive partition coding
EP2777286B1 (en) 2011-11-11 2017-01-04 GE Video Compression, LLC Effective wedgelet partition coding
US9349188B2 (en) 2013-03-15 2016-05-24 Samsung Electronics Co., Ltd. Creating details in an image with adaptive frequency strength controlled transform
US9305332B2 (en) 2013-03-15 2016-04-05 Samsung Electronics Company, Ltd. Creating details in an image with frequency lifting
US9536288B2 (en) 2013-03-15 2017-01-03 Samsung Electronics Co., Ltd. Creating details in an image with adaptive frequency lifting
US9066025B2 (en) * 2013-03-15 2015-06-23 Samsung Electronics Co., Ltd. Control of frequency lifting super-resolution with image features
US9161040B2 (en) 2014-01-10 2015-10-13 Sony Corporation Adaptive block partitioning with shared bit-budget
KR101978194B1 (ko) * 2014-11-14 2019-05-14 후아웨이 테크놀러지 컴퍼니 리미티드 디지털 이미지를 처리하는 방법 및 시스템
KR102093802B1 (ko) * 2014-11-14 2020-05-27 후아웨이 테크놀러지 컴퍼니 리미티드 디지털 이미지의 블록의 마스크 기반 처리를 위한 시스템 및 방법
WO2016074745A1 (en) 2014-11-14 2016-05-19 Huawei Technologies Co., Ltd. Systems and methods for processing a block of a digital image
US9652829B2 (en) 2015-01-22 2017-05-16 Samsung Electronics Co., Ltd. Video super-resolution by fast video segmentation for boundary accuracy control
CN112135147B (zh) * 2019-06-24 2023-02-28 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
CN114240975A (zh) * 2022-02-28 2022-03-25 安翰科技(武汉)股份有限公司 图像处理方法和图像处理装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69619097T2 (de) * 1995-10-18 2002-09-05 Koninkl Philips Electronics Nv Bereichbasiertes strukturkodierungs- und dekodierungsverfahren sowie zugehörige systeme
DE69618565D1 (de) 1995-10-18 2002-02-21 Koninkl Philips Electronics Nv Bereichbasiertes strukturkodierungs- und -dekodierungsverfahren sowie zugehörige systeme
EP0914004A1 (en) 1997-10-29 1999-05-06 Ntec Media GmbH Coding system and method for lossless and lossy compression of still and motion images
KR100382516B1 (ko) * 1999-01-15 2003-05-01 주식회사 팬택앤큐리텔 물체 단위 영상신호 부호화/복호화 장치 및 방법
TW508940B (en) * 2000-03-28 2002-11-01 Omnivision Tech Inc Method and apparatus for color image date processing and compression
US9418450B2 (en) * 2006-08-31 2016-08-16 Ati Technologies Ulc Texture compression techniques
US7885476B2 (en) 2006-12-14 2011-02-08 Sony Corporation System and method for effectively performing an adaptive encoding procedure
CN101325707B (zh) * 2007-06-12 2012-04-18 浙江大学 纹理自适应视频编解码系统

Also Published As

Publication number Publication date
WO2011066672A1 (en) 2011-06-09
KR101630006B1 (ko) 2016-06-13
US20120288210A1 (en) 2012-11-15
BR112012013479A2 (pt) 2016-05-24
EP2508001A1 (en) 2012-10-10
US8666177B2 (en) 2014-03-04
KR20120124058A (ko) 2012-11-12
CN102640498A (zh) 2012-08-15
JP2013512627A (ja) 2013-04-11
EP2508001A4 (en) 2016-07-20
WO2011066672A8 (en) 2012-06-28
CN102640498B (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
JP5456907B2 (ja) テクスチャー・パターン適応式の分割ブロック変換
CN111699694B (zh) 使用变换跳过标志的图像编码方法和装置
CN108259900B (zh) 针对视频的上下文自适应二进制熵编码的变换系数编码
CN109151485B (zh) 解码显著性图的装置
CN107071412B (zh) 由编码设备和解码设备执行的帧内预测方法
US10645410B2 (en) Video decoding apparatus
KR101758954B1 (ko) 디코더 및 방법
KR20110114524A (ko) 화상 예측 부호화 장치, 방법 및 프로그램, 화상 예측 복호 장치, 방법 및 프로그램, 및 부호화·복호 시스템 및 방법
US8295618B2 (en) Image processing apparatus, image processing method, and computer program product
KR101407755B1 (ko) 인코딩 및 디코딩을 위한 멀티레벨 유의성 맵
US20090304292A1 (en) Encoding and decoding methods, devices implementing said methods and bitstream
CN110431844B (zh) 用于对图像进行编码和解码的方法、编码和解码设备以及相应的计算机记录介质
JP5696248B2 (ja) 動画像符号化装置及び動画像復号化装置
JP2006340163A (ja) 画像圧縮装置
KR20090046791A (ko) 인코딩 방법, 디코딩 방법, 상기 방법을 구현하는 디바이스, 및 비트스트림
Lee et al. Efficient Color Image Compression with Category-Based Entropy Coder

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140108

R150 Certificate of patent or registration of utility model

Ref document number: 5456907

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees