JPWO2010067668A1 - 画像符号化装置及び画像復号装置 - Google Patents

画像符号化装置及び画像復号装置 Download PDF

Info

Publication number
JPWO2010067668A1
JPWO2010067668A1 JP2010542057A JP2010542057A JPWO2010067668A1 JP WO2010067668 A1 JPWO2010067668 A1 JP WO2010067668A1 JP 2010542057 A JP2010542057 A JP 2010542057A JP 2010542057 A JP2010542057 A JP 2010542057A JP WO2010067668 A1 JPWO2010067668 A1 JP WO2010067668A1
Authority
JP
Japan
Prior art keywords
division
unit
image
mode
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010542057A
Other languages
English (en)
Inventor
山本 智幸
智幸 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2010067668A1 publication Critical patent/JPWO2010067668A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

サイド情報の増加を抑えつつ、複数の分割モードの中から画像の特性に適合した分割モードを選択可能にする。画像符号化装置1は、入力画像を複数のマクロブロックに分割し、マクロブロック単位で符号化処理を行う。画像符号化装置1は、マクロブロック毎に予測画像の生成方法を示す予測モードを判定する予測モード判定部148と、予測モード判定部148により判定された予測モードに応じて、マクロブロック毎にサブマクロブロックへの分割方法を示す分割モードを決定する分割モード決定部149と、分割モード決定部149により決定された分割モードに基づいてマクロブロックをサブマクロブロックに分割するSMB分割部140と、予測モード判定部148により判定された予測モードに基づいて、マクロブロックの予測画像を生成する予測部141とを備え、サブマクロブロック単位で入力画像と予測画像の差分を周波数変換する。

Description

本発明は、画像符号化装置及び画像復号装置に関し、より詳細には、画像を符号化して符号化データを生成する画像符号化装置と、伝送・蓄積された符号化データから画像を復号する画像復号装置に関する。
一般的な画像符号化においては、符号化対象である入力画像を、マクロブロック(以下、MB)と呼ばれる所定の処理単位に分割し、MB毎に符号化処理を行って、符号化データを生成する。画像復号においては、復号対象である符号化データから、MBに相当する符号化データであるMB符号化データを抽出して順に復号し、得られるMB復号画像を集めて復号画像を生成する。
MBの処理順としては、一般的に図18に示すように、画像を一定サイズの正方形のMB(16画素×16画素など)に分割し、画像内で左上から右下に走査するラスタスキャン順でMBの処理が行われる。
MBは、MB内の入力画像(MB画像)の性質に応じて、さらに小さい処理単位であるサブマクロブロック(以下、SMB)に分割される。そして、SMB毎に、SMB内の入力画像(SMB画像)を推定する予測画像が生成され、SMB画像と予測画像の差分である予測残差が離散コサイン変換(DCT)に代表される周波数変換で変換された後に符号化される。
ここで、非特許文献1の記載に準拠する動画像符号化装置において、画像符号化処理(以下、従来技術)の際に、MB毎にSMB分割の方法(分割モード)および予測画像の生成方法(予測モード)を切り替えることができる。以下、従来技術における分割モードおよび予測モードについて説明する。
従来技術では16×16画素のMBが用いられる。また、MB走査としてラスタスキャン順が一般に用いられる。なお、以降の説明では、説明を簡単にするため、特に断らない限り16×16画素のMBおよびMB走査順としてラスタスキャン順とする。
MBは、適用される分割モードに応じてI16、I8、I4の3つのMBタイプに分類される。図19に各MBタイプで適用される分割モードを示す。図19(A)はI16タイプの例、図19(B)はI8タイプの例、図19(C)はI4タイプの例を示す。まず、I16タイプでは分割は行われない。すなわち、MBとSMBが一致する。I8タイプでは、MBは8×8画素から成る4個のSMBに分割される。I4タイプでは、MBは4×4画素から成る16個のSMBに分割される。
また、SMBで適用可能な予測モードはMBタイプによって異なる。図19に各MBタイプで適用可能な予測モードの種類を示す。I16タイプでは、平均値モード・0度・90度・平面モードの4モードが適用可能である。I8タイプおよびI4タイプでは、平均値モード・0度・90度・45度・22.5度・67.5度・−22.5度・112.5度・135度の9モードが適用可能である。なお、ここでX度は右方向を0度として時計回りの方向を正方向とした場合の角度である。そして、X度の予測モードでは、その角度の示す方向の画像の空間相関を利用して予測画像を生成する。
従来技術では、MB画像の性質に合わせて上記の多様な分割モードや予測モードを選択することができる。それにより、予測残差の絶対値を減少させるとともに、周波数変換により予測残差のエネルギーを一部の変換係数に集中させることができるため、少ない符号量で入力画像を符号化できる。
ここで、上記の「予測残差のエネルギー」とは、物理量として、画素毎の予測残差値の2乗和に相当する。また、この「予測残差のエネルギー」を一部の変換係数に集中させることで、予測残差の符号量が減少する理由は以下の通りである。
(1) 画像符号化では、変換係数を量子化した変換係数レベルが可変長符号化される。
(2) ブロック内の変換係数レベルを可変長符号化する際に、ゼロの値を持つ変換係数レベルが多いほど、可変長符号化後の符号化データの符号量が少なくなる。
(3)上記(2)の根拠として、可変長符号化において、ゼロの値を持つ変換係数レベルを複数個まとめて、短いビット列で表現する方式を用いられることが挙げられる。
(4)「予測残差のエネルギー」を一部の変換係数に集中させることで、残りの多数の変換係数の有するエネルギーは相対的に小さくなる。
(5)エネルギーの小さい変換係数は、変化係数の絶対値の値が小さいので、量子化によって対応する変換係数レベルがゼロになる可能性が高くなる。
(6)すなわち、上記(4)と(5)より、「予測残差のエネルギー」を一部の変換係数に集中させることで、より多くの変換係数で変換係数レベルがゼロになる可能性が高くなることがわかる。
(7)従って、上記(2)と(6)より、「予測残差のエネルギー」を一部の変換係数に集中させることで、可変長符号化後の符号化データの符号量は少なくなる可能性が高くなることがわかる。
(8)一つのブロックで見た場合、符号量は少なくなる可能性が高くなるという結論になるが、画像は多数のブロックから構成されるため、画像全体として、符号量が減少することになる。
ITU-T Recommendation H.264(11/07) URL http://www.itu.int/rec/T-REC-H.264-200711-S/en
しかしながら、従来技術においては、分割モードが規定の3種類のみであるため、MB画像の性質にあった分割モードが必ずしも選択できないという問題がある。以下、この問題についてさらに詳しく説明する。
予測残差はSMBの単位で周波数変換されるが、その際に周波数変換の結果、予測残差のエネルギーを可能な限り少数の周波数係数に集中させることが、より少ない符号量で予測残差を符号化するためには好ましい。一般に、広い範囲で空間相関を持つ信号に対しては、広い単位で周波数変換することで少数の周波数係数にエネルギーを集中させることができる。逆に、狭い範囲でしか空間相関を持たない信号に対して広い単位で周波数変換すると、多数の周波数係数にエネルギーが分散する。したがって、変換対象の信号の空間相関に応じて、変換ブロックサイズを選択することが好ましい。そのような点を考慮して、従来技術においては、複数の異なる単位の周波数変換を備えている。
しかし、従来技術の周波数変換の単位は、16×16画素、8×8画素、4×4画素であり、例えば、16×4画素や4×16画素といった単位は備えられていない。予測残差の空間相関が、横方向に大きく、縦方向に小さい場合には16×4画素単位の周波数変換が有効である。また同様に、予測残差の空間相関が、縦方向に大きく、横方向に小さい場合には4×16画素単位の周波数変換が有効である。従来技術においては、そのような単位の周波数変換を適用できないため、特定の空間相関特性を持つ予測残差を周波数変換した際に十分少ない周波数係数へエネルギーが集中しないという問題が生じる。
上記問題の解決策として、MBに対して適用可能な分割モード数を増やす方法が考えられる。しかし、分割モードはMB毎にサイド情報として符号化する必要があり、適用可能な分割モード数を増やした場合、いずれの分割モードを適用するかを示すサイド情報の符号量が増加してしまうという、新たな問題が生じる。
本発明は、このような状況に鑑みてなされたもので、サイド情報を増加させず、多数の分割モードの中から入力画像の局所的特性に適した分割モードを選択することで、従来よりも少ない符号量で入力画像を符号化することを可能とする画像符号化装置を提供すること、を目的とする。
また、画像符号化装置で符号化された符号化データを復号することができる画像復号装置を提供すること、を目的とする。
上記課題を解決するために、第1の技術手段は、入力画像を複数のマクロブロックに分割し、マクロブロック単位で符号化処理を行う画像符号化装置であって、マクロブロック毎に予測画像の生成方法を示す予測モードを判定する予測モード判定部と、該予測モード判定部により判定された予測モードに応じて、マクロブロック毎にサブマクロブロックへの分割方法を示す分割モードを決定する分割モード決定部と、該分割モード決定部により決定された分割モードに基づいてマクロブロックをサブマクロブロックに分割するSMB分割部と、前記予測モード判定部により判定された予測モードに基づいて、マクロブロックの予測画像を生成する予測部とを備え、サブマクロブロック単位で前記入力画像と前記予測画像の差分を周波数変換することを特徴としたものである。
第2の技術手段は、第1の技術手段において、前記予測部は、マクロブロックの予測画像を、サブマクロブロック単位で生成することを特徴としたものである。
第3の技術手段は、第1または第2の技術手段において、各予測モードに対して適切な分割モードを関連付けたSMB分割ルールを生成するSMB分割ルール生成部を備え、前記分割モード決定部は、前記予測モード判定部により判定された予測モードに応じた分割モードを、前記SMB分割ルールに従って決定することを特徴としたものである。
第4の技術手段は、第3の技術手段において、前記SMB分割ルールを符号化することを特徴としたものである。
第5の技術手段は、第4の技術手段において、前記SMB分割ルールをスライス単位で符号化することを特徴としたものである。
第6の技術手段は、第3〜第5のいずれか1の技術手段において、前記入力画像をマクロブロック単位で符号化するVLC部をさらに備え、前記SMB分割ルールは、各予測モードに対応する有効分割モードリストを含み、前記有効分割モードリストは、対応する予測モードに対して有効な分割モードを少なくとも1個以上要素として含み、前記分割モード決定部は、マクロブロックの予測画像の生成に用いられる予測モードに対応する前記有効分割モードリストを前記SMB分割ルールから抽出し、前記有効分割モードリストに要素として含まれる分割モードの中から当該マクロブロックにおける分割モードを選択し、前記VLC部は、前記分割モード決定部により選択された分割モードを示す情報を符号化することを特徴としたものである。
第7の技術手段は、第3〜第6のいずれか1の技術手段において、マクロブロックの複雑度を示すMBクラスを計算するMBクラス決定部を備え、前記分割モード決定部は、前記予測モード判定部により判定された予測モードに応じた分割モードを、前記SMB分割ルール及び前記MBクラスに従って決定することを特徴としたものである。
第8の技術手段は、第1〜第7のいずれか1の技術手段において、前記分割モードは、横長矩形型のサブマクロブロックを含むよう分割することを指定する横長矩形分割モードと、縦長矩形型のサブマクロブロックを含むよう分割することを指定する縦長矩形分割モードとを含むことを特徴としたものである。
第9の技術手段は、マクロブロック単位で符号化されている符号化データを復号して復号画像を生成する画像復号装置であって、前記符号化データから変換係数レベルと予測モードを抽出して可変長復号するVLD部と、該VLD部により抽出された変換係数レベルを逆量子化して変換係数を復元する逆量子化部と、該逆量子化部により復元された変換係数を逆周波数変換して予測残差を復元するIDCT部と、前記VLD部により抽出された予測モードに基づいてサブマクロブロックに対応する予測画像を生成する予測部とを備え、サブマクロブロック単位で前記予測画像に前記予測残差を加算して得られる局所復号画像を、前記予測モードに応じて決定される分割モードに基づいて、複数個結合することでマクロブロック単位の復号画像を生成することを特徴としたものである。
本発明の画像符号化装置によれば、多数の分割モード候補の中から、特定の予測モードを適用した際の予測残差の性質に適した分割モードでMBをSMBに分割して周波数変換を行うことで、入力画像を従来技術よりも少ない符号量で符号化することができる。
また、本発明の画像復号装置によれば、画像符号化装置で符号化された符号化データを復号することができる。
本発明の一実施形態に係る画像符号化装置の構成例を示すブロック図である。 図1に示す画像符号化装置の動作例を説明するためのフロー図である。 MB符号化部の構成例を示すブロック図である。 本発明において適用可能な分割モードを示す図である。 MB符号化部の動作例について説明するためのフロー図である。 SMB分割ルール生成部の構成例を示すブロック図である。 SMB分割ルール生成部の動作例を説明するためのフロー図である。 本発明の一実施形態に係る画像復号装置の構成例を示すブロック図である。 図8に示す画像復号装置の動作例を説明するためのフロー図である。 MB復号部の構成例を示すブロック図である。 MB復号部の動作例を説明するためのフロー図である。 MB符号化部の他の構成例を示すブロック図である。 MB符号化部の他の動作例を説明するためのフロー図である。 SMB分割ルール生成部の他の構成例を示すブロック図である。 SMB分割ルール生成部の他の動作例を説明するためのフロー図である。 MB復号部の他の構成例を示すブロック図である。 MB復号部の他の動作例を説明するためのフロー図である。 画像をマクロブロック単位で処理する際の処理順序を説明するための図である。 従来技術において各MBタイプで適用可能な分割モードと予測モードを示す図である。
(実施形態1:SMB分割ルールを利用した方法)
以下、本発明による画像符号化装置及び画像復号装置の一実施形態について添付図面に基づいて説明する。
<エンコーダの構成例>
まず、本実施形態における画像符号化装置について説明する。
図1は、本発明の一実施形態に係る画像符号化装置の構成例を示すブロック図である。図中、1は画像符号化装置で、該画像符号化装置1は、SMB分割ルール生成部120、MB分割部121、MB符号化部122、及び符号化データ多重化部123を備える。
SMB分割ルール生成部120は、入力画像100に基づいて、SMB分割ルール102を生成して出力する。SMB分割ルールには、特定の予測モードが選択された場合に何れの分割モードを適用するべきかが示されており、詳細は後述する。
MB分割部121は、入力画像100を分割し、得られたMB画像101をラスタスキャン順で順次出力する。
MB符号化部122は、SMB分割ルール生成部120から入力されるSMB分割ルール102に基づいて、MB分割部121から順次入力されるMB画像101を符号化し、各MBの符号化結果をMB符号化データ103として順次出力する。
符号化データ多重化部123は、SMB分割ルール生成部120から入力されるSMB分割ルール102と、MB符号化部122から順次入力されるMB符号化データ103とを多重化し、これを符号化データ104として出力する。
<エンコーダの動作例>
図2は、図1に示す画像符号化装置1の動作例を説明するためのフロー図である。
まず、画像符号化装置1は、外部から入力画像100が入力されると、この入力画像100をSMB分割ルール生成部120及びMB分割部121にそれぞれ供給する(ステップS1)。
次に、SMB分割ルール生成部120は、ステップS1で供給された入力画像100に基づいて、SMB分割ルール102を生成(決定)し、このSMB分割ルール102をMB符号化部122及び符号化データ多重化部123に出力する(ステップS2)。
MB分割部121は、ステップS1で供給された入力画像100をMB画像101に分割し、MB符号化部122に順次出力する。続いて、識別子MB_id(MB_id=0,…,Nmb−1)によって識別される計Nmb個のMB画像それぞれに対して、ステップS4の処理を実行する(ステップS3)。
次に、MB符号化部122は、ステップS2で入力されたSMB分割ルール102と、ステップS3で入力されたMB画像101とに基づいて、MB符号化データ103を生成し、このMB符号化データ103を符号化データ多重化部123に出力する(ステップS4)。
そして、符号化データ多重化部123は、ステップS2で入力されたSMB分割ルール102と、ステップS4で入力された計Nmb個のMB符号化データ103とを多重化して符号化データ104を生成し、これを外部に出力する(ステップS5)。
上記手順により、画像符号化装置1は、入力画像100を符号化して符号化データ104を生成し、外部に出力することができる。
<MB符号化部122の構成例>
次に、画像符号化装置1が備えるMB符号化部122の詳細構成について説明する。
図3は、MB符号化部122の構成例を示すブロック図である。図中、MB符号化部122は、SMB分割部140、予測部141、DCT部142、量子化部143、VLC(Variable Length Coding)部144、逆量子化部145、IDCT部146、局所復号画像メモリ147、予測モード判定部148、及び分割モード決定部149により構成される。
画像符号化装置1は、主たる構成要素として、マクロブロック毎に予測画像の生成方法を示す予測モードを判定する予測モード判定部148と、予測モード判定部148により判定された予測モードに応じて、マクロブロック毎にサブマクロブロックへの分割方法を示す分割モードを決定する分割モード決定部149と、分割モード決定部149により決定された分割モードに基づいてマクロブロックをサブマクロブロックに分割するSMB分割部140と、予測モード判定部148により判定された予測モードに基づいて、マクロブロックの予測画像を生成する予測部141とを備え、サブマクロブロック単位で入力画像と予測画像の差分を周波数変換する。以下、画像符号化装置1が備える各構成要素について詳細に説明する。
<予測モード判定部148の説明>
予測モード判定部148は、入力されるMB画像101に基づいて、画像符号化装置1で用いられる予測モードであるDC、Hor、Vertの3予測モードのうち、現MB内のSMB画像の予測に適する予測モード110を選択して出力する。なお、各予測モードによる予測画像生成処理については後述するが、DCの場合、SMB周辺の局所復号画像の平均画素値に基づく予測画像を生成する。また、Horの場合、水平方向予測モードであるため、SMB左辺に隣接する局所復号画像に基づいて予測画像を生成する。また、Vertの場合、鉛直方向予測モードであるため、SMB上辺に隣接する局所復号画像に基づいて予測画像を生成する。
予測モード判定部148による予測モードの選択方法は次の通りである。まず、MB画像101の水平エッジ強度EHおよび垂直エッジ強度EVを次式により計算する。
Figure 2010067668
なお、B(i,j)はMB画像の左上の画素を基準として(i,j)の位置する画素の画素値に相当する。ただし、(i,j)がMB外の画素を示すとき、すなわちi<0または16≦iまたはj<0または16≦jの場合、B(i,j)の値は、(i,j)で示される画素に最も近いMB内の画素の画素値とする。
次に、所定の閾値THE(例えば、THE=1000)とEHおよびEVを比較して予測モードを決定する。EH≧THEかつEV<THEの場合、予測モードをHorとする。それ以外の場合で、EH<THEかつEV≧THEの場合、予測モードをVertとする。それ以外の場合、予測モードをDCとする。
このように選択することで、MB画像101に水平方向のエッジが存在する場合のように、MB画像101の水平方向の画素間相関が高く、垂直方向の画素間相関が低い場合にはHorが予測モードとして選択される。同様に、MB画像101に垂直エッジが存在する場合のように、MB画像101の垂直方向の画素間相関が高く、水平方向の画素間相関が低い場合にはVertが予測モードとして選択される。そして、複雑な領域であり水平/垂直両方向の画素間相関が低い場合、または平坦な領域であり水平/垂直両方向の画素間相関が高い場合にはDCが予測モードとして選択される。
<分割モード決定部149の説明>
分割モード決定部149は、入力されるSMB分割ルール102で規定されている予測モードと分割モードの対応関係に基づいて、予測モード判定部148から入力される予測モード110に対応する分割モード111を出力する。
ここで、画像符号化装置1は、図4に示す5種類の分割モード(16×16分割、8×8分割、4×4分割、4×16分割、16×4分割)を用いる。図4(A)に示す16×16分割ではMBを分割しない。すなわちMBとSMBが一致し、SMBは16×16画素で構成される。また、図4(B)に示す8×8分割では、MBを4個の8×8画素で構成されるSMBに分割する。また、図4(C)に示す4×4分割では、MBを16個の4×4画素で構成されるSMBに分割する。また、図4(D)に示す4×16分割では、MBを4個の4×16画素で構成される縦長矩形のSMBに分割する。また、図4(E)に示す16×4分割では、MBを4個の16×4画素で構成される横長矩形のSMBに分割する。
SMB分割ルール102では、3種類の予測モード(DC、Hor、Vert)に対し、それぞれ上記5種類の分割モードのいずれかが関連付けられている。そのため、分割モード決定部149では、予測モード110に応じて出力する分割モード111を決定することができる。
SMB分割ルール102の一例として、比較的平坦な領域が多い画像では、(DC、Hor、Vert)の各予測モードに対して、(16×16分割、4×16分割、16×4分割)の各分割モードがそれぞれ関連付けられる。また、別の例として、比較的複雑な領域が多い画像では、(DC、Hor、Vert)の各予測モードに対して、(8×8分割、4×4分割、4×4分割)の各分割モードがそれぞれ関連付けられる。
<SMB分割部140の説明>
SMB分割部140は、分割モード決定部149から入力される分割モード111に基づいて、順次入力されるMB画像101を分割し、これをSMB画像105として所定の順序(例えば、MB内におけるSMB左上画素の位置が、ラスタスキャン順で先に来る順序)で出力する。
<予測部141の説明>
予測部141は、予測モード判定部148から入力される予測モード110に基づいて、SMB分割部140から入力されるSMB画像105を近似する予測画像106を生成して出力する。例えば、入力されるSMB画像105のサイズがWs×Hs画素、SMB画像105の左上画素の入力画像100内での位置を(xcs、ycs)とした場合、特定の予測モードPMにおいて生成される予測画像106の各画素値P(i,j)は次式により定められる。
Figure 2010067668
ここで、Id(x、y)は局所復号画像メモリ147に記録されている局所復号画像の画素値である。
<DCT部142の説明>
DCT部142は、入力される予測残差107(Ws×Hs画素)に対して、2次元離散コサイン変換を施し、この変換結果を変換係数(Ws×Hs個)として出力する。
<量子化部143の説明>
量子化部143は、DCT部142から入力される変換係数を所定の量子化ステップで量子化し、変換係数レベル108(Ws×Hs個)を導出して出力する。
<VLC部144の説明>
VLC部144は、量子化部143から入力された変換係数レベル108と、予測モード判定部148から入力された予測モード110とをそれぞれ可変長符号化および多重化し、これをMB符号化データ103として出力する。
<逆量子化部145の説明>
逆量子化部145は、量子化部143から入力された変換係数レベル108(Ws×Hs個)に対して、逆量子化を施し、これを周波数変換係数(Ws×Hs個)として復元して出力する。
<IDCT部146の説明>
IDCT部146は、逆量子化部145から入力された周波数変換係数(Ws×Hs個)に対して、2次元逆離散コサイン変換を施し、予測残差(Ws×Hs画素)を再構築して出力する。
<局所復号画像メモリ147の説明>
局所復号画像メモリ147には、SMB単位で生成された局所復号画像109が順次記録される。したがって、現MB内にあるSMBが処理されている段階では、現MBよりもラスタスキャン順で前に位置するMBに対応する局所復号画像と、現MB内で当該SMBよりも前に処理されたSMBに対応する局所復号画像とが局所復号画像メモリ147に記録されている。
<MB符号化部122の動作例>
図5は、MB符号化部122の動作例について説明するためのフロー図である。なお、以下のフローは、前述の図2に示した画像符号化装置1の動作例におけるステップS4の処理を詳細に説明したものである。
まず、予測モード判定部148は、図1に示したMB分割部121から入力されたMB画像101に基づいて予測モード110を導出し、これを予測部141,分割モード決定部149,及びVLC部144に出力する(ステップS11)。
次に、分割モード決定部149は、ステップS11にて予測モード判定部148から入力された予測モード110と、図1に示したSMB分割ルール生成部120から入力されたSMB分割ルール102とに基づいて、分割モード111を決定し、これをSMB分割部140に出力する(ステップS12)。
次に、SMB分割部140は、図1に示したMB分割部121から入力されたMB画像101を、ステップS12にて入力された分割モード111に基づいてNsmb個のSMB画像に分割する。そして、分割の結果得られる、識別子SMB_id(SMB_id=0,…,Nsmb−1)によって識別される計Nsmb個のSMB画像105を、予測部141およびDCT部142に順次出力する。そして、各SMB画像105に対して、ステップS14〜ステップS17の各処理が順次実行される(ステップS13)。
予測部141は、ステップS11にて予測モード判定部148から入力された予測モード110と、局所復号画像メモリ147に記録されている局所復号画像とに基づいて、予測画像106を生成して出力する(ステップS14)。
次に、ステップS13で出力されたSMB画像105と、ステップS14で出力された予測画像106との差分である予測残差107がDCT部142に入力される。このDCT部142が周波数変換(DCT)により予測残差107を変換係数に変換した後に、量子化部143により量子化され、これが変換係数レベル108としてVLC部144および逆量子化部145に出力される(ステップS15)。
次に、ステップS15で出力された変換係数レベル108は、逆量子化部145により逆量子化され、変換係数として復元された後、IDCT部146により逆周波数変換され、予測残差107として復元されて出力される(ステップS16)。
次に、ステップS16で出力された予測残差107は、ステップS14で出力された予測画像106と加算されて、局所復号画像109として局所復号画像メモリ147に記録される(ステップS17)。
最後に、VLC部144は、ステップS11にて予測モード判定部148から入力された予測モード110と、ステップS15にて量子化部143から入力された各SMBの変換係数レベル108とをそれぞれ可変長符号化し、これらをMB符号化データ103として図1に示す符号化データ多重化部123に出力する(ステップS18)。
上記の手順により、MB符号化部122は、入力されたMB画像101を符号化し、MB符号化データ103を生成することができる。その際、MB画像101の特性に合った予測モードが選択されるとともに、別途入力されるSMB分割ルール102に基づいて当該予測モードに適する分割モードが選択される。このため、予測モードと独立に分割モードを決定する場合に比べて、少ない符号量でMB画像を符号化することができる。
<SMB分割ルール生成部120の構成例>
次に、画像符号化装置1が備えるSMB分割ルール生成部120の詳細構成について説明する。
図6は、SMB分割ルール生成部120の構成例を示すブロック図である。図中、SMB分割ルール生成部120は、モード制御部160、入力画像メモリ161、予測/分割評価部162、評価情報記録メモリ163、及びSMB分割ルール決定部164より構成される。なお、MB分割部121は、図1に示したMB分割部121と同じものとする。
SMB分割ルール生成部120は、予測モード及び分割モードの組み合わせの適切さを示すモード評価値を算出し、算出したモード評価値に基づいて、各予測モードに対して適切な分割モードを関連付けたSMB分割ルールを生成する。そして、分割モード決定部149は、予測モード判定部148により判定された予測モードに応じた分割モードを、SMB分割ルールに従って決定する。以下、SMB分割ルール生成部120が備える各構成要素について詳細に説明する。
<モード制御部160の説明>
モード制御部160は、MB画像101の入力に応じて起動し、予測モード110と分割モード111とにより可能な全ての組み合わせを、任意の順番で出力する。例えば、3種類の予測モード(DC、Hor、Vert)と5種類の分割モード(16×16分割、8×8分割、4×4分割、16×4分割、4×16分割)に対しては、計15種類の組み合わせが出力される。
<入力画像メモリ161の説明>
入力画像メモリ161には、入力画像100が記録される。
<予測/分割評価部162の説明>
予測/分割評価部162は、MB分割部121から入力されるMB画像101と、モード制御部160から入力される予測モード110,分割モード111とに基づいて、特定の予測モードと分割モードの組み合わせの適切さを示すモード評価値112を計算し、これを出力する。なお、モード評価値112は、予測モード110および分割モード111と関連付けられた上で出力される。
具体的には、モード評価値112は次の手順で計算される。なお、予測/分割評価部162に入力される予測モードと分割モードをそれぞれPM、DMと呼称する。まず始めに、予測モードPMに基づいて、入力画像メモリ161に記録されている入力画像100から予測画像が計算される。予測画像P’(16×16画素)の各画素P’(i,j)は次式により計算される。
Figure 2010067668
ここで、Ic(x、y)は入力画像100における位置(x、y)の画素の画素値を示す。また、(xc、yc)は処理対象のMBの左上に位置する画素の入力画像100上での位置を表す。上式により、PM=DCの場合はMB周囲の画素の平均値に基づく予測画像が生成される。また、PM=HorやPM=Vertの場合は、それぞれ横方向または縦方向の画素値の空間相関を利用した予測画像が生成される。
次に、MB画像101と予測画像P’の差分である予測残差D’(16×16画素)を計算する。D’の各画素値D’(i,j)を次式により計算する。
Figure 2010067668
次に、予測残差D’を分割モード111に基づいてSMB単位に分割して、SMB単位毎にDCTを実行して変換係数C’を得る。各SMBに対応する、変換係数C’の各係数値C’(u、v)は次式により計算される。
Figure 2010067668
ここで、(Ox、Oy)は、処理対象SMBの左上画素の処理対象MBの左上画素からの変位を画素単位で表す。また、WsはSMBの幅、HsはSMBの高さを画素単位で表す。
次に、各SMBの変換係数C’において、何個の変換係数に予測残差のエネルギーの大部分が集中しているかを表すエネルギー分散度ECs(SMB_id)を計算する。エネルギー分散度ECs(SMB_id)には、次式を満たす最小の整数値Kの値が設定される。
Figure 2010067668
ここで、C’(k)は変換係数C’を値の大きい順に並べた際のk+1番目の係数値を表す。また、Reはエネルギー分散度を計算するためのパラメータであり、例えば、Re=0.95を用いる。また、Esは予測残差のエネルギーを表し、予測残差内の画素値の自乗和として計算できる。上式によると、ECsの値は、例えばRe=0.95の場合、予測残差のエネルギーの95%が、何個の変換係数に集中しているかを表す。したがって、ECsの値が小さいほど、SMB内の予測残差のエネルギーが少数の変換係数に集中していると言える。
最後に、処理対象MBにおける予測モードPMに対する分割モードDMの適切さを表す量であるモード評価値112(ECm)が、MB内のSMBにおけるエネルギー分散度の和として次式により導出される。
Figure 2010067668
上式によると、モード評価値112は、処理対象MBにおいて予測モードPMと分割モードDMを用いた場合の変換係数のエネルギー分散の程度を表すため、モード評価値が小さいほど予測モードPMと分割モードDMの組み合わせが好ましいといえる。
<評価情報記録メモリ163の説明>
評価情報記録メモリ163には、予測モード110および分割モード111と関連付けられたモード評価値112が順次記録される。
<SMB分割ルール決定部164の説明>
SMB分割ルール決定部164は、評価情報記録メモリ163に記録されているモード評価値112を参照し、これに基づいてSMB分割ルール102を作成して出力する。
SMB分割ルール102は、適用可能な全ての予測モードそれぞれに対して、有効な分割モードが関連付けられる。特定の予測モードPMに対する最適な分割モードDMは次の手順で決定される。
まず、評価情報記録メモリ163に記録されているモード評価値112に基づいて予測モードPMに対する各分割モードDMの評価値を計算する。例えば、予測モードPMに対する分割モードDMの評価値は、評価情報記録メモリ163から予測モードPMおよび分割モードDMに関連付けられたモード評価値112を取得して、得られた複数のモード評価値112の平均値を予測モードPMに対する分割モードDMの評価値とする。
次に、予測モードPMに対してモード評価値ECmが最小となるような分割モードを選択して、予測モードPMに対する最適な分割モードとする。モード評価値ECmは周波数変換後の各変換係数へのエネルギーの散らばり度合を示す指標であるため、上記の手順で予測モードPMに対する分割モードDMを選択することで、変換係数へのエネルギーの散らばり度合が小さい分割モードを選択することができる。言い換えると、周波数変換後により少数の変換係数へエネルギーが集中するような分割モードを選択することができる。
<SMB分割ルール生成部120の動作例>
図7は、SMB分割ルール生成部120の動作例を説明するためのフロー図である。なお、以下のフローは、前述の図2に示した画像符号化装置1の動作例におけるステップS2の処理を詳細に説明したものである。
まず、外部からの入力画像100がMB分割部121に入力されると共に、入力画像メモリ161に記録される(ステップS21)。
MB分割部121は、外部からの入力画像100をMB画像101に分割する。分割の結果得られた、識別子MB_id(MB_id=0,…,Nmb−1)によって識別される計Nmb個のMB画像は、SMB分割部140(図3)およびモード制御部160(図6)に順次出力される。続いて、各MB画像に対して、ステップS23〜ステップS24の処理が実行される(ステップS22)。
モード制御部160は、予測モード110と分割モード111の対を生成して、これらを予測/分割評価部162に順次出力する。続いて、各予測モード110と分割モード111の対に対して、ステップS24の処理が実行される(ステップS23)。
予測/分割評価部162は、ステップS23にてモード制御部160から入力される予測モード110と分割モード111の対に対するモード評価値112を計算し、このモード評価値112を評価情報記録メモリ163に出力して記録する(ステップS24)。
SMB分割ルール決定部164は、ステップS24にて評価情報記録メモリ163に記録された各モード評価値112に基づいて、1つのSMB分割ルール102を決定し、これを図1に示したMB符号化部122と符号化データ多重化部123に出力する(ステップS25)。
なお、ステップS22からステップS24の処理において、各予測モードと分散モードの組み合わせ毎にNmb個のモード評価値112が評価情報記録メモリ163に記録される。このため、ステップS25ではNmb個のモード評価値112の平均値を、ある予測モードに対して何れの分割モードを選択するかの選択基準として用いるようにしている。
以上の手順により、SMB分割ルール生成部120は、外部からの入力画像100に基づいてSMB分割ルール102を決定して出力する。その際、各予測モードに対して、入力画像を構成するSMBにおいてDCTを予測残差に適用する場合に、エネルギー集中性が最も高くなるようなブロックサイズを提供するSMB分割モードが関連付けられる。
このように、SMB分割ルール生成部120で生成されるSMB分割ルール102に基づいて分割モードを決定する画像符号化装置1では、予測残差を周波数変換した際にエネルギー集中度が高くなるSMB分割モードが、予測モードに基づいて選択される。そのため、周波数変換された予測残差を可変長符号化するのに要する符号量が減少する。また、その際に、SMB分割モードは予測モード110に応じて決まるため、いずれの分割モード111を適用するかを示すサイド情報は不要であるため、サイド情報の増加に伴う符号量増加も生じない。
(他の実施形態)
なお、上記の画像符号化装置1に関する説明では、SMB分割ルール102において、全ての予測モードに対して、それぞれ有効な分割モードが1つ関連付けられているものとした。しかし、必ずしも全ての予測モードに対する有効な分割モードをSMB分割ルール102中に含める必要はなく、特定の予測モードに対しては、適切であると推定される分割モードをSMB分割ルール102に依存せずに常に用いることもできる。
例えば、予測モードがHorの場合には、入力画像の横方向の相関を利用して予測画像を生成する。そのため、SMB画像と予測画像の差分である予測残差では、横方向の相関が除去され、結果として縦方向の相関が残っている場合が多い。そのため、横方向の相関が低く縦方向の相関の高い画像に対して有効な、縦長形状のSMBを生じるような分割モードを用いることが有効である。それゆえ、Hor予測モードに対し、SMB分割ルール生成部120で決定される分割モードの代わりに、縦長形状のSMBへの分割を行う分割モードを採用した場合でも、少数の変換係数へエネルギーが集中する。その場合には、SMB分割ルール生成処理の処理量を削減することができ、またSMB分割ルール102の符号量を低減することができる。
同様に、予測モードがVertの場合には、入力画像の縦方向の相関を利用して予測画像を生成するため、横長形状のSMBへの分割を行う分割モードを用いることが好ましい。
さらにいえば、予測モードが画像の特定方向の相関を利用して予測画像を生成する場合、その方向と垂直な方向に長い形状のSMBへの分割を行う分割モードを用いることが好ましいといえる。
また、上記の場合とは逆に、特定の予測モードに対して有効だと推定される分割モードが複数存在する場合に、予測モードに2個以上の分割モードを優先順位付きで関連付けたSMB分割ルールを用いることもできる。以下、そのような場合における、(1)SMB分割ルールの決定方法、(2)SMB分割ルールの可変長符号化方法、(3)SMB分割ルールに基づいたMB毎の分割モードの決定方法、(4)MB毎の分割モードの符号化方法について前述の図3,6を参照しながら説明する。
(1)SMB分割ルールの決定方法 図6において、特定の予測モードに対して2個以上の分割モードが関連付けられている場合のSMB分割ルール102bは、上記の画像符号化装置1の構成要素であるSMB分割ルール決定部164(図6)を、以下に説明するSMB分割ルール決定部164bに置き換えることで導出できる。
SMB分割ルール決定部164bは、評価情報記録メモリ163に記録されているモード評価値112を参照し、これに基づいてSMB分割ルール102bを作成して出力する。特定の予測モードPMに対して有効な分割モードを優先順位付きで並べた、有効分割モードリスト{DM1、DM2、・・・、DMn}は次の手順で決定される。
まず、評価情報記録メモリ163に記録されているモード評価値112に基づいて予測モードPMに対する各分割モードの評価値を計算する。評価値は、前述のSMB分割ルール決定部164の動作で説明した手順で計算できる。
次に、各予測モードPMに対する有効分割モードリストを決定する。各予測モードPMに対し、モード評価値ECmが最小となるような分割モードを選択して、その分割モードを有効分割モードリストの先頭要素DM1に設定し、そのモード評価値ECmの最小値をECm1とする。さらに、モード評価値ECmと前記ECm1との差分が所定の閾値(例えば2)以下となるような分割モードを選択し、モード評価値が小さい順に、有効分割モードリストに追加し、順にDM2、DM3、・・・、DMnとする。
上記の手順で導出した、各予測モードPMに対する有効分割モードリストには、周波数変換後の変換係数へのエネルギーの散らばり度合が最も小さい分割モード(DM1)と、分割モードDM1の利用時に較べて、前記エネルギーの散らばり度合が十分に小さい分割モード(DM2、DM3、・・・、DMn)が含まれる。なお、上記の手順により導出された有効分割モードリストには、少なくとも1個の分割モードが含まれる。
SMB分割ルール102bは、各予測モードPMと、対応する有効分割モードリストの組として定義される。
(2)SMB分割ルールの可変長符号化方法
SMB分割ルール102bは、符号化データ多重化部123で多重化されて符号化データに組みこまれるが、その際に可変長符号化することが好ましい。具体的には、所定の予測モード順(例えばVert,Hor,DCの順)で有効分割モードリストを符号化する。その際、各有効分割モードリストとして、リストの要素数、および、リストの先頭から順に並べた各要素に対応する分割モードを示す所定の識別子を可変長符号化することが好ましい。
(3)SMB分割ルールに基づいたMB毎の分割モードの決定方法
図3において、分割モード決定部149を置き換えた分割モード決定部149bによる分割モードの決定手順は次の通りである。なお、分割モード決定部149bには、SMB分割ルール102bと予測モード110に加え、MB画像101も入力されている必要がある。分割モード決定部149bでは、まずSMB分割ルール102bから、予測モード110に対応する有効分割モードリストを抽出する。次に、抽出した有効分割モードリストに含まれる各分割モードに対して、モード評価値ECmを、予測/分割評価部162(図6)の動作説明に記載した方法で計算する。そして、モード評価値ECmが最小となる分割モードを処理対象MBで用いる分割モードに決定する。
(4)MB毎の分割ルールの可変長符号化方法
前述の分割モード決定部149bでは、有効分割モードリスト内の候補から、分割モードを選択するために、MB画像101を利用している。しかし、復号時にはMB画像101が利用できないため、MBで有効分割リストに含まれる何れの分割モードが選択されたかを符号化する必要が生じる。そのため、選択された分割モードが有効分割リストにおける何番目の要素であるかをMB毎に符号化する。なお、抽出された有効分割リストの要素数が1の場合には、何れの分割モードが選択されたかは自明であるため、選択された分割モードの情報を符号化しないことが好ましい。MB毎に選択された分割モードを示す情報113は、分割モード決定部149bからVLC部144に入力されて、VLC部144で可変長符号化される。
上記の手順によると、特定の予測モードに対して有効性の高い2個以上の分割モードを関連付け、それらの分割モードの中からMB画像の特性に合った分割モードを選択することができる。それにより、画像内で特定の予測モードを用いた場合の予測残差の特性がばらつく場合でも、変換係数のエネルギーを少数の変換係数に集中できる分割モードを選択することができる。
なお、上記画像符号化装置1に入力される入力画像100は、符号化対象の画像自体であっても構わないし、前記符号化対象の画像を複数の領域に分割して得られるスライスと呼ばれる分割画像であっても構わない。
スライスを入力画像100として処理を行った場合、SMB分割ルールはスライス単位で符号化されることになる。その場合、画像の局所的な特性に合わせて各予測モードに対して最適な分割モードを選択することができるため、符号量を削減することができる。
ここで、本発明では、1つの入力画像に対して、少なくとも1つ以上のSMB分割ルールを生成、符号化できるようにしている。このため、画像を部分画像(スライス)に分割して、部分画像毎に異なるSMB分割ルールを用いることも可能となる。
ここで、上記の画像符号化装置1において、分割モードを特定するために必要な符号量について補足しておく。例えば、3種類の予測モードに対しそれぞれ、5種類の分割モードのいずれを用いるかを表現する場合、SMB分割ルールを用いる場合、その符号量は、(予測モードの数)×(分割モードの選択に必要なビット数)≦3×3ビット=9ビットとなるため、9ビットあれば十分である。一方、MB毎にサイド情報を送る場合、MB(16×16)毎に3ビット送る必要があるため、QCIF(176×144)のような小さい画像でも297ビット、HD(1920×1080)のような大きい画像では、24,300ビットもの符号量が必要となる。
また、上記の画像符号化装置1に関する説明では、符号化に利用する分割モードを5種類(16×16分割、8×8分割、4×4分割、16×4分割、4×16分割)としたが、他の分割モードの組を利用しても構わない。例えば、上記5種類の分割モードに16×1分割と1×16分割を加えた7種類の分割モードを利用してもよい。16×1分割は、予測残差の画素間相関が、水平方向には高いが、垂直方向には極端に低い場合に有効である。また、1×16分割は、予測残差の画素間相関が、垂直方向には高いが、水平方向には極端に低い場合に有効である。そのため、16×1分割と1×16分割を加えた7種類の分割モードを利用することで、より予測残差の特性に合った分割モードが選択できる。
<予測画像生成の単位>
なお、上記の画像符号化装置1においては、予測部141における予測画像106の生成とDCT部142における周波数変換がともにSMB単位で実行されるものとして説明したが、予測画像をSMBとは異なるMB以下の大きさの単位で生成することもできる。例えば、予測画像をMB単位で生成し、MB画像(16×16画素)と予測画像(16×16画素)の差分として得られる予測残差(16×16画素)を、分割モードに基づいてSMB単位の予測残差に分割してDCT部142より周波数変換してもよい。予測画像の精度(予測画像と入力画像が近似している度合)は若干低下するが、予測画像生成処理が簡略されて処理が容易になるというメリットが得られる。
<デコーダの構成例>
次に、前述の画像符号化装置1で符号化された符号化データを復号して画像を再生する画像復号装置2について説明する。
図8は、本発明の一実施形態に係る画像復号装置2の構成例を示すブロック図である。画像復号装置2は、符号化データ分解部220、MB復号部221、及びMB結合部222より構成される。
符号化データ分解部220は、入力される符号化データ104から、SMB分割ルール102および複数のMB符号化データ103を抽出し、これらをMB復号部221に出力する。
MB復号部221は、符号化データ分解部220から入力されるSMB分割ルール102およびMB符号化データ103に基づいて、MB復号画像200を生成し、これを出力する。このMB復号部221の処理の詳細については後述するものとする。
MB結合部222は、MB復号部221から順次入力されるMB復号画像200を用いて復号画像201を構成し、これを出力する。
<デコーダの動作例>
続いて、画像復号装置2の動作例について図9に示すフロー図を参照しながら説明する。
図9において、外部から画像復号装置2に符号化データ104が入力され、符号化データ104は符号化データ分解部220に供給される(ステップS31)。
符号化データ分解部220は、ステップS31で入力された符号化データ104から、SMB分割ルール102を抽出してMB復号部221に出力する。続いて、入力画像に含まれる各MBに対応するMB符号化データ103を抽出して、MB復号部221に順次出力する。そして、識別子MB_id(MB_id=0,…,Nmb−1)によって識別される計Nmb個のMB符号化データ各々に対し、ステップS33の処理を実行する(ステップS32)。
MB復号部221は、ステップS32にて符号化データ分解部220から入力されたSMB分割ルール102及びMB符号化データ103に基づいて、MB復号画像200を生成し、これをMB結合部222に出力する(ステップS33)。
MB結合部222は、ステップS33で順次入力されたMB復号画像200に基づいて、復号画像201を構成して、これを外部に出力する(ステップS34)。
<MB復号部221の構成例>
次に、画像復号装置2が備えるMB復号部221の詳細構成について説明する。
図10は、MB復号部221の構成例を示すブロック図である。MB復号部221は、予測部141、逆量子化部145、IDCT部146、局所復号画像メモリ147、分割モード決定部149、SMB結合部241、VLD部244より構成される。なお、SMB結合部241、VLD(Variable Length Decoding)部244、変換係数レベル分割部245以外の構成要素は、前述の図3に示したMB符号化部122内の対応する各構成要素と同一の機能を有するため、同一の符号を付与して説明を省略する。
画像復号装置2は、主たる構成要素として、符号化データから変換係数レベルと予測モードを抽出して可変長復号するVLD部244と、VLD部244により抽出された変換係数レベルを逆量子化して変換係数を復元する逆量子化部145と、逆量子化部145により復元された変換係数を逆周波数変換して予測残差を復元するIDCT部146と、VLD部244により抽出された予測モードに基づいてサブマクロブロックに対応する予測画像を生成する予測部141と、サブマクロブロック単位で予測画像に予測残差を加算して得られる局所復号画像を、予測モードに応じて決定される分割モードに基づいて、複数個結合することでマクロブロック単位の復号画像を生成するSMB結合部241とを備える。
VLD部244は、入力されるMB符号化データ103から、予測モード110および変換係数レベルを抽出し、予測モード110を予測部141及び分割モード決定部149に出力し、変換係数レベルを変換係数レベル分割部245に出力する。
変換係数レベル分割部245は、分割モード決定部149から入力される分割モード111に基づいて、VLD部244から入力される変換係数レベルをSMB単位の変換係数レベル108に分割し、これを順次出力する。
SMB結合部241は、分割モード決定部149から入力される分割モード111に基づいて、局所復号画像メモリ147から予測部141を介して順次入力される局所復号画像109を結合して、MB復号画像200として出力する。
<MB復号部221の動作例>
続いて、MB復号部221の動作例について図11に示すフロー図を参照しながら説明する。なお、以下で説明する動作は、前述の画像復号装置2の動作におけるステップS33(図9)の処理を詳細に説明したものである。
まず、図8に示した符号化データ分解部220からMB復号部221にMB符号化データ103が入力され、VLD部244に供給される。VLD部244は、変換係数レベルおよび予測モード110をMB符号化データ103より復号し、予測モード110を予測部141および分割モード決定部149に出力する。また、変換係数レベルを変換係数レベル分割部245に出力する(ステップS41)。
分割モード決定部149は、ステップS41にてVLD部244から入力された予測モード110と、図8に示した符号化データ分解部220から入力されたSMB分割ルール102とに基づいて、分割モード111を決定し、この分割モード111を変換係数レベル分割部245およびSMB結合部241に出力する(ステップS42)。
変換係数レベル分割部245は、ステップS42にて分割モード決定部149から入力された分割モード111に基づいて、ステップS41にてVLD部244から入力された変換係数レベルをSMB単位の変換係数レベル108に分割して、逆量子化部145に順次出力する。そして、識別子SMB_id(SMB_id=0,…,Nsmb−1)によって識別される計Nsmb個のSMBに対応する変換係数レベル各々に対し、ステップS44〜S46の処理が実行される(ステップS43)。
ステップS43にて逆量子化部145に入力された変換係数レベル108に対して逆量子化が適用されて、変換係数レベル108が変換係数としてIDCT部146に出力される。続いて、IDCT部146は、逆量子化部145から入力された変換係数に対して逆離散コサイン変換を適用し、変換係数から生成した予測残差を出力する(ステップS44)。
予測部141は、ステップS41にてVLD部244から入力された予測モード110に基づいて、局所復号画像メモリ147に記録されている局所復号画像を利用して予測画像106を生成して、これを出力する(ステップS45)。
次に、ステップS44でIDCT部146から出力された予測残差を、ステップS45で予測部141から出力された予測画像106に加えた画像が、局所復号画像109として局所復号画像メモリ147に記録されるとともに、SMB結合部241に出力される(ステップS46)。
SMB結合部241は、ステップS42で分割モード決定部149から入力された分割モード111に基づいて、ステップS46にて順次入力される局所復号画像109を結合し、MB復号画像200として、図8に示したMB結合部222に出力する(ステップS47)。
以上の手順により、MB復号部221は、符号化データ分解部220から入力されるSMB分割ルール102に基づいて、符号化データ分解部220から順次入力されるMB符号化データ103を復号して、対応するMB復号画像を順次出力することができる。
上述のとおり、画像復号装置2によれば、画像符号化装置1で生成された符号化データから復号画像を生成することができる。
(実施形態2:MBクラスに応じたSMB分割ルールを利用する方法)
次に、本発明による画像符号化装置および画像復号装置の別の実施形態について図12〜図17を用いて説明する。本実施形態において説明する画像符号化装置は、MBクラスと呼ぶMB画像の特性を表す情報に基づいて、特定の予測モードに対応する分割モードを決定するという特徴を有する。
<エンコーダの構成・動作>
前述の図1において、画像符号化装置1を画像符号化装置3に置き換えたものとして説明し、画像符号化装置3の各構成要素については図1の括弧内に図示する。画像符号化装置3は、MB符号化部122をMB符号化部322に、SMB分割ルール生成部120をSMB分割ルール生成部320に、符号化データ多重化部123を符号化データ多重化部323にそれぞれ置き換えた構成を持つものとする。
SMB分割ルール生成部320は、入力画像100に基づいて、SMB分割ルール102aを生成し、このSMB分割ルール102aをMB符号化部322及び符号化データ多重化部323に出力する。SMB分割ルール102aには、任意のMBクラスに分類されるMBにおいて特定の予測モードが選択された場合に何れの分割モードを適用すべきかの情報が示されている。このSMB分割ルール生成部320の詳細およびSMBルール102aの生成方法の詳細は後述する。
MB符号化部322は、SMB分割ルール生成部320から入力されるSMB分割ルール102aに基づいて、MB分割部121から順次入力されるMB画像101を符号化し、各MB画像101の符号化結果をMB符号化データ103aとして符号化データ多重化部323に順次出力する。MB符号化データ103aは、MB画像が分類されるMBクラスを示す情報を含む点が、画像符号化装置1におけるMB符号化データ103と異なる。
符号化データ多重化部323は、SMB分割ルール生成部320から入力されるSMB分割ルール102aと、MB符号化部322から順次入力されるMB符号化データ103aとを多重化して、これを符号化データ104aとして出力する。
画像符号化装置3の概略動作については、前述の画像符号化装置1におけるステップS1〜S5(図2)で示した動作例と同様であるため、ここでの説明は省略する。
<MB符号化部322の構成例>
次に、画像符号化装置3が備えるMB符号化部322の詳細構成について説明する。
図12は、MB符号化部322の構成例を示すブロック図である。MB符号化部322は、SMB分割部140、予測部141、DCT部142、量子化部143、VLC部344、逆量子化部145、IDCT部146、局所復号画像メモリ147、予測モード判定部148、分割モード決定部349、MBクラス決定部350により構成される。上記構成要素の内、VLC部344、分割モード決定部349、MBクラス決定部350以外の各構成要素は、前述のMB符号化部122(図3)の各構成要素と同一の機能を有するため、同一の符号を付与してその説明を省略する。
<MBクラス決定部350の説明>
MBクラス決定部350は、MB分割部121から入力されるMB画像101の特性に基づいて、MB画像を所定のカテゴリに分類し、この分類結果をMBクラス301として分割モード決定部349及びVLC部344に出力する。なお、所定のカテゴリとしては、画像符号化装置3では(複雑、平坦)の2つのMBクラスが定義される。これら2つのMBクラスは、MB画像101の画像が平坦か否かを表し、分類は以下の手順で実行される。
まず、MB画像101の複雑度Amが次式により計算される。
Figure 2010067668
次に、複雑度Amと所定の閾値THaとが比較され、複雑度Amが閾値THaより大きければ、MB画像101は「複雑」なMBクラスであると判定される。逆に、複雑度Amが閾値THa以下ならば、MB画像101は「平坦」なMBクラスであると判定される。なお、例えば、画素値の範囲が0〜255の場合、閾値THaとしてTHa=5を用いることができる。
<分割モード決定部349の説明>
分割モード決定部349は、SMB分割ルール生成部320から入力されるSMB分割ルール102aで規定されているMBクラスと予測モードと分割モードの対応関係に基づいて、MBクラス決定部350から入力されるMBクラス301と予測モード判定部148から入力される予測モード110とに対応する分割モード111をSMB分割部140に出力する。
画像符号化装置3では、(複雑、平坦)の2種類のMBクラスの他に、前述の画像符号化装置1と同様に、3種類の予測モード(DC、Hor、Vert)、および図4に示した5種類の分割モード(16×16分割、8×8分割、4×4分割、16×4分割、4×16分割)が用いられる。
SMB分割ルール102aでは、MBクラス毎に、3種類の予測モードそれぞれに対し、上記5種類の分割モードのいずれかが関連付けられて記録されている。そのため、分割モード決定部349では、MBクラス決定部350から入力されるMBクラス301において、予測モード判定部148から入力される予測モード110と関連付けられている分割モード111をSMB分割ルール102aから読み出すことができる。
SMB分割ルール102aの一例として、「平坦」なMBクラスにおいて、(DC、Hor、Vert)の各予測モードに対して、(16×16分割、4×16分割、16×4分割)の各分割モードがそれぞれ関連付けられ、また、「複雑」なMBクラスにおいて、(DC、Hor、Vert)の各予測モードに対して、(8×8分割、4×4分割、4×4分割)の各分割モードがそれぞれ関連付けられている例が挙げられる。
<VLC部344の説明>
VLC部344は、量子化部143から入力された変換係数レベル108と、予測モード判定部148から入力された予測モード110と、MBクラス決定部350から入力されたMBクラス301とをそれぞれ可変長符号化および多重化し、これをMB符号化データ103aとして符号化データ多重化部323に出力する。
<MB符号化部322の動作例>
続いて、MB符号化部322の動作例について図13に示すフロー図を参照しながら説明する。
まず、予測モード判定部148は、外部から入力されたMB画像101に基づいて予測モード110を導出して、これを予測部141、分割モード決定部349、及びVLC部344に出力する(ステップS51)。
次に、MBクラス決定部350は、外部から入力されたMB画像101に基づいてMBクラス301を導出して、これを分割モード決定部349およびVLC部344に出力する(ステップS52)。
分割モード決定部349は、ステップS51にて予測モード判定部148から入力された予測モード110と、ステップS52にてMBクラス決定部350から入力されたMBクラス301と、外部より入力されたSMB分割ルール102aとに基づいて分割モード111を決定し、この分割モード111をSMB分割部140に出力する(ステップS53)。
SMB分割部140は、外部から入力されたMB画像101を、ステップS52にて分割モード決定部349から入力された分割モード111に基づいてNsmb個のSMB画像に分割する。そして、分割の結果得られる、識別子SMB_id(SMB_id=0,…,Nsmb−1)によって識別される計Nsmb個のSMB画像105を、予測部141およびDCT部142に順次出力する。そして、各SMB画像105に対してステップS55〜S58の各処理が順次実行される(ステップS54)。
予測部141は、ステップS51にて予測モード判定部148から入力された予測モード110に基づいて、局所復号画像メモリ147に記録されている局所復号画像を利用して予測画像106を生成して出力する(ステップS55)。
そして、ステップS54でSMB分割部140から出力されたSMB画像105と、ステップS55で出力された予測画像106の差分である予測残差107がDCT部142に入力される。そして、DCT部142において周波数変換により予測残差107が変換係数に変換された後、量子化部143において量子化され、変換係数レベル108としてVLC部344および逆量子化部145に出力される(ステップS56)。
そして、ステップS56で出力された変換係数レベル108は、逆量子化部145において逆量子化されて変換係数として復元された後、IDCT部146において逆周波数変換により予測残差107として復元されて出力される(ステップS57)。
次に、ステップS57で出力された予測残差107は、ステップS55で予測部141から出力された予測画像106に加算されて、局所復号画像109として局所復号画像メモリ147に記録される(ステップS58)。
VLC部344は、ステップS51にて予測モード判定部148から入力された予測モード110と、ステップS52にてMBクラス決定部350から入力されたMBクラス301と、ステップS56にて量子化部143から入力された各SMBの変換係数レベル108とをそれぞれ可変長符号化して、MB符号化データ103aとして外部に出力する(ステップS59)。
上記の手順により、MB符号化部322では、入力されたMB画像101を符号化して、MB符号化データ103aを生成することができる。その際、MB画像101の特性に合った予測モードが選択されるとともに、MB画像101の特性を表すMBクラスが導出される。そして、別途入力されるSMB分割ルール102aに基づいて、MBクラスの示す特性を持つMB画像に対して、選択された予測モードに適する分割モードが決定される。
MBクラスが異なる場合には、同じ予測モードを用いた場合でも、予測残差の性質が異なる。そのため、特定の予測モードに対して最適な分割モードは、MBクラスに応じて異なる。したがって、MBクラスに応じて、各予測モードに対して関連付ける分割モードを変えることで、より適した分割モードが選択できるようになる。それにより、予測残差のエネルギーをより少数の変換係数に集中させることができる。
<SMB分割ルール生成部320の構成例>
次に、画像符号化装置3が備えるSMB分割ルール生成部320の詳細構成について説明する。
図14は、SMB分割ルール生成部320の構成例を示すブロック図である。SMB分割ルール生成部320は、モード制御部160、入力画像メモリ161、予測/分割評価部362、評価情報記録メモリ363、及びSMB分割ルール決定部364より構成される。なお、MB分割部121は図1に示したものと同じであり、MBクラス決定部350は図12に示したものと同じである。予測/分割評価部362、評価情報記録メモリ363、及びSMB分割ルール決定部364以外の各構成要素については、前述のSMB分割ルール生成部120(図6)またはMB符号化部322(図12)内の対応する構成要素と同一の機能を有するため、同一の符号を付与してその説明を省略する。
<予測/分割評価部362の説明>
予測/分割評価部362は、MB分割部121から入力されるMB画像101と、モード制御部160から入力される予測モード110,分割モード111とに基づいて、予測モード110に対する分割モード111の適切さを示すモード評価値112を計算する。モード評価値の定義および導出手順は、前述(図6)の予測/分割評価部162と同じであるため、ここでの説明は省略する。モード評価値112は、予測モード110,分割モード111,および別途入力されるMBクラス301に関連付けられた上で出力される。
<評価情報記録メモリ363の説明>
評価情報記録メモリ363には、予測/分割評価部363から入力される、予測モード110,分割モード111,及びMBクラス301が関連付けられたモード評価値112を順次記録される。
<SMB分割ルール決定部364の説明>
SMB分割ルール決定部364は、評価情報記録メモリ363に記録されているモード評価値112を参照して、SMB分割ルール102aを作成して出力する。
SMB分割ルール102aには、MBクラス毎に、適用可能な全ての予測モードそれぞれに対して有効な分割モードが対応付けられている。このSMB分割ルール102aは、次の手順で作成される。
まず、SMB分割ルール決定部364は、評価情報記録メモリ363に記録されているモード評価値112に基づいて、特定のMBクラスにおける、予測モードPMに対する各分割モードの評価値を計算する。例えば、MBクラスMCにおける予測モードPMに対する分割モードDMの評価値として、評価情報記録メモリ363からMBクラスMC,予測モードPM,及び分割モードDMに関連付けられたモード評価値112を全て取得して、得られた複数のモード評価値の平均値を評価値とする。これにより、MBクラスと予測モードと分割モードの任意の組み合わせに対する組み合わせ評価値が得られる。
次に、MBクラス毎に予測モードPMに対して、上記組み合わせ評価値が最小となるような分割モードを選択して、予測モードPMに対して適する分割モードとする。これにより、MBクラス毎に、予測モードそれぞれに対して適する分割モードが選択される。
<SMB分割ルール生成部320の動作例>
続いて、SMB分割ルール生成部320の動作例について図15に示すフロー図を参照しながら説明する。
まず、SMB分割ルール生成部320は、外部から入力された入力画像100を入力画像メモリ161に記録する(ステップS61)。
MB分割部121は、外部から入力された入力画像100をMB画像101に分割する。そして、分割の結果得られた、識別子MB_id(MB_id=0,・・・,Nmb−1)によって識別される計Nmb個のMB画像を、SMB分割部140(図12),予測/分割評価部362,モード制御部160,及びMBクラス決定部350に順次出力する。そして、各MB画像に対して、ステップS63〜S65の処理が実行される(ステップS62)。
MBクラス決定部350は、ステップS62にてMB分割部121から入力されたMB画像101に基づいて、MBクラス301を導出して、予測/分割評価部362に出力する(ステップS63)。
モード制御部160は、予測モード110と分割モード111の対(モードペア)を生成して、予測/分割評価部362に順次出力する。続いて、各予測モード110と分割モード111の対に対して、ステップS65の処理が実行される(ステップS64)。
予測/分割評価部362は、ステップS62にてMB分割部121から入力されるMB画像、ステップS63にてMBクラス決定部350から入力されるMBクラス301、および、ステップS64にてモード制御部160から入力される予測モード110,分割モード111の対に対するモード評価値112を計算して、評価情報記録メモリ363に記録する(ステップS65)。
SMB分割ルール決定部364は、ステップS65にて評価情報記録メモリ363に記録された各モード評価値112に基づいて、1つのSMB分割ルール102aを生成して、外部に出力する(ステップS66)。
以上の手順により、SMB分割ルール生成部320では、外部から入力される入力画像100に基づいてSMB分割ルール102aが決定されて出力される。その際、MBクラスで表わされる特性を有するMB画像において、SMBの予測残差にDCTを適用する際に、予測残差のエネルギーが少数の変換係数に集中するような分割モードが各予測モードに対して関連付けられる。
<デコーダの構成・動作>
次に、前述の画像符号化装置3で符号化された符号化データ103aを復号して画像を再生する画像復号装置について説明する。
前述の図8において、画像復号装置2を画像復号装置4に置き換えたものとして説明し、画像復号装置4の各構成要素については図8の括弧内に図示する。画像復号装置4は、符号化データ分解部220を符号化データ分解部420に、MB復号部221をMB復号部421にそれぞれ置き換えた構成を持つものとする。
符号化データ分解部420は、入力される符号化データ104aから、SMB分割ルール102aおよび複数のMB符号化データ103aを抽出し、これらをMB復号部421に出力する。
MB復号部421は、符号化データ分解部420から入力されるSMB分割ルール102a及びMB符号化データ103aに基づいて、MB復号画像200を生成し、これをMB結合部222に出力する。このMB復号部421の処理の詳細については後述する。
なお、画像復号装置4の動作例については、前述の画像復号装置2におけるステップS31〜S34(図9)で示した動作例と同じであるため、ここでの説明は省略する。
<MB復号部421の構成例>
次に、画像復号装置4が備えるMB復号部421の詳細構成について説明する。
図16は、MB復号部421の構成例を示すブロック図である。MB復号部421は、予測部141、逆量子化部145、IDCT部146、局所復号画像メモリ147、分割モード決定部349、SMB結合部241、及びVLD部444より構成される。なお、VLD部444以外の構成要素は、図10のMB復号部221及び図12のMB符号化部322内の対応する各構成要素と同一の機能を有するため、同一の符号を付与して説明を省略する。
VLD部444は、入力されるMB符号化データ103aから、予測モード110,MBクラス301,及び変換係数レベルを抽出して出力する。
<MB復号部421の動作例>
続いて、MB復号部421の動作例について図17に示すフロー図を参照しながら説明する。
まず、外部からMB符号化データ103aが入力され、VLD部444に供給され、VLD部444は、変換係数レベル,予測モード110,及びMBクラス301をMB符号化データ103aより復号して、予測モード110を予測部141および分割モード決定部349に、MBクラス301を分割モード決定部349に、変換係数レベルを変換係数レベル分割部245にそれぞれ出力する(ステップS71)。
分割モード決定部349は、ステップS71にてVLD部444から入力された予測モード110及びMBクラス301と、外部から入力されたSMB分割ルール102aとに基づいて、分割モード111を決定して、変換係数レベル分割部245およびSMB結合部241に出力する(ステップS72)。
変換係数レベル分割部245は、ステップS72にて分割モード決定部349から入力された分割モード111に基づいて、ステップS71にてVLD部444から入力された変換係数レベルをSMB単位の変換係数レベル108に分割し、逆量子化部145に順次出力する。そして、識別子SMB_id(SMB_id=0,…,Nsmb−1)によって識別される計Nsmb個のSMBに対応する変換係数レベル各々に対して、ステップS74〜S76の処理が実行される(ステップS73)。
次に、ステップS73にて逆量子化部145に入力された変換係数レベル108に対して逆量子化が適用され、この変換係数レベル108が変換係数としてIDCT部146に出力される。続いて、IDCT部146は、入力された変換係数に対して逆離散コサイン変換を適用し、これにより生成された予測残差を出力する(ステップS74)。
予測部141は、ステップS71にてVLD部444から入力された予測モード110に基づいて、局所復号画像メモリ147に記録されている局所復号画像を利用して予測画像106を生成して、これを出力する(ステップS75)。
そして、ステップS74でIDCT部146から出力された予測残差を、ステップS75で予測部141から出力された予測画像106に加えた画像が、局所復号画像109として、局所復号画像メモリ147に記録されるとともに、SMB結合部241に出力される(ステップS76)。
SMB結合部241は、ステップS72で分割モード決定部349から入力された分割モード111に基づいて、ステップS76にて順次入力される局所復号画像109を結合して、MB復号画像200として外部に出力する(ステップS77)。
以上の手順により、MB復号部421では、入力されるSMB分割ルール102aに基づいて、順次入力されるMB符号化データ103aを復号して、対応するMB復号画像を順次出力することができる。
上述のとおり、画像復号装置4によれば、画像符号化装置3で生成された符号化データから復号画像を生成することができる。
1,3…画像符号化装置、2,4…画像復号装置、100…入力画像、101…MB画像、102,102a…SMB分割ルール、103,103a…MB符号化データ、104,104a…符号化データ、105…SMB画像、106…予測画像、107…予測残差、108…変換係数レベル、109…局所復号画像、110…予測モード、111…分割モード、112…モード評価値、113…分割モードを示す情報、120,320…SMB分割ルール生成部、121…MB分割部、122,322…MB符号化部、123,323…符号化データ多重化部、140…SMB分割部、141…予測部、142…DCT部、143…量子化部、144,344…VLC部、145…逆量子化部、146…IDCT部、147…局所復号画像メモリ、148…予測モード判定部、149,349…分割モード決定部、160…モード制御部、161…入力画像メモリ、162,362…予測/分割評価部、163,363…評価情報記録メモリ、164,364…SMB分割ルール決定部、200…MB復号画像、201…復号画像、220,420…符号化データ分解部、221,421…MB復号部、222…MB結合部、241…SMB結合部、244,444…VLD部、245…変換係数レベル分割部、301…MBクラス、350…MBクラス決定部。
上記課題を解決するために、第1の技術手段は、入力画像を複数のマクロブロックに分割し、マクロブロック単位で符号化処理を行う画像符号化装置であって、測画像の生成方法を示す予測モードを判定する予測モード判定部と、該予測モード判定部により判定された予測モードに応じて、サブマクロブロックへの分割方法を示す分割モードを決定する分割モード決定部とを備えることを特徴としたものである。
第2の技術手段は、第1の技術手段において、前記分割モードに基づいて、マクロブロックをサブマクロブロックに分割するSMB分割部と、前記予測モードに基づいて、マクロブロックの予測画像を生成する予測部とを備え、前記予測モード判定部は、マクロブック毎に予測モードを判定し、前記分割モード決定部は、マクロブック毎に分割モードを決定することを特徴としたものである。
の技術手段は、第の技術手段において、前記予測部は、マクロブロックの予測画像を、サブマクロブロック単位で生成することを特徴としたものである。
の技術手段は、第1〜第3のいずれか1の技術手段において、各予測モードに対して適切な分割モードを関連付けたSMB分割ルールを生成するSMB分割ルール生成部を備え、前記分割モード決定部は、前記予測モード判定部により判定された予測モードに応じた分割モードを、前記SMB分割ルールに従って決定することを特徴としたものである。
の技術手段は、第の技術手段において、前記SMB分割ルールを符号化することを特徴としたものである。
の技術手段は、第の技術手段において、前記SMB分割ルールをスライス単位で符号化することを特徴としたものである。
の技術手段は、第〜第のいずれか1の技術手段において、前記入力画像をマクロブロック単位で符号化するVLC部をさらに備え、前記SMB分割ルールは、各予測モードに対応する有効分割モードリストを含み、前記有効分割モードリストは、対応する予測モードに対して有効な分割モードを少なくとも1個以上要素として含み、前記分割モード決定部は、マクロブロックの予測画像の生成に用いられる予測モードに対応する前記有効分割モードリストを前記SMB分割ルールから抽出し、前記有効分割モードリストに要素として含まれる分割モードの中から当該マクロブロックにおける分割モードを選択し、前記VLC部は、前記分割モード決定部により選択された分割モードを示す情報を符号化することを特徴としたものである。
の技術手段は、第〜第のいずれか1の技術手段において、マクロブロックの複雑度を示すMBクラスを計算するMBクラス決定部を備え、前記分割モード決定部は、前記予測モード判定部により判定された予測モードに応じた分割モードを、前記SMB分割ルール及び前記MBクラスに従って決定することを特徴としたものである。
の技術手段は、第1〜第のいずれか1の技術手段において、前記分割モードは、横長矩形型のサブマクロブロックを含むよう分割することを指定する横長矩形分割モードと、縦長矩形型のサブマクロブロックを含むよう分割することを指定する縦長矩形分割モードとを含むことを特徴としたものである。
10の技術手段は、マクロブロック単位で符号化されている符号化データを復号して復号画像を生成する画像復号装置であって、前記符号化データから予測モードを抽出して可変長復号するVLD部と、前記予測モードに基づいて予測画像を生成する予測部と前記予測モードに応じて、サブマクロブックへの分割方法を示す分割モードを決定る分割モード決定部とを備えることを特徴としたものである。

Claims (9)

  1. 入力画像を複数のマクロブロックに分割し、マクロブロック単位で符号化処理を行う画像符号化装置であって、
    マクロブロック毎に予測画像の生成方法を示す予測モードを判定する予測モード判定部と、
    該予測モード判定部により判定された予測モードに応じて、マクロブロック毎にサブマクロブロックへの分割方法を示す分割モードを決定する分割モード決定部と、
    該分割モード決定部により決定された分割モードに基づいてマクロブロックをサブマクロブロックに分割するSMB分割部と、
    前記予測モード判定部により判定された予測モードに基づいて、マクロブロックの予測画像を生成する予測部とを備え、
    サブマクロブロック単位で前記入力画像と前記予測画像の差分を周波数変換することを特徴とする画像符号化装置。
  2. 前記予測部は、マクロブロックの予測画像を、サブマクロブロック単位で生成することを特徴とする請求項1に記載の画像符号化装置。
  3. 各予測モードに対して適切な分割モードを関連付けたSMB分割ルールを生成するSMB分割ルール生成部を備え、
    前記分割モード決定部は、前記予測モード判定部により判定された予測モードに応じた分割モードを、前記SMB分割ルールに従って決定することを特徴とする請求項1または2に記載の画像符号化装置。
  4. 前記SMB分割ルールを符号化することを特徴とする請求項3に記載の画像符号化装置。
  5. 前記SMB分割ルールをスライス単位で符号化することを特徴とする請求項4に記載の画像符号化装置。
  6. 前記入力画像をマクロブロック単位で符号化するVLC部をさらに備え、
    前記SMB分割ルールは、各予測モードに対応する有効分割モードリストを含み、
    前記有効分割モードリストは、対応する予測モードに対して有効な分割モードを少なくとも1個以上要素として含み、
    前記分割モード決定部は、マクロブロックの予測画像の生成に用いられる予測モードに対応する前記有効分割モードリストを前記SMB分割ルールから抽出し、前記有効分割モードリストに要素として含まれる分割モードの中から当該マクロブロックにおける分割モードを選択し、
    前記VLC部は、前記分割モード決定部により選択された分割モードを示す情報を符号化することを特徴とする請求項3〜5のいずれか1項に記載の画像符号化装置。
  7. マクロブロックの複雑度を示すMBクラスを計算するMBクラス決定部を備え、
    前記分割モード決定部は、前記予測モード判定部により判定された予測モードに応じた分割モードを、前記SMB分割ルール及び前記MBクラスに従って決定することを特徴とする請求項3〜6のいずれか1項に記載の画像符号化装置。
  8. 前記分割モードは、横長矩形型のサブマクロブロックを含むよう分割することを指定する横長矩形分割モードと、縦長矩形型のサブマクロブロックを含むよう分割することを指定する縦長矩形分割モードとを含むことを特徴とする請求項1〜7のいずれか1項に記載の画像符号化装置。
  9. マクロブロック単位で符号化されている符号化データを復号して復号画像を生成する画像復号装置であって、
    前記符号化データから変換係数レベルと予測モードを抽出して可変長復号するVLD部と、
    該VLD部により抽出された変換係数レベルを逆量子化して変換係数を復元する逆量子化部と、
    該逆量子化部により復元された変換係数を逆周波数変換して予測残差を復元するIDCT部と、
    前記VLD部により抽出された予測モードに基づいてサブマクロブロックに対応する予測画像を生成する予測部とを備え、
    サブマクロブロック単位で前記予測画像に前記予測残差を加算して得られる局所復号画像を、前記予測モードに応じて決定される分割モードに基づいて、複数個結合することでマクロブロック単位の復号画像を生成することを特徴とする画像復号装置。
JP2010542057A 2008-12-08 2009-10-28 画像符号化装置及び画像復号装置 Pending JPWO2010067668A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008312295 2008-12-08
JP2008312295 2008-12-08
PCT/JP2009/068458 WO2010067668A1 (ja) 2008-12-08 2009-10-28 画像符号化装置及び画像復号装置

Publications (1)

Publication Number Publication Date
JPWO2010067668A1 true JPWO2010067668A1 (ja) 2012-05-17

Family

ID=42242660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010542057A Pending JPWO2010067668A1 (ja) 2008-12-08 2009-10-28 画像符号化装置及び画像復号装置

Country Status (5)

Country Link
US (1) US20110235931A1 (ja)
EP (1) EP2373034A4 (ja)
JP (1) JPWO2010067668A1 (ja)
CN (1) CN102239694A (ja)
WO (1) WO2010067668A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160065959A1 (en) * 2014-08-26 2016-03-03 Lyrical Labs Video Compression Technology, LLC Learning-based partitioning for video encoding
CN102215404B (zh) * 2011-05-20 2013-07-10 昌信科技有限公司 嵌入式系统中视频的解码方法和系统
US9699457B2 (en) 2011-10-11 2017-07-04 Qualcomm Incorporated Most probable transform for intra prediction coding
CN109561307B (zh) * 2018-10-26 2021-08-06 上海九吾尊易信息科技有限公司 带宽压缩中跳块扫描多方向预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007201880A (ja) * 2006-01-27 2007-08-09 Victor Co Of Japan Ltd 画像符号化装置および画像復号装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100962759B1 (ko) * 2002-01-24 2010-06-09 가부시키가이샤 히타치세이사쿠쇼 동화상 신호의 부호화 방법 및 복호화 방법
US7469070B2 (en) * 2004-02-09 2008-12-23 Lsi Corporation Method for selection of contexts for arithmetic coding of reference picture and motion vector residual bitstream syntax elements
JP4383240B2 (ja) * 2004-04-30 2009-12-16 日本放送協会 画面内予測符号化装置、その方法及びそのプログラム
US8085846B2 (en) * 2004-08-24 2011-12-27 Thomson Licensing Method and apparatus for decoding hybrid intra-inter coded blocks
DE602005018796D1 (de) * 2004-09-16 2010-02-25 Thomson Licensing Verfahren und vorrichtung zur schnelllaufentscheidung für interframes
JP2008519484A (ja) * 2004-11-04 2008-06-05 トムソン ライセンシング ビデオ・エンコーダにおける高速イントラ・モード予測
JP2006324888A (ja) * 2005-05-18 2006-11-30 Fujitsu Ltd 動画像符号化装置
JP5089878B2 (ja) * 2005-10-28 2012-12-05 パナソニック株式会社 画像符号化装置
KR100750145B1 (ko) * 2005-12-12 2007-08-21 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
US7983343B2 (en) * 2006-01-12 2011-07-19 Lsi Corporation Context adaptive binary arithmetic decoding for high definition video
US8270490B2 (en) * 2006-07-06 2012-09-18 Canon Kabushiki Kaisha Motion vector detection apparatus, motion vector detection method, image encoding apparatus, image encoding method, and computer program
JP4906458B2 (ja) * 2006-09-29 2012-03-28 キヤノン株式会社 画像符号化装置、画像符号化方法
JP4921239B2 (ja) * 2007-05-09 2012-04-25 キヤノン株式会社 画像処理装置およびその方法
JP4650461B2 (ja) * 2007-07-13 2011-03-16 ソニー株式会社 符号化装置、符号化方法、プログラム、及び記録媒体
KR101496324B1 (ko) * 2007-10-17 2015-02-26 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JPWO2010087157A1 (ja) * 2009-01-29 2012-08-02 パナソニック株式会社 画像符号化方法及び画像復号方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007201880A (ja) * 2006-01-27 2007-08-09 Victor Co Of Japan Ltd 画像符号化装置および画像復号装置

Also Published As

Publication number Publication date
US20110235931A1 (en) 2011-09-29
EP2373034A4 (en) 2012-11-21
CN102239694A (zh) 2011-11-09
EP2373034A1 (en) 2011-10-05
WO2010067668A1 (ja) 2010-06-17

Similar Documents

Publication Publication Date Title
JP6347860B2 (ja) 画像復号装置、画像復号方法、画像符号化装置および画像符号化方法
JP5957561B2 (ja) 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置
JP7012809B2 (ja) 画像符号化装置、動画像復号装置、動画像符号化データ及び記録媒体
WO2011083599A1 (ja) 動画像符号化装置及び動画像復号化装置
US20150010067A1 (en) Adaptive intra-prediction encoding and decoding method
JP6212890B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
JP5908619B2 (ja) 動画像符号化装置及び動画像復号化装置
WO2010067668A1 (ja) 画像符号化装置及び画像復号装置
JP5526277B2 (ja) 動画像復号化装置、方法及びプログラム
JP5432359B2 (ja) 動画像符号化装置、方法及びプログラム
JP5432412B1 (ja) 動画像符号化装置及び動画像復号化装置
JP2018107692A (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
JP5323209B2 (ja) 動画像符号化装置及び動画像復号化装置
JP5525650B2 (ja) 動画像復号化装置、方法及びプログラム
JP5597782B2 (ja) 動画像符号化装置及び動画像復号化装置
JP5696248B2 (ja) 動画像符号化装置及び動画像復号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130625