JP6012816B2 - 動画像符号化装置および動画像復号装置 - Google Patents

動画像符号化装置および動画像復号装置 Download PDF

Info

Publication number
JP6012816B2
JP6012816B2 JP2015113547A JP2015113547A JP6012816B2 JP 6012816 B2 JP6012816 B2 JP 6012816B2 JP 2015113547 A JP2015113547 A JP 2015113547A JP 2015113547 A JP2015113547 A JP 2015113547A JP 6012816 B2 JP6012816 B2 JP 6012816B2
Authority
JP
Japan
Prior art keywords
conversion
partition
unit
frequency
transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015113547A
Other languages
English (en)
Other versions
JP2015173505A (ja
Inventor
山本 智幸
智幸 山本
知宏 猪飼
知宏 猪飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42936156&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6012816(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2015113547A priority Critical patent/JP6012816B2/ja
Publication of JP2015173505A publication Critical patent/JP2015173505A/ja
Application granted granted Critical
Publication of JP6012816B2 publication Critical patent/JP6012816B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像を符号化して符号化データを生成する動画像符号化装置と、伝送・蓄積された動画像の符号化データから動画像を再生する動画像復号装置に関する。
<導入と基本的な用語の定義>
ブロックベースの動画像符号化方式においては、符号化対象である入力動画像が、マクロブロック(以下、MB)と呼ばれる所定の処理単位に分割され、MB毎に符号化処理が行われて、符号化データが生成される。動画像の再生時には、復号対象である符号化データをMB単位で処理して復号することで、復号画像が生成される。
現在広く普及しているブロックベースの動画像符号化方式として、非特許文献1により規定される方式(H.264/AVC(Advanced Video Coding))がある。H.264/AVCでは、MB単位に分割された入力動画像を推定する予測画像が生成されて、入力動画像と予測画像の差分である予測残差が計算される。得られた予測残差には、離散コサイン変換(DCT)に代表される周波数変換が適用されて、変換係数が導出される。導出された変換係数は、CABAC(Context-based Adaptive Binary Arithmetic Coding)やCAVLC(Context-based Adaptive Variable Length Coding)と呼ばれる方法で可変長符号化される。なお、予測画像は、動画像の空間的な相関を利用するイントラ予測や、動画像の時間的な相関を利用するインター予測(動き補償予測)により生成される。
<パーティションの概念とその効果>
インター予測では、符号化対象MBの入力動画像を近似する画像が、パーティションと呼ばれる単位で生成される。各パーティションには、1個または2個の動きベクトルが対応付けられる。前記動きベクトルに基づいて、フレームメモリに記録されている局所復号画像上において符号化対象MBに対応する領域を参照することで、予測画像が生成される。なお、その際に参照される局所復号画像は参照画像と呼ばれる。H.264/AVCでは、画素単位で、16×16、16×8、8×16、8×8、8×4、4×8、4×4のパーティションサイズが利用できる。小さいパーティションサイズを利用すれば、細かい単位で動きベクトルを指定して予測画像を生成できるため、動きの空間的な相関が小さい場合であっても、入力動画像に近い予測画像を生成できる。一方、大きいパーティションサイズを利用すれば、動きの空間的な相関が大きい場合に、動きベクトルの符号化に要する符号量を低減できる。
<変換サイズの概念とその効果>
予測画像を用いて生成された予測残差では、入力動画像の画素値の空間的または時間的冗長性が削減されている。さらに、予測残差に対してDCTを適用することで、変換係数の低周波成分にエネルギーを集中させられる。従って、そのエネルギーの偏りを利用して可変長符号化を実行することで、予測画像やDCTを利用しない場合に較べて、符号化データの符号量を削減できる。
H.264/AVCでは、DCTによる低周波成分へのエネルギー集中性を増加させる目的で、複数種の変換サイズのDCTから動画像の局所的性質に適合したDCTを選択する方式(ブロック適応変換選択)が採用されている。例えば、予測画像がインター予測により生成される場合には、8×8DCTと4×4DCTの二種類のDCTから、予測残差の変換に適用するDCTを選択できる。8×8DCTは、広い範囲で画素値の空間相関を利用できるため、高周波成分が比較的少ない平坦な領域に対して有効である。一方、4×4DCTは、物体の輪郭を含むような高周波成分の多い領域で有効である。H.264/AVCにおいては、8×8DCTは大きい変換サイズのDCTであり、4×4DCTは小さい変換サイズのDCTといえる。
なお、H.264/AVCでは、パーティションの面積が8×8画素以上の場合に8×8DCTと4×4DCTを選択できる。また、パーティションの面積が8×8画素未満の場合に4×4DCTを選択できる。
上記説明の通り、H.264/AVCは、動画像の局所的性質である画素値の空間相関や動きベクトルの空間相関の高低に応じて好適なパーティションサイズや変換サイズを選択できるため、符号化データの符号量を削減できる。
<適応変換サイズ拡張とパーティションサイズ拡張の説明>
近年、HD(1920画素×1080画素)以上の解像度を有する高精細動画像が増加している。高精細動画像では従来の低解像度の動画像の場合に較べて、動画像内の局所領域において動画像上の画素値の空間相関や動きベクトルの空間相関の取り得る範囲が広い。とりわけ、画素値と動きベクトルの双方に関して、局所領域における空間相関が高い場合が多いという性質を高精細動画像は有している。
非特許文献2には、H.264/AVCのパーティションサイズや変換サイズを拡張することで、上記のような高精細動画像の空間相関の性質を利用して、符号化データの符号量を削減する動画像符号化方式が記載されている。
具体的には、パーティションサイズとして、H.264/AVCで規定されているものに加え、64×64、64×32、32×64、32×32、32×16、16×32のパーティションサイズが追加されている。さらに、DCTとして、H.264/AVCで規定されているものに加え、16×16DCT、16×8DCT、8×16DCTの3種の新しい変換サイズを有するDCTが追加されている。
パーティションの面積が16×16画素以上の場合には16×16DCT、8×8DCT、4×4DCTが選択できる。また、パーティションサイズが16×8の場合は16×8DCT、8×8DCT、4×4DCTが選択できる。パーティションサイズが8×16の場合は8×16DCT、8×8DCT、4×4DCTが選択できる。パーティションサイズが8×8の場合は8×8DCT、4×4DCTが選択できる。パーティションの面積が8×8画素未満の場合には4×4DCTが選択できる。
非特許文献2記載の方式では、上記のような多様なパーティションサイズや変換サイズを切り替えることで、画素や動きベクトルの空間相関のダイナミックレンジが比較的広い高精細動画像に対しても動画像の局所的性質に適合したパーティションサイズや変換サイズを選択できるため、符号化データの符号量を削減できる。
ITU−T Recommendation H.264(11/07) ITU−T T09−SG16−C−0123
上記説明の通り、動画像符号化方式において、選択可能なパーティションサイズや変換サイズの種類を増加させることは、符号化データの符号量削減に有効である。しかしながら、動画像上の各局所領域において、復号時に適用するパーティションサイズや変換サイズを選択するために必要な付加情報の符号量が増加するという新たな問題が生じる。
非特許文献1および非特許文献2では、パーティションサイズが大きい場合においても小さい変換サイズの周波数変換(4×4DCT)を利用できる。しかしながら、大きいパーティションは画素値や動きベクトルの空間相関の高い領域で選択されやすいため、そのようなパーティションに対して小さい変換サイズの周波数変換を適用する場合に、大きい変換サイズの周波数変換を適用する場合に較べて予測残差のエネルギーをより少数の変換係数に集中することが難しい。そのため、小さい変換サイズの周波数変換が選択されることは殆ど無く、変換サイズの選択に必要な付加情報が無駄になっている。特に、最大パーティションサイズが拡大されることで、大きいパーティションサイズと小さい変換サイズの大きさの差が拡大した場合には、小さい変換サイズはより選択され難くなる。
また、非特許文献2では、長方形のパーティションに対して同じ大きさの変換サイズの周波数変換を選択できたが、変換サイズの種類をさらに追加した場合に、選択可能な変換サイズをどのような基準で決定するかについては言及されていない。
本発明は、このような状況に鑑みてなされたもので、多様なパーティションサイズや変換サイズが動画像符号化装置において利用可能である場合に、動画像の局所的特性に適合したパーティションサイズや変換サイズを選択できる可能性を維持しつつ、付加情報の符号量を低減することを可能とする動画像符号化装置を提供するものである。また、前記動画像符号化装置で符号化された符号化データを復号可能な動画像復号装置を提供するものである。
上述のごとき課題を解決するために、本発明の第1の技術手段は、入力動画像を所定の大きさのブロックに分割して、ブロック単位に符号化処理を行う動画像符号化装置において、ブロックのパーティション構造を決定する予測パラメータ決定部と、パーティション構造で規定されるパーティションを単位として予測画像を生成する予測画像生成部と、予測画像と入力動画像の差分である予測残差に対して所定の変換プリセットに含まれる変換のいずれかを適用する変換係数生成部と、パーティション形状情報に基づいて適用可能な変換のリストである変換候補リストを生成する変換候補導出部と、変換候補リストに基づいてパーティション毎に適用する変換を示す変換選択フラグを決定する周波数変換決定部と、変換候補リストと変換プリセットに基づいて変換選択フラグを可変長符号化する可変長符号化部を備えることを特徴としたものである。
第2の技術手段は、第1の技術手段において、パーティション形状情報に基づいてパーティション毎に適用不可能な変換のリストである禁止変換リストを生成する変換制約導出部を備え、変換候補リストは、禁止変換リストと変換プリセットに基づいて導出されることを特徴としたものである。
第3の技術手段は、第1または2の技術手段において、パーティション形状情報とは、パーティションの縦の長さと横の長さの比、または、パーティションの縦の長さと横の長さの大小関係であることを特徴としたものである。
第4の技術手段は、第1または2の技術手段において、パーティション形状情報とは、パーティションの縦の長さと横の長さの最小値であることを特徴としたものである。
第5の技術手段は、第1または2の技術手段において、パーティション構造は、階層構造によって表現されて各パーティションはその形状に応じていずれかの階層に含まれることが規定され、パーティション形状情報とは、パーティションが属する階層であることを特徴としたものである。
第6の技術手段は、第1の技術手段において、所定の変換プリセットは、変換サイズが縦1画素の横長矩形である変換を少なくとも一個以上含み、変換候補リスト生成部は、パーティションの横の長さが縦の長さよりも長い場合に縦1画素の横長矩形の変換サイズの変換を変換候補リストに含めることを特徴としたものである。
第7の技術手段は、第2の技術手段において、所定の変換プリセットは、変換サイズが正方形の変換を少なくとも一個、変換サイズが横長矩形または縦長矩形である変換を少なくとも一個含み、変換制約導出部は、パーティションの縦の長さと横の長さが一致しない場合に、正方形の変換を少なくとも一個、禁止変換リストへ含めることを特徴としたものである。
第8の技術手段は、第2の技術手段において、所定の変換プリセットは、変換サイズが横長矩形の変換および変換サイズが縦長矩形の変換を少なくとも各一個以上含み、変換制約導出部は、パーティションの横の長さが縦の長さよりも長い場合に、縦長矩形の変換サイズの変換を禁止変換リストへ含めることを特徴としたものである。
第9の技術手段は、第2の技術手段において、所定の変換プリセットは、互いに類似関係にある変換サイズの変換を少なくとも二個以上含み、変換制約導出部は、パーティションの縦の長さと横の長さの最小値が所定の閾値以上の場合に、類似関係にある変換サイズを有する変換の中で最小の変換サイズの変換を禁止変換リストへ含めることを特徴としたものである。
第10の技術手段は、第1の技術手段において、所定の変換プリセットは、第一の変換と、第一の変換と相似関係にありかつ第一の変換よりも変換サイズが小さい第二の変換を含み、パーティション構造は、階層構造によって表現されて各パーティションはその形状に応じていずれかの階層に含まれることが規定され、変換制約導出部は、パーティションが最下位ではない所定の階層に属する場合には第一の変換を変換候補リストに含めるとともに第二の変換は変換候補リストに含めず、パーティションが最下位ではない所定の階層よりも下位の階層に属する場合には第二の変換を変換候補リストに含めることを特徴としたものである。
第11の技術手段は、入力符号化データをブロック単位に復号処理を行う動画像復号装置において、入力符号化データから、処理対象のブロックのパーティション構造を復号する可変長符号復号部と、パーティション構造で規定されるパーティションを単位として予測画像を生成する予測画像生成部と、パーティション形状情報に基づいて適用可能な変換の変換制約および/または変換候補を導出する変換制御導出部とを有し、可変長復号部は、入力符号化データと変換制約および/または変更に基づいて変換選択フラグを復号するとともに、変換選択フラグに基づいて処理対象のブロックの変換係数を復号し、さらに変換選択フラグにより規定される変換に対応する逆変換を変換係数に適用して予測残差を再構築する予測残差再構築部と、予測画像と予測残差とに基づいて処理対象のブロックに対応する復号画像データを出力する局所復号画像生成部と、を備えることを特徴としたものである。
第12の技術手段は、第の技術手段において、入力符号化データを処理してブロック単位で画像を復号する動画像復号装置において、処理対象のブロックのパーティション構造を決定する予測パラメータ、および、パーティションおよびパーティションの集合に対して適用可能な変換を規定または更新するためのルールを復号する可変長符号復号部と、パーティション構造で規定されるパーティションを単位として予測画像を生成する予測画像生成部と、可変長復号部は、入力符号化データとルールに基づいて変換選択フラグを復号するとともに、変換選択フラグに基づいて処理対象のブロックの変換係数を復号し、さらに変換選択フラグにより規定される変換に対応する逆変換を変換係数に適用して予測残差を再構築する予測残差再構築部と、予測画像と予測残差とに基づいて処理対象のブロックに対応する復号画像データを出力する局所復号画像生成部と、を備えることを特徴としたものである。
第13の技術手段は、第12の技術手段において、ルールは、特定の形状のパーティションに対して、特定の種類の変換を変換候補リストに含めることを規定するルールを含むことを特徴としたものである。
第14の技術手段は、第12の技術手段において、ルールは、特定の形状のパーティションに対して、特定の種類の変換を変換候補リストに含めることを禁止することを規定するルールを含むことを特徴としたものである。
第15の技術手段は、第12の技術手段において、ルールは、特定の形状のパーティションに対して、特定の種類の変換が変換候補リストに含まれている場合に、当該変換を別の変換に置換することを規定するルールを含むことを特徴としたものである。
第16の技術手段は、第12の技術手段において、ルールは、特定の形状のパーティションに対して特定の種類の変換を許可または禁止または置換する基礎ルールの組み合わせとして表現される複合ルールを含むことを特徴としたものである。
第17の技術手段は、第16の技術手段において、ルールは、特定の階層よりも上位の階層に属するパーティションに対して、類似関係にある変換の中で小さいサイズの変換を変換候補リストに含めることを禁止することを規定するルールを複合ルールとして含むことを特徴としたものである。
第18の技術手段は、第16または17の技術手段において、可変長符号化部は、ルールとして、複合ルールを適用するか否かのフラグを符号化することを特徴とする特徴としたものである。
第19の技術手段は、入力動画像を所定の大きさのブロックに分割して、ブロック単位に符号化処理を行う動画像符号化装置において、ブロックのパーティション構造を決定する予測パラメータ決定部と、パーティション構造で規定されるパーティションを単位として予測画像を生成する予測画像生成部と、予測画像と入力動画像の差分である予測残差に対して所定の変換プリセットに含まれる周波数変換のいずれかを適用する変換係数生成部と、パーティション形状情報に基づいてパーティション毎に適用可能な変換の変換制約および/または変換候補を導出する変換制御導出部と、変換制約および/または変換候補に基づいて適用する変換を示す変換選択フラグを決定する周波数変換決定部と、変換制御導出部における変換制約および/または変換候補の導出方法を規定または更新するルールを決定する変換候補導出ルール決定部と、変換制約および/または変換候補リストと変換プリセットに基づいて変換選択フラグを可変長符号化し、加えて変換候補導出ルールをブロックより大きい所定の単位毎に可変長符号化する可変長符号化部を備えることを特徴としたものである。
本発明の動画像符号化装置では、特定のパーティションサイズが選択される場合に、選択可能な変換サイズを有効性の高いものに制限することで、動画像の局所的特性に適合した変換サイズを選択できる可能性を高く維持しつつ、付加情報の符号量を低減でき、さらに、符号化処理の処理量を削減できる。また、本発明の動画像復号装置では、前記動画像符号化装置で符号化された符号化データを復号できる。
拡張マクロブロック(MB)と処理順序の定義を説明するための図である。 本発明の動画像符号化装置の一実施例を示すブロック図である。 パーティション階層構造と処理順序の定義を説明するための図である。 禁止変換リストの生成処理の一例を説明するためのフローチャートである。 禁止変換リストの生成処理の他の例を説明するためのフローチャートである。 禁止変換リストの生成時のパーティション分割について説明するための図である。 禁止変換リストの生成時のパーティション分割について説明するための他の図である。 禁止変換リストの生成処理の更に他の例を説明するためのフローチャートである。 禁止変換リストの生成手順の具体例を説明するための図である。 変換選択フラグの符号化データ生成処理例を説明するためのフローチャートである。 本発明の動画像復号装置の一実施例を示すブロック図である。 本発明の動画像符号化装置の他の実施例を示すブロック図である。 変換候補リストの生成処理の一例を説明するためのフローチャートである。 本発明の動画像復号装置の他の実施例を示すブロック図である。 本発明の動画像符号化装置の更に他の実施例を示すブロック図である。 本発明の動画像復号装置の更に他の実施例を示すブロック図である。
(実施形態1)
以下、本発明による動画像符号化装置および動画像復号装置の一実施形態である動画像符号化装置10および動画像復号装置20について図1〜図11を参照しながら説明する。なお、図面の説明においては、同一要素には同一符号を付与して説明を省略する。
以下の説明において、動画像符号化装置には64×64画素から構成される拡張MB単位で入力動画像が順次入力されて処理が実行されるものとする。また、拡張MBの入力順序は、図1に示すようなラスタスキャン順を仮定する。ただし、本発明は拡張MBのサイズが上記以外の場合にも適用可能である。特に、現在広く利用されている処理単位である16×16画素よりも大きなサイズの拡張MBに対して有効である。
以下の説明における動画像符号化装置および動画像復号装置における処理は、H.264/AVCを元に実現されるものとし、動作について特に触れていない部分については、H.264/AVCの動作に準じるものとする。ただし、本発明はH.264/AVCに限定されるものではなく、類似のVC−1、MPEG−2、AVS等の方式や、ブロック単位の処理や周波数変換を採用する他の動画像符号化方式に対しても適用可能である。
<動画像符号化装置10の構成>
図2は動画像符号化装置10の構成を示すブロック図である。動画像符号化装置10は、フレームメモリ101、予測パラメータ決定部102、予測画像生成部103、変換制約導出部104、周波数変換決定部105、予測残差生成部106、変換係数生成部107、可変長符号化部108、予測残差再構築部109、局所復号画像生成部110より構成される。
<フレームメモリ101>
フレームメモリ101には、局所復号画像を記録する。ここで、局所復号画像とは、変換係数に対して逆周波数変換を適用することで再構築された予測残差に対し、予測画像を足し合わせることで生成される画像である。入力動画像の特定フレームの特定拡張MBを処理する時点では、処理対象フレームより先に符号化されたフレームに対する局所復号画像、および、処理対象拡張MBより先に符号化された拡張MBに対応する局所復号画像がフレームメモリ101に記録されている。なお、フレームメモリ101に記録された局所復号画像は、装置内の各構成要素によって適宜読み出すことが可能とする。
<予測パラメータ決定部102(パーティション構造定義、モード判定説明)>
予測パラメータ決定部102は、入力動画像の局所的性質に基づいて、予測パラメータを決定して出力する。ここで、予測パラメータには、少なくとも、拡張MB内各部で適用するパーティションの構造を表すパーティション構造と、インター予測のための動き情報(動きベクトルおよび参照する局所復号画像のインデックス(参照画像インデックス))が含まれる。また、イントラ予測の際の予測画像生成方法を示すイントラ予測モードを含んでもよい。
パーティション構造の詳細について、図3を参照しながら説明する。パーティション構造は階層構造により表現され、64×64画素を処理単位とする階層を階層L0、32×32画素を処理単位とする階層を階層L1、16×16画素を処理単位とする階層を階層L2、8×8画素を処理単位とする階層を階層L3と定義する。各階層では、分割方法として、分割を行わない一分割、水平方向の直線により領域を等分する水平二分割、垂直方向の直線により領域を等分する垂直二分割、水平方向と垂直方向の2本の直線により領域を四等分する四分割のいずれかを選択できる。なお、処理単位が大きい階層を上位階層、処理単位が小さい階層を下位階層と呼ぶ。本実施形態においては、階層L0が最上位階層であり、階層L3が最下位階層である。パーティション構造は最上位階層である階層L0から順に各階層における分割方法を特定することで表現される。具体的には、次の手順によってパーティション構造を一意に表現できる。
(手順S10)階層L0における分割方法が一分割、水平二分割、垂直二分割のいずれかであれば、その分割方法で表現される領域を、階層L0における処理単位のパーティションとする。分割方法が四分割の場合には、各分割領域に対し手順S11によりパーティションを決定する。
(手順S11)階層L1における分割方法が一分割、水平二分割、垂直二分割のいずれかであれば、その分割方法で表現される領域を、階層L1における処理単位のパーティションとする。分割方法が四分割の場合には、各分割領域に対し手順S12によりパーティションを決定する。
(手順S12)階層L2における分割方法が一分割、水平二分割、垂直二分割のいずれかであれば、その分割方法で表現される領域を、階層L2における処理単位のパーティションとする。分割方法が四分割の場合には、各分割領域に対し手順S13によりパーティションを決定する。
(手順S13)階層L3における分割方法で表現される領域を、階層L3における処理単位のパーティションとする。
ここで、拡張MB内の各パーティションの処理順序について説明しておく。図3に示したように各階層において、分割方法に関わらずラスタスキャン順で処理が実行される。ただし、最下位の階層(階層L3)以外で、分割方法として四分割が選択されている場合には、各四分割領域に対して下位階層で表現されるパーティションがラスタスキャン順に処理される。以降説明する各部において、拡張MB内のパーティションを処理する場合には、上記の処理順序が適用されるものとする。
パーティションpが属する階層Lxは次の手順により導出する。
(手順S20)パーティションpのサイズが、特定の階層Lyの一分割または水平二分割または垂直二分割により生成されるパーティションのサイズと等しい場合、Lxの値をLyに設定する。
(手順S21)上記以外の場合、Lxの値をL3に設定する(Lxを最下位階層に設定する)。
<パーティション形状の説明>
パーティション構造に属する各パーティションを特徴付ける情報、すなわち、パーティションサイズ、もしくは、パーティションサイズの特徴を示す情報、もしくは、パーティション構造における階層を、パーティション形状情報と呼ぶ。例えば、32×32などのパーティションサイズそのもの、所定のパーティションサイズよりも大きいかどうかを示す情報、パーティションの縦の長さと横の長さの比、パーティションの縦の長さと横の長さの大小関係、パーティションの縦の長さと横の長さの最小値や最大値、パーティションが属する階層などは、全てパーティション形状情報である。
予測パラメータは、レート歪判定により決定される。レート歪判定では、各予測パラメータ候補に対し、該予測パラメータを用いて処理対象拡張MBを符号化した際の符号化データの符号量と、局所復号画像と入力動画像の歪からレート歪コストと呼ばれるコストを計算して、当該コストを最小とする予測パラメータを選択する。すなわち、予測パラメータであるパーティション構造や動き情報の可能なあらゆる組み合わせに対してレート歪コストを計算して、最良の組み合わせを予測パラメータとする。レート歪コストCは、拡張MBの符号化データの符号量をR、拡張MBに対応する入力動画像と局所復号画像の平均二乗誤差をD、符号量Rと誤差Dの関係を表すパラメータλを用いて、C=D+λRの式により計算できる。
レート歪判定により、処理対象拡張MBを符号化するのに好適な予測パラメータ、すなわち、好適なパーティション構造と、各パーティションに対応する動き情報が決定されて、出力される。
なお、特定の予測パラメータに対してレート歪コストを計算する際に処理対象拡張MBに対して適用する周波数変換が一意に定まっていない可能性がある。その場合には、特定の周波数変換を適用して得られるレート歪コストとして利用することもできるし、複数の周波数変換全てを適用した場合に得られる最小のレート歪コストを利用することもできる。
<予測画像生成部103>
予測画像生成部103は、入力される予測パラメータに基づいて処理対象拡張MBの予測画像を生成して出力する。予測画像生成は次の手順で実行される。
(手順S30)予測パラメータに含まれるパーティション構造に基づいて、拡張MBをパーティションに分割して、各パーティションにおける予測画像を手順S31により生成する。
(手順S31)処理対象のパーティションに対応する動き情報、すなわち、動きベクトルと参照画像インデックスを予測パラメータより読み出す。参照画像インデックスの示す局所復号画像上で、動きベクトルが示す領域の画素値に基づいて動き補償予測によって予測画像を生成する。
<予測残差生成部106>
予測残差生成部106は、入力される入力動画像と予測画像に基づいて、拡張MBの予測残差を生成して出力する。予測残差は拡張MBと同サイズの2次元データであり、各要素は、入力動画像と予測画像の対応する画素間の差分値となる。
<変換係数生成部107>
変換係数生成部107は、入力される予測残差と変換選択フラグに基づいて、予測残差を周波数変換することで変換係数を生成して出力する。変換選択フラグは拡張MBの各パーティションに対して適用する周波数変換を示し、変換係数生成部107は拡張MB内の各パーティションに変換選択フラグの示す周波数変換を選択して、選択した周波数変換を予測残差に適用する。変換選択フラグによって示される周波数変換は、変換係数生成部107で適用され得る全ての周波数変換の集合(変換プリセット)の含む周波数変換のいずれかである。
本実施形態における変換プリセットには、4×4DCT、8×8DCT、16×16DCT、16×8DCT、8×16DCT、16×1DCT、1×16DCT、8×1DCT、および1×8DCTの9種類の周波数変換が含まれる。ここで規定した各周波数変換は、それぞれ特定の変換サイズのDCT(離散コサイン変換)に対応する(例えば、4×4DCTは4×4画素を変換サイズとする離散コサイン変換に対応する。)なお、本発明は上記周波数変換の組に対してのみ制限されるものではなく、上記変換プリセットのサブセットに対しても適応できる。また、別の変換サイズの離散コサイン変換、例えば32×32DCTや64×64DCTを含む周波数変換を変換プリセットに含めても良いし、離散コサイン変換以外の周波数変換、例えばアダマール変換やサイン変換やウェーブレット変換、またはそれらの変換を近似する変換を含む周波数変換を変換プリセットに含めても構わない。
M×N画素のパーティションに対して、W×Hの変換サイズを有する周波数変換を適用する処理は、次の疑似コードで示す処理である。なお、領域R(x,y,w,h)は、パーティション内左上を起点として右方向にx画素、下方向にy画素変位した位置に存在する幅w画素、高さh画素の領域を意味する。
for(j=0,j<N,j+=H){
for(i=0,i<M,i+=W){
領域R(i,j,W,H)に周波数変換を適用

<変換制約導出部104>
変換制約導出部104は、入力される予測パラメータに基づいて、拡張MB内の各パーティションにおいて選択可能な周波数変換に関する制約を変換制約として導出して出力する。すなわち、予測パラメータにより決定される各パーティションのパーティション形状情報に基づいて、そのパーティションの変換制約を導出する。
変換制約は、拡張MB内の各パーティションにそれぞれ対応付けられた禁止変換リストの集合として定義する。ここで、禁止変換リストには、変換プリセットに含まれる周波数変換のうち、対応付けられたパーティションにおいて選択することができない周波数変換(禁止周波数変換)が要素に含まれる。言い換えると、変換プリセットの要素から、禁止変換リストの要素を取り除いたものが、対応付けられたパーティションで選択可能な周波数変換の集合(変換候補リスト)となる。
なお、禁止変換リスト、変換候補リストは各変換を集合に含めるか否かの情報を含む変換集合情報によって表現できる。変換プリセットに含まれる変換の数をNt個のとすると、変換の組み合わせは2のNt乗であるため、0〜(2のNt乗―1)の値域を持つ変換集合情報で集合に含まれる変換を表現きる。なお、変換集合情報により必ずしも全ての変換の組合せを表現できる必要はなく、特定の組み合わせに対応する値を表現してもよい。端的な例として、変換プリセットが4x4DCT及び8x8DCTのみを含む場合に、4x4DCT(または8x8DCT)を禁止するか否かを示す1bitのフラグにより禁止リストを表現できる。また4x4DCTを0、4x4DCTと8x8DCTの組を1、8x8DCTを2という値に各々対応付けて、0〜2の値により変換候補リストを表現することもできる。
また、変換集合情報の意味は、階層、パーティション、ブロックの組などの単位で変更しても構わない。すなわち、同じ変換集合情報の値0が、階層L0では16x16DCT、階層L1では8x8DCT、階層L2では4x4DCTを意味しても良い。変換集合情報の値の意味を変更することにより、少ない値の範囲で禁止変換リスト及び変換候補リストの表現が可能になる。
従って、本発明における、変換制約、変換候補リストは、リストという言葉に捉われることなく、変換制約、変換候補を示す変換集合情報と同値と考えることとする。
特定のパーティションpに対する禁止変換リストLpは次の手順で生成される。なお、パーティションpの大きさをM×N画素(横M画素、縦N画素)とする。また、パーティションpは階層Lxに属するとする。
(手順S40)Lpを空に設定する。
(手順S41)M×N画素より大きい変換サイズの周波数変換をLpに追加する。
(手順S42)Min(M,N)の値に応じて決定した周波数変換をLpに追加する。
(手順S43)M÷Nの値に応じて決定した周波数変換をLpに追加する。
(手順S44)階層Lxの値に応じて決定した周波数変換をLpに追加する。
なお、M×N画素より大きいかどうかを示す情報、Min(M,N)の値、M÷Nの値、階層Lxの値はパーティション形状情報である。
<Min(M,N)による変換サイズの制限>
上記手順S42のさらに詳細な手順を図4のフロー図を参照して説明する。
(手順S50)Min(M,N)が所定の閾値Th1(例えばTh1=16画素)以上であれば手順S51へ進み、それ以外であれば手順S52へ進む。
(手順S51)周波数変換リスト内で類似関係の変換サイズを有する周波数変換が2個以上存在する場合、それぞれの類似関係の変換サイズを有する周波数変換の組の中で変換サイズが最小である周波数変換(4×4DCT、8×1DCT、1×8DCT)をLpに追加して手順S52へ進む。ここでの類似関係には相似関係が含まれる。例えば、本実施形態の変換プリセットにおける16×16と8×8と4×4の変換サイズが類似関係となる。また、類似関係には近似的な相似関係も含まれる。たとえば、本実施形態の変換プリセットにおける16×1と8×1の変換サイズや、1×16と1×8の変換サイズが類似関係となる。なお、以下の説明においては適用しないが、周波数変換をそのサイズに基づいて正方形、縦長矩形、横長矩形の3カテゴリに分類し、各カテゴリに属する周波数変換を類似関係と見なすこともできる。
(手順S52)Min(M,N)が所定の閾値Th2(例えばTh2=32画素)以上であれば手順S53へ進み、それ以外であれば処理を終了する。
(手順S53)変換プリセット内で類似関係の変換サイズを有する周波数変換が3個以上存在する場合、それぞれの類似関係の変換サイズを有する周波数変換の組の中で2番目に小さい変換サイズの周波数変換(8×8DCT)をLpに追加して処理を終了する。ただし、Th2>Th1とする。
パーティションは動き補償の単位であり、動きベクトルを用いてパーティション単位で生成される予測画像を入力画像に近づけるために、パーティション内の画像のフレーム間の動きが一様となるようパーティション構成が決定される。すなわち、入力動画像上の大きい物体(またはその一部)には大きいパーティションが、小さい物体には小さいパーティションが割り当てられる。一般に、入力動画像上において、大きい物体に対応する領域の画素値の空間相関は、小さい物体に対応する領域の画素値の空間相関に比べて高い。そのため、大きいパーティションに対しては大きい変換サイズの周波数変換が小さい変換サイズの周波数変換に比べて有効である。したがって、大きいパーティションに対して、ある程度小さい変換サイズの周波数変換を禁止変換とした場合でも、符号化データの符号量はほとんど増加しない。
<M÷Nの値による変換サイズの制限>
次に、上記手順S43のさらに詳細な手順を図5のフロー図を参照して説明する。
(手順S60)M÷Nの値が2以上(パーティションpの横の長さが縦の長さの2倍以上)ならば手順S61へ進み、それ以外であれば手順S63へ進む。
(手順S61)全ての正方形の変換サイズを持つ周波数変換(4×4DCT、8×8DCT、16×16DCT)をLpに追加して手順S62へ進む。
(手順S62)変換サイズの縦の長さが横の長さより長い周波数変換(8×16DCT、1×16DCT)をLpに追加して処理を終了する。
(手順S63)M÷Nの値が0.5以下(パーティションpの縦の長さが横の長さの2倍以上)ならば手順S64へ進み、それ以外であれば手順S66へ進む。
(手順S64)全ての正方形の変換サイズを持つ周波数変換(4×4DCT、8×8DCT、16×16DCT)をLpに追加して手順S65へ進む。
(手順S65)変換サイズの横の長さが縦の長さより長い周波数変換(16×8DCT、16×1DCT)をLpに追加して処理を終了する。
(手順S66)M÷Nの値が1に等しい(パーティションpの横と縦の長さが等しい)ならば手順S67へ進み、それ以外であれば処理を終了する。
(手順S67)変換サイズの横の長さと縦の長さが異なる周波数変換(16×8DCT、16×1DCT、8×16DCT、1×16DCT)をLpに追加する。
上記手順S61及び手順S62の意図について、図6を参照しながら説明する。図6(a)に示したように、ある階層の処理単位Uの中に2つの物体(前景物体Oと背景B)が存在し、前景物体Oと背景Bの境界が処理単位Uの下部に存在するとする。この場合、図6(b)に示すような、M÷Nの値が2以上となるような横長矩形のパーティションが選択される。逆に、図6(c)に示すような、縦長矩形のパーティションは選択されない。
次に、横長矩形パーティションが選択された場合の、背景Bと前景物体Oの両方を含む方のパーティションにおける変換サイズと符号化データの符号量の関係について、図6(d)〜(f)を参照して説明する。図6の(d)、(e)、(f)は、前記パーティションにおいて、それぞれ正方形、横長矩形、縦長矩形の変換サイズが適用される場合におけるパーティションと変換サイズの関係を図示したものである。正方形の変換サイズの周波数変換(図6(d))や、縦長矩形の変換サイズの周波数変換(図6(f))を用いると、周波数変換を適用する領域内に境界が存在する場合が多い。
一方、横長矩形の変換サイズの周波数変換(図6(e))を用いると、周波数変換を適用する領域内に境界が存在する場合が少ない。周波数変換を適用する領域内に境界が存在する場合、周波数変換によって変換係数の低周波成分にエネルギーを集中できないため、変換係数の符号化に要する符号量が多くなる。一方、周波数変換を適用する領域内に境界が存在しない場合、周波数変換によって変換係数の低周波成分にエネルギーを集中できるため、変換係数の符号化に要する符号量が少なくなる。ゆえに、横長矩形のパーティションに対しては、横長矩形の変換サイズの周波数変換を適用する方が、正方形や縦長矩形の変換サイズの周波数変換を適用する場合に較べて有効である。したがって、横長矩形パーティションに対して、正方形または縦長矩形の変換サイズの周波数変換を禁止変換に設定した場合でも、符号化データの符号量はほとんど増加しない。
上記手順S64及び手順S65の意図も上記と同様である。すなわち、縦長矩形パーティションに対して、正方形または横長矩形の変換サイズの周波数変換を禁止変換に設定した場合でも、符号化データの符号量はほとんど増加しない。
上記手順S66の意図について、図7を参照しながら説明する。図7(a)に示したように、ある階層の処理単位Uの中に2つの物体(前景物体Oと背景B)が存在し、前景物体Oと背景Bの境界が処理単位Uの右下部に存在するとする。この場合、図7(b)に示すような、M÷Nの値が1となるような正方形のパーティションが選択される。
次に、正方形のパーティションが選択された場合の、背景Bと前景物体Oの両方を含むパーティション(右下パーティション)における変換サイズと符号化データの符号量の関係を、図7(d)〜(f)を参照して説明する。図7の(d)、(e)、(f)は、右下パーティションにおいて、それぞれ正方形、横長矩形、縦長矩形の変換サイズが適用される場合におけるパーティションと変換サイズの関係を図示したものである。この場合、正方形、縦長矩形、横長矩形のいずれ変換サイズを用いる場合でも、周波数変換を適用する領域内に境界が存在する割合はそれほど変わらない。したがって、右下パーティションに関しては、正方形、縦長矩形、横長矩形のいずれの変換サイズの周波数変換を用いても、符号化データの符号量の違いは少ない。
一方、処理単位U内の右下パーティション以外のパーティションにおいては、背景Bのみが含まれ境界が存在しないため、いずれの変換サイズを用いても、周波数変換を適用する領域内に境界が存在しない。そこで、予測残差の画素値の空間相関を水平方向(横方向)と垂直方向(縦方向)の両方向にバランス良く活用できる正方形の変換サイズの周波数変換を用いる方が、縦長矩形や横長矩形の変換サイズの周波数変換を用いるのに較べて、より変換係数においてエネルギーを集中できる。ゆえに、正方形のパーティションには、正方形の変換サイズの周波数変換の方が、横長矩形や縦長矩形の変換サイズの周波数変換より有効である。したがって、正方形のパーティションに対して、横長矩形または縦長矩形の変換サイズの周波数変換を禁止変換に設定した場合でも、符号化データの符号量はほとんど増加しない。
<パーティションの属する階層による変換サイズの制限>
次に、上記手順S44のさらに詳細な手順を図8のフロー図を参照して説明する。
(手順S70)階層Lxが最上位階層ならば手順S71へ進み、それ以外であれば手順S72へ進む。
(手順S71)相似形状の変換サイズを有する複数の周波数変換候補(16×16DCT、8×8DCT、4×4DCT)のうち、最大の変換サイズを有する周波数変換以外の周波数変換(8×8DCT、4×4DCT)をLpに追加して処理を終了する。
(手順S72)階層Lxが最下位階層ならば手順S73へ進み、それ以外であれば処理を終了する。
(手順S73)相似形状の変換サイズを有する複数の周波数変換候補(16×16DCT、8×8DCT、4×4DCT)のうち、最小の変換サイズを有する周波数変換以外の周波数変換(16×16DCT、8×8DCT)をLpに追加して処理を終了する。
パーティションが階層構造で表現される場合、最上位階層に属するパーティションで、比較的変換サイズの小さい一部の周波数変換を制限したとしても、符号化データの符号量はほとんど増加しない。それは、最上位階層で特定の変換(例えば8×8DCTや4×4DCT)が選択できなくても、下位階層において選択可能なためである。つまり、小さい変換サイズの周波数変換が有効な領域では、最上位階層に属するパーティションを選択せず、小さい変換サイズの周波数変換が選択可能な下位階層のパーティションを選択することで、符号化データの符号量増加を抑制できる。特に、大きいパーティションに対しては、大きい変換サイズの周波数変換が有効であるという事実を踏まえると、周波数変換候補の中に複数の相似形状の変換サイズの周波数変換が存在する場合に、それらの周波数変換の中で小さい変換サイズの周波数変換を最上位階層で制限するのが好ましい。
同様に、パーティションが階層構造で表現される場合、最下位階層に属するパーティションで、比較的変換サイズの大きい一部の変換サイズの周波数変換を制限したとしても、符号化データの符号量はほとんど増加しない。特に、小さいパーティションに対しては、小さい変換サイズの周波数変換が有効であるという事実を踏まえて、周波数変換候補の中に複数の相似形状の変換サイズの周波数変換が存在する場合に、それらの周波数変換の中で大きい変換サイズの周波数変換を最下位階層で制限するのが好ましい。
<禁止変換リスト生成処理の具体例>
上で説明した、変換制約導出部104において、特定のパーティション構造に対して変換制約、すなわちパーティション毎の禁止変換リストを生成する手順の具体例について図9を参照して紹介しておく。図9に示したように、拡張MBは、階層L0で四分割された後、左上部は階層L1で一分割(パーティションa)、右上部は階層L1で水平二分割(パーティションb、c)、左下部は階層L1で垂直二分割(パーティションd、e)、右下部は階層L1で四分割されている。
階層L1で四分割された領域は、左上部は階層L2で一分割(パーティションf)、右上部は階層L2で水平二分割(パーティションg、h)、左下部は階層L2で垂直二分割(パーティションi、j)、右下部は階層L2で四分割されている。階層L2で四分割された各部は、階層L3で一分割(パーティションk、l、m、n)されている。選択可能な周波数変換の変換サイズは、前記の通り、4×4、8×8、16×16、16×1、1×16、8×1、1×8、16×8、8×16の9種類である。
パーティションaは、大きさが32×32画素であり階層L1に属している。上記の禁止変換リストの生成手順を適用すると、手順S51で4×4、8×1、1×8、手順S52で8×8、手順S67で1×16、16×1、16×8、8×16の各変換サイズの周波数変換が禁止変換リストに追加される。
パーティションb、cは、大きさは32×16画素であり階層L1に属している。上記の禁止変換リストの生成手順を適用すると、手順S51で4×4、8×1、1×8、手順S61で4×4、8×8、16×16、手順S62で1×16、8×16の各変換サイズの周波数変換が禁止変換リストに追加される。
パーティションd、eは、大きさは16×32画素であり階層L1に属している。上記の禁止変換リストの生成手順を適用すると、手順S51で4×4、8×1、1×8、手順S64で4×4、8×8、16×16、手順S65で16×1、16×8の各変換サイズの周波数変換が禁止変換リストに追加される。
パーティションfの大きさは16×16画素であり階層L2に属している。上記の禁止変換リストの生成手順を適用すると、手順S51で4×4、8×1、1×8、手順S67で16×1、1×16、16×8、8×16の各変換サイズの周波数変換が禁止変換リストに追加される。
パーティションg,hの大きさは16×8画素であり階層L2に属している。上記の禁止変換リストの生成手順を適用すると、手順S41で16×16、1×16、8×16、手順S61で4×4、8×8、16×16、手順S62で1×16、8×16の各変換サイズの周波数変換が禁止変換リストに追加される。
パーティションi,jの大きさは8×16画素であり階層L2に属している。上記の禁止変換リストの生成手順を適用すると、手順S41で16×16、16×1、16×8、手順S64で4×4、8×8、16×16、手順S65で16×1、16×8の各変換サイズの周波数変換が禁止変換リストに追加される。
パーティションk、l、m、nの大きさは8×8画素であり階層L3に属している。上記の禁止変換リストの生成手順を適用すると、手順S41で16×16、16×1、16×8、1×16、8×16、手順S67で16×1、16×8、1×16、8×16、手順5bで8×8、16×16の各変換サイズの周波数変換が禁止変換リストに追加される。
上記の例のように、他のパーティション構造を有する拡張MBに対しても、拡張MB内の各パーティションに対して禁止変換リストを生成して、変換制約として出力できる。
なお、上記説明では、禁止変換リスト生成手順において、手順S42、手順S43、手順S44の全てを実行するものとしたが、それらの一部のみを用いても良い。また、手順S42の詳細手順では、手順S50の判定と手順S51の判定のいずれか一方のみを実行しても良い。また、手順S43の詳細手順では、判定に関して、手順S60、手順63、手順66の各判定の一部のみを実行しても良いし、判定後の処理に関して、手順S61と手順S62のいずれか一方、手順S64と手順S65のいずれか一方のみを実行しても良い。また、手順S44の詳細手順では、手順S70と手順72の判定のいずれか一方のみを実行しても良い。そのような手順省力を行った場合、禁止変換リスト生成に要する計算処理が軽減できる。
<周波数変換決定部105>
周波数変換決定部105は、入力される変換制約を利用して、拡張MB内の各パーティションにおいて適用する周波数変換を決定し、その情報を変換選択フラグとして出力する。特定のパーティションpにおいて適用する周波数変換を決定する手順は次の通りである。
(手順S120)パーティションpに対応する禁止変換リストLpを変換制約から抽出する。
(手順S121)変換プリセットと、禁止変換リストLpの差集合をとって、変換候補リストCpとする。
(手順S122)変換候補リストCpが空集合であった場合は、変換プリセットに含まれる正方形の変換サイズの周波数変換のうち最小の変換サイズの周波数変換を変換候補リストCpに追加する。この手順は、禁止変換リストが変換プリセットと一致した場合に適用すべき周波数変換が存在しない状況を避けるために必要である。変換プリセットと一致しない禁止変換リストが常に生成される場合には、この手順は無くても良い。
(手順S123)変換候補リストCpに含まれる各周波数変換を適用した場合のレート歪コストを計算して、レート歪コストを最小とする周波数変換を、パーティションpにおいて適用する周波数変換とする。
<可変長符号化部108>
可変長符号化部108は、入力される変換係数と予測パラメータと変換制約と変換選択フラグに基づいて、拡張MBにおける変換係数と予測パラメータと変換選択フラグに対応する符号化データを生成して出力する。
変換係数と予測パラメータは従来通りの方法で可変長符号化されて出力される。変換選択フラグは変換制約を利用して可変長符号化されて出力される。以下、変換選択フラグの可変長符号化手順について図10のフロー図を参照して説明する。
(手順S80)拡張MBにおける階層L0の分割方法が四分割以外であれば、手順S81の処理を実行し、それ以外であれば手順S82〜手順S92の処理を実行する。
(手順S81)階層L0の処理単位(64×64画素)内の各パーティションに適用する周波数変換を示す情報を可変長符号化して、処理を終了する。
(手順S82)階層L0の処理単位を四分割して得られる階層L1の各処理単位(32×32画素)それぞれに対して、以下の手順S83〜手順S92の処理を実行する。
(手順S83)現在の処理単位(32×32画素)における階層L1の分割方法が四分割以外であれば、手順S84へ進み、それ以外であれば手順S85へ進む。
(手順S84)現在の処理単位(32×32画素)内の各パーティションに適用する周波数変換を示す情報を可変長符号化して、手順S92に進む。
(手順S85)階層L1の処理単位(32×32画素)を四分割して得られる階層L2の各処理単位(16×16画素)それぞれに対して、以下の手順S86〜手順S91の処理を適用する。
(手順S86)現在の処理単位(16×16画素)における階層L2の分割方法が四分割以外であれば、手順S87へ進み、それ以外であれば手順S88へ進む。
(手順S87)現在の処理単位(16×16画素)内の各パーティションに適用する周波数変換を示す情報を可変長符号化して、手順S91に進む。
(手順S88)階層L2の処理単位を四分割して得られる階層L3の各処理単位(8×8画素)それぞれに対して、以下の手順S89〜手順S90の処理を実行する。
(手順S89)現在の処理単位(8×8画素)内の各パーティションに適用する周波数変換を示す情報を可変長符号化して、手順S90に進む。
(手順S90)全ての処理単位(8×8画素)の処理が終了していれば手順S91に進む。そうでなければ、次の処理単位(8×8画素)を設定して、手順S89に進む
(手順S91)全ての処理単位(16×16画素)の処理が終了していれば手順S92に進む。そうでなければ、次の処理単位(16×16画素)を設定して、手順S86に進む
(手順S92)全ての処理単位(32×32画素)の処理が終了していれば処理を終了する。そうでなければ次の処理単位(32×32画素)を設定して、手順S83に進む
特定のパーティションpに対応する変換選択フラグの可変長符号化は、以下の手順で実行される。
(手順S130)パーティションpに対応する禁止変換リストLpを変換制約から抽出する。
(手順S131)変換プリセットと、禁止変換リストLpの差集合をとって、変換候補リストCpとする。
(手順S132)変換候補リストCpが空集合であった場合は、変換プリセットに含まれる正方形の変換サイズの周波数変換のうち最小の変換サイズの周波数変換を数変換候補リストCpに追加する。この手順で追加する周波数変換は上記の周波数変換に限らず、変換プリセットに含まれる他のパーティションpより小さい変換サイズの周波数変換であっても良い。ただし、周波数変換決定部の手順S122で用いたのと同一の周波数変換である必要がある。
(手順S133)変換候補リストCpに含まれる周波数変換の数が1個のみの場合は、可変長符号化処理を終了する。この場合、パーティションpに適用する周波数変換を示す情報を符号化データに含まなくても、データの復号時にはいずれの周波数変換を適用すべきかが一意に特定できるため、問題は生じない。
(手順S134)変換候補リストCpに含まれる周波数変換を所定の順序で並べ換えて0から始まり1ずつ増加するインデックスを対応付ける。
(手順S135)パーティションpに適用する周波数変換に関連付けられたインデックスを可変長符号化する。インデックスの可変長符号化方法として、例えば、周波数変換候補リストの要素数sとした場合に2のt乗がs以上となる最小のtを用いて、インデックス値のtビットで2進化して得られるビット列を符号化データとする方法が適用できる。
周波数変換候補リストの要素数が少なければインデックスの符号化に要する符号量は小さくなる。すなわち、禁止変換を各パーティションに設定することで、変換選択フラグの符号化に要する符号量を削減できる。また、周波数変換候補リストの要素数が少なければ、適用する周波数変換を選択するための符号化処理の演算量を削減することができる。
なお、上記手順S134における所定の順序とは、例えば大きい変換サイズの周波数変換に対して小さい変換サイズの周波数変換よりも小さいインデックス、変換サイズが正方形である場合に横長矩形である場合よりも小さいインデックス、変換サイズが横長矩形である場合に縦長矩形である場合よりも小さいインデックスが付加されるような順序を用いることができる。この場合、16×16DCT、16×8DCT、8×16DCT、8×8DCT、4×4DCT、16×1DCT、1×16DCT、8×1DCT、1×8DCTの順に小さいインデックスが対応付けられ易くなる。
別の例として、上記手順S134における所定の順序を、各周波数変換の選択頻度の高い順とすることもできる。具体的には、入力動画像の符号化処理を始めた後にパーティションの変換として変換プリセット中の各変換が何回選択されたかを計数しておき、選択回数が多い周波数変換に対してより小さいインデックスが割り当てられるような順序を作る。この場合、インデックスの発生頻度にも偏りが生じるため、手順S135でインデックスを可変長符号化した際の符号量が減少する。なお、新しいフレームの符号化開始時や、所定の個数の拡張MBの集合であるスライスの符号化開始時等の適当なタイミングで、上記選択回数の係数値をゼロ等の規定値に初期化しても良い。また、条件付きの周波数変換選択回数、例えば、パーティションサイズ毎の各周波数変換の選択回数を計数しておき利用しても良い。
また、上記手順S135におけるインデックスの可変長符号化に別の方法を用いても良い。例えばH.264/AVCで規定されている各種VLCや、CABAC等を用いることもできる。
なお、インデックスはそのまま可変長符号化するのではなく、インデックス予測値と一致するか否かのフラグを符号化し、該フラグが一致しないことを示す場合のみインデックスを可変長符号化してもよい。符号化済の拡張MBの情報(局所復号画像、パーティション構造、動きベクトル等)を用いて処理対象パーティションで利用される周波数変換を推定し、その周波数変換に対応するインデックスをインデックス予測値とできる。特に、周波数変換の空間相関を考慮して、処理対象パーティション近傍のパーティションで適用される周波数変換に基づいて、インデックス予測値を導出することが好ましい。具体的には、処理対象パーティションの左、上、右上に位置する各パーティションで適用される周波数変換のインデックスをそれぞれ導出する。そして、それらのインデックスの2個以上が一致すればその値をインデックス予測値とし、それ以外ならば、それらのインデックスの中で最小の値をインデックス予測値とする方式が好ましい。
また、上記の変換選択フラグの可変長符号化手順では、全てのパーティションに対する変換選択フラグを可変長符号化すると説明したが、特定の階層Lxの同一処理単位に属する各パーティションに対して適用する周波数変換は共通とする制約を課した上で、処理単位内パーティション共通の変換選択フラグを階層Lxの処理単位毎に1個可変長符号化しても良い。その場合、周波数変換の選択の自由度は低下するが、パーティション毎に変換選択フラグを符号化する必要がなく、階層Lxの処理単位毎に変換選択フラグを符号化すれば良いため、変換選択フラグの符号化に要する符号量を低減できる。逆に、変換候補リストに含まれる最大の変換サイズの周波数変換よりも小さくならない単位にパーティションをさらに分割し、その単位で変換選択フラグを符号化してもよい。
<予測残差再構築部109>
予測残差再構築部109は、入力される変換係数と変換選択フラグに基づいて、変換係数を逆周波数変換することで予測残差を再構築して出力する。なお、変換係数が量子化されている場合には、周波数変換の適用に先立って逆量子化を適用する。
<局所復号画像生成部110>
局所復号画像生成部110は、入力される予測画像と予測残差に基づいて局所復号画像を生成して出力する。局所復号画像の各画素値は、予測画像と予測残差の対応する画素間の画素値の和となる。なお、局所復号画像に対して、ブロック境界に発生するブロック歪低減や、量子化誤差低減を目的としてフィルタを適用してもよい。
<動画像符号化装置10の動作>
続いて、動画像符号化装置10の動作について説明する。
(手順S100)外部から動画像符号化装置10に入力された入力動画像は、拡張MBを単位として予測パラメータ決定部102および予測残差生成部106に順次入力されて、各拡張MBについて、以降のS101〜S109の処理が順に実行される。
(手順S101)予測パラメータ決定部102では、処理対象拡張MBについて、入力された入力動画像に基づいて予測パラメータが決定されて、予測画像生成部103および可変長符号化部108に出力される。
(手順S102)予測画像生成部103では、入力された予測パラメータおよびフレームメモリ101に記録されている局所復号画像に基づいて、入力動画像における処理対象拡張MBの領域を近似する予測画像が生成されて予測残差生成部106および局所復号画像生成部110に出力される。
(手順S103)予測残差生成部106では、入力された入力動画像と予測画像に基づいて、処理対象拡張MBに対応する予測残差が生成されて、周波数変換決定部105および変換係数生成部107に出力される。
(手順S104)変換制約導出部104では、入力された予測パラメータに基づいて、処理対象拡張MBの各パーティションにおける周波数変換に関する制約が変換制約として導出されて、周波数変換決定部105および可変長符号化部108に出力される。
(手順S105)周波数変換決定部105では、入力された変換制約と予測残差に基づいて、処理対象拡張MBの各パーティションに適用する周波数変換が決定されて、変換選択フラグとして変換係数生成部107および可変長符号化部108および予測残差再構築部109に出力される。
(手順S106)変換係数生成部107では、入力された変換選択フラグにより規定される周波数変換が、入力された予測残差に適用されて、処理対象拡張MBに対応する変換係数が生成されて、可変長符号化部108および予測残差再構築部109に出力される。
(手順S107)予測残差再構築部109では、入力された変換選択フラグにより規定される周波数変換に対応する逆周波数変換が、入力された変換係数に適用されて、処理対象拡張MBに対応する予測残差が再構築されて、局所復号画像生成部110に出力される。
(手順S108)局所復号画像生成部110では、入力された予測残差と予測画像に基づいて局所復号画像が生成されてフレームメモリ101に出力されて記録される。
(手順S109)可変長符号化部108では、入力された変換制約を利用して、入力された変換係数および予測パラメータおよび変換選択フラグが可変長符号化されて、符号化データとして外部に出力される。
上記の手順により、動画像符号化装置10では、入力された入力動画像を符号化して符号化データを生成し、外部に出力できる。
<動画像復号装置20の構成>
次に、動画像符号化装置10で符号化された符号化データを復号して復号動画像を生成する動画像復号装置20について説明する。
図11は画像復号装置20の構成を表すブロック図である。動画像復号装置20はフレームメモリ101、予測画像生成部103、変換制約導出部104、予測残差再構築部109、局所復号画像生成部110および可変長符号復号部201より構成される。
可変長符号復号部201は、入力される符号化データと変換制約に基づいて、予測パラメータおよび変換選択フラグおよび変換係数を復号して出力する。具体的には、まず、符号化データから予測パラメータを復号して出力する。次に、変換制約を利用して、符号化データから変換選択フラグを復号して出力する。最後に、変換選択フラグを利用して、符号化データから変換係数を復号して出力する。
<動画像復号装置20の動作>
続いて、動画像復号装置20の動作について説明する。
(手順S110)外部から動画像復号装置20に入力された符号化データは、拡張MBを単位として可変長符号復号部201に順次入力されて、各拡張MBに対応する符号化データに対して、以降のS111〜S117の処理が順に実行される。
(手順S111)可変長符号復号部201では、入力された符号化データから、処理対象拡張MBに対応する予測パラメータが復号されて、予測画像生成部103および変換制約導出部104へ出力される。
(手順S112)変換制約導出部104では、入力された予測パラメータに基づいて、処理対象拡張MBの各パーティションにおける周波数変換に関する制約が変換制約として導出されて、可変長符号復号部201に出力される。
(手順S113)可変長符号復号部201では、入力された符号化データと変換制約に基づいて、処理対象MBに対応する変換選択フラグが復号されて、予測残差再構築部109へ出力される。
(手順S114)可変長符号復号部201では、入力された符号化データと(手順S113)で導出した変換選択フラグに基づいて、処理対象拡張MBに対応する変換係数が復号されて、予測残差再構築部109へ出力される。
(手順S115)予測画像生成部103では、入力された予測パラメータおよびフレームメモリ101に記録されている局所復号画像に基づいて、処理対象拡張MBに対応する予測画像が生成されて局所復号画像生成部110に出力される。
(手順S116)予測残差再構築部109では、入力された変換選択フラグにより規定される周波数変換に対応する逆周波数変換が、入力された変換係数に適用されて、処理対象拡張MBに対応する予測残差が再構築されて、局所復号画像生成部110に出力される。
(手順S117)局所復号画像生成部110では、入力された予測残差と予測画像に基づいて局所復号画像が生成されてフレームメモリ101に出力されて記録されるとともに、処理対象ブロックに対応する復号動画像上の領域として外部に出力される。
以上説明したように、動画像復号装置20によれば、動画像符号化装置10で生成された符号化データから復号動画像を生成することができる。
<付記事項1:パーティションサイズや属する階層以外の情報の利用について>
なお、上記動画像符号化装置10や動画像復号装置20の説明において、拡張MB内のパーティション毎の禁止変換リストは、パーティションサイズやパーティションの属する階層にのみ基づいて生成されるものとして説明を行ったが、符号化データに含まれた情報に基づいて復号時に再現可能な別の情報を用いても良い。例えば、予測パラメータに含まれる動きベクトルや参照画像インデックスを禁止変換リストの導出に用いることもできる。
特定のパーティションpにおいて動きベクトルと参照画像インデックスを用いて禁止変換リストへ周波数変換を追加する手順を以下に示す。なお、パーティションpの動きベクトルをmvp、参照画像インデックスをrefpとする。また、パーティションpの上辺に隣接するパーティションの中で左端に位置するパーティション(パーティションu)の動きベクトルをmvu、参照画像インデックスをrefuとする。また、パーティションpの左辺に隣接するパーティションの中で上端に位置するパーティション(パーティションl)の動きベクトルをmvl、参照画像インデックスをreflと定義する。
(手順S140)mvpとmvuとmvlが全て一致し、かつ、refpとrefuとreflが全て一致する場合は手順S141へ進む。それ以外の場合は処理を終了する。
(手順S141)周波数変換リスト内で類似関係の変換サイズを有する周波数変換が2個以上存在する場合、それぞれの類似関係の変換サイズを有する周波数変換の組の中で変換サイズが最小である周波数変換をLpに追加して処理を終了する.
隣接ブロック間で動きベクトルが一致することは、符号化対象の拡張MB近傍の局所領域において動きベクトルの空間相関が高いことを意味する。動きベクトルの空間相関が高い場合には画素値の空間相関も高い傾向があるため、類似の変換サイズを有する周波数変換の中で小さい変換サイズの周波数変換の適用を禁止しても符号化データの符号量増加はわずかである。
なお、上記説明では禁止変換リスト導出に用いる動きベクトルや参照画像インデックスをパーティションpの隣接パーティションの動きベクトルや参照画像インデックスであるとしたが、別の動きベクトルを用いることもできる。例えば、パーティションpが属する拡張MB(処理対象拡張MB)に隣接する拡張MB内の動きベクトルを用いてもよい。具体的には、処理対象拡張MBの左側に隣接する拡張MB内で右上に位置するパーティションの動きベクトルをmvl、処理対象拡張MBの上側に隣接する拡張MB内で左下に位置するパーティションの動きベクトルをmvuとして用いる。この場合、拡張MB内の全パーティションで同一のmvl、mvuが利用されるため、手順S140、S141の処理がパーティションを単位として並列実行可能となる。
<付記事項2:禁止変換リストの生成タイミングについて>
なお、上記動画像符号化装置10や動画像復号装置20の説明において、変換制約導出部104は拡張MBのパーティション毎に随時禁止変換リストの生成処理を実行するものと説明したが、禁止変換リストへの周波数変換の追加がパーティションサイズやパーティションの属する階層のみに基づいて実行される場合には、所定のタイミングで事前に禁止周波数変換リストを生成しておいても良い。その場合、パーティションの種類毎に事前に生成された禁止変換リストを変換制約導出部104において拡張MB内の各パーティションに関連付ける必要がある。前記所定のタイミングとは、入力動画像の符号化開始または符号化データの復号開始直後であっても良いし、シーケンス、フレーム、スライス等の所定の符号化単位の符号化または復号処理の開始直後であっても良い。禁止変換リストの生成処理の実行回数を減らせるため、符号化および復号処理の処理量を低減できる。
逆に、禁止変換リストへの周波数変換の追加の際に動きベクトルや参照画像インデックスを用いる場合には、上記動画像符号化装置10や動画像復号装置20で説明したように拡張MB毎に随時禁止変換リストの生成処理を実行する必要がある。この場合、禁止変換リストの生成処理回数の増加により符号化および復号処理の処理量は増加するが、MB毎に生成処理を実行しない場合に較べて、符号化データより導出できるより多くの情報を用いることにより、より動画像の局所的性質に適合した禁止変換リストを生成できる。
(実施形態2)
次に、本発明による動画像符号化装置および動画像復号装置の別の一実施形態である動画像符号化装置11および動画像復号装置21について図12〜図14を参照しながら説明する。なお、図面の説明においては、同一要素には同一符号を付与して説明を省略する。
本実施形態における動画像符号化装置11および動画像復号装置21では、動画像符号化装置10や動画像復号装置20における変換制約導出部104を変換候補導出部111により置き換えることで、禁止変換リストを生成せずに、変換候補リストを直接導出することを特徴としている。
なお、変換制約導出部104と変換候補導出部111を合わせて、変換制御導出部と呼ぶ。
図12は動画像符号化装置11の構成を示すブロック図である。動画像符号化装置11は、フレームメモリ101、予測パラメータ決定部102、予測画像生成部103、予測残差生成部106、変換係数生成部107、予測残差再構築部109、局所復号画像生成部110、変換候補導出部111、周波数変換決定部112、可変長符号化部113より構成される。
変換候補導出部111は、入力される予測パラメータに基づいて、拡張MB内の各パーティションにおいて選択可能な周波数変換に関する情報を変換候補リストとして出力する。すなわち、予測パラメータにより決定される各パーティションのパーティション形状情報に基づいて、そのパーティションの変換候補リストを生成する。
変換候補リストは、拡張MB内の各パーティションにそれぞれ対応付けられており、変換プリセットに含まれる周波数変換の中で、各パーティションで選択可能な周波数変換の集合を規定する。
特定のパーティションpに対する変換候補リストCpは次の手順で生成される。なお、パーティションpの大きさをM×N画素(横M画素、縦N画素)とする。また、パーティションpは階層Lxに属するとする。
(手順S150)MとNの大小関係に応じて決定した周波数変換をCpに追加する。
(手順S151)Cpが空である場合に全てのパーティションサイズよりも小さい変換サイズを持つ周波数変換の中で、最も大きい変換サイズの周波数変換をCpに追加する。
上記手順S150のさらに詳細な手順を図13のフロー図を参照して説明する。
(手順S160)所定の値Th3(例えば以下ではTh3=16)を用いて、M1にMin(M、Th3)の値、N1にMin(N,Th3)の値を設定する。なお、Th3の値は、変換プリセットに含まれる最大の正方形の変換サイズの周波数変換における変換サイズの一辺の長さに設定することが好ましい。変換サイズM1×N1の変換サイズを持つ周波数変換が変換プリセットに存在すれば、その周波数変換を変換候補リストCpに追加して、手順S161へ進む。
(手順S161)MがNより大きい場合(パーティションpが横長矩形の場合)手順S162へ進み、それ以外であれば手順S163へ進む。
(手順S162)変換サイズM1×1の変換サイズを持つ周波数変換が変換プリセットに存在すれば、その周波数変換を変換候補リストCpに追加して処理を終了する。
(手順S163)MがNより小さい場合(パーティションpが縦長矩形の場合)手順S164へ進み、それ以外であれば手順S165へ進む。
(手順S164)変換サイズ1×N1の変換サイズを持つ周波数変換が変換プリセットに存在すれば、その周波数変換を変換候補リストCpに追加して処理を終了する。
(手順S165)M2にM1÷2の値、N2にN1÷2の値を設定する。変換サイズM2×N2の変換サイズを持つ周波数変換が変換プリセットに存在すれば、その周波数変換を変換候補リストCpに追加して処理を終了する。なお、この手順はMとNが等しい場合(パーティションpが正方形の場合)に実行される。
上記、MとNの大小関係、パーティションサイズMxNはパーティション形状情報である。
上記の手順においては、横長矩形(縦長矩形)のパーティションに対し、変換プリセットに存在すれば、パーティションの高さ(幅)より縦(横)の長さが短い変換サイズの周波数変換が変換候補リストCpに追加される。動画像符号化装置10の変換制約導出部104における禁止変換リストの導出手順の説明において図6を参照して言及した通り、横長矩形(縦長矩形)のパーティションに対しては、横長矩形(縦長矩形)の変換サイズの周波数変換が有効である。特に、短い辺の長さが長い辺に較べて極端に短い変換サイズの周波数変換を用いることで、変換サイズ内に物体の境界が存在する場合を少なくすることができ、周波数変換による変換係数の低周波数成分へのエネルギー集中効果を高めることができる。
周波数変換決定部112は、入力される変換候補リストを利用して、拡張MB内の各パーティションにおいて適用する周波数変換を決定し、その情報を変換選択フラグとして出力する。具体的には、変換候補リストCpに含まれる各周波数変換を適用した場合のレート歪コストを計算して、レート歪コストを最小とする周波数変換を、パーティションpにおいて適用する周波数変換とする。
可変長符号化部113は、入力される変換係数と予測パラメータに可変長符号化と変換候補リストと変換選択フラグに基づいて、拡張MBにおける変換係数と予測パラメータと変換選択フラグに対応する符号化データを生成して出力する。
拡張MB内の各パーティションにおける変換選択フラグの可変長符号化手順は、動画像符号化装置10の可変長符号化部108における手順S80〜手順S92(図10)で示した通りである。特定のパーティションpにおける詳細な変換選択フラグの可変長符号化手順としては、可変長符号化部108における手順S133〜手順S135を適用する。
続いて、動画像符号化装置11の動作について説明する。
(手順S170)外部から動画像符号化装置11に入力された入力動画像は、拡張MBを単位として予測パラメータ決定部102および予測残差生成部106に順次入力されて、各拡張MBについて、以降のS171〜S179の処理が順に実行される。
(手順S171)予測パラメータ決定部102では、処理対象拡張MBについて、入力された入力動画像に基づいて予測パラメータが決定されて、予測画像生成部103および可変長符号化部113に出力される。
(手順S172)予測画像生成部103では、入力された予測パラメータおよびフレームメモリ101に記録されている局所復号画像に基づいて、入力動画像における処理対象拡張MBの領域を近似する予測画像が生成されて予測残差生成部106および局所復号画像生成部110に出力される。
(手順S173)予測残差生成部106では、入力された入力動画像と予測画像に基づいて、処理対象拡張MBに対応する予測残差が生成されて、周波数変換決定部112および変換係数生成部107に出力される。
(手順S174)変換候補導出部111では、入力された予測パラメータに基づいて、処理対象拡張MBの各パーティションにおける周波数変換に関する制約が導出されて、周波数変換決定部112および可変長符号化部113に出力される。
(手順S175)周波数変換決定部112では、入力された変換制約と予測残差に基づいて、処理対象拡張MBの各パーティションに適用する周波数変換が決定されて、変換選択フラグとして変換係数生成部107および可変長符号化部113および予測残差再構築部109に出力される。
(手順S176)変換係数生成部107では、入力された変換選択フラグにより規定される周波数変換が、入力された予測残差に適用されて、処理対象拡張MBに対応する変換係数が生成されて、可変長符号化部108および予測残差再構築部109に出力される。
(手順S177)予測残差再構築部109では、入力された変換選択フラグにより規定される周波数変換に対応する逆周波数変換が、入力された変換係数に適用されて、処理対象拡張MBに対応する予測残差が再構築されて、局所復号画像生成部110に出力される。
(手順S178)局所復号画像生成部110では、入力された予測残差と予測画像に基づいて局所復号画像が生成されてフレームメモリ101に出力されて記録される。
(手順S179)可変長符号化部113では、入力された変換制約を利用して、入力された変換係数および予測パラメータおよび変換選択フラグが可変長符号化されて、符号化データとして外部に出力される。
上記の手順により、動画像符号化装置11では、入力された入力動画像を符号化して符号化データを生成し、外部に出力できる。
<変換候補リスト生成方法の他の例>
なお、上記の変換候補導出部111に関する説明で、変換候補リスト生成方法の一例を示したが、別の方法で変換候補リストを生成してもよい。例えば、変換プリセットに相似関係にある2個の周波数変換DCTa、DCTb(ただしDCTaの変換サイズはDCTbの変換サイズより大きい)が含まれる場合に、上位階層に含まれるパーティションに対する変換候補リストにはDCTaを追加してDCTbを追加せず、下位階層に含まれるパーティションに対する変換候補リストにはDCTbを追加する、という変換候補リスト生成方法も有効である。より具体的には、変換プリセットに16×16DCTと8×8DCTが含まれる場合に、64×64画素を処理単位とする階層L0に含まれるパーティションに対する変換候補リストには少なくとも16×16DCTを追加して8×8DCTは追加せず、32×32画素を処理単位とする階層L1に含まれるパーティションに対する変換候補リストには少なくとも8×8DCTを追加する。
特定の階層Lxに属するパーティションで特定の周波数変換DCTb(例えば8×8DCT)が選択できなくても、階層Lxよりも下位の階層Lyに属するパーティションにおいてDCTbが選択可能であれば、DCTbが有効な領域では、上位階層Lxに属するパーティションを選択せず、DCTbが選択可能な下位階層Lyに属するパーティションを選択することで、符号化データの符号量増加を抑制できる。特に、大きいパーティションに対しては、大きい変換サイズの周波数変換が有効であるという事実を踏まえて、上位階層Lxに属するパーティションに対してはDCTbの選択を禁止する代わりに、より大きな変換サイズを有するDCTa(例えば16×16DCT)を選択可能とし、一方で下位階層Lyに属するパーティションに対してはDCTbを選択可能とすることが有効である。
<動画像復号装置21の構成>
次に、動画像符号化装置11で符号化された符号化データを復号して復号動画像を生成する動画像復号装置21について説明する。
図14は画像復号装置21の構成を表すブロック図である。動画像復号装置20はフレームメモリ101、予測画像生成部103、予測残差再構築部109、局所復号画像生成部110、変換候補導出部111および可変長符号復号部202より構成される。
可変長符号復号部202は、入力される符号化データと変換候補リストに基づいて、予測パラメータ、変換選択フラグおよび変換係数を復号して出力する。具体的には、まず、符号化データから予測パラメータを復号して出力する。次に、変換候補リストを利用して、符号化データから変換選択フラグを復号して出力する。最後に、変換選択フラグを利用して、符号化データから変換係数を復号して出力する。なお、変換選択フラグの復号時に、変換選択フラグが何ビットで符号化されているかを知る必要があるが、そのためには変換候補リストに含まれる要素の情報は必ずしも必要ではなく、変換候補リストに含まれる要素数のみが分かれば十分である。この場合、可変長符号復号部202に入力される信号および変換選択フラグの復号に用いられる信号は、変換候補リストのうち、変換候補リストに含まれる要素数に関する信号のみでも構わない。
<動画像復号装置21の動作>
続いて、動画像復号装置21の動作について説明する。
(手順S180)外部から動画像復号装置20に入力された符号化データは、拡張MBを単位として可変長符号復号部201に順次入力されて、各拡張MBに対応する符号化データに対して、以降のS181〜S187の処理が順に実行される。
(手順S181)可変長符号復号部202では、入力された符号化データから、処理対象拡張MBに対応する予測パラメータが復号されて、予測画像生成部103および変換候補導出部111へ出力される。
(手順S182)変換候補導出部111では、入力された予測パラメータに基づいて、処理対象拡張MBの各パーティションにおける変換候補リストが導出されて、可変長符号復号部202に出力される。
(手順S183)可変長符号復号部202では、入力された符号化データと変換制約に基づいて、処理対象MBに対応する変換選択フラグが復号されて、予測残差再構築部109へ出力される。
(手順S184)可変長符号復号部202では、入力された符号化データと(手順S183)で導出した変換選択フラグに基づいて、処理対象拡張MBに対応する変換係数が復号されて、予測残差再構築部109へ出力される。
(手順S185)予測画像生成部103では、入力された予測パラメータおよびフレームメモリ101に記録されている局所復号画像に基づいて、処理対象拡張MBに対応する予測画像が生成されて局所復号画像生成部110に出力される。
(手順S186)予測残差再構築部109では、入力された変換選択フラグにより規定される周波数変換に対応する逆周波数変換が、入力された変換係数に適用されて、処理対象拡張MBに対応する予測残差が再構築されて、局所復号画像生成部110に出力される。
(手順S187)局所復号画像生成部110では、入力された予測残差と予測画像に基づいて局所復号画像が生成されてフレームメモリ101に出力されて記録されるとともに、処理対象ブロックに対応する復号動画像上の領域として外部に出力される。
<デコーダまとめ>
以上説明したように、動画像復号装置21によれば、動画像符号化装置11で生成された符号化データから復号動画像を生成することができる。
(実施形態3)
次に、本発明による動画像符号化装置および動画像復号装置の別の一実施形態である動画像符号化装置30および動画像復号装置40について図15〜図16を参照しながら説明する。なお、図面の説明においては、同一要素には同一符号を付与して説明を省略する。また、動画像符号化装置30および動画像復号装置40において利用可能なパーティション構造や変換プリセットは、動画像符号化装置11および動画像復号装置21で用いたものと同じとする。
本実施形態における動画像符号化装置30や動画像復号装置40では、動画像のシーン、フレーム、スライスといったMBより大きい所定の単位で変換候補導出部による変換候補リストの導出方法を動画像の性質に合わせて適応的に変更する機能を備える点が、動画像符号化装置11や動画像復号装置21と異なる。
図15は動画像符号化装置30の構成を示すブロック図である。動画像符号化装置30は、フレームメモリ101、予測パラメータ決定部102、予測画像生成部103、予測残差生成部106、変換係数生成部107、予測残差再構築部109、局所復号画像生成部110、周波数変換決定部112、変換候補リスト導出ルール決定部301、変換候補導出部302、可変長符号化部303より構成される。
変換候補リスト導出ルール決定部301は、シーン、フレーム、スライス等のMBより大きい所定の単位で入力される入力動画像に基づいて、変換候補導出部における変換候補リスト導出方法を規定または更新する変換候補リスト導出ルールを生成する。なお、以下では説明の簡単のため、変換候補リスト導出ルールはフレーム毎に生成されるものとして説明する。
(変換候補リスト導出ルールの定義)
変換候補リスト導出ルールは、以下に示す基礎ルールの組み合わせとして定義する。
・基礎ルール1:所定のパーティションAに対して変換プリセット内の所定の周波数変換Bを変換候補リストへ追加することを規定する。なお、以下では基礎ルール1を、[許可、パーティションA、周波数変換B]という形式で記載する。例えば、[許可、64×64、T16×16]は、64×64のパーティションに対してT16×16の周波数変換を変換候補リストへ追加することを示す。
・基礎ルール2:所定のパーティションAに対して変換プリセット内の所定の周波数変換Bを変換候補リストへ含めることを禁止することを規定する。なお、以下では基礎ルール2を、[禁止、パーティションA、周波数変換B]という形式で記載する。例えば、[禁止、64×64、T4×4]は、64×64の大きさパーティションに対してT4×4を禁止して、変換候補リストに含めないことを示す。
・基礎ルール3:所定のパーティションAに対して変換プリセット内の所定の周波数変換Bが変換候補リストへ含まれている場合に、変換候補リスト中の周波数変換Bを別の周波数変換Cで置き換えることを規定する。なお、以下では基礎ルール3を、[置換、パーティションA、周波数変換B、周波数変換C]という形式で記載する。例えば、[置換、64×32、T4×4、T16×1]は、64×32の大きさのパーティションに対してT4×4が変換候補リストに含まれる場合に、T4×4を変換候補リストから除外して、代わりにT16×1を変換候補リストに加えることを示す。
すなわち、変換候補リスト導出ルールには複数の基礎ルールが含まれており、各基礎ルールは、上記基礎ルール1〜3のいずれかに分類される。
なお、変換候補リスト導出ルールにおいて、基礎ルールに加えて、もしくは、基礎ルールの代替として、基礎ルールの組み合わせにより表現される複合ルールを含めてもよい。以下、いくつかの複合ルールの例を挙げる。
・複合ルール1:特定の階層に属するパーティションで特定の変換を禁止する。例えば、L0階層でT8×8以下の大きさの変換を禁止するというルールがこの複合ルール1に相当する。上記複合ルール(R1)は、次のような基礎ルールの集合として表現できる。
R1={[禁止、P、T]:(PはL0階層に属するパーティション)∧(TはT8×8以下の周波数変換)}
また、所定の階層より上位の階層で類似関係にある周波数変換の中でサイズの小さい周波数変換を禁止するというルール、より具体的には、階層L1よりも上位の階層で類似関係にあるT16×16、T8×8、T4×4の各変換のうち、T8×8およびT4×4を禁止するというルール、もこの複合ルール1に相当する。
・複合ルール2:特定の形状のパーティションでは、特定の変換Aを特定の変換Bに置き換える。例えば、正方形のパーティションでは長方形の周波数変換を所定の正方形の周波数変換(例えばT4×4)に置き換えるというルールがこの複合ルール2に相当する。上記複合ルール(R2)は、次のような基礎ルールの集合として表現できる。
R2={[置換、P、T、T4×4]:(P∈正方形のパーティション)∧(T∈長方形の周波数変換)}
また、横長矩形のパーティションでは正方形の周波数変換を横長矩形の周波数変換に置き換えるというルールもこの複合ルール2に相当する。
(変換候補リスト導出ルールの決定手順)
まず、基礎ルールおよび複合ルールを構成要素とするルール候補を符号化処理開始前にあらかじめ規定しておき、変換候補リスト導出ルールを空に設定する。次に、入力される各フレームに対し、ルール候補に含まれる各基礎ルールまたは複合ルールをそれぞれ適用して符号化処理を行った場合のレート歪コストを計算する。また、全てのルール候補を適用しない場合のレート歪コストC1も計算しておく。続いて、各基礎ルールまたは複合ルールを適用した場合のレート歪コストC2とコストC1を比較して、コストC2がコストC1より小さければ、当該基礎ルールまたは複合ルールを適用することを決定して、変換候補リスト導出ルールに含める。
上記の手順により、所定のルール候補のうち、フレームの符号化時に適用することでレート歪コストが低減され得る基礎ルールまたは複合ルールのみが、変換候補リスト導出ルールに追加される。
変換候補導出部302は、入力される予測パラメータと変換候補リスト導出ルールに基づいて、拡張MB内の各パーティションにおいて選択可能な周波数変換に関する情報を変換候補リストとして出力する。変換候補リストは、拡張MB内の各パーティションにそれぞれ対応付けられており、変換プリセットに含まれる周波数変換の中で、各パーティションで選択可能な周波数変換の集合を規定する。なお、その際には、入力される変換候補リスト導出ルールも変換候補リスト導出処理に用いられる。
入力された変換候補リスト導出ルールに基づいて、特定のパーティションpに対する変換候補リストCpを生成する手順は次の通りである。なお、パーティションpの大きさをM×N画素(横M画素、縦N画素)とする。
(手順S200)変換候補リスト導出ルールに複合ルールが含まれる場合、各複合ルールを基礎ルールに分解して変換候補リスト導出ルールに追加する。
(手順S201)変換候補リストに含まれる全ての基礎ルール1に属する基礎ルールに対して、手順S202の処理を実行する。
(手順S202)処理対象の基礎ルール1を[許可、P1、T1]と表わす。パーティションpの形状とP1が一致する場合、変換候補リストに周波数変換T1を追加する。
(手順S203)変換候補リストに含まれる全ての基礎ルール2に属する基礎ルールに対して、手順S204の処理を実行する。
(手順S204)処理対象の基礎ルール2を[禁止、P2、T2]と表わす。パーティションpの形状とP2が一致し、かつ変換候補リストに周波数変換T2が存在している場合、周波数変換T2を変換候補リストから除去する。
(手順S205)変換候補リストに含まれる全ての基礎ルール3に属する基礎ルールに対して、手順S206の処理を実行する。
(手順S206)処理対象の基礎ルール2を[置換、P3、T3、T4]と表わす。パーティションpの形状とP3が一致し、かつ変換候補リストに周波数変換T3が存在している場合、周波数変換T3を周波数変換T4に置き換える。
以上の手順により、変換候補導出部302において、入力される変換候補リスト導出ルールに従って変換候補リストを導出できる。
可変長符号化部303は、入力される変換係数と予測パラメータと変換候補リストと変換選択フラグと変換候補リスト導出ルールそれぞれに対応する符号化データを生成して出力する。
変換候補リスト導出ルールに対応する符号化データの生成処理の詳細を説明する。符号化データは、変換候補リスト導出ルールに含まれる各基礎ルールまたは複合ルールを可変長符号化することで生成される。基礎ルールの可変長符号化では、まず対象の基礎ルールが基礎ルール1〜3のいずれに分類されるかを示す情報を符号化し、次に基礎ルールの適応対象であるパーティションを示す情報符号化する。最後に、基礎ルール1の場合は許可する周波数変換、基礎ルール2の場合は禁止する周波数変換、基礎ルール3の場合は置換前後の各周波数変換の種類を示す情報が符号化される。なお、どのような基礎ルールが変換候補リスト導出リストに含まれ得るかがあらかじめ決めっている場合には、上記の方法で基礎ルールを可変長符号化する代わりに、基礎ルールを適用するか否かの情報を符号化データとすることで符号量を削減できる。なお、特定の基礎ルールを常に適用することがあらかじめ決められている場合には、その基礎ルールを可変長符号化する必要はない。
複合ルールは、基礎ルールに分解して符号化される。また、どのような複合ルールが変換候補リスト導出リストに含まれ得るかがあらかじめ決めっている場合には、複合ルールを適用するか否かの情報を符号化データとすることで符号量を削減できる。例えば、32×32より大きいパーティションにおいてT4×4およびT8×8を禁止するという複合ルールの適用有無を1bitのフラグとして符号化できる。
また、特定の基礎ルールまたは複合ルールをひとまとめにしてルールグループを規定し、当該ルールグループに含まれる基礎ルール各々について適用有無を示す情報を符号化するか、または当該ルールグループに含まれる全ての基礎ルールの適用有無を既定の方法で推定するかを示すフラグを符号化してもよい。具体的には、階層L3においてT16×16、T8×8、T4×4各々の適用有無を示す複合ルールをenable_t16×16_L3、enable_t16×16_L3、enable_t16×16_L3とする場合、前記3つの復号ルールをまとめてルールグループenable_L3を作成する。符号化時には、まずenable_L3の適用有無を1ビットで符号化し、enable_L3を適用する場合には、当該ルールグループに含まれる各複合ルールの適用有無を各々1ビットで符号化する。enable_L3を適用しない場合には、各複合ルールの適用有無は既定の方法で推定される。
なお、基礎ルールおよび複合ルールを1個ずつ可変長符号化するのではなく、まとめて符号化してもよい。例えば、全ての基礎ルールを適用しないか、少なくとも1個の基礎ルールを適用するかを示すフラグを符号化して、当該フラグが少なくとも1個の基礎ルールを適用することを示すときに限り、基礎ルール毎に適用するか否かの情報を符号化してもよい。また、前フレームで適用した変換候補リスト導出ルールを引き継ぐか否かのフラグを符号化し、引き継がない場合にのみ変換候補リスト導出ルールを符号化することもできる。
続いて、動画像符号化装置30の動作について説明する。
(手順S210)外部から動画像符号化装置30に入力された入力動画像はフレームを単位として変換候補リスト導出ルール決定部301に入力されると共に、拡張MBを単位として予測パラメータ決定部102および予測残差生成部106に順次入力される。各フレームに対して手順S211〜S212の処理、各拡張MBに対して手順S213〜S221の処理が実行される。
(手順S211)変換候補リスト導出ルール決定部301では、入力フレームに基づいて、変換候補リスト導出ルールが生成されて、変換候補導出部302および可変長符号化部303に出力される。
(手順S212)可変長符号化部303では、入力された変換候補リスト導出ルールに基づいて対応する符号化データが生成されて外部に出力される。
(手順S213)予測パラメータ決定部102では、処理対象拡張MBについて、入力された入力動画像に基づいて予測パラメータが決定されて、予測画像生成部103、変換候補導出部302、および可変長符号化部303に出力される。
(手順S214)予測画像生成部103では、入力された予測パラメータおよびフレームメモリ101に記録されている局所復号画像に基づいて、入力動画像における処理対象拡張MBの領域を近似する予測画像が生成されて予測残差生成部106および局所復号画像生成部110に出力される。
(手順S215)予測残差生成部106では、入力された入力動画像と予測画像に基づいて、処理対象拡張MBに対応する予測残差が生成されて、周波数変換決定部112および変換係数生成部107に出力される。
(手順S216)変換候補導出部302では、入力された予測パラメータおよび変換候補リスト導出ルールに基づいて、処理対象拡張MBの各パーティションにおける周波数変換に関する制約が導出されて、周波数変換決定部112および可変長符号化部303に出力される。
(手順S217)周波数変換決定部112では、入力された変換制約と予測残差に基づいて、処理対象拡張MBの各パーティションに適用する周波数変換が決定されて、変換選択フラグとして変換係数生成部107および可変長符号化部303および予測残差再構築部109に出力される。
(手順S218)変換係数生成部107では、入力された変換選択フラグにより規定される周波数変換が、入力された予測残差に適用されて、処理対象拡張MBに対応する変換係数が生成されて、可変長符号化部108および予測残差再構築部109に出力される。
(手順S219)予測残差再構築部109では、入力された変換選択フラグにより規定される周波数変換に対応する逆周波数変換が、入力された変換係数に適用されて、処理対象拡張MBに対応する予測残差が再構築されて、局所復号画像生成部110に出力される。
(手順S220)局所復号画像生成部110では、入力された予測残差と予測画像に基づいて局所復号画像が生成されてフレームメモリ101に出力されて記録される。
(手順S221)可変長符号化部303では、入力された変換制約を利用して、入力された変換係数および予測パラメータおよび変換選択フラグが可変長符号化されて、符号化データとして外部に出力される。
上記の手順により、動画像符号化装置30では、入力された入力動画像を符号化して符号化データを生成し、外部に出力できる。
<動画像復号装置40の構成>
次に、動画像符号化装置30で符号化された符号化データを復号して復号動画像を生成する動画像復号装置40について説明する。
図16は画像復号装置40の構成を表すブロック図である。動画像復号装置40はフレームメモリ101、予測画像生成部103、予測残差再構築部109、局所復号画像生成部110、変換候補導出部302および可変長符号復号部401より構成される。
可変長符号復号部401は、入力される符号化データと変換候補リストに基づいて、予測パラメータ、変換選択フラグ、変換係数、および変換候補リスト導出ルールを復号して出力する。具体的には、まず、変換候補リスト導出ルールを復号して出力する。次に、符号化データから予測パラメータを復号して出力する。次に、変換候補リストを利用して、符号化データから変換選択フラグを復号して出力する。最後に、変換選択フラグを利用して、符号化データから変換係数を復号して出力する。
<動画像復号装置40の動作>
続いて、動画像復号装置40の動作について説明する。
(手順S230)外部から動画像復号装置40に入力された符号化データは、フレームを単位として可変長符号復号部401に順次入力されて、各フレームに対応する符号化データに対して、以降のS231〜S239の処理が順に実行される。
(手順S231)可変長符号復号部401では、入力された符号化データから、処理対象フレームに対応する変換候補リスト導出ルールが復号されて、変換候補導出部302へ出力される。
(手順S232)可変長符号復号部401では、入力されたフレーム単位の符号化データが拡張MB単位の符号化データに分割され、各拡張MBに対応する符号化データに対して以降のS233〜S239の処理が順に実行される。
(手順S233)可変長符号復号部401では、処理対象である拡張MB単位の符号化データから予測パラメータが復号されて、変換候補導出部302へ出力される。
(手順S234)変換候補導出部302では、入力された変換候補リスト導出ルールおよび予測パラメータに基づいて、処理対象拡張MBの各パーティションにおける変換候補リストが導出されて、可変長符号復号部401に出力される。
(手順S235)可変長符号復号部401では、入力された符号化データと変換制約に基づいて、処理対象MBに対応する変換選択フラグが復号されて、予測残差再構築部109へ出力される。
(手順S236)可変長符号復号部202では、入力された符号化データと(手順S235)で導出した変換選択フラグに基づいて、処理対象拡張MBに対応する変換係数が復号されて、予測残差再構築部109へ出力される。
(手順S237)予測画像生成部103では、入力された予測パラメータおよびフレームメモリ101に記録されている局所復号画像に基づいて、処理対象拡張MBに対応する予測画像が生成されて局所復号画像生成部110に出力される。
(手順S238)予測残差再構築部109では、入力された変換選択フラグにより規定される周波数変換に対応する逆周波数変換が、入力された変換係数に適用されて、処理対象拡張MBに対応する予測残差が再構築されて、局所復号画像生成部110に出力される。
(手順S239)局所復号画像生成部110では、入力された予測残差と予測画像に基づいて局所復号画像が生成されてフレームメモリ101に出力されて記録されるとともに、処理対象ブロックに対応する復号動画像上の領域として外部に出力される。
以上説明したように、動画像復号装置40によれば、動画像符号化装置11で生成された符号化データから復号動画像を生成することができる。
また、上述した実施形態における動画像符号化装置および動画像復号装置の一部、または全部を典型的には集積回路であるLSI(Large Scale Integration)として実施してもよい。動画像符号化装置及び動画像復号装置の各機能ブロックは個別にチップ化してもよいし、一部、または全部を集積してチップ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いることも可能である。
10…動画像符号化装置、11…動画像符号化装置、20…動画像復号装置、21…動画像復号装置、30…動画像符号化装置、40…動画像復号装置、101…フレームメモリ、102…予測パラメータ決定部、103…予測画像生成部、104…変換制約導出部、105…周波数変換決定部、106…予測残差生成部、107…変換係数生成部、108…可変長符号化部、109…予測残差再構築部、110…局所復号画像生成部、111…変換候補導出部、112…周波数変換決定部、113…可変長符号化部、201…可変長符号復号部、202…可変長符号復号部、301…候補リスト導出ルール決定部、302…変換候補導出部、302…可変長符号化部、401…可変長符号復号部。








Claims (2)

  1. 入力符号化データをブロック単位に復号処理を行う動画像復号装置において、
    前記入力符号化データから、処理対象のブロックのパーティション構造を復号する可変長符号復号部と、
    前記パーティション構造で規定されるパーティションを単位として予測画像を生成する予測画像生成部と、
    少なくともパーティション構造におけるレイヤに関して各パーティションを特徴づけるパーティション形状情報のうちの前記パーティション構造におけるレイヤに基づいて、所定の変換プリセットに含まれる変換から、適用可能な変換のリストである変換候補リストを決定する変換候補導出部とを有していて、
    前記可変長符号復号部は、前記入力符号化データ及び前記変換候補リストに基づいて変換選択フラグを復号するとともに、前記変換選択フラグに基づいて前記処理対象のブロックの変換係数を復号し、
    さらに、前記変換選択フラグにより規定される変換に対応する逆変換を前記変換係数に適用して予測残差を再構築する予測残差再構築部と、
    前記予測画像と前記予測残差とに基づいて前記処理対象のブロックに対応する復号画像データを出力する局所復号画像生成部と、を備えることを特徴とする動画像復号装置。
  2. 入力動画像を所定の大きさのブロックに分割して、ブロック単位に符号化処理を行う動画像符号化装置において、
    ブロックのパーティション構造を決定する予測パラメータ決定部と、
    前記パーティション構造で規定されるパーティションを単位として予測画像を生成する予測画像生成部と、
    前記予測画像と入力動画像の差分である予測残差に対して所定の変換プリセットに含まれる変換のいずれかを適用する変換係数生成部と、
    少なくともパーティション構造におけるレイヤに関して各パーティションを特徴づけるパーティション形状情報のうちの前記パーティション構造におけるレイヤに基づいて適用可能な前記所定の変換プリセットに含まれる変換のリストである変換候補リストを決定する変換候補導出部と、
    前記各ブロックに関して、前記変換候補リストに含まれる変換の中から前記ブロックにおける前記予測残差に適用するための変換を示す変換選択フラグを決定する周波数変換決定部と、
    前記変換候補リストに基づく前記変換選択フラグを可変長符号化する可変長符号化部を備えることを特徴とする動画像符号化装置。














JP2015113547A 2009-04-08 2015-06-04 動画像符号化装置および動画像復号装置 Expired - Fee Related JP6012816B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015113547A JP6012816B2 (ja) 2009-04-08 2015-06-04 動画像符号化装置および動画像復号装置

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2009093606 2009-04-08
JP2009093606 2009-04-08
JP2009146509 2009-06-19
JP2009146509 2009-06-19
JP2015113547A JP6012816B2 (ja) 2009-04-08 2015-06-04 動画像符号化装置および動画像復号装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011508308A Division JPWO2010116869A1 (ja) 2009-04-08 2010-03-17 動画像符号化装置および動画像復号装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016183397A Division JP6239713B2 (ja) 2009-04-08 2016-09-20 動画像符号化装置および動画像復号装置

Publications (2)

Publication Number Publication Date
JP2015173505A JP2015173505A (ja) 2015-10-01
JP6012816B2 true JP6012816B2 (ja) 2016-10-25

Family

ID=42936156

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2011508308A Pending JPWO2010116869A1 (ja) 2009-04-08 2010-03-17 動画像符号化装置および動画像復号装置
JP2015113547A Expired - Fee Related JP6012816B2 (ja) 2009-04-08 2015-06-04 動画像符号化装置および動画像復号装置
JP2016183397A Active JP6239713B2 (ja) 2009-04-08 2016-09-20 動画像符号化装置および動画像復号装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011508308A Pending JPWO2010116869A1 (ja) 2009-04-08 2010-03-17 動画像符号化装置および動画像復号装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016183397A Active JP6239713B2 (ja) 2009-04-08 2016-09-20 動画像符号化装置および動画像復号装置

Country Status (10)

Country Link
US (1) US8855203B2 (ja)
EP (1) EP2418855B1 (ja)
JP (3) JPWO2010116869A1 (ja)
CN (5) CN104717505B (ja)
BR (1) BRPI1014257B1 (ja)
EA (5) EA024522B1 (ja)
HK (4) HK1211399A1 (ja)
MX (1) MX2011010550A (ja)
MY (1) MY157572A (ja)
WO (1) WO2010116869A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9549190B2 (en) * 2009-10-01 2017-01-17 Sk Telecom Co., Ltd. Method and apparatus for encoding/decoding image using variable-size macroblocks
EP3101897B1 (en) 2010-04-09 2021-10-20 Xylene Holding S.A. Moving image encoding device and method, moving image decoding device and method, bitstream
CA3207722A1 (en) * 2010-12-17 2012-06-21 Mitsubishi Electric Corporation Image coding device, image decoding device, image coding method, and image decoding method
CN102685487B (zh) * 2011-03-16 2015-07-08 华为技术有限公司 图像编解码方法、图像编解码设备及网络系统
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units
CN102857755B (zh) * 2011-07-01 2016-12-14 华为技术有限公司 确定变换块尺寸的方法和设备
CN103918263A (zh) * 2011-07-22 2014-07-09 摩托罗拉移动有限责任公司 用于扫描视频编译中的矩形变换的设备和方法
US9787982B2 (en) 2011-09-12 2017-10-10 Qualcomm Incorporated Non-square transform units and prediction units in video coding
JP2013085096A (ja) * 2011-10-07 2013-05-09 Sony Corp 画像処理装置および方法
US9247254B2 (en) 2011-10-27 2016-01-26 Qualcomm Incorporated Non-square transforms in intra-prediction video coding
CN103096053B (zh) 2011-11-04 2015-10-07 华为技术有限公司 一种变换模式的编解码方法和装置
WO2013096671A1 (en) 2011-12-20 2013-06-27 General Instrument Corporation Method and apparatus for efficient transform unit encoding
CN102761742B (zh) * 2012-07-03 2017-06-06 华为技术有限公司 变换块划分方法,变换块划分参数的编码方法及解码方法
EP2941864B1 (en) * 2013-01-07 2016-12-07 Telefonaktiebolaget LM Ericsson (publ) Limiting use of largest transform unit size for intra coding units in inter coded slices of encoded video
WO2015015681A1 (ja) * 2013-07-31 2015-02-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法および画像符号化装置
JP6187826B2 (ja) 2014-02-04 2017-08-30 パナソニックIpマネジメント株式会社 動画像符号化装置及び動画像符号化方法
US9591313B2 (en) * 2014-03-04 2017-03-07 Vixs Systems, Inc. Video encoder with transform size preprocessing and methods for use therewith
CN104284188B (zh) * 2014-10-11 2018-03-13 华为技术有限公司 预测块的划分方法、编码设备和解码设备
CN113613009A (zh) * 2015-02-27 2021-11-05 索尼公司 发送装置、发送方法、接收装置和接收方法
FR3038196A1 (fr) * 2015-06-29 2016-12-30 B<>Com Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes
US20170150186A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Flexible transform tree structure in video coding
CA3197905A1 (en) * 2016-02-09 2017-08-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for picture/video data streams allowing efficient reducibility or efficient random access
US10390048B2 (en) * 2016-02-15 2019-08-20 Qualcomm Incorporated Efficient transform coding using optimized compact multi-pass transforms
ES2710807B1 (es) 2016-03-28 2020-03-27 Kt Corp Metodo y aparato para procesar senales de video
FR3057131A1 (fr) * 2016-10-04 2018-04-06 B<>Com Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal et programmes d'ordinateurs associes
FR3064870A1 (fr) * 2017-03-31 2018-10-05 B<>Com Procede de decodage d'au moins une image numerique, procede de codage, dispositifs, equipement terminal et programmes d'ordinateurs associes
CN109151468B (zh) 2017-06-28 2020-12-08 华为技术有限公司 一种图像数据的编码、解码方法及装置
FR3068556A1 (fr) 2017-06-29 2019-01-04 B<>Com Procede de decodage d'une image, procede de codage, dispositifs, equipement terminal et programmes d'ordinateurs associes
WO2019151268A1 (ja) * 2018-01-30 2019-08-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法
TWI731322B (zh) * 2018-03-29 2021-06-21 弗勞恩霍夫爾協會 變換組
TWI783390B (zh) * 2021-02-26 2022-11-11 圓展科技股份有限公司 影像處理系統及產生動態影像分割畫面的方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241395A (en) * 1989-08-07 1993-08-31 Bell Communications Research, Inc. Adaptive transform coding using variable block size
RU2217879C2 (ru) * 1996-12-18 2003-11-27 Томсон Конзьюмер Электроникс, Инк. Процессор многоформатного видеосигнала
US6529634B1 (en) * 1999-11-08 2003-03-04 Qualcomm, Inc. Contrast sensitive variance based adaptive block size DCT image compression
JP2003519945A (ja) * 2000-01-03 2003-06-24 エフェクタ テクノロジーズ コーポレイション データの送信または記憶のための効率的で可逆的な変換
DE10022331A1 (de) 2000-05-10 2001-11-15 Bosch Gmbh Robert Verfahren zur Transformationscodierung von Bewegtbildsequenzen
JP3679083B2 (ja) * 2002-10-08 2005-08-03 株式会社エヌ・ティ・ティ・ドコモ 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム
BRPI0406507B1 (pt) * 2003-02-21 2018-10-16 Matsushita Electric Ind Co Ltd método de codificação de imagem e método de decodificação de imagem
CN100401780C (zh) * 2004-05-07 2008-07-09 美国博通公司 在视频解码器中动态选择变换尺寸的方法和系统
US8116374B2 (en) * 2004-05-07 2012-02-14 Broadcom Corporation Method and system for generating a transform size syntax element for video decoding
CN1589023A (zh) * 2004-08-06 2005-03-02 联合信源数字音视频技术(北京)有限公司 一种基于上下文的多码表变长编解码方法及编解码装置
KR100703770B1 (ko) * 2005-03-25 2007-04-06 삼성전자주식회사 가중 예측을 이용한 비디오 코딩 및 디코딩 방법, 이를위한 장치
JP4889231B2 (ja) 2005-03-31 2012-03-07 三洋電機株式会社 画像符号化方法および装置、画像復号方法
JP2008219205A (ja) 2007-02-28 2008-09-18 Sony Corp 画像情報符号化装置及び画像情報符号化方法
JP4922101B2 (ja) 2007-08-21 2012-04-25 株式会社東芝 情報処理装置およびインター予測モード判定方法
JP4937224B2 (ja) * 2008-09-30 2012-05-23 株式会社東芝 画像符号化装置
CA2742390C (en) * 2008-10-03 2015-05-12 Qualcomm Incorporated Video coding using transforms bigger than 4x4 and 8x8

Also Published As

Publication number Publication date
HK1211399A1 (en) 2016-05-20
US8855203B2 (en) 2014-10-07
JP2015173505A (ja) 2015-10-01
CN102388614A (zh) 2012-03-21
EP2418855A4 (en) 2013-07-24
CN104717505A (zh) 2015-06-17
CN104717503A (zh) 2015-06-17
CN102388614B (zh) 2015-04-29
EP2418855B1 (en) 2017-12-27
EA201690320A2 (ru) 2016-09-30
HK1211398A1 (en) 2016-05-20
CN104717504B (zh) 2018-04-06
CN104717505B (zh) 2019-01-11
EA201690329A1 (ru) 2016-11-30
JP2017028726A (ja) 2017-02-02
HK1211401A1 (en) 2016-05-20
CN104717502B (zh) 2018-06-22
EA201690326A1 (ru) 2016-10-31
JPWO2010116869A1 (ja) 2012-10-18
EA029351B1 (ru) 2018-03-30
WO2010116869A1 (ja) 2010-10-14
CN104717502A (zh) 2015-06-17
HK1211400A1 (en) 2016-05-20
BRPI1014257A2 (pt) 2016-04-12
EA024522B1 (ru) 2016-09-30
EA201690324A1 (ru) 2016-10-31
EP2418855A1 (en) 2012-02-15
CN104717503B (zh) 2018-12-04
BRPI1014257B1 (pt) 2021-03-09
EA029773B1 (ru) 2018-05-31
EA201690320A3 (ru) 2016-10-31
JP6239713B2 (ja) 2017-11-29
MX2011010550A (es) 2011-10-19
US20120033731A1 (en) 2012-02-09
EA029414B1 (ru) 2018-03-30
MY157572A (en) 2016-06-30
CN104717504A (zh) 2015-06-17
EA201101473A1 (ru) 2012-04-30

Similar Documents

Publication Publication Date Title
JP6239713B2 (ja) 動画像符号化装置および動画像復号装置
CN110024392B (zh) 用于视频译码的低复杂度符号预测
US10645410B2 (en) Video decoding apparatus
TWI556632B (zh) 視訊之算術編碼方法及其裝置、以及視訊之算術解碼方法及其裝置
TWI748201B (zh) 適於相依純量量化之變換係數熵寫碼技術
EP3266212A1 (en) Methods of palette coding with inter-prediction in video coding
CN105721878A (zh) Hevc视频编解码中执行帧内预测的图像处理装置及方法
TWI533705B (zh) 用於內容脈絡集選擇之方法及裝置
JP2004350072A (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム及びそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160719

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160805

R155 Notification before disposition of declining of application

Free format text: JAPANESE INTERMEDIATE CODE: R155

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160920

R150 Certificate of patent or registration of utility model

Ref document number: 6012816

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees