JPWO2019077751A1 - 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム - Google Patents

動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム Download PDF

Info

Publication number
JPWO2019077751A1
JPWO2019077751A1 JP2019549088A JP2019549088A JPWO2019077751A1 JP WO2019077751 A1 JPWO2019077751 A1 JP WO2019077751A1 JP 2019549088 A JP2019549088 A JP 2019549088A JP 2019549088 A JP2019549088 A JP 2019549088A JP WO2019077751 A1 JPWO2019077751 A1 JP WO2019077751A1
Authority
JP
Japan
Prior art keywords
picture
block
moving image
divided
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019549088A
Other languages
English (en)
Other versions
JP7004001B2 (ja
Inventor
健士郎 武内
健士郎 武内
ギヨム デニー クリスティアン バル
ギヨム デニー クリスティアン バル
数井 君彦
君彦 数井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2019077751A1 publication Critical patent/JPWO2019077751A1/ja
Priority to JP2021128677A priority Critical patent/JP7156471B2/ja
Application granted granted Critical
Publication of JP7004001B2 publication Critical patent/JP7004001B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

動画像符号化装置は、符号化対象ピクチャを分割して得られる複数のブロックのうち、符号化対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックを四分木構造に従って4分割するか、あるいはピクチャ端ブロックに含まれる符号化対象ピクチャの端部と直交する方向に2分割して、ピクチャ端ブロックを複数のサブブロックに分割する分割パターン判定部と、各サブブロックについて、符号化済みの他のピクチャあるいは符号化対象ピクチャの符号化済みの領域を参照して予測ブロックを生成する予測ブロック生成部と、各サブブロックについて、そのサブブロックと対応する予測ブロックの対応画素間の予測誤差を算出し、予測誤差を符号化する符号化部と、ピクチャ端ブロックについて4分割されたか2分割されたかを表す分割情報を、符号化された動画像データに付加する付加部とを有する。

Description

本発明は、例えば、動画像データを符号化する動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム、ならびに、符号化された動画像データを復号する動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラムに関する。
動画像データは、一般に非常に大きなデータ量を有する。そのため、動画像データを扱う装置は、動画像データを他の装置へ送信しようとする場合、あるいは、動画像データを記憶装置に記憶しようとする場合、動画像データを符号化することにより圧縮する。代表的な動画像の符号化標準として、Advanced Video Coding(MPEG-4 AVC|ITU-T H.264)及びHigh Efficiency Video Coding(HEVC|ITU-T H.265)が策定されている(例えば、非特許文献1を参照)。
このような符号化標準では、符号化対象のピクチャはブロックごとに分割される。そして符号化対象となるブロックごとに、既に符号化された他のピクチャまたは符号化対象ピクチャの符号化済みの領域から予測ブロックが生成され、符号化対象となるブロックと予測ブロック間の差分を符号化することで冗長性が削減される。
例えば、HEVCでは、動画像データに含まれる各ピクチャは複数の段階で分割される。そこで先ず、HEVCにおける、ピクチャの分割について説明する。
図1は、HEVCによる、ピクチャの分割の一例を示す図である。図1に示されるように、ピクチャ100は、符号化処理の単位であるCoding Tree Unit(CTU)(あるは、Largest Coding Unit(LCU)とも呼ばれる)単位で分割される。各CTU101は、ラスタスキャン順に符号化される。CTU101のサイズは、64x64〜16x16画素の中から選択できる。
CTU101は、さらに、四分木構造で複数のCoding Unit(CU)102に分割される。一つのCTU101内の各CU102は、Zスキャン順に符号化される。CU102のサイズは可変であり、そのサイズは、CU分割モード8x8〜64x64画素の中から選択される。CU102は、符号化モードであるイントラ予測符号化方式とインター予測符号化方式を選択する単位となる。なお、イントラ予測符号化方式は、符号化対象ピクチャの符号化済みの領域を参照して予測ブロックを生成する符号化方式である。また、インター予測符号化方式は、既に符号化された他のピクチャを復号して得られる参照ピクチャ(局所復号ピクチャとも呼ばれる)を参照して予測ブロックを生成する符号化方式である。
CU102は、Prediction Unit(PU)103単位またはTransform Unit(TU)104単位で個別に処理される。PU103は、符号化モードに応じた予測が行われる、予測ブロックの生成単位となる。例えば、PU103は、イントラ予測符号化方式では、予測ブロックの生成の際に参照される画素及び予測ブロックの生成方法を規定する予測モードが適用される単位となる。一方、インター予測符号化方式では、PU103は、動き補償を行う単位となる。PU103のサイズは、例えば、インター予測符号化方式が適用される場合、2Nx2N, NxN, 2NxN, Nx2N, 2NxU, 2NxnD, nRx2N, nLx2N(Nは、CUサイズ/2)の中から選択可能である。一方、TU104は、直交変換の単位であり、TUごとに直交変換される。TU104のサイズは、4x4画素〜32x32画素の中から選択される。TU104は、四分木構造で分割され、Zスキャン順に処理される。
なお、CTUは、ピクチャを分割して得られるブロックの一例である。またCUは、ブロックの他の一例である。さらに、CUは、ブロックを分割して得られるサブブロックの一例でもある。
HEVCでは、CUが正方形となるようにCTUは分割される。しかし、ピクチャの水平方向のサイズまたは垂直方向のサイズが、CTUの水平方向または垂直方向のサイズの整数倍でない場合、右端または下端のCTUでは、そのCTU内にピクチャ端が含まれることになる。この場合、ピクチャ外の情報が含まれないようにそのCTUを符号化するためには、CU間の境界とピクチャ端とが一致するように、すなわち、何れかのCU内にピクチャ端が含まれないように、そのCTUは分割されることが好ましい。しかし、何れかのCU内にピクチャ端が含まれないようにCTUを分割するためには、CUのサイズを小さくして、CTU内に含まれるCUの数を増やすことが求められることがある。このような場合、CTUの符号化データに含まれるシンタックスの情報が増加して符号化効率が低下することがある。
一方、より符号化効率を向上するために、CTUが四分木構造で複数のサブブロックに分割された後、個々のサブブロックを二分木構造でさらに分割することで個々のCUを決定することが提案されている(例えば、非特許文献2を参照)。この場合、CUは、長方形となることがある。
しかし、上記のように二分木構造が適用される場合でも、既に正方形状に分割されたサブブロック同士が連結されることは無いので、ピクチャ端を含むCTUについては、CUのサイズが大きくなるように、CTUを分割できないことがある。
また、マクロブロックサイズ未満のサイズとなるエッジブロックを判別する技術が提案されている。この技術では、エッジブロックと判別された非正方領域のサイズ、またはエッジブロックを水平方向と垂直方向の何れか一方の方向に分割して得られる複数の非正方領域のサイズのうち、符号化効率が高い方のサイズが検出される(例えば、特許文献1を参照)。
特開2011−223303号公報
ITU-T Recommendation H.265 | ISO/IEC 23008-2 "High Efficiency Video Coding"、2013年4月 J.An他、 "Block partitioning structure for next generation video coding"、ITU-T SG16 Doc. COM16-C966、2015年9月
しかしながら、動画像符号化装置は、エッジブロックを非正方領域として符号化する場合でも、エッジブロックの分割パターンを表すシンタックスを符号化動画像データに含めることになる。そのため、非正方領域であるエッジブロックの分割パターンの種類が増えるほど、符号量が増加し、その結果として、符号化効率が低下する。
一つの側面では、本発明は、ピクチャ端が符号化処理の単位となるブロック内に含まれる場合でも、符号化効率を向上できる動画像符号化装置を提供することを目的とする。
一つの実施形態によれば、動画像データに含まれる符号化対象ピクチャを符号化する動画像符号化装置が提供される。この動画像符号化装置は、符号化対象ピクチャを分割して得られる複数のブロックのうち、符号化対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックを四分木構造に従って4分割するか、あるいはピクチャ端ブロックに含まれる符号化対象ピクチャの端部と直交する方向に2分割することで、何れのサブブロックにも符号化対象ピクチャの端部が含まれないように、ピクチャ端ブロックを複数のサブブロックに分割する分割パターン判定部と、複数のサブブロックのそれぞれについて、符号化済みの他のピクチャあるいは符号化対象ピクチャの符号化済みの領域を参照して予測ブロックを生成する予測ブロック生成部と、複数のサブブロックのそれぞれについて、そのサブブロックと対応する予測ブロックの対応画素間の予測誤差を算出し、予測誤差を符号化する符号化部と、ピクチャ端ブロックについて4分割されたか2分割されたかを表す分割情報を、符号化された動画像データに付加する付加部とを有する。
また他の実施形態によれば、符号化された動画像データに含まれる復号対象ピクチャを復号する動画像復号装置が提供される。この動画像復号装置は、復号対象ピクチャを分割して得られる複数のブロックのうち、復号対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックが四分木構造に従って4分割されたか、あるいは2分割されたかを表す、符号化された動画像データに含まれる分割情報を参照して、ピクチャ端ブロックを四分木構造に従って4分割するか、あるいはピクチャ端ブロックに含まれる復号対象ピクチャの端部と直交する方向に2分割することで、何れのサブブロックにも復号対象ピクチャの端部が含まれないように、ピクチャ端ブロックを複数のサブブロックに分割する分割パターン判定部と、複数のサブブロックのそれぞれについて、復号済みの他のピクチャあるいは復号対象ピクチャの復号済みの領域を参照して予測ブロックを生成する予測ブロック生成部と、複数のサブブロックのそれぞれについて、符号化された動画像データに含まれる、そのサブブロックと対応する予測ブロックの対応画素間の予測誤差に、予測ブロックの対応画素の値を加算することでピクチャ端ブロックを復号する復号部とを有する。
一つの側面では、本明細書に開示された動画像符号化装置は、ピクチャ端が符号化処理の単位となるブロック内に含まれる場合でも、符号化効率を向上できる。
図1は、HEVCによる、ピクチャの分割の一例を示す図である。 図2は、ピクチャ端を含むCTUの分割の一例を示す図である。 図3は、一つの実施形態に係る動画像符号化装置の概略構成図である。 図4は、ピクチャの下端を含むCTUの分割の一例を示す図である。 図5は、ピクチャの右端を含むCTUの分割の一例を示す図である。 図6は、ピクチャの下端と右端の両方を含むCTUの分割の一例を示す図である。 図7は、符号化モード判定部による、分割パターン及び符号化モード判定処理の動作フローチャートである。 図8は、動画像符号化処理の動作フローチャートである。 図9は、動画像復号装置の概略構成図である。 図10は、分割パターン判定部による、分割パターン判定処理の動作フローチャートである。 図11は、動画像復号処理の動作フローチャートである。 図12は、実施形態またはその変形例による動画像符号化装置または動画像復号装置の各部の機能を実現するコンピュータプログラムが動作することにより、動画像符号化装置または動画像復号装置として動作するコンピュータの構成図である。
以下、図を参照しつつ、動画像符号化装置について説明する。
最初に、ピクチャ端を含むCTUの分割について説明する。
図2は、ピクチャ端を含むCTUの分割の一例を示す図である。この例では、ピクチャ200の水平方向サイズ及び垂直方向サイズの何れも、CTUサイズの整数倍でないため、ピクチャ200の右端及び下端のそれぞれは、右端または下端のCTU内に含まれる。このうち、ピクチャ200の下端を含むCTU201に着目すると、分割パターン210に示されるように、CTU201は、何れのCU202にもピクチャ端220が含まれないように分割される。その際、四分木構造を用いて、ピクチャ端220とCU202同士の境界とが一致するようCTU201を分割するために、CTU201の1/4のサイズのCU202が用いられることとなる。その結果として、この例では、CTU201は、6個のCU202で分割されることになる。また、四分木構造を用いてCTU201を分割した後に、二分木構造を用いてさららに各CU202を分割するとしても、より多くのCUを用いてCTU201が分割されることになる。
一方、ピクチャ端が含まれるCTU201を、最初から二分木構造を適用して分割する場合には、分割パターン211に示されるような、正方形でないCU203を用いてCTU201を分割することが可能となる。しかし、四分木構造を適用してCTUを複数のサブブロックに分割してから個々のサブブロックに二分木構造を適用する従来技術では、CTU201は、先ず、正方形状のサブブロックに分割される。そのため、CTU201を、分割パターン211のように分割することは許可されない。
そこで、本実施形態では、動画像符号化装置は、ピクチャの右端及び下端の何れか一方が含まれるブロックを、四分木構造のサブブロック(正方形)と二分木構造のサブブロック(長方形)のうち、符号化コストが低い方のサブブロックを用いて分割する。そしてこの動画像符号化装置は、ピクチャ端を含むブロックについて、四分木構造が適用されたか二分木構造が適用されたかを表すシンタックスを符号化動画像データに付加する。
また、図2に示されるように、ピクチャの下端が含まれるブロックに二分木構造を適用してそのブロックを複数のサブブロックに分割する場合、サブブロックの数を少なくするためには、そのブロックをピクチャ端と直交する方向に沿って分割することが好ましい。すなわち、ピクチャの下端が含まれるブロックは、サブブロック間の境界線がピクチャ端と平行となるように分割されることが好ましい。したがって、ピクチャの下端が含まれるブロックは、サブブロック間の境界線が水平となるように、垂直方向に沿って分割されることが好ましい。同様に、ピクチャの右端が含まれるブロックに二分木構造を適用する場合、そのブロックは、サブブロック間の境界線が垂直となるように、水平方向に沿って分割されることが好ましい。そのため、動画像符号化装置は、二分木構造が適用されるブロックについての分割方向は符号化動画像データに含めなくてよい。また、動画像符号化装置は、ピクチャの下端と右端の両方を含むブロックについては、四分木構造を適用して分割する。
なお、ピクチャは、フレームまたはフィールドの何れであってもよい。フレームは、動画像データ中の一つの静止画像であり、一方、フィールドは、フレームから奇数行のデータあるいは偶数行のデータのみを取り出すことにより得られる静止画像である。
また本実施形態では、動画像符号化装置は、HEVCのように、ピクチャをCTU単位で分割して、CTU単位で符号化するものとする。しかし、動画像符号化装置は、ピクチャを複数のブロックに分割してブロックごとに符号化する他の符号化標準に準拠して動画像データを符号化してもよい。
図3は、一つの実施形態による動画像符号化装置の概略構成図である。動画像符号化装置1は、動き探索部11と、符号化モード判定部12と、予測ブロック生成部13と、予測符号化部14と、復号部15と、記憶部16と、エントロピー符号化部17とを有する。
動画像符号化装置1は、符号化対象のピクチャについて、各CTUをラスタスキャン順に符号化する。そこで、以下では、動画像符号化装置1の各部について、一つのCTUに対する処理を例として説明する。
動き探索部11は、符号化対象CTUを含む符号化対象ピクチャがインター予測符号化方式が適用可能なPピクチャまたはBピクチャである場合、符号化対象CTUについて適用可能なPUごとに動きベクトルを算出する。なお、輝度成分は、第1の成分の一例である。また、符号化対象ピクチャの種別は、例えば、制御部(図示せず)が符号化対象の動画像データに適用するGroup Of Pictures(GOP)の構造及び符号化対象ピクチャのGOP内での位置に基づいて決定される。
動き探索部11は、符号化対象CTUの着目するPUについて、少なくとも一つの局所復号ピクチャのそれぞれについての参照可能な領域に対してブロックマッチングを行って、着目するPUと最も一致する参照ブロックを特定する。そして動き探索部11は、着目するPUと参照ブロック間の移動量を表すベクトルを動きベクトルとして算出する。なお、動き探索部11は、符号化対象ピクチャが双方向予測符号化モードを適用可能なBピクチャである場合、L0予測とL1予測の両方について動きベクトルを算出する。動き探索部11は、各PUの動きベクトル及びその動きベクトルで参照される局所復号ピクチャを表す情報を、記憶部16に記憶するとともに、符号化モード判定部12へ通知する。
符号化モード判定部12は、分割パターン判定部の一例であり、符号化対象CTUを分割するCU、PU及びTUの分割パターン及びCUごとに適用される符号化モードを決定する。符号化モード判定部12は、例えば、図示しない制御部から取得した、符号化対象CTUが含まれる符号化対象のピクチャのタイプを示す情報に基づいて、そのCTUに適用可能な符号化モードを決定する。そして符号化モード判定部12は、適用可能な符号化モードの中から、実際に適用する符号化モードを選択する。符号化対象のピクチャのタイプがイントラ予測符号化方式のみが適用可能なIピクチャであれば、符号化モード判定部12は、適用される符号化モードとしてイントラ予測符号化方式を選択する。また、符号化対象のピクチャのタイプが、PピクチャまたはBピクチャであれば、符号化モード判定部12は、例えば、適用される符号化モードとして、インター予測符号化方式及びイントラ予測符号化方式の何れかを選択する。
符号化モード判定部12は、適用可能な符号化モードについての符号化対象CTUの符号化されたデータ量の評価値である符号化コストをCU単位でそれぞれ算出する。例えば、符号化モード判定部12は、インター予測符号化方式については、CTUを分割するCU分割パターン、PU分割パターン及び動きベクトルの予測ベクトルの生成方法を規定するベクトルモードの組み合わせごとに符号化コストを算出する。なお、符号化モード判定部12は、ベクトルモードとして、例えば、Adaptive Motion Vector Prediction(AMVP)モード、及び、Mergeモードの何れかを利用できる。
また、イントラ予測符号化方式については、符号化モード判定部12は、CTUを分割するCU分割パターン、PU分割パターン及びピクチャ内での参照方向を規定する予測モードの組み合わせごとに符号化コストを算出する。
符号化モード判定部12は、符号化コストを算出するために、例えば、着目するPUについて、次式に従って、予測誤差、すなわち画素差分絶対値和SADを算出する。
SAD=Σ|OrgPixel-PredPixel|
ここで、OrgPixelは着目するPUに含まれる画素の値であり、PredPixelは着目するブロックに対応する、符号化コストの算出対象となる符号化モードに従って生成された予測ブロックに含まれる画素の値である。
そして符号化モード判定部12は、例えば、次式に従って、着目するCUについての符号化コストCostを算出する。
Cost=ΣSAD + λ*B
ここで、ΣSADは、着目するCUに含まれる各PUについて算出されたSADの総和である。またBは、動きベクトル、予測モードを表すフラグなど、予測誤差以外の項目についての符号量の推定値である。そしてλはラグランジュの未定乗数である。
なお、符号化モード判定部12は、SADの代わりに、着目するPUと予測ブロックとの差分画像をアダマール変換した後の各画素のアダマール係数の絶対値和SATDを算出してもよい。
符号化モード判定部12は、符号化対象CTUについて、例えば、取り得るCUサイズの中でサイズが大きい方から順に着目するCUを設定する。そして符号化モード判定部12は、着目するCUについて、イントラ予測符号化方式に関してそのCU内のPU分割パターンごとにコストが最小となる予測モードを選択する。また、符号化モード判定部12は、着目するCUについて、インター予測符号化方式に関してそのCU内のPU分割パターンごとにコストが最小となるベクトルモードを選択する。さらに、符号化モード判定部12は、同サイズのCUごとに、イントラ予測符号化方式とインター予測符号化方式のうちで、符号化コストが小さい方を、そのCUについて適用する符号化モードとして選択する。
さらに、符号化モード判定部12は、着目するCUにピクチャ端が含まれない場合、着目するCUを四分木構造に従って4分割したCUのそれぞれを、次に着目するCUとして、同様の処理を実行して、最小符号化コストを算出する。そして符号化モード判定部12は、分割したCUのそれぞれについて算出された、最小符号化コストの総和が、着目するCUについての最小符号化コストよりも小さければ、着目するCUを四分木構造に従って4分割する。符号化モード判定部12は、各CUが分割されなくなるまで、上記の処理を繰り返すことで、符号化対象CTUに適用されるCU分割パターン及びPU分割パターンを決定する。
また、着目するCTUまたはCU(以下、着目するブロックと呼ぶ)がピクチャの右端及び下端の両方を含む場合、符号化モード判定部12は、着目するブロックを四分木構造に従って4分割する。これは、着目するブロック内にピクチャの右端と下端の両方が含まれる場合、ピクチャの右端と下端の両方が何れのCUにも含まれないようにするためには、着目するブロックを水平方向と垂直方向の両方について分割することが求められるためである。
さらに、着目するブロックがピクチャの右端を含み、かつ、ピクチャの下端を含まない場合、符号化モード判定部12は、着目するブロックを四分木構造に従って4個のサブブロックに分割する。さらに、符号化モード判定部12は、着目するブロックを二分木構造に従って水平方向に2個のサブブロックに分割する。同様に、着目するブロックがピクチャの下端を含み、かつ、ピクチャの右端を含まない場合、符号化モード判定部12は、着目するブロックを四分木構造に従って4個のサブブロックに分割し、かつ、着目するブロックを垂直方向に2個のサブブロックに分割する。
なお、着目するブロックを分割して得られた何れかのサブブロックに、ピクチャ端が含まれる場合、符号化モード判定部12は、上記のように、ピクチャ端を含むサブブロックをさらに4分割または2分割する。符号化モード判定部12は、何れのサブブロックにもピクチャ端が含まれなくなるまで、上記の処理を繰り返す。
ただし、符号化モード判定部12は、一旦二分木構造が適用され、かつ、水平方向に沿って分割されたブロックについては、そのブロックを分割して得られる各サブブロックのうち、ピクチャ端を含むものについても、二分木構造に従って、かつ、水平方向に沿って分割する。同様に、符号化モード判定部12は、一旦二分木構造が適用され、かつ、垂直方向に沿って分割されたブロックのうち、ピクチャ端を含むものについては、そのブロックを分割して得られる各サブブロックについても、二分木構造に従って、かつ、垂直方向に沿って分割する。
符号化モード判定部12は、得られたサブブロックの組み合わせごとに、上記と同様の処理を行って符号化コストを算出する。そして符号化モード判定部12は、符号化コストが最小となるサブブロックの組み合わせを選択し、選択した組み合わせに含まれる個々のサブブロックをそれぞれ一つのCUとすればよい。
図4は、ピクチャの下端を含むCTUの分割の一例を示す図である。図4に示される例では、CTU400に、ピクチャの下端401が含まれている。そのため、符号化モード判定部12は、CTU400に四分木構造を適用して、4個の正方形のCU410−1〜410−4に分割するか、二分木構造を適用して、垂直方向に2個のCU420−1、420−2に分割する。そして符号化モード判定部12は、CU410−1及びCU410−2については、ピクチャの下端401が含まれないので、四分木構造に従ってさらに4分割してもよい。符号化モード判定部12は、CU410−1及びCU410−2を4分割するか否かを、符号化コストに基づいて決定すればよい。また、符号化モード判定部12は、CU410−3及びCU410−4については、ピクチャの下端401が含まれるので、四分木構造に従って4分割するか、あるいは、二分木構造に従って垂直方向に2分割する。
符号化モード判定部12は、ピクチャの下端401が含まれないCU420−1についても、二分木構造に従ってさらに垂直方向に2分割してもよい。符号化モード判定部12は、CU420−1を2分割するか否かは、符号化コストに基づいて決定すればよい。また、符号化モード判定部12は、ピクチャの下端401が含まれるCU420−2については、二分木構造に従ってさらに垂直方向に、CU421−1とCU421−2とに2分割する。
最終的に、全てのCUにピクチャの下端401が含まれなくなったときのCUの組み合わせのそれぞれについて、CUごとに算出される符号化コストの合計が算出され、その合計が最小となるCUの組み合わせに従って、CTU400は分割される。例えば、CU420−1とCU421−1の組み合わせについての符号化コストの合計が最小となる場合、CTU401は、CU420−1とCU421−1とに分割される。そして符号化モード判定部12は、CTUまたはCUを分割する度に、そのCTUまたはCUに対して四分木構造と二分木構造の何れが適用されたかを表すシンタックスを生成し、そのシンタックスをエントロピー符号化部17へ通知する。なお、四分木構造と二分木構造の何れが適用されたかを表すシンタックスは、分割情報の一例である。ただし、二分木構造を適用して得られたCUについては、そのCUがさらに分割される場合でも、四分木構造は適用されないので、四分木構造と二分木構造の何れが適用されたかを表すシンタックスは生成されなくてよい。
図5は、ピクチャの右端を含むCTUの分割の一例を示す図である。図5に示される例では、CTU500に、ピクチャの右端501が含まれている。そのため、符号化モード判定部12は、CTU500に四分木構造を適用して、4個の正方形のCU510−1〜510−4に分割するか、二分木構造を適用して、水平方向に2個のCU520−1、520−2に分割する。そして符号化モード判定部12は、CU510−1及びCU510−3については、ピクチャの右端501が含まれないので、四分木構造に従ってさらに4分割してもよい。符号化モード判定部12は、CU510−1及びCU510−3を4分割するか否かを、符号化コストに基づいて決定すればよい。また、符号化モード判定部12は、CU510−2及びCU510−4については、ピクチャの右端501が含まれるので、四分木構造に従って4分割するか、あるいは、二分木構造に従って水平方向に2分割する。また、符号化モード判定部12は、ピクチャの右端501が含まれるCU520−2については、二分木構造に従ってさらに水平方向に、CU521−1とCU521−2とに2分割する。
最終的に、全てのCUにピクチャの右端501が含まれなくなったときのCUの組み合わせのそれぞれについて、CUごとに算出される符号化コストの合計が算出され、その合計が最小となるCUの組み合わせに従って、CTU500は分割される。
図6は、ピクチャの下端と右端の両方を含むCTUの分割の一例を示す図である。図6に示される例では、CTU600に、ピクチャの右端601とピクチャの下端602とが含まれている。そのため、符号化モード判定部12は、CTU600に四分木構造を適用して、4個の正方形のCU610−1〜610−4に分割する。そして符号化モード判定部12は、CU610−1については、ピクチャの右端601及びピクチャの下端602の両方が含まれないので、四分木構造に従ってさらに4分割してもよい。符号化モード判定部12は、CU610−1を4分割するか否かは、符号化コストに基づいて決定すればよい。また、符号化モード判定部12は、CU610−3については、ピクチャの下端602が含まれるので、ピクチャの下端602がCU内に含まれなくなるまで、図4に示されるCTU400と同様に、四分木構造または二分木構造に従って分割を繰り返せばよい。なお、CU610−2及びCU610−4にはピクチャが含まれないので、CU610−2及びCU610−4は無視される。
さらに、符号化モード判定部12は、上記のようにして決定したCU分割パターンに従ったCUごとに、TU分割パターンを決定する。その際、符号化モード判定部12は、適用可能なTU分割パターンごとに、次式に従ってRDコストCostを算出する。
Figure 2019077751
ここで、org(i)は、着目するCUに含まれる画素の値であり、ldec(i)は、着目するTU分割パターンを用いてそのCUを符号化し、さらに復号して得られる復号画素の値を表す。またbitは、そのCUを着目するTU分割パターンを用いて符号化したときの符号量を表す。(1)式の右辺の第一項は、符号化歪みを表し、右辺の第二項は符号量を表す。そのため、RDコストが最小となるTU分割パターンでは、符号化歪みと符号量が最適なバランスとなっている。
そこで、符号化モード判定部12は、RDコストCostが最小となるTU分割パターンを選択する。
符号化モード判定部12は、符号化対象CTUについて選択したCU及びPUの分割パターン及び符号化モードの組み合わせを予測ブロック生成部13に通知し、TU分割パターンを予測符号化部14へ通知する。また符号化モード判定部12は、符号化対象CTUについて選択したCU、PU及びTUの分割パターン及び符号化モードの組み合わせを記憶部16に保存する。なお、CTUを個々のCUに分割する分割パターンを表す情報は、例えば、CTUを再帰的に分割して得られる個々のサブブロックについて、分割されたか否かを表す情報を含む。さらに、符号化モード判定部12は、ピクチャ端を含むCTUと、そのCTUを再帰的に分割して得られる個々のサブブロックのうち、ピクチャ端を含むサブブロックについて、4分木構造が適用されたか二分木構造が適用されたかを表すシンタックスを生成する。そして符号化モード判定部12は、そのシンタックスをエントロピー符号化部17へわたす。
図7は、符号化モード判定部12による、分割パターン及び符号化モード判定処理の動作フローチャートである。
符号化モード判定部12は、着目するブロックにピクチャの端部が含まれるか否か判定する(ステップS101)。なお、一番最初の着目するブロックは、符号化対象CTUである。
着目するブロックにピクチャの端部が含まれない場合(ステップS101−No)、符号化モード判定部12は、符号化コストが最小化されるように、着目するブロックを分割する(ステップS102)。なお、着目するブロックを分割しない方が符号化コストが小さい場合、着目するブロックはそれ以上分割されなくてもよい。一方、着目するブロックにピクチャの端部が含まれる場合(ステップS101−Yes)、符号化モード判定部12は、着目するブロックにピクチャの右端と下端の両方が含まれるか否か判定する(ステップS103)。
着目するブロックにピクチャの右端と下端の両方が含まれる場合(ステップS103−Yes)、符号化モード判定部12は、着目するブロックを四分木構造に従って4分割する(ステップS104)。一方、着目するブロックに含まれるピクチャ端がピクチャの右端または下端の何れか一方である場合(ステップS103−No)、符号化モード判定部12は、着目するブロックを含むブロックは2分割されたか否か判定する(ステップS105)。
着目するブロックを含むブロックが2分割されている場合(ステップS105−Yes)、符号化モード判定部12は、着目するブロックも2個のサブブロックに分割する(ステップS106)。その際、符号化モード判定部12は、着目するブロックを含むブロックについての分割方向と同じ方向に沿って、着目するブロックも分割すればよい。
一方、着目するブロックを含むブロックが2分割されていない場合(ステップS105−No)、符号化モード判定部12は、着目するブロックを4分割して正方形の4個のサブブロックを生成する。さらに、符号化モード判定部12は、着目するブロックをピクチャ端と直交する方向に沿って2分割して長方形の2個のサブブロックを生成する(ステップS107)。
ステップS102、S104、S106またはS107の後、符号化モード判定部12は、ピクチャ端を含むサブブロックがあるか否か判定する(ステップS108)。何れかのサブブロックにピクチャ端が含まれる場合(ステップS108−Yes)、符号化モード判定部12は、各サブブロックをそれぞれ着目するブロックに設定する(ステップS109)。そして符号化モード判定部12は、着目するブロックごとに、ステップS101以降の処理を実行する。
一方、何れのサブブロックにもピクチャ端が含まれない場合(ステップS108−No)、符号化モード判定部12は、得られたブロックの組み合わせの中から、符号化コストが最小化となる組み合わせを選択する。そして符号化モード判定部12は、選択した組み合わせに従って、CU、PU及びTUのそれぞれの分割パターン、適用される符号化モードを決定する(ステップS110)。そして符号化モード判定部12は、分割パターン及び符号化モード判定処理を終了する。
予測ブロック生成部13は、符号化対象CTUについて選択されたCU及びPUの分割パターン及び符号化モードの組み合わせに従ってPUごとに予測ブロックを生成する。
例えば、着目するPUがイントラ予測符号化される場合、予測ブロック生成部13は、そのPUについて選択された予測モードに従って参照される、そのPUの周囲の局所復号ブロック内の画素の値に基づいて予測ブロックを生成する。一方、予測ブロック生成部13は、着目するPUがインター予測符号化される場合、記憶部16から読み出した、そのPUについて参照される局所復号ピクチャを、そのPUについて算出された動きベクトルに基づいて動き補償することで予測ブロックを生成する。
予測ブロック生成部13は、生成された予測ブロックを予測符号化部14及び復号部15へ渡す。
予測符号化部14は、符号化対象CTUを予測符号化する。
予測符号化部14は、符号化対象CTU内の各画素について、予測ブロックの対応画素との差分演算を実行する。そして予測符号化部14は、符号化対象CTU内の各TUについて、その差分演算により得られたTU内の各画素に対応する差分値を、そのTUの各画素の予測誤差信号とする。
さらに、予測符号化部14は、インター予測符号化される各PUについて、符号化モード判定部12により適用されると判定されたベクトルモードに従ってそのPUの予測ベクトルの候補のリストを作成する。そして予測符号化部14は、そのPUの動きベクトルと各予測ベクトルの候補間の予測誤差信号を算出する。予測符号化部14は、インター予測符号化される各PUについて、各予測ベクトルの候補について算出された予測誤差信号に基づいて、各予測ベクトルの候補の中から予測ベクトルを決定する。そして予測符号化部14は、各PUの動きベクトルについて、予測ベクトルの候補のリスト中で予測ベクトルを特定する情報、及び、動きベクトルと予測ベクトル間の予測誤差信号などをエントロピー符号化部17へわたす。
また、予測符号化部14は、符号化対象CTU内の各TUについて、そのTUの予測誤差信号を直交変換することで予測誤差信号の水平方向の周波数成分及び垂直方向の周波数成分を表す直交変換係数を求める。例えば、予測符号化部14は、予測誤差信号に対して、直交変換処理として離散コサイン変換(Discrete Cosine Transform, DCT)を実行することにより、直交変換係数として、DCT係数の組を得る。
そして予測符号化部14は、符号化対象CTUにおいて、TUごとの直交変換係数を、量子化幅を指定するqp値などを含む量子化パラメータに従って量子化することにより、量子化された直交変換係数を算出する。なお、以下では、量子化された直交変換係数を、単に量子化係数と呼ぶことがある。
予測符号化部14は、量子化された直交変換係数を復号部15及びエントロピー符号化部17へ出力する。
復号部15は、符号化対象CTU内の各TUの量子化係数から、そのTUよりも後のCUなどを符号化するために参照される局所復号ブロックを生成し、その局所復号ブロックを記憶部16に記憶する。
復号部15は、各TUの量子化された量子化係数を逆量子化することで、量子化前の直交変換係数を復元する。例えば、復号部15は、TUごとに、復元された直交変換係数に対して逆直交変換を行う。例えば、予測符号化部14が直交変換としてDCTを用いている場合、復号部15は、逆直交変換として逆DCT処理を実行する。これにより、復号部15は、TUごとに、符号化前の予測誤差信号と同程度の情報を有する予測誤差信号を復元する。
復号部15は、TUごとに、そのTUの予測ブロックの各画素値に、復元された予測誤差信号を加算することで、局所復号ブロックを生成する。
復号部15は、局所復号ブロックを生成する度に、その局所復号ブロックを記憶部16に記憶させる。
さらに、復号部15は、1枚のピクチャ分の局所復号ブロックを各CTUの符号化順序に従って結合することで得られる局所復号ピクチャを記憶部16に書き込む。
記憶部16は、復号部15から受け取った局所復号ブロックを一時的に記憶する。記憶部16は、動き探索部11、符号化モード判定部12及び予測ブロック生成部13に、局所復号ピクチャまたは局所復号ブロックを供給する。なお、記憶部16は、符号化対象ピクチャが参照する可能性がある、予め定められた所定枚数分の局所復号ピクチャを記憶し、局所復号ピクチャの枚数がその所定枚数を超えると、符号化順序が古い局所復号ピクチャから順に破棄する。
さらに、記憶部16は、インター予測符号化された局所復号ブロックのそれぞれについての動きベクトルを記憶する。さらにまた、記憶部16は、各CTUについて選択したCU、PU及びTUの分割パターン及び符号化モードの組み合わせを記憶する。
エントロピー符号化部17は、付加部の一例であり、符号化対象CTUの各TUの量子化係数及び各種シンタックスなどをエントロピー符号化する。またエントロピー符号化部17は、インター予測符号化される各PUについて、予測ベクトルの候補のリスト中で予測ベクトルを特定する情報などもエントロピー符号化する。なお、シンタックスには、ピクチャ端を含むCTUについて、そのCTU及びそのCTUを再帰的に分割して得られ、かつ、ピクチャ端を含むサブブロックごとに、四分木構造と二分木構造のうちの適用された方を表すシンタックスが含まれる。
本実施形態では、エントロピー符号化部17は、エントロピー符号化方式として、Context-based Adaptive Binary Arithmetic Coding(CABAC)といった算術符号化処理を用いる。そしてエントロピー符号化部17は、エントロピー符号化により得られたビットストリームを出力する。
エントロピー符号化部17により出力された各CTUのビットストリームは所定の順序で結合され、HEVCで規定されるヘッダ情報などを付加することで、符号化された動画像データを含む符号化ビットストリームが得られる。動画像符号化装置1は、その符号化ビットストリームを磁気記録媒体、光記録媒体あるいは半導体メモリなどを有する記憶装置(図示せず)に記憶するか、あるいはその符号化ビットストリームを他の機器へ出力する。
図8は、動画像符号化装置1により実行される、動画像符号化処理の動作フローチャートである。動画像符号化装置1は、CTUごとに以下に示される動作フローチャートに従って動画像符号化処理を実行する。
動き探索部11は、符号化対象CTU内のインター予測符号化方式を適用可能な各PUについて動きベクトルを算出する(ステップS201)。そして動き探索部11は、各PUの動きベクトルを符号化モード判定部12へ通知する。なお、符号化対象CTUが含まれる符号化対象ピクチャがBピクチャである場合には、L0方向及びL1方向のそれぞれについて動きベクトルを算出する。また、符号化対象ピクチャがIピクチャである場合には、ステップS201の処理は省略されてもよい。
符号化モード判定部12は、符号化対象CTUについて、符号化コストが最小化されるように、CU、PU及びTUのそれぞれの分割パターン、適用される符号化モードを決定する(ステップS202)。そして符号化モード判定部12は、CU及びPUの分割パターン、適用される符号化モードを予測ブロック生成部13に通知するとともに、TU分割パターンを予測符号化部14に通知する。また、符号化モード判定部12は、CU、PU及びTUのそれぞれの分割パターン及び適用される符号化モードを記憶部16に記憶する。
予測ブロック生成部13は、決定されたCU及びPUの分割パターン、適用される符号化モードに応じて予測ブロックを生成する(ステップS203)。そして予測ブロック生成部13は、生成した予測ブロックを予測符号化部14及び復号部15へわたす。
予測符号化部14は、符号化対象CTUと予測ブロックの対応画素間の予測誤差信号を算出する(ステップS204)。そして予測符号化部14は、各画素の予測誤差信号をTUごとに直交変換することで、TUごとに直交変換係数を算出する(ステップS205)。さらに、予測符号化部14は、符号化対象CTUの各TUの直交変換係数を量子化して量子化係数を算出する(ステップS206)。そして予測符号化部14は、各TUの量子化係数を復号部15及びエントロピー符号化部17へ出力する。
復号部15は、符号化対象CTUの各TUについての量子化係数から予測誤差信号を復元し、復元した予測誤差信号と対応する予測ブロックとに基づいてそのCTUに対応する局所復号ブロックを生成する(ステップS207)。そして復号部15は、局所復号ブロックを記憶部16に記憶する。
エントロピー符号化部17は、量子化係数及び各種シンタックスなどをエントロピー符号化する(ステップS208)。各種シンタックスには、ピクチャ端を含むCTUまたはCUについて、四分木構造及び二分木構造の何れが適用されたかを表すシンタックスも含まれる。エントロピー符号化部17は、得られた符号化ビットストリームを出力する。そして動画像符号化装置1は、一つのCTUに対する動画像符号化処理を終了する。
以上に説明してきたように、この動画像符号化装置は、ピクチャの右端及び下端の何れか一方を含むブロックを、四分木構造及びピクチャ端と直交する方向の二分木構造のうち、符号化コストが小さい方に従って分割する。そのため、この動画像符号化装置は、ピクチャ端を含むブロックに最初から二分木構造を適用することもできるので、ピクチャ端を含むブロックが過度に細かく分割されることを防止できる。さらに、この動画像符号化装置は、ピクチャ端を含むブロックについて、四分木構造と二分木構造のうちの適用された方を表すシンタックスを符号化された動画像データに付加する。一方、二分木構造が適用されたブロックについて、分割方向を表すシンタックスは符号化された動画像データに付加されなくてよい。そのため、この動画像符号化装置は、符号化動画像データに含まれる、ピクチャ端を含むブロックの分割パターンを表す情報の符号量を削減できる。したがって、この動画像符号化装置は、ピクチャ端がブロック内に含まれる場合でも、符号化効率を向上できる。
図9は、上記の実施形態による動画像符号化装置により符号化された動画像データを復号する動画像復号装置の概略構成図である。動画像復号装置2は、エントロピー復号部21と、分割パターン判定部22と、予測ブロック生成部23と、復号部24と、記憶部25とを有する。
動画像復号装置2が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像復号装置2が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像復号装置2に実装されてもよい。さらに、動画像復号装置2が有するこれらの各部は、動画像復号装置2が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
動画像復号装置2は、符号化された動画像データを含む符号化ビットストリームを、例えば、通信ネットワーク及び動画像復号装置2を通信ネットワークに接続するためのインターフェース回路を介して取得する。そして動画像復号装置2は、その符号化ビットストリームを、図示しないバッファメモリに記憶させる。動画像復号装置2は、符号化されたデータを、CTU単位でバッファメモリから読み出し、そのCTU単位のデータをエントロピー復号部21へ入力する。
エントロピー復号部21は、CTU単位で符号化されているデータをエントロピー復号する。そしてエントロピー復号部21は、CTU内の各TUの量子化係数を復号する。またエントロピー復号部21は、インター予測符号化されている各CUについて、そのCUに含まれる各PUについて動きベクトルを特定する情報(例えば、適用されるベクトルモード及び動きベクトルの予測ベクトルを表す情報など)をエントロピー復号する。さらに、エントロピー復号部21は、イントラ予測符号化されている各CUについて、そのCUに含まれる各PUについての予測モードをエントロピー復号する。さらに、エントロピー復号部21は、適用された分割パターン及び符号化モードを含む、各種シンタックスをエントロピー復号する。そしてエントロピー復号部21は、CU、PU及びTUの分割パターンを表すシンタックスを分割パターン判定部22及び予測ブロック生成部23へわたす。さらに、エントロピー復号部21は、ピクチャ端を含むCTUと、そのCTUを再帰的に分割して得られ、かつ、ピクチャ端を含むサブブロックのそれぞれについて、四分木構造及び二分木構造の何れが適用されたかを表すシンタックスを分割パターン判定部22へわたす。またエントロピー復号部21は、その他の各種シンタックスなどを予測ブロック生成部23へわたす。さらに、エントロピー復号部21は、量子化係数を復号部24へ渡す。
分割パターン判定部22は、復号対象CTUについて、CUごとに分割する。その際、分割パターン判定部22は、復号対象CTUにピクチャ端が含まれない場合、エントロピー復号部21により復号された、復号対象CTUについての分割パターンを表すシンタックスを参照して、復号対象CTUをCUごとに分割すればよい。
一方、分割パターン判定部22は、復号対象CTUがピクチャの右端及び下端のうちの何れか一方を含む場合、四分木構造と二分木構造の何れが適用されたかを表すシンタックスを参照して、復号対象CTUを4分割または2分割する。すなわち、復号対象CTUについて四分木構造が適用されている場合、分割パターン判定部22は、復号対象CTUを4分割する。一方、復号対象CTUについて二分木構造が適用されている場合、分割パターン判定部22は、復号対象CTUを2分割する。その際、分割パターン判定部22は、復号対象CTUに含まれるピクチャ端と直交する方向に沿って復号対象CTUを2分割すればよい。すなわち、復号対象CTUにピクチャの右端が含まれていれば、分割パターン判定部22は、復号対象CTUを水平方向に沿って2分割する。一方、復号対象CTUにピクチャの下端が含まれていれば、分割パターン判定部22は、復号対象CTUを垂直方向に沿って2分割する。
また、分割パターン判定部22は、復号対象CTUがピクチャの右端及び下端の両方を含む場合、復号対象CTUを4分割する。
分割パターン判定部22は、復号対象CTUを分割して得られる個々のサブブロックについて、復号対象CTUに対する処理と同様の処理を行えばよい。そして分割パターン判定部22は、個々のサブブロックについて、ピクチャ端を含まず、かつ、復号されたシンタックスにより、それ以上分割されないことが示されている場合、その個々のサブブロックを、それぞれ、一つのCUとする。
図10は、分割パターン判定部22による、分割パターン判定処理の動作フローチャートである。
分割パターン判定部22は、着目するブロックにピクチャの端部が含まれるか否か判定する(ステップS301)。なお、一番最初の着目するブロックは、復号対象CTUである。
着目するブロックにピクチャの端部が含まれる場合(ステップS301−Yes)、分割パターン判定部22は、着目するブロックにピクチャの右端と下端の両方が含まれるか否か判定する(ステップS302)。
着目するブロックにピクチャの右端と下端の両方が含まれる場合(ステップS302−Yes)、分割パターン判定部22は、着目するブロックを四分木構造に従って4分割する(ステップS303)。一方、着目するブロックに含まれるピクチャ端がピクチャの右端または下端の何れか一方である場合(ステップS302−No)、分割パターン判定部22は、着目するブロックを含むブロックは2分割されたか否か判定する(ステップS304)。
着目するブロックを含むブロックが2分割されている場合(ステップS304−Yes)、分割パターン判定部22は、着目するブロックも2個のサブブロックに分割する(ステップS305)。その際、分割パターン判定部22は、着目するブロックを含むブロックについての分割方向と同じ方向に沿って、着目するブロックも分割すればよい。
一方、着目するブロックを含むブロックが2分割されていない場合(ステップS304−No)、分割パターン判定部22は、四分木構造と二分木構造のうち、シンタックスで示された方の構造に従って着目するブロックを分割する(ステップS306)。
ステップS303、S305またはS306の後、分割パターン判定部22は、着目するブロックを分割して得られた個々のサブブロックをそれぞれ着目するブロックに設定する(ステップS307)。そして符号化モード判定部12は、着目するブロックごとに、ステップS301以降の処理を実行する。
一方、ステップS301において、着目するブロックにピクチャの端部が含まれない場合(ステップS301−No)、分割パターン判定部22は、シンタックスで示された分割パターンに従って着目するブロックを各CUに分割する(ステップS308)。そして分割パターン判定部22は、ピクチャ端を含むブロックが無くなると、分割パターン判定処理を終了する。
分割パターン判定部22は、復号対象CTUに含まれる各CUを表す情報を予測ブロック生成部23へ通知する。
予測ブロック生成部23は、復号対象CTUに含まれるCUごとに、適用された符号化モード及びPUの分割パターンに従って、復号済みのピクチャまたは復号対象ピクチャの復号済みの領域を参照してそのCUに含まれる各PUの予測ブロックを生成する。その際、予測ブロック生成部23は、適用されたベクトルモードを表す情報、及び、動きベクトルの予測誤差信号などから動きベクトルも復号する。
予測ブロック生成部23は、動画像符号化装置1の予測ブロック生成部13と同様に、復号対象CTUの各PUについて、そのPUに適用される符号化モードに従って予測ブロックを生成する。すなわち、予測ブロック生成部23は、エントロピー復号された符号化モードに従って、復号済みの参照ピクチャまたは復号対象ピクチャにおいて参照される領域を特定し、特定した領域に基づいて、PU単位で予測ブロックを生成する。その際、復号対象となるPUがインター予測符号化されている場合には、予測ブロック生成部23は、そのPUについて復号した動きベクトルを用いて、復号済みの参照ピクチャにおいて参照される領域を特定すればよい。また、復号対象となるPUがイントラ予測符号化されている場合には、予測ブロック生成部23は、復号された予測モードに従って、復号対象ピクチャにおいて参照される領域を特定すればよい。
予測ブロック生成部23は、生成した予測ブロックを復号部24へ出力する。
復号部24は、エントロピー復号部21から受け取った各TUの量子化係数に、復号されたヘッダ情報から取得した量子化パラメータにより決定された量子化幅に相当する所定数を乗算することにより逆量子化する。この逆量子化により、各TUの直交変換係数が復元される。その後、復号部24は、TUごとに、直交変換係数を逆直交変換処理する。逆量子化処理及び逆直交変換処理を各TUの量子化係数に対して実行することにより、CTU全体の各画素の予測誤差信号が再生される。
復号部24は、各PUの予測ブロックの各画素値に、その画素に対応する再生された予測誤差信号を加算することにより、各PUを復号できる。そして復号部24は、復号された各PUを、符号化順序に従って結合することにより、CTUを復号する。復号部24は、復号されたCTUを記憶部25に記憶させる。また、復号部24は、復号されたCTUを、符号化順序に従って結合することでピクチャ全体を復号する。復号部24は、復号されたピクチャを記憶部25に記憶するとともに、復号されたピクチャをバッファメモリに記憶する。バッファメモリに記憶されている復号された各ピクチャは、制御部(図示せず)により表示順序に従って、表示装置(図示せず)へ出力される。
記憶部25は、復号部24から受け取った、復号されたCTU及び復号されたピクチャを一時的に記憶する。そして記憶部25は、予測ブロック生成部23に、CTUを参照領域として、あるいはピクチャを参照ピクチャとして供給する。なお、記憶部25は、予め定められた所定枚数分のピクチャを記憶し、記憶されているデータ量がその所定枚数に相当する量を超えると、符号化順序が古いピクチャから順に破棄する。
図11は、動画像復号装置2により実行される、動画像復号処理の動作フローチャートである。動画像復号装置2は、復号対象となるCTUごとに図11に示される動画像復号処理を実行する。
エントロピー復号部21は、CTU単位で符号化されているデータをエントロピー復号する。これにより、エントロピー復号部21は、復号対象CTUの各TUの量子化係数、及び、各種シンタックスなどを復号する(ステップS401)。
分割パターン判定部22は、復号対象CTUに含まれる個々のCUを特定する(ステップS402)。その際、分割パターン判定部22は、図10に示されるフローチャートに従って、個々のCUを特定すればよい。
予測ブロック生成部23は、復号対象CTUの各CUについて、そのCUに含まれるPUごとに、適用された符号化モードを参照して予測ブロックを生成する(ステップS403)。
復号部24は、エントロピー復号部21から受け取った量子化係数に、符号化ビットストリームに含まれるヘッダ情報から取得した量子化パラメータにより決定された量子化幅に相当する所定数を乗算することにより逆量子化する。そして、復号部24は、直交変換信号をTU単位で逆直交変換処理することにより復号対象CTUの各画素の予測誤差信号を再生する。その後、復号部24は、予測ブロックの各画素値に、その画素に対応する再生された予測誤差信号を加算することにより、復号対象CTUを再生する(ステップS404)。復号部24は、再生したCTUを記憶部25に記憶する。そして動画像復号装置2は、復号対象CTUについての動画像復号処理を終了する。
以上に説明してきたように、この動画像復号装置は、上記の実施形態による動画像符号化装置により、ピクチャ端を含むブロックに二分木構造が適用されていても、符号化された動画像データを復号できる。
なお、変形例によれば、動画像符号化装置1の符号化モード判定部12は、二分木構造に従って2分割される個々のブロックについて、分割方向を表すシンタックスも生成してもよい。そしてエントロピー符号化部17は、二分木構造に従って2分割される個々のブロックについて、分割方向を表すシンタックスを符号化された動画像データに付加してよい。これにより、二分木構造に従って2分割されるブロックについて、分割方向が明示的に動画像復号装置2に伝達される。したがって、動画像復号装置2の分割パターン判定部22は、二分木構造が適用されたことを示すシンタックスが付加されたブロックを、エントロピー復号部21により復号された、分割方向を表すシンタックスを参照して、その分割方向に沿って2分割すればよい。
また他の変形例によれば、CU単位で予測ブロックが生成されてもよい。あるいは、CU単位で直交変換が行われてもよい。この場合、動画像符号化装置1の符号化モード判定部12は、PUの分割パターン、あるいは、TUの分割パターンについてはもとめなくてよい。
あるいは、CUについてはピクチャ端が含まれるか否かの判断は行われなくてもよい。この場合、動画像符号化装置1の符号化モード判定部12は、ピクチャ端を含むPUについて、上記の実施形態におけるCUと同様に分割パターンを決定してもよい。同様に、符号化モード判定部12は、ピクチャ端を含むTUについて、上記の実施形態におけるCUと同様に分割パターンを決定してもよい。この場合、動画像復号装置2の分割パターン判定部22も、復号対象CTUをPUごと、あるいは、TUごとに分割する際に、上記の実施形態と同様に、分割パターンを特定すればよい。
また他の変形例によれば、ピクチャ端を含まないCTUについても、二分木構造に従って再帰的に2分割されてもよい。この場合には、動画像符号化装置1の符号化モード判定部12は、着目するCTUあるいは、着目するCTUを分割して得られる個々のサブブロックについて、四分木構造に従って4分割した場合と、二分木構造に従って2分割した場合とで、符号化コストを算出すればよい。そして符号化モード判定部12は、符号化コストが最小化されるように、四分木構造が適用されるか、あるいは、二分木構造が適用されるかを決定すればよい。またこの場合、符号化モード判定部12は、着目するCTUあるいは、着目するCTUを再帰的に分割して得られる個々のサブブロックについて、四分木構造と二分木構造のうちの適用された構造を表すシンタックスを生成する。さらに、符号化モード判定部12は、二分木構造が適用されたCTUあるいはサブブロックについて分割方向を表すシンタックスを生成する。そして動画像符号化装置1のエントロピー符号化部17は、適用された構造を表すシンタックス及び分割方向を表すシンタックスを符号化された動画像データに含める。また、動画像復号装置2の分割パターン判定部22は、適用された構造を表すシンタックス及び分割方向を表すシンタックスを参照して、復号対象CTUのCUの分割パターンを判定すればよい。
図12は、上記の実施形態またはその変形例による動画像符号化装置または動画像復号装置の各部の機能を実現するコンピュータプログラムが動作することにより、動画像符号化装置または動画像復号装置として動作するコンピュータの構成図である。
コンピュータ100は、ユーザインターフェース101と、通信インターフェース102と、メモリ103と、記憶媒体アクセス装置104と、プロセッサ105とを有する。プロセッサ105は、ユーザインターフェース101、通信インターフェース102、メモリ103及び記憶媒体アクセス装置104と、例えば、バスを介して接続される。
ユーザインターフェース101は、例えば、キーボードとマウスなどの入力装置と、液晶ディスプレイといった表示装置とを有する。または、ユーザインターフェース101は、タッチパネルディスプレイといった、入力装置と表示装置とが一体化された装置を有してもよい。そしてユーザインターフェース101は、例えば、ユーザの操作に応じて、符号化する動画像データ、あるいは、復号する動画像データを選択する操作信号をプロセッサ105へ出力する。なお、符号化する動画像データ、あるいは、復号する動画像データは、プロセッサ105上で動作するアプリケーションプログラムによって決定されてもよい。
通信インターフェース102は、例えば、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有する。そして通信インターフェース102は、通信ネットワークに接続された他の機器から、符号化する動画像データを取得し、そのデータをプロセッサ105へ渡す。また通信インターフェース102は、プロセッサ105から受け取った、符号化動画像データを通信ネットワークを介して他の機器へ出力してもよい。また、通信インターフェース102は、通信ネットワークに接続された他の機器から、復号対象となる、符号化された動画像データを含むビットストリームを取得し、そのビットストリームをプロセッサ105へ渡してもよい。
メモリ103は、記憶部の一例であり、例えば、読み書き可能な半導体メモリと読み出し専用の半導体メモリとを有する。そしてメモリ103は、プロセッサ105上で実行される、動画像符号化処理を実行するためのコンピュータプログラム、または、動画像復号処理を実行するためのコンピュータプログラムを記憶する。さらに、メモリ103は、動画像符号化処理または動画像復号処理の途中または結果として生成されるデータを記憶する。
記憶媒体アクセス装置104は、記憶部の他の一例であり、例えば、磁気ディスク、半導体メモリカード及び光記憶媒体といった記憶媒体106にアクセスする装置である。記憶媒体アクセス装置104は、例えば、記憶媒体106に記憶されたプロセッサ105上で実行される、動画像符号化処理用のコンピュータプログラムまたは動画像復号処理用のコンピュータプログラムを読み込み、プロセッサ105に渡す。
プロセッサ105は、例えば、Central Processing Unit(CPU)、Graphics Processing Unit(GPU)及び数値演算プロセッサの少なくとも何れかを含む。そしてプロセッサ105は、上記の実施形態または変形例による動画像符号化処理用コンピュータプログラムを実行することにより、動画像データを符号化する。そしてプロセッサ105は、符号化された動画像データをメモリ103に保存し、または通信インターフェース102を介して他の機器へ出力する。あるいは、プロセッサ105は、上記の実施形態または変形例による動画像復号処理用コンピュータプログラムを実行することにより、符号化された動画像データを復号する。そしてプロセッサ105は、復号されたピクチャをユーザインターフェース101の表示装置に表示させる。
なお、動画像符号化装置1の各部の機能をプロセッサ上で実行可能なコンピュータプログラムは、コンピュータによって読み取り可能な媒体に記録された形で提供されてもよい。同様に、動画像復号装置2の各部の機能をプロセッサ上で実行可能なコンピュータプログラムは、コンピュータによって読み取り可能な媒体に記録された形で提供されてもよい。ただし、そのような記録媒体には、搬送波は含まれない。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
1 動画像符号化装置
11 動き探索部
12 符号化モード判定部
13 予測ブロック生成部
14 予測符号化部
15 復号部
16 記憶部
17 エントロピー符号化部
2 動画像復号装置
21 エントロピー復号部
22 分割パターン判定部
23 予測ブロック生成部
24 復号部
25 記憶部
100 コンピュータ
101 ユーザインターフェース
102 通信インターフェース
103 メモリ
104 記憶媒体アクセス装置
105 プロセッサ
106 記憶媒体
CU102は、Prediction Unit(PU)103単位またはTransform Unit(TU)104単位で個別に処理される。PU103は、符号化モードに応じた予測が行われる、予測ブロックの生成単位となる。例えば、PU103は、イントラ予測符号化方式では、予測ブロックの生成の際に参照される画素及び予測ブロックの生成方法を規定する予測モードが適用される単位となる。一方、インター予測符号化方式では、PU103は、動き補償を行う単位となる。PU103のサイズは、例えば、インター予測符号化方式が適用される場合、2Nx2N, NxN, 2NxN, Nx2N, 2NxnU, 2NxnD, nRx2N, nLx2N(Nは、CUサイズ/2)の中から選択可能である。一方、TU104は、直交変換の単位であり、TUごとに直交変換される。TU104のサイズは、4x4画素〜32x32画素の中から選択される。TU104は、四分木構造で分割され、Zスキャン順に処理される。
符号化モード判定部12は、適用可能な符号化モードについての符号化対象CTUの符号化されたデータ量の評価値である符号化コストをCU単位でそれぞれ算出する。例えば、符号化モード判定部12は、インター予測符号化方式については、CTUを分割するCU分割パターン、PU分割パターン及び動きベクトルの予測ベクトルの生成方法を規定するベクトルモードの組み合わせごとに符号化コストを算出する。なお、符号化モード判定部12は、ベクトルモードとして、例えば、Advanced Motion Vector Prediction(AMVP)モード、及び、Mergeモードの何れかを利用できる。
最終的に、全てのCUにピクチャの下端401が含まれなくなったときのCUの組み合わせのそれぞれについて、CUごとに算出される符号化コストの合計が算出され、その合計が最小となるCUの組み合わせに従って、CTU400は分割される。例えば、CU420−1とCU421−1の組み合わせについての符号化コストの合計が最小となる場合、CTU40は、CU420−1とCU421−1とに分割される。そして符号化モード判定部12は、CTUまたはCUを分割する度に、そのCTUまたはCUに対して四分木構造と二分木構造の何れが適用されたかを表すシンタックスを生成し、そのシンタックスをエントロピー符号化部17へ通知する。なお、四分木構造と二分木構造の何れが適用されたかを表すシンタックスは、分割情報の一例である。ただし、二分木構造を適用して得られたCUについては、そのCUがさらに分割される場合でも、四分木構造は適用されないので、四分木構造と二分木構造の何れが適用されたかを表すシンタックスは生成されなくてよい。
ステップS303、S305またはS306の後、分割パターン判定部22は、着目するブロックを分割して得られた個々のサブブロックをそれぞれ着目するブロックに設定する(ステップS307)。そして分割パターン判定部22は、着目するブロックごとに、ステップS301以降の処理を実行する。
コンピュータ00は、ユーザインターフェース01と、通信インターフェース02と、メモリ03と、記憶媒体アクセス装置04と、プロセッサ05とを有する。プロセッサ05は、ユーザインターフェース01、通信インターフェース02、メモリ03及び記憶媒体アクセス装置04と、例えば、バスを介して接続される。
ユーザインターフェース01は、例えば、キーボードとマウスなどの入力装置と、液晶ディスプレイといった表示装置とを有する。または、ユーザインターフェース01は、タッチパネルディスプレイといった、入力装置と表示装置とが一体化された装置を有してもよい。そしてユーザインターフェース01は、例えば、ユーザの操作に応じて、符号化する動画像データ、あるいは、復号する動画像データを選択する操作信号をプロセッサ05へ出力する。なお、符号化する動画像データ、あるいは、復号する動画像データは、プロセッサ05上で動作するアプリケーションプログラムによって決定されてもよい。
通信インターフェース02は、例えば、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有する。そして通信インターフェース02は、通信ネットワークに接続された他の機器から、符号化する動画像データを取得し、そのデータをプロセッサ05へ渡す。また通信インターフェース02は、プロセッサ05から受け取った、符号化動画像データを通信ネットワークを介して他の機器へ出力してもよい。また、通信インターフェース02は、通信ネットワークに接続された他の機器から、復号対象となる、符号化された動画像データを含むビットストリームを取得し、そのビットストリームをプロセッサ05へ渡してもよい。
メモリ03は、記憶部の一例であり、例えば、読み書き可能な半導体メモリと読み出し専用の半導体メモリとを有する。そしてメモリ03は、プロセッサ05上で実行される、動画像符号化処理を実行するためのコンピュータプログラム、または、動画像復号処理を実行するためのコンピュータプログラムを記憶する。さらに、メモリ03は、動画像符号化処理または動画像復号処理の途中または結果として生成されるデータを記憶する。
記憶媒体アクセス装置04は、記憶部の他の一例であり、例えば、磁気ディスク、半導体メモリカード及び光記憶媒体といった記憶媒体06にアクセスする装置である。記憶媒体アクセス装置04は、例えば、記憶媒体06に記憶されたプロセッサ05上で実行される、動画像符号化処理用のコンピュータプログラムまたは動画像復号処理用のコンピュータプログラムを読み込み、プロセッサ05に渡す。
プロセッサ05は、例えば、Central Processing Unit(CPU)、Graphics Processing Unit(GPU)及び数値演算プロセッサの少なくとも何れかを含む。そしてプロセッサ05は、上記の実施形態または変形例による動画像符号化処理用コンピュータプログラムを実行することにより、動画像データを符号化する。そしてプロセッサ05は、符号化された動画像データをメモリ03に保存し、または通信インターフェース02を介して他の機器へ出力する。あるいは、プロセッサ05は、上記の実施形態または変形例による動画像復号処理用コンピュータプログラムを実行することにより、符号化された動画像データを復号する。そしてプロセッサ05は、復号されたピクチャをユーザインターフェース01の表示装置に表示させる。
1 動画像符号化装置
11 動き探索部
12 符号化モード判定部
13 予測ブロック生成部
14 予測符号化部
15 復号部
16 記憶部
17 エントロピー符号化部
2 動画像復号装置
21 エントロピー復号部
22 分割パターン判定部
23 予測ブロック生成部
24 復号部
25 記憶部
00 コンピュータ
01 ユーザインターフェース
02 通信インターフェース
03 メモリ
04 記憶媒体アクセス装置
05 プロセッサ
06 記憶媒体

Claims (10)

  1. 動画像データに含まれる符号化対象ピクチャを符号化する動画像符号化装置であって、
    前記符号化対象ピクチャを分割して得られる複数のブロックのうち、前記符号化対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックを四分木構造に従って4分割するか、あるいは当該ピクチャ端ブロックに含まれる前記端部と直交する方向に2分割することで、何れのサブブロックにも前記符号化対象ピクチャの端部が含まれないように、前記ピクチャ端ブロックを複数のサブブロックに分割する分割パターン判定部と、
    前記複数のサブブロックのそれぞれについて、符号化済みの他のピクチャあるいは前記符号化対象ピクチャの符号化済みの領域を参照して予測ブロックを生成する予測ブロック生成部と、
    前記複数のサブブロックのそれぞれについて、当該サブブロックと対応する前記予測ブロックの対応画素間の予測誤差を算出し、前記予測誤差を符号化する符号化部と、
    前記ピクチャ端ブロックについて4分割されたか2分割されたかを表す分割情報を、符号化された前記動画像データに付加する付加部と、
    を有する動画像符号化装置。
  2. 前記分割パターン判定部は、前記ピクチャ端ブロックを分割して得られる前記複数のサブブロックのうちの第1のサブブロックに、前記符号化対象ピクチャの水平方向の端部または垂直方向の端部が含まれる場合、当該第1のサブブロックをさらに四分木構造に従って4分割するか、あるいは当該第1のサブブロックに含まれる前記端部と直交する方向に2分割し、
    前記付加部は、前記第1のサブブロックについて4分割されたか2分割されたかを表す情報を、符号化された前記動画像データに付加する、請求項1に記載の動画像符号化装置。
  3. 前記分割パターン判定部は、前記第1のサブブロックが2分割されて得られる第2のサブブロックに、前記符号化対象ピクチャの水平方向の端部または垂直方向の端部が含まれる場合、当該第2のサブブロックを、前記第1のサブブロックが分割された方向と同じ方向に沿ってさらに2分割する、請求項2に記載の動画像符号化装置。
  4. 前記付加部は、前記ピクチャ端ブロックが2分割された場合、前記ピクチャ端ブロックが分割された方向を表す情報を符号化された前記動画像データに付加する、請求項1〜3の何れか一項に記載の動画像符号化装置。
  5. 符号化された動画像データに含まれる復号対象ピクチャを復号する動画像復号装置であって、
    前記復号対象ピクチャを分割して得られる複数のブロックのうち、前記復号対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックが四分木構造に従って4分割されたか、あるいは2分割されたかを表す、前記符号化された動画像データに含まれる分割情報を参照して、前記ピクチャ端ブロックを四分木構造に従って4分割するか、あるいは当該ピクチャ端ブロックに含まれる前記端部と直交する方向に2分割することで、何れのサブブロックにも前記復号対象ピクチャの端部が含まれないように、前記ピクチャ端ブロックを複数のサブブロックに分割する分割パターン判定部と、
    前記複数のサブブロックのそれぞれについて、復号済みの他のピクチャあるいは前記復号対象ピクチャの復号済みの領域を参照して予測ブロックを生成する予測ブロック生成部と、
    前記複数のサブブロックのそれぞれについて、前記符号化された動画像データに含まれる、当該サブブロックと対応する前記予測ブロックの対応画素間の予測誤差に、前記予測ブロックの対応画素の値を加算することで前記ピクチャ端ブロックを復号する復号部と、
    を有する動画像復号装置。
  6. 前記分割パターン判定部は、前記ピクチャ端ブロックが2分割され、かつ、前記ピクチャ端ブロックを分割して得られる前記複数のサブブロックのうちの第1のサブブロックに、前記復号対象ピクチャの水平方向の端部または垂直方向の端部が含まれる場合、当該第1のサブブロックに含まれる前記端部と直交する方向に沿って当該第1のサブブロックをさらに2分割する、請求項5に記載の動画像復号装置。
  7. 動画像データに含まれる、符号化対象ピクチャを符号化する動画像符号化方法であって、
    前記符号化対象ピクチャを分割して得られる複数のブロックのうち、前記符号化対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックを四分木構造に従って4分割するか、あるいは当該ピクチャ端ブロックに含まれる前記端部と直交する方向に2分割することで、何れのサブブロックにも前記符号化対象ピクチャの端部が含まれないように、前記ピクチャ端ブロックを複数のサブブロックに分割し、
    前記複数のサブブロックのそれぞれについて、符号化済みの他のピクチャあるいは前記符号化対象ピクチャの符号化済みの領域を参照して予測ブロックを生成し、
    前記複数のサブブロックのそれぞれについて、当該サブブロックと対応する前記予測ブロックの対応画素間の予測誤差を算出し、前記予測誤差を符号化し、
    前記ピクチャ端ブロックについて4分割されたか2分割されたかを表す情報を、符号化された前記動画像データに付加する、
    ことを含む動画像符号化方法。
  8. 符号化された動画像データに含まれる復号対象ピクチャを復号する動画像復号方法であって、
    前記復号対象ピクチャを分割して得られる複数のブロックのうち、前記復号対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックが四分木構造に従って4分割されたか、あるいは2分割されたかを表す、前記符号化された動画像データに含まれる分割情報を参照して、前記ピクチャ端ブロックを四分木構造に従って4分割するか、あるいは当該ピクチャ端ブロックに含まれる前記端部と直交する方向に2分割することで、何れのサブブロックにも前記復号対象ピクチャの端部が含まれないように、前記ピクチャ端ブロックを複数のサブブロックに分割し、
    前記複数のサブブロックのそれぞれについて、復号済みの他のピクチャあるいは前記復号対象ピクチャの復号済みの領域を参照して予測ブロックを生成し、
    前記複数のサブブロックのそれぞれについて、前記符号化された動画像データに含まれる、当該サブブロックと対応する前記予測ブロックの対応画素間の予測誤差に、前記予測ブロックの対応画素の値を加算することで前記ピクチャ端ブロックを復号する、
    ことを含む動画像復号方法。
  9. 動画像データに含まれる、符号化対象ピクチャを符号化する動画像符号化用コンピュータプログラムであって、
    前記符号化対象ピクチャを分割して得られる複数のブロックのうち、前記符号化対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックを四分木構造に従って4分割するか、あるいは当該ピクチャ端ブロックに含まれる前記端部と直交する方向に2分割することで、何れのサブブロックにも前記符号化対象ピクチャの端部が含まれないように、前記ピクチャ端ブロックを複数のサブブロックに分割し、
    前記複数のサブブロックのそれぞれについて、符号化済みの他のピクチャあるいは前記符号化対象ピクチャの符号化済みの領域を参照して予測ブロックを生成し、
    前記複数のサブブロックのそれぞれについて、当該サブブロックと対応する前記予測ブロックの対応画素間の予測誤差を算出し、前記予測誤差を符号化し、
    前記ピクチャ端ブロックについて4分割されたか2分割されたかを表す情報を、符号化された前記動画像データに付加する、
    ことをコンピュータに実行させるための動画像符号化用コンピュータプログラム。
  10. 符号化された動画像データに含まれる復号対象ピクチャを復号する動画像復号用コンピュータプログラムであって、
    前記復号対象ピクチャを分割して得られる複数のブロックのうち、前記復号対象ピクチャの水平方向の端部及び垂直方向の端部の何れか一方を含むピクチャ端ブロックが四分木構造に従って4分割されたか、あるいは2分割されたかを表す、前記符号化された動画像データに含まれる分割情報を参照して、前記ピクチャ端ブロックを四分木構造に従って4分割するか、あるいは当該ピクチャ端ブロックに含まれる前記端部と直交する方向に2分割することで、何れのサブブロックにも前記復号対象ピクチャの端部が含まれないように、前記ピクチャ端ブロックを複数のサブブロックに分割し、
    前記複数のサブブロックのそれぞれについて、復号済みの他のピクチャあるいは前記復号対象ピクチャの復号済みの領域を参照して予測ブロックを生成し、
    前記複数のサブブロックのそれぞれについて、前記符号化された動画像データに含まれる、当該サブブロックと対応する前記予測ブロックの対応画素間の予測誤差に、前記予測ブロックの対応画素の値を加算することで前記ピクチャ端ブロックを復号する、
    ことをコンピュータに実行させるための動画像復号用コンピュータプログラム。
JP2019549088A 2017-10-20 2017-10-20 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム Active JP7004001B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021128677A JP7156471B2 (ja) 2017-10-20 2021-08-05 動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/038062 WO2019077751A1 (ja) 2017-10-20 2017-10-20 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021128677A Division JP7156471B2 (ja) 2017-10-20 2021-08-05 動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラム

Publications (2)

Publication Number Publication Date
JPWO2019077751A1 true JPWO2019077751A1 (ja) 2020-11-05
JP7004001B2 JP7004001B2 (ja) 2022-01-21

Family

ID=66173939

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019549088A Active JP7004001B2 (ja) 2017-10-20 2017-10-20 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2021128677A Active JP7156471B2 (ja) 2017-10-20 2021-08-05 動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021128677A Active JP7156471B2 (ja) 2017-10-20 2021-08-05 動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラム

Country Status (9)

Country Link
US (2) US11089326B2 (ja)
EP (2) EP3700204A4 (ja)
JP (2) JP7004001B2 (ja)
KR (2) KR102465773B1 (ja)
CN (2) CN116320470A (ja)
BR (1) BR112020006742A2 (ja)
CA (1) CA3078905C (ja)
MX (1) MX2020003813A (ja)
WO (1) WO2019077751A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111345039B (zh) * 2017-11-16 2024-04-02 松下电器(美国)知识产权公司 解码装置和解码方法
EP3777147B1 (en) * 2018-03-29 2023-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding a picture using picture boundary handling

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010193401A (ja) * 2009-02-20 2010-09-02 Canon Inc 画像符号化方法及び画像符号化装置
JP2011223303A (ja) * 2010-04-09 2011-11-04 Sony Corp 画像符号化装置と画像符号化方法および画像復号化装置と画像復号化方法
JP2013509788A (ja) * 2009-10-30 2013-03-14 サムスン エレクトロニクス カンパニー リミテッド ピクチャ境界の符号化単位を符号化/復号化する方法及びその装置
US20170208336A1 (en) * 2016-01-15 2017-07-20 Qualcomm Incorporated Multi-type-tree framework for video coding

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009296300A (ja) * 2008-06-05 2009-12-17 Panasonic Corp 画像符号化装置および方法
JP2011147049A (ja) 2010-01-18 2011-07-28 Sony Corp 画像処理装置および方法、並びにプログラム
SG187094A1 (en) * 2010-07-20 2013-03-28 Ntt Docomo Inc Image prediction encoding device, image prediction encoding method, image prediction encoding program, image prediction decoding device, image prediction decoding method, and image prediction decoding program
US8526495B2 (en) 2010-11-22 2013-09-03 Mediatek Singapore Pte. Ltd. Apparatus and method of constrained partition size for high efficiency video coding
JP6260534B2 (ja) 2012-09-03 2018-01-17 ソニー株式会社 画像処理装置および方法
JP2015070488A (ja) * 2013-09-30 2015-04-13 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
WO2015145504A1 (ja) * 2014-03-25 2015-10-01 株式会社ソシオネクスト 画像復号装置、画像復号方法、及び集積回路
JP6435822B2 (ja) * 2014-12-04 2018-12-12 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2016090568A1 (en) * 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Binary tree block partitioning structure
US10003807B2 (en) * 2015-06-22 2018-06-19 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks
US10542294B2 (en) 2016-03-16 2020-01-21 Mediatek Inc. Method and apparatus of video data processing with restricted block size in video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010193401A (ja) * 2009-02-20 2010-09-02 Canon Inc 画像符号化方法及び画像符号化装置
JP2013509788A (ja) * 2009-10-30 2013-03-14 サムスン エレクトロニクス カンパニー リミテッド ピクチャ境界の符号化単位を符号化/復号化する方法及びその装置
JP2011223303A (ja) * 2010-04-09 2011-11-04 Sony Corp 画像符号化装置と画像符号化方法および画像復号化装置と画像復号化方法
US20170208336A1 (en) * 2016-01-15 2017-07-20 Qualcomm Incorporated Multi-type-tree framework for video coding

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FUZHENG YANG, WEI LI, SHUAI WAN, YILIN CHANG, GUANGLIANG REN: "CTB splitting on frame boundary for arbitrary resolution video", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. [JCTVC-C025], JPN6017044311, 1 October 2010 (2010-10-01), pages 1 - 4, ISSN: 0004524540 *
JAEIL KIM, TAEYOUNG NA, CHANGHEE KIM, BUMSHIK LEE, MUNCHURL KIM: "Enlarging MB size for high fidelity video coding beyond HD", ITU - TELECOMMUNICATIONS STANDARDIZATION SECTOR STUDY GROUP 16 QUESTION 6 VIDEO CODING EXPERTS GROUP, vol. [VCEG-AJ21], JPN6013038170, 5 October 2008 (2008-10-05), pages 1 - 6, ISSN: 0004524541 *
JIANLE CHEN, ELENA ALSHINA, GARY J.SULLIVAN, JENS-RAINER OHM, JILL BOYCE: "Algorithm Description of Joint Exploration Test Model 7 (JEM7)", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. [JVET-G1001-v1], JPN6017044310, 19 August 2017 (2017-08-19), pages 2 - 3, ISSN: 0004524539 *

Also Published As

Publication number Publication date
CN111264060B (zh) 2023-10-17
KR20200053577A (ko) 2020-05-18
CN111264060A (zh) 2020-06-09
EP3700204A1 (en) 2020-08-26
JP7004001B2 (ja) 2022-01-21
JP7156471B2 (ja) 2022-10-19
BR112020006742A2 (pt) 2020-10-06
WO2019077751A1 (ja) 2019-04-25
KR102465773B1 (ko) 2022-11-10
US20210337233A1 (en) 2021-10-28
CA3078905A1 (en) 2019-04-25
EP3700204A4 (en) 2020-08-26
KR102465994B1 (ko) 2022-11-10
US20200236393A1 (en) 2020-07-23
KR20220038520A (ko) 2022-03-28
US11089326B2 (en) 2021-08-10
MX2020003813A (es) 2020-08-13
JP2021185685A (ja) 2021-12-09
EP3979641A1 (en) 2022-04-06
CA3078905C (en) 2023-01-03
CN116320470A (zh) 2023-06-23
US11778228B2 (en) 2023-10-03

Similar Documents

Publication Publication Date Title
KR102644185B1 (ko) 비디오 코딩 시스템에서 레지듀얼 신호 코딩 방법 및 장치
KR102383105B1 (ko) 비디오 신호 처리 방법 및 장치
CA2863208C (en) Image decoding device, image encoding device, and data structure of encoded data
KR101316060B1 (ko) 인터 예측 부호화된 동영상 복호화 방법
KR20220151140A (ko) 영상 부호화 방법 및 컴퓨터로 읽을 수 있는 기록 매체
CN107295347B (zh) 用于解码合并模式下的运动信息的装置
KR20170058838A (ko) 화면간 예측 향상을 위한 부호화/복호화 방법 및 장치
KR20120012401A (ko) 인트라 예측 복호화 장치
JP6244864B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR20140129607A (ko) 동영상 처리 방법 및 장치
JP2019129371A (ja) 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、及び動画像符号化用コンピュータプログラムならびに動画像復号用コンピュータプログラム
JP2017034531A (ja) 動画像符号化装置及び動画像符号化方法
JP2018107580A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
KR20130067280A (ko) 인터 예측 부호화된 동영상 복호화 방법
JP7156471B2 (ja) 動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラム
JP6459761B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2019022129A (ja) 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、及び動画像符号化用コンピュータプログラムならびに動画像復号用コンピュータプログラム
JP6825506B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
JP2015211386A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2017073602A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR20140135855A (ko) 동영상 처리 방법 및 장치
KR102516137B1 (ko) 두 개의 후보 인트라 예측 모드를 이용한 화면 내 예측 모드의 부/복호화 방법 및 이러한 방법을 사용하는 장치
JP2015226263A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200409

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211213

R150 Certificate of patent or registration of utility model

Ref document number: 7004001

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150