JP2022530287A - クロマブロックのサイズを制限する画像符号化/復号化方法、装置、及びビットストリームを伝送する方法 - Google Patents

クロマブロックのサイズを制限する画像符号化/復号化方法、装置、及びビットストリームを伝送する方法 Download PDF

Info

Publication number
JP2022530287A
JP2022530287A JP2021576161A JP2021576161A JP2022530287A JP 2022530287 A JP2022530287 A JP 2022530287A JP 2021576161 A JP2021576161 A JP 2021576161A JP 2021576161 A JP2021576161 A JP 2021576161A JP 2022530287 A JP2022530287 A JP 2022530287A
Authority
JP
Japan
Prior art keywords
block
current block
prediction
division
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021576161A
Other languages
English (en)
Inventor
チャンウォン チェ
チン ホ
ソンミ ユ
チョンア チェ
スン ファン キム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2022530287A publication Critical patent/JP2022530287A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

画像符号化/復号化方法及び装置が提供される。本開示による画像復号化装置によって行われる画像復号化方法は、現在ブロックの分割タイプを決定するステップと、前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割するステップと、前記下位ブロックを復号化するステップと、を含む。このとき、前記現在ブロックは、クロマブロックであり、前記現在ブロックの分割タイプを決定するステップは、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを許可しないことにより行われることができる。【選択図】図30

Description

本開示は、画像符号化/復号化方法及び装置に係り、より詳細には、クロマブロックに対するサイズ制限を用いて画像を符号化/復号化する方法、装置、及び本開示の画像符号化方法/装置によって生成されたビットストリームを伝送する方法に関する。
最近、高解像度、高品質の画像、例えばHD(High Definition)画像及びUHD(Ultra High Definition)画像への需要が多様な分野で増加している。画像データが高解像度、高品質になるほど、従来の画像データに比べて、伝送される情報量又はビット量が相対的に増加する。伝送される情報量又はビット量の増加は、伝送費用と保存費用の増加をもたらす。
これにより、高解像度、高品質画像の情報を効果的に伝送又は保存し、再生するための高効率の画像圧縮技術が求められる。
本開示は、符号化/復号化効率が向上した画像符号化/復号化方法及び装置を提供することを目的とする。
また、本開示は、クロマブロックに対するサイズ制限を用いて画像を符号化/復号化する方法及び装置を提供することを目的とする。
また、本開示は、クロマブロックに対する分割が実行できない場合、分割情報をシグナリングしない画像符号化/復号化方法及び装置を提供することを目的とする。
また、本開示は、本開示による画像符号化方法又は装置によって生成されたビットストリームを伝送する方法を提供することを目的とする。
また、本開示は、本開示による画像符号化方法又は装置によって生成されたビットストリームを保存した記録媒体を提供することを目的とする。
また、本開示は、本開示による画像復号化装置によって受信され、復号化されて画像の復元に利用されるビットストリームを保存した記録媒体を提供することを目的とする。
本開示で解決しようとする技術的課題は上述した技術的課題に制限されず、上述していない別の技術的課題は以降の記載から本開示の属する技術分野における通常の知識を有する者に明確に理解できるであろう。
本開示の一態様による画像復号化装置によって行われる画像復号化方法は、現在ブロックの分割タイプを決定するステップと、前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割するステップと、前記下位ブロックを復号化するステップと、を含むことができる。前記現在ブロックは、クロマブロックであり、前記現在ブロックの分割タイプを決定するステップは、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを許可しないことにより行われることができる。前記所定の値は、0より大きく、前記画像復号化装置のクロックあたり処理ブロックのサイズよりも小さい値を有することができる。前記現在ブロックの分割タイプを決定するステップは、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して行われることができる。
前記現在ブロックの幅が4である場合、四分木分割タイプ及び垂直バイナリ分割タイプは前記現在ブロックの分割タイプとして許可されないことができる。前記現在ブロックのツリー構造がデュアルツリー構造であり、前記現在ブロックの幅が4である場合、四分木分割タイプ及び垂直バイナリ分割タイプは、前記現在ブロックの分割タイプとして許可されないことができる。
前記現在ブロックの幅が8である場合、垂直ターナリ分割タイプは、前記現在ブロックの分割タイプとして許可されないことができる。前記現在ブロックのツリー構造がデュアルツリー構造であり、前記現在ブロックの幅が8である場合、垂直ターナリ分割タイプは、前記現在ブロックの分割タイプとして許可されないことができる。
前記画像復号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが4である場合、四分木分割タイプ及び水平バイナリ分割タイプは、前記現在ブロックの分割タイプとして許可されないことができる。
前記画像復号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが8である場合、水平ターナリ分割タイプは、前記現在ブロックの分割タイプとして許可されないことができる。
前記下位ブロックの幅は、前記現在ブロックの分割タイプに応じて前記現在ブロックの幅を分割することにより決定され、前記現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅とカラーフォーマットに基づいて決定されることができる。
前記現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅をカラーフォーマットに基づいて導出されるクロマサンプルとルマサンプルの成分比で割った値に決定されることができる。
前記現在ブロックの分割タイプを決定するステップは、前記複数の分割タイプのうち、前記所定の分割タイプ以外の分割タイプに前記現在ブロックの分割タイプを決定することにより行われることができる。
また、本開示の一態様による画像復号化装置は、メモリと少なくとも一つのプロセッサとを含み、前記少なくとも一つのプロセッサは、現在ブロックの分割タイプを決定し、前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割し、前記下位ブロックを復号化するが、前記現在ブロックは、クロマブロックであり、前記プロセッサは、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを除いて現在ブロックの分割タイプを決定することができる。
また、本開示の一態様による画像符号化装置によって行われる画像符号化方法は、現在ブロックの分割タイプとして用いられる利用可能分割タイプを決定するステップと、前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割するステップと、前記下位ブロックを符号化することにより前記現在ブロックを符号化するステップと、を含み、前記利用可能分割タイプは、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを除いた分割タイプに決定されることができる。
本開示の別の態様による伝送方法は、本開示の画像符号化装置又は画像符号化方法によって生成されたビットストリームを伝送することができる。
本開示の別の態様によるコンピュータ可読記録媒体は、本開示の画像符号化方法又は画像符号化装置によって生成されたビットストリームを保存することができる。
本開示について簡略に要約して上述した特徴は、後述する本開示の詳細な説明の例示的な態様に過ぎず、本開示の範囲を制限するものではない。
本開示によれば、符号化/復号化効率が向上した画像符号化/復号化方法及び装置が提供されることができる。
また、本開示によれば、クロマブロックに対する所定のサイズを制限し、所定のサイズの制限によって所定の分割イプが制限される場合、クロマブロックの分割情報をシグナリングしないことにより、ビットストリームの量を減らすことができる画像符号化/復号化する方法及び装置が提供されることができる。
また、本開示によれば、本開示による画像符号化方法又は装置によって生成されたビットストリームを伝送する方法が提供されることができる。
また、本開示によれば、本開示による画像符号化方法又は装置によって生成されたビットストリームを保存した記録媒体が提供されることができる。
また、本開示によれば、本開示による画像復号化装置によって受信され、復号化されて画像の復元に利用されるビットストリームを保存した記録媒体が提供されることができる。
本開示で得られる効果は、上述した効果に限定されず、上述していない別の効果は、以降の記載から、本開示の属する技術分野における通常の知識を有する者に明確に理解できるだろう。
本開示による実施例が適用できるビデオコーディングシステムを概略的に示す図である。 本開示による実施例が適用できる画像符号化装置を概略的に示す図である。 本開示による実施例が適用できる画像復号化装置を概略的に示す図である。 一実施例による画像の分割構造を示す図である。 マルチタイプツリー構造によるブロックの分割タイプの一実施例を示す図である。 本開示によるマルチタイプツリーを伴う四分木(quadtree with nested multi-type tree)構造におけるブロック分割情報のシグナリングメカニズムを例示する図である。 CTUが多重CUに分割される一実施例を示す図である。 冗長(redundant)分割パターンの一実施例を示す図である。 一実施例によるインター予測ベースのビデオ/画像符号化方法を示すフローチャートである。 一実施例によるインター予測部180の構成を例示的に示す図である。 一実施例によるインター予測ベースのビデオ/画像復号化方法を示すフローチャートである。 一実施例によるインター予測部260の構成を例示的に示す図である。 一実施例による空間マージ候補として用いることができる周辺ブロックを例示する図である。 一実施例によるマージ候補リスト構成方法を概略的に示す図である。 一実施例による動きベクトル予測子候補リスト構成方法を概略的に示す図である。 一実施例による画像符号化装置から画像復号化装置へMVDを伝送するためのシンタックス構造を示す図である。 一実施例によるIBCベースのビデオ/画像符号化方法を示すフローチャートである。 一実施例によるIBCベースのビデオ/画像符号化方法を行う予測部の構成を例示的に示す図である。 一実施例によるIBCベースのビデオ/画像復号化方法を示すフローチャートである。 一実施例によるIBCベースのビデオ/画像復号化方法を行う予測部の構成を例示的に示す図である。 一実施例によるパイプライニング遅延(pipelining delay)問題を示す図である。 現在ブロックがデュアルツリー構造を持つときに2×Nクロマブロックにクロマブロックが分割されることを制限した場合に測定された実験データを示す図である。 一実施例による復号化装置が現在ブロックに対して垂直ターナリ分割(SPLIT_TT_VER)が許可されるか否かを決定する方法を説明する図である。 一実施例による復号化装置が現在ブロックに対して水平ターナリ分割(SPLIT_TT_HOR)が許可されるか否かを決定する方法を説明する図である。 一実施例による復号化装置が現在ブロックに対して水平バイナリ分割(SPLIT_BT_HOR)が許可されるか否かを決定する方法を説明する図である。 一実施例による復号化装置が現在ブロックに対して垂直バイナリ分割(SPLIT_BT_VER)が許可されるか否かを決定する方法を説明する図である。 一実施例による復号化装置が、現在ブロックに対して四分木分割が許可されるか否かを決定する方法を説明する図である。 第1制限条件のみを適用した場合に得られた実験結果を示す図である。 第1、第2及び第3制限条件を全て適用した場合に得られた実験結果を示す図である。 一実施例による符号化装置が画像を符号化する方法を説明するフローチャートである。 一実施例による現在ブロックの分割に関する情報をシグナリングするビットストリームに対するシンタックスを示す図である。 一実施例による復号化装置が画像を復号化する方法を説明するフローチャートである。 本開示の実施例が適用できるコンテンツストリーミングシステムを例示する図である。
以下、添付図面を参照して、本開示の実施例について、本開示の属する技術分野における通常の知識を有する者が容易に実施し得るように詳細に説明する。しかし、本開示は、様々な異なる形態で実現でき、ここで説明する実施例に限定されない。
本開示の実施例を説明するにあたり、公知の構成又は機能についての具体的な説明が本開示の要旨を不明確にするおそれがあると判断される場合には、それについての詳細な説明は省略する。そして、図面において、本開示についての説明と関係ない部分は省略し、同様の部分には同様の図面符号を付した。
本開示において、ある構成要素が他の構成要素と「連結」、「結合」又は「接続」されているとするとき、これは、直接的な連結関係だけでなく、それらの間に別の構成要素が存在する間接的な連結関係も含むことができる。また、ある構成要素が他の構成要素を「含む」又は「有する」とするとき、これは、特に反対される記載がない限り、別の構成要素を排除するのではなく、別の構成要素をさらに含むことができることを意味する。
本開示において、「第1」、「第2」などの用語は、一つの構成要素を他の構成要素から区別する目的のみで使用され、特に言及されない限り、構成要素間の順序又は重要度などを限定しない。したがって、本開示の範囲内において、一実施例の第1構成要素は、他の実施例で第2構成要素と呼んでもよく、これと同様に、一実施例の第2構成要素を、他の実施例で第1構成要素と呼んでもよい。
本開示において、互いに区別される構成要素は、それぞれの特徴を明確に説明するためのものであり、構成要素が必ずしも分離されることを意味するものではない。つまり、複数の構成要素が統合されて一つのハードウェア又はソフトウェア単位で構成されてもよく、一つの構成要素が分散されて複数のハードウェア又はソフトウェア単位で構成されてもよい。よって、別に言及しなくても、このように統合された又は分散された実施例も本開示の範囲に含まれる。
本開示において、さまざまな実施例で説明する構成要素が必ず必要不可欠な構成要素を意味するものではなく、一部は選択的な構成要素であり得る。したがって、一実施例で説明する構成要素の部分集合で構成される実施例も本開示の範囲に含まれる。また、様々な実施例で説明する構成要素にさらに他の構成要素を含む実施例も、本開示の範囲に含まれる。
本開示は、画像の符号化及び復号化に関するものであって、本開示で使用される用語は、本開示で新たに定義されない限り、本開示の属する技術分野における通常の意味を持つことができる。
本開示において、「ピクチャ(picture)」は、一般的に、特定の時間帯のいずれか一つの画像を示す単位を意味し、スライス(slice)/タイル(tile)は、ピクチャの一部を構成する符号化単位であって、一つのピクチャは、一つ以上のスライス/タイルで構成できる。また、スライス/タイルは、一つ以上のCTU(coding tree unit)を含むことができる。
本開示において、「ピクセル(pixel)」又は「ペル(pel)」は、一つのピクチャ(又は画像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用できる。サンプルは、一般的に、ピクセル又はピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。
本開示において、「ユニット(unit)」は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定の領域及び当該領域に関連する情報のうちの少なくとも一つを含むことができる。ユニットは、場合に応じて、「サンプルアレイ」、「ブロック(block)」又は「領域(area)」などの用語と混用して使用できる。一般な場合、M×Nブロックは、M個の列とN個の行からなるサンプル(又はサンプルアレイ)又は変換係数(transform coefficient)のセット(又はアレイ)を含むことができる。
本開示において、「現在ブロック」は、「現在コーディングブロック」、「現在コーティングユニット」、「符号化対象ブロック」、「復号化対象ブロック」又は「処理対象ブロック」のうちのいずれか一つを意味することができる。予測が行われる場合、「現在ブロック」は、「現在予測ブロック」又は「予測対象ブロック」を意味することができる。変換(逆変換)/量子化(逆量子化)が行われる場合、「現在ブロック」は「現在変換ブロック」又は「変換対象ブロック」を意味することができる。フィルタリングが行われる場合、「現在ブロック」は「フィルタリング対象ブロック」を意味することができる。
また、本開示において、「現在ブロック」は、クロマブロックという明示的な記載がない限り、「現在ブロックのルマブロック」を意味することができる。「現在ブロックのクロマブロック」は、明示的に「クロマブロック」又は「現在クロマブロック」のようにクロマブロックという明示的な記載を含んで表現できる。
本開示において、「/」と「、」は「及び/又は」と解釈されることができる。例えば、「A/B」と「A、B」は「A及び/又はB」と解釈されることができる。また、「A/B/C」と「A、B、C」は、「A、B及び/又はCのうちの少なくとも一つ」を意味することができる。
本開示において、「又は」は「及び/又は」と解釈されることができる。例えば、「A又はB」は、1)「A」のみを意味するか、2)「B」のみを意味するか、3)「A及びB」を意味することができる。又は、本開示において、「又は」は、「追加的に又は代替的に(additionally or alternatively)」を意味することができる。
ビデオコーディングシステムの概要
図1は本開示によるビデオコーディングシステムを示す図である。
一実施例によるビデオコーディングシステムは、符号化装置10及び復号化装置20を含むことができる。符号化装置10は、符号化されたビデオ(video)及び/又は画像(image)情報又はデータをファイル又はストリーミング形式でデジタル記憶媒体又はネットワークを介して復号化装置20へ伝達することができる。
一実施例による符号化装置10は、ビデオソース生成部11、符号化部12及び伝送部13を含むことができる。一実施例による復号化装置20は、受信部21、復号化部22及びレンダリング部23を含むことができる。前記符号化部12は、ビデオ/画像符号化部と呼ばれることができ、前記復号化部22は、ビデオ/画像復号化部と呼ばれることができる。伝送部13は、符号化部12に含まれることができる。受信部21は、復号化部22に含まれることができる。レンダリング部23は、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイス又は外部コンポーネントとして構成されることもできる。
ビデオソース生成部11は、ビデオ/画像のキャプチャ、合成又は生成過程などを介してビデオ/画像を取得することができる。ビデオソース生成部11は、ビデオ/画像キャプチャデバイス及び/又はビデオ/画像生成デバイスを含むことができる。ビデオ/画像キャプチャデバイスは、例えば、一つ以上のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含むことができる。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレット及びスマートフォンなどを含むことができ、(電子的に)ビデオ/画像を生成することができる。例えば、コンピュータなどを介して、仮想のビデオ/画像が生成されることができ、この場合、ビデオ/画像キャプチャ過程は、関連データが生成される過程に置き換えられることができる。
符号化部12は、入力ビデオ/画像を符号化することができる。符号化部12は、圧縮及び符号化効率のために、予測、変換、量子化などの一連の手順を行うことができる。符号化部12は、符号化されたデータ(符号化されたビデオ/画像情報)をビットストリーム(bitstream)形式で出力することができる。
伝送部13は、ビットストリーム形式で出力された、符号化されたビデオ/画像情報又はデータを、ファイル又はストリーミング形式でデジタル記憶媒体又はネットワークを介して復号化装置20の受信部21に伝達することができる。デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray、HDD、SSDなどのさまざまな記憶媒体を含むことができる。伝送部13は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介して伝送するためのエレメントを含むことができる。受信部21は、前記記憶媒体又はネットワークから前記ビットストリームを抽出/受信して復号化部22に伝達することができる。
復号化部22は、符号化部12の動作に対応する逆量子化、逆変換、予測などの一連の手順を行ってビデオ/画像を復号化することができる。
レンダリング部23は、復号化されたビデオ/画像をレンダリングすることができる。レンダリングされたビデオ/画像は、ディスプレイ部を介して表示されることができる。
画像符号化装置の概要
図2は本開示による実施例が適用できる画像符号化装置を概略的に示す図である。
図2に示されているように、画像符号化装置100は、画像分割部110、減算部115、変換部120、量子化部130、逆量子化部140、逆変換部150、加算部155、フィルタリング部160、メモリ170、インター予測部180、イントラ予測部185及びエントロピー符号化部190を含むことができる。インター予測部180及びイントラ予測部185は、合わせて「予測部」と呼ばれることができる。変換部120、量子化部130、逆量子化部140及び逆変換部150は、レジデュアル(residual)処理部に含まれることができる。レジデュアル処理部は減算部115をさらに含むこともできる。
画像符号化装置100を構成する複数の構成部の全部又は少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、エンコーダ又はプロセッサ)で実現されることができる。また、メモリ170は、DPB(decoded picture buffer)を含むことができ、デジタル記憶媒体によって実現できる。
画像分割部110は、画像符号化装置100に入力された入力画像(又は、ピクチャ、フレーム)を一つ以上の処理ユニット(processing unit)に分割することができる。一例として、前記処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれることができる。コーディングユニットは、コーディングツリーユニット(coding tree unit、CTU)又は最大コーディングユニット(largest coding unit、LCU)をQT/BT/TT(Quad-tree/binary-tree/ternary-tree)構造によって再帰的に(recursively)分割することにより取得されることができる。例えば、一つのコーディングニットは、四分木構造、二分木構造及び/又は三分木構造に基づいて、下位(deeper)デプスの複数のコーディングユニットに分割されることができる。コーディングユニットの分割のために、四分木構造が先に適用され、二分木構造及び/又は三分木構造が後で適用されることができる。それ以上分割されない最終コーディングユニットを基に、本開示によるコーディング手順が行われることができる。最大コーディングユニットが最終コーディングユニットとして使用されることができ、最大コーディングユニットを分割して取得した下位デプスのコーディングユニットが最終コーディングユニットとして使用されることもできる。ここで、コーディング手順とは、後述する予測、変換及び/又は復元などの手順を含むことができる。他の例として、前記コーディング手順の処理ユニットは、予測ユニット(PU:Prediction Unit)又は変換ユニット(TU:Transform Unit)であることができる。前記予測ユニット及び前記変換ユニットは、それぞれ前記最終コーディングユニットから分割又はパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であることができ、前記変換ユニットは、変換係数を誘導する単位、及び/又は変換係数からレジデュアル信号(residual signal)を誘導する単位であることができる。
予測部(インター予測部180又はイントラ予測部185)は、処理対象ブロック(現在ブロック)に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、現在ブロック又はCU単位でイントラ予測が適用されるか、或いはインター予測が適用されるかを決定することができる。予測部は、現在ブロックの予測に関するさまざまな情報を生成してエントロピー符号化部190に伝達することができる。予測に関する情報は、エントロピー符号化部190で符号化されてビットストリーム形式で出力されることができる。
イントラ予測部185は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。参照される前記サンプルは、イントラ予測モード及び/又はイントラ予測技法に従って、前記現在ブロックの周辺(neighbor)に位置することもでき、或いは離れて位置することもできる。イントラ予測モードは、複数の非方向性モードと複数の方向性モードを含むことができる。非方向性モードは、例えば、DCモード及びPlanarモードを含むことができる。方向性モードは、予測方向の細密な程度に応じて、例えば33個の方向性予測モード又は65個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定に基づいてそれ以上又はそれ以下の個数の方向性予測モードが使用できる。イントラ予測部185は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。
インター予測部180は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。この時、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現在ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合、周辺ブロックは、現在ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と、参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)を含むことができる。前記参照ブロックを含む参照ピクチャと、前記時間周辺ブロックを含む参照ピクチャとは、同一でもよく、互いに異なってもよい。前記時間周辺ブロックは、コロケート参照ブロック(collocated reference block)、コロケートCU(colCU)などの名前で呼ばれることができる。前記時間周辺ブロックを含む参照ピクチャは、コロケートピクチャ(collocated picture、colPic)と呼ばれることができる。例えば、インター予測部180は、周辺ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われることができ、例えばスキップモードとマージモードの場合に、インター予測部180は、周辺ブロックの動き情報を現在ブロックの動き情報として用いることができる。スキップモードの場合、マージモードとは異なり、レジデュアル信号が伝送されないことができる。動き情報予測(motion vector prediction、MVP)モードの場合、周辺ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として用い、動きベクトル差分(motion vector difference)及び動きベクトル予測子に対するインジケータ(indicator)を符号化することにより、現在ブロックの動きベクトルをシグナリングすることができる。動きベクトル差分は、現在ブロックの動きベクトルと動きベクトル予測子との差を意味することができる。
予測部は、後述する様々な予測方法及び/又は予測技法に基づいて予測信号を生成することができる。例えば、予測部は、現在ブロックの予測のために、イントラ予測又はインター予測を適用することができるだけでなく、イントラ予測とインター予測を同時に適用することができる。現在ブロックの予測のためにイントラ予測とインター予測を同時に適用する予測方法は、CIIP(combined inter and intra prediction)と呼ばれることができる。また、予測部は、現在ブロックの予測のためにイントラブロックコピー(intra block copy、IBC)を行うこともできる。イントラブロックコピーは、例えば、SCC(screen content coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。IBCは、現在ブロックから所定の距離だけ離れた位置の現在ピクチャ内の既に復元された参照ブロックを用いて現在ブロックを予測する方法である。IBCが適用される場合、現在ピクチャ内の参照ブロックの位置は前記所定の距離に該当するベクトル(ブロックベクトル)として符号化されることができる。IBCは、基本的に、現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出するという点において、インター予測と同様に行われることができる。すなわち、IBCは、本開示で説明されるインター予測技法のうちの少なくとも一つを用いることができる。
予測部によって生成された予測信号は、復元信号を生成するために用いられるか、或いはレジデュアル信号を生成するために用いられることができる。減算部115は、入力画像信号(原本ブロック、原本サンプルアレイ)から、予測部から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算して、レジデュアル信号(residual signal、残余ブロック、残余サンプルアレイ)を生成することができる。生成されたレジデュアル信号は、変換部120に伝送されることができる。
変換部120は、レジデュアル信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、又はCNT(Conditionally Non-linear Transform)のうちの少なくとも一つを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとするとき、このグラフから得られた変換を意味する。CNTは、以前に復元されたすべてのピクセル(all previously reconstructed pixel)を用いて予測信号を生成し、それに基づいて取得される変換を意味する。変換過程は、正方形の同じサイズを有するピクセルブロックに適用されることもでき、正方形ではない、可変サイズのブロックに適用されることもできる。
量子化部130は、変換係数を量子化してエントロピー符号化部190に伝送することができる。エントロピー符号化部190は、量子化された信号(量子化された変換係数に関する情報)を符号化してビットストリーム形式で出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部130は、係数スキャン順序(scan order)に基づいて、ブロック形式の量子化された変換係数を1次元ベクトル形式で再整列することができ、前記1次元ベクトル形式の量子化された変換係数に基づいて、前記量子化された変換係数に関する情報を生成することもできる。
エントロピー符号化部190は、例えば、指数ゴロム(exponential Golomb)、CAVLC(context-adaptive variable length coding)、CABAC(context-adaptive binary arithmetic coding)などの様々な符号化方法を行うことができる。エントロピー符号化部190は、量子化された変換係数の他に、ビデオ/画像復元に必要な情報(例えば、シンタックス要素(syntax elements)の値など)を一緒に又は別々に符号化することもできる。符号化された情報(例えば、符号化されたビデオ/画像情報)は、ビットストリーム形式でNAL(network abstraction layer)ユニット単位で伝送又は保存されることができる。前記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。本開示で言及されたシグナリング情報、伝送される情報及び/又はシンタックス要素は、上述した符号化手順を介して符号化されて前記ビットストリームに含まれることができる。
前記ビットストリームは、ネットワークを介して伝送されることができ、又はデジタル記憶媒体に保存されることができる。ここで、ネットワークは、放送網及び/又は通信網などを含むことができ、デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray、HDD、SSDなどのさまざまな記憶媒体を含むことができる。エントロピー符号化部190から出力された信号を伝送する伝送部(図示せず)及び/又は保存する保存部(図示せず)が画像符号化装置100の内/外部要素として備えられることができ、又は伝送部はエントロピー符号化部190の構成要素として備えられることもできる。
量子化部130から出力された、量子化された変換係数は、レジデュアル信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部140及び逆変換部150を介して逆量子化及び逆変換を適用することにより、レジデュアル信号(レジデュアルブロック又はレジデュアルサンプル)を復元することができる。
加算部155は、復元されたレジデュアル信号をインター予測部180又はイントラ予測部185から出力された予測信号に加えることにより、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部155は、復元部又は復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
フィルタリング部160は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部160は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ170、具体的にはメモリ170のDPBに保存することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部160は、各フィルタリング方法についての説明で後述するようにフィルタリングに関する様々な情報を生成してエントロピー符号化部190に伝達することができる。フィルタリングに関する情報は、エントロピー符号化部190で符号化されてビットストリーム形式で出力されることができる。
メモリ170に伝送された、修正された復元ピクチャは、インター予測部180で参照ピクチャとして使用されることができる。画像符号化装置100は、これを介してインター予測が適用される場合、画像符号化装置100と画像復号化装置での予測ミスマッチを回避することができ、符号化効率も向上させることができる。
メモリ170内のDPBは、インター予測部180での参照ピクチャとして使用するために、修正された復元ピクチャを保存することができる。メモリ170は、現在ピクチャ内の動き情報が導出された(又は符号化された)ブロックの動き情報及び/又は既に復元されたピクチャ内ブロックの動き情報を保存することができる。前記保存された動き情報は、空間周辺ブロックの動き情報又は時間周辺ブロックの動き情報として活用するために、インター予測部180に伝達されることができる。メモリ170は、現在ピクチャ内の復元されたブロックの復元サンプルを保存することができ、イントラ予測部185に伝達することができる。
画像復号化装置の概要
図3は本開示による実施例が適用できる画像復号化装置を概略的に示す図である。
図3に示されているように、画像復号化装置200は、エントロピー復号化部210、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260及びイントラ予測部265を含んで構成できる。インター予測部260及びイントラ予測部265を合わせて「予測部」と呼ばれることができる。逆量子化部220、逆変換部230はレジデュアル処理部に含まれることができる。
画像復号化装置200を構成する複数の構成部の全部又は少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、デコーダ又はプロセッサ)で実現されることができる。また、メモリ170は、DPBを含むことができ、デジタル記憶媒体によって実現できる。
ビデオ/画像情報を含むビットストリームを受信した画像復号化装置200は、図1の画像符号化装置100で行われたプロセスに対応するプロセスを実行して画像を復元することができる。例えば、画像復号化装置200は、画像符号化装置で適用された処理ユニットを用いて復号化を行うことができる。したがって、復号化の処理ユニットは、例えばコーディングユニットであることができる。コーディングユニットは、コーディングツリーユニット又は最大コーディングユニットを分割して取得できる。そして、画像復号化装置200を介して復号化及び出力された復元画像信号は、再生装置(図示せず)を介して再生できる。
画像復号化装置200は、図2の画像符号化装置から出力された信号をビットストリーム形式で受信することができる。受信された信号は、エントロピー復号化部210を介して復号化できる。例えば、エントロピー復号化部210は、前記ビットストリームをパーシングして画像復元(又はピクチャ復元)に必要な情報(例えば、ビデオ/画像情報)を導出することができる。前記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)又はビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。画像復号化装置は、画像を復号化するために、前記パラメータセットに関する情報及び/又は前記一般制限情報をさらに用いることができる。本開示で言及されたシグナリング情報、受信される情報及び/又はシンタックス要素は、前記復号化手順を介して復号化されることにより、前記ビットストリームから取得されることができる。例えば、エントロピー復号化部210は、指数ゴロム符号化、CAVLC又はCABACなどのコーディング方法に基づいてビットストリーム内の情報を復号化し、画像復元に必要なシンタックス要素の値、レジデュアルに関する変換係数の量子化された値を出力することができる。より詳細には、CABACエントロピー復号化方法は、ビットストリームから各シンタックス要素に該当するビン(bin)を受信し、復号化対象シンタックス要素情報と周辺ブロック及び復号化対象ブロックの復号化情報、或いは以前ステップで復号化されたシンボル/ビンの情報を用いてコンテキスト(context)モデルを決定し、決定されたコンテキストモデルに基づいてビン(bin)の発生確率を予測してビンの算術復号化(arithmetic decoding)を行うことにより、各シンタックス要素の値に該当するシンボルを生成することができる。この時、CABACエントロピー復号化方法は、コンテキストモデルの決定後、次のシンボル/ビンのコンテキストモデルのために、復号化されたシンボル/ビンの情報を用いてコンテキストモデルを更新することができる。エントロピー復号化部210で復号化された情報のうち、予測に関する情報は、予測部(インター予測部260及びイントラ予測部265)に提供され、エントロピー復号化部210でエントロピー復号化が行われたレジデュアル値、すなわち量子化された変換係数及び関連パラメータ情報は、逆量子化部220に入力されることができる。また、エントロピー復号化部210で復号化された情報のうち、フィルタリングに関する情報は、フィルタリング部240に提供されることができる。一方、画像符号化装置から出力された信号を受信する受信部(図示せず)が画像復号化装置200の内/外部要素としてさらに備えられることができ、又は受信部はエントロピー復号化部210の構成要素として備えられることもできる。
一方、本開示による画像復号化装置は、ビデオ/画像/ピクチャ復号化装置と呼ばれることができる。前記画像復号化装置は、情報デコーダ(ビデオ/画像/ピクチャ情報デコーダ)及び/又はサンプルデコーダ(ビデオ/画像/ピクチャサンプルデコーダ)を含むこともできる。前記情報デコーダは、エントロピー復号化部210を含むことができ、前記サンプルデコーダは、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260及びイントラ予測部265のうちの少なくとも一つを含むことができる。
逆量子化部220では、量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部220は、量子化された変換係数を2次元のブロック形式で再整列することができる。この場合、前記再整列は、画像符号化装置で行われた係数スキャン順序に基づいて行われることができる。逆量子化部220は、量子化パラメータ(例えば、量子化ステップサイズ情報)を用いて、量子化された変換係数に対する逆量子化を行い、変換係数(transform coefficient)を取得することができる。
逆変換部230では、変換係数を逆変換してレジデュアル信号(レジデュアルブロック、レジデュアルサンプルアレイ)を取得することができる。
予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピー復号化部210から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか或いはインター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モード(予測技法)を決定することができる。
予測部が後述の様々な予測方法(技法)に基づいて予測信号を生成することができるのは、画像符号化装置100の予測部についての説明で述べたのと同様である。
イントラ予測部265は、現在ピクチャ内のサンプルを参照して現在ブロックを予測することができる。イントラ予測部185についての説明は、イントラ予測部265に対しても同様に適用されることができる。
インター予測部260は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現在ブロックに対する予測されたブロックを誘導することができる。この時、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現在ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)を含むことができる。例えば、インター予測部260は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出することができる。様々な予測モード(技法)に基づいてインター予測が行われることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測のモード(技法)を指示する情報を含むことができる。
加算部235は、取得されたレジデュアル信号を予測部(インター予測部260及び/又はイントラ予測部265を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより、復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部155についての説明は、加算部235に対しても同様に適用されることができる。加算部235は、復元部又は復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
フィルタリング部240は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部240は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ250、具体的にはメモリ250のDPBに保存することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット(sample adaptive offset)、適応的ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。
メモリ250のDPBに保存された(修正された)復元ピクチャは、インター予測部260で参照ピクチャとして使用されることができる。メモリ250は、現在ピクチャ内の動き情報が導出された(又は復号化された)ブロックの動き情報及び/又は既に復元されたピクチャ内のブロックの動き情報を保存することができる。前記保存された動き情報は、空間周辺ブロックの動き情報又は時間周辺ブロックの動き情報として活用するために、インター予測部260に伝達することができる。メモリ250は、現在ピクチャ内の復元されたブロックの復元サンプルを保存することができ、イントラ予測部265に伝達することができる。
本明細書において、画像符号化装置100のフィルタリング部160、インター予測部180及びイントラ予測部185で説明された実施例は、それぞれ画像復号化装置200のフィルタリング部240、インター予測部260及びイントラ予測部265にも、同様に又は対応するように適用されることができる。
画像分割の概要
本開示によるビデオ/画像コーディング方法は、次の画像分割構造に基づいて行われることができる。具体的には、後述する予測、レジデュアル処理((逆)変換、(逆)量子化など)、シンタックス要素コーディング、フィルタリングなどの手順は、前記画像分割構造に基づいて導出されたCTU、CU(及び/又はTU、PU)に基づいて行われることができる。画像はブロック単位で分割されることができ、ブロック分割手順は上述した符号化装置の画像分割部110で行われることができる。分割関連情報は、エントロピー符号化部190で符号化されてビットストリーム形式で復号化装置に伝達できる。復号化装置のエントロピー復号化部210は、前記ビットストリームから取得した前記分割関連情報に基づいて、現在ピクチャのブロック分割構造を導出し、これに基づいて画像復号化のための一連の手順(例えば、予測、レジデュアル処理、ブロック/ピクチャ復元、インループフィルタリングなど)を行うことができる。
ピクチャは、コーディングツリーユニット(coding tree units、CTUs)のシーケンスに分割されることができる。図4はピクチャがCTUに分割される例を示す。CTUはコーディングツリーブロック(CTB)に対応することができる。或いは、CTUはルマサンプルのコーディングツリーブロックと、対応するクロマサンプルの二つのコーディングツリーブロックを含むことができる。例えば、三つのサンプルアレイを含むピクチャに対して、CTUは、ルマサンプルのN×Nブロックとクロマサンプルの二つの対応ブロックを含むことができる。
CTU分割の概要
前述したように、コーディングユニットは、コーディングツリーユニット(CTU)又は最大符号化ユニット(LCU)をQT/BT/TT(Quad-tree/binary-tree/ternary-tree)構造によって再帰的に分割することにより取得できる。例えば、CTUは、まず、四分木構造に分割されることができる。その後、四分木構造のリーフノードは、マルチタイプツリー構造によってさらに分割されることができる。
四分木による分割は、現在CU(又はCTU)を4等分する分割を意味する。四分木による分割によって、現在CUは、同じ幅と同じ高さを有する4つのCUに分割されることができる。現在CUがそれ以上四分木構造に分割されない場合、現在CUは、四分木構造のリーフノードに該当する。四分木構造のリーフノードに該当するCUは、それ以上分割されず、前述した最終コーディングユニットとして使用できる。又は、四分木構造のリーフノードに該当するCUは、マルチタイプツリー構造によってさらに分割されることができる。
図5はマルチタイプツリー構造によるブロックの分割タイプを示す図である。マルチタイプツリー構造による分割は、二分木構造による2つの分割と三分木構造による2つの分割を含むことができる。
二分木構造による2つの分割は、垂直バイナリ分割(vertical binary splitting、SPLIT_BT_VER)と水平バイナリ分割(horizontal binary splitting、SPLIT_BT_HOR)を含むことができる。垂直バイナリ分割(SPLIT_BT_VER)は、現在CUを垂直方向に二等分する分割を意味する。図4に示されているように、垂直バイナリ分割によって、現在CUの高さと同じ高さ及び現在CUの幅の半分の幅を有する2つのCUが生成されることができる。水平バイナリ分割(SPLIT_BT_HOR)は、現在CUを水平方向に二等分する分割を意味する。図5に示されているように、水平バイナリ分割によって、現在CUの高さの半分の高さをもって現在CUの幅と同じ幅を有する2つのCUが生成されることができる。
三分木構造による2つの分割は、垂直ターナリ分割(vertical ternary splitting、SPLIT_TT_VER)と水平ターナリ分割(horizontal ternary splitting、SPLIT_TT_HOR)を含むことができる。垂直ターナリ分割(SPLIT_TT_VER)は、現在CUを垂直方向に1:2:1の割合で分割する。図5に示されているように、垂直ターナリ分割によって、現在CUの高さと同じ高さ及び現在CUの幅の1/4の幅を有する2つのCUと、現在CUの高さと同じ高さ及び現在CUの幅の半分の幅を有するCUが生成されることができる。水平ターナリ分割SPLIT_TT_HORは、現在CUを水平方向に1:2:1の割合で分割する。図4に示されているように、水平ターナリ分割によって、現在CUの高さの1/4の高さ及び現在CUの幅と同じ幅を有する2つのCUと、現在CUの高さの半分の高さ及び現在CUの幅と同じ幅を有する1つのCUが生成されることができる。
図6は本開示によるマルチタイプツリーを伴う四分木(quadtree with nested multi-type tree)構造でのブロック分割情報のシグナリングメカニズムを例示する図である。
ここで、CTUは四分木のルート(root)ノードとして扱われ、CTUは四分木構造に初めて分割される。現在CU(CTU又は四分木のノード(QT_node))に対して四分木分割を行うか否かを指示する情報(例えば、qt_split_flag)がシグナリングされることができる。例えば、qt_split_flagが第1値(例えば、「1」)であれば、現在CUは四分木に分割されることができる。また、qt_split_flagが第2値(例えば、「0」)であれば、現在CUは、四分木に分割されず、四分木のリーフノード(QT_leaf_node)になる。各四分木のリーフノードは、以後、マルチタイプツリー構造にさらに分割されることができる。つまり、四分木のリーフノードは、マルチタイプツリーのノード(MTT_node)になることができる。マルチタイプツリー構造で、現在ノードがさらに分割されるかを指示するために、第1フラグ(a first flag、例えば、mtt_split_cu_flag)がシグナリングされることができる。もし当該ノードがさらに分割される場合(例えば、第1フラグが1である場合)には、分割方向(splitting direction)を指示するために、第2フラグ(a second flag、例えば、mtt_split_cu_verticla_flag)がシグナリングされることができる。例えば、第2フラグが1である場合には、分割方向は垂直方向であり、第2フラグが0である場合には、分割方向は水平方向であることができる。その後、分割タイプがバイナリ分割タイプであるかターナリ分割タイプであるかを指示するために、第3フラグ(a third flag、例えば、mtt_split_cu_binary_flag)がシグナリングされることができる。例えば、第3フラグが1である場合には、分割タイプはバイナリ分割タイプであり、第3フラグが0である場合には、分割タイプはターナリ分割タイプであることができる。バイナリ分割又はターナリ分割によって取得されたマルチタイプツリーのノードは、マルチタイプツリー構造にさらにパーティショニングされることができる。しかし、マルチタイプツリーのノードは四分木構造にパーティショニングされることはできない。前記第1フラグが0である場合、マルチタイプツリーの該当ノードは、それ以上分割されず、マルチタイプツリーのリーフノード(MTT_leaf_node)になる。マルチタイプツリーのリーフノードに該当するCUは、前述した最終コーディングユニットとして使用できる。
前述したmtt_split_cu_vertical_flag及びmtt_split_cu_binary_flagに基づいて、CUのマルチタイプツリー分割モード(multi-type tree splitting mode、MttSplitMode)が表1のとおりに導出されることができる。以下の説明において、マルチトリー分割モードは、マルチツリー分割タイプ又は分割タイプと略称することができる。
Figure 2022530287000002
図7は四分木の適用後にマルチタイプツリーが適用されることによりCTUが多重CUに分割される例を示す。図7において、太いブロックエッジ(bold block edge)710は四分木分割を示し、残りのエッジ720はマルチタイプツリー分割を示す。CUは、コーディングロック(CB)に対応することができる。一実施例において、CUは、ルマサンプルのコーディングブロックと、ルマサンプルに対応するクロマサンプルの二つのコーディングブロックと、を含むことができる。
クロマ成分(サンプル)CB又はTBサイズは、ピクチャ/画像のカラーフォーマット(クロマフォーマット、例えば、4:4:4、4:2:2、4:2:0など)による成分比に従ってルマ成分(サンプル)CB又はTBサイズに基づいて導出されることができる。カラーフォーマットが4:4:4である場合、クロマ成分CB/TBサイズは、ルマ成分CB/TBサイズと同一に設定されることができる。カラーフォーマットが4:2:2である場合、クロマ成分CB/TBの幅はルマ成分CB/TBの幅の半分に設定されることができ、クロマ成分CB/TBの高さはルマ成分CB/TBの高さに設定されることができる。カラーフォーマットが4:2:0である場合、クロマ成分CB/TBの幅はルマ成分CB/TBの幅の半分に設定されることができ、クロマ成分CB/TBの高さはルマ成分CB/TBの高さの半分に設定されることができる。
一実施例において、ルマサンプル単位を基準にCTUのサイズが128であるとき、CUのサイズは、CTUと同じサイズである128×128から4×4までのサイズを持つことができる。一実施例において、4:2:0カラーフォーマット(又はクロマフォーマット)である場合、クロマCBサイズは64×64から2×2までのサイズを持つことができる。
一方、一実施例において、CUサイズとTUサイズとが同じであることができる。又は、CU領域内に複数のTUが存在することもできる。TUサイズとは、一般的に、ルマ成分(サンプル)TB(Transform Block)サイズを示すことができる。
前記TUサイズは、予め設定された値である最大許容TBサイズ(maxTbSize)に基づいて導出されることができる。例えば、前記CUサイズが前記maxTbSizeよりも大きい場合、前記CUから、前記maxTbSizeを持つ複数のTU(TB)が導出され、前記TU(TB)単位で変換/逆変換が行われることができる。例えば、最大許容ルマTBサイズは64×64であり、最大許容クロマTBサイズは32×32であることができる。もし前記ツリー構造によって分割されたCBの幅又は高さが最大変換幅又は高さよりも大きい場合、当該CBは、自動的に(又は暗黙的に)水平及び垂直方向のTBサイズの制限を満足するまで分割されることができる。
また、例えばイントラ予測が適用される場合、イントラ予測モード/タイプは、前記CU(又はCB)単位で導出され、周辺参照サンプル導出及び予測サンプル生成手順は、TU(又はTB)単位で行われることができる。この場合、一つのCU(又はCB)領域内に一つ又は複数のTU(又はTB)が存在することができ、この場合、前記複数のTU(又はTB)は同じイントラ予測モード/タイプを共有することができる。
一方、マルチタイプツリーを伴った四分木コーディングツリースキームのために、次のパラメータがSPSシンタックス要素として符号化装置から復号化装置にシグナリングされることができる。例えば、四分木のルートノードのサイズを示すパラメータであるCTUsize、四分木のリーフノードの最小許容サイズを示すパラメータであるMinQTSize、二分木のルートノードの最大許容サイズを示すパラメータであるMaxBTSize、三分木のルートノードの最大許容サイズを示すパラメータであるMaxTTSize、四分木のリーフノードから分割されるマルチタイプツリーの最大許容階層深さ(maximum allowed hierarchy depth)を示すパラメータであるMaxMttDepth、二分木の最小許容リーフノードサイズを示すパラメータであるMinBtSize、及び三分木の最小許容リーフノードサイズを示すパラメータであるMinTtSizeのうちの少なくとも一つがシグナリングされることができる。
4:2:0クロマフォーマットを用いる一実施例において、CTUサイズは128×128ルマブロック及びルマブロックに対応する二つの64×64クロマブロックに設定されることができる。この場合、MinQTSizeは16×16に設定され、MaxBtSizeは128×128に設定され、MaxTtSzieは64×64に設定され、MinBtSize及びMinTtSizeは4×4に設定され、MaxMttDepthは4に設定されことができる。四分木パーティショニングは、CTUに適用されて四分木のリーフノードを生成することができる。四分木のリーフノードはリーフQTノードと呼ばれることができる。四分木のリーフノードは16×16サイズ(例えば、the MinQTSize)乃至128×128サイズ(例えば、the CTU size)を持つことができる。もしリーフQTノードが128×128である場合、さらに二分木/三分木に分割されないことができる。これは、この場合に分割されてもMaxBtsize及びMaxTtszie(例えば、64×64)を超過するためである。これ以外の場合、リーフQTノードは、マルチタイプツリーにさらに分割されることができる。よって、リーフQTノードは、マルチタイプツリーに対するルートノード(root node)であり、リーフQTノードは、マルチタイプツリーデプス(mttDepth)0値を持つことができる。もし、マルチタイプツリーデプスがMaxMttdepth(例えば、4)に到達した場合、それ以上の追加分割は考慮されないことができる。もし、マルチタイプツリーノードの幅がMinBtSizeと同じであり、2xMinTtSizeと同じかそれより小さい場合、それ以上の追加的な水平分割は考慮されないことができる。もし、マルチタイプツリーノードの高さがMinBtSizeと同じであり、2xMinTtSizeと同じかそれより小さい場合、それ以上の追加的な垂直分割は考慮されないことができる。このように分割が考慮されない場合、符号化装置は、分割情報のシグナリングを省略することができる。このような場合、復号化装置は、所定の値に分割情報を誘導することができる。
一方、一つのCTUは、ルマサンプルのコーディングブロック(以下、「ルマブロック」という)と、これに対応するクロマサンプルの二つのコーディングブロック(以下、「クロマブロック」という)と、を含むことができる。前述したコーディングツリースキームは、現在CUのルマブロック及びクロマブロックに対して同様に適用されることもでき、個別的に(separate)適用されることもできる。具体的には、一つのCTU内のルマブロック及びクロマブロックが同じブロックツリー構造に分割されることができ、この場合のツリー構造は、シングルツリー(SINGLE_TREE)と表すことができる。又は、一つのCTU内のルマブロック及びクロマブロックは、個別ブロックツリー構造に分割されることができ、この場合のツリー構造は、デュアルツリー(DUAL_TREE)と表すことができる。つまり、CTUがデュアルツリーに分割される場合、ルマブロックに対するブロックツリー構造とクロマブロックに対するブロックツリー構造が別個に存在することができる。このとき、ルマブロックに対するブロックツリー構造は、デュアルツリールマ(DUAL_TREE_LUMA)と呼ばれることができ、クロマブロックに対するブロックツリー構造は、デュアルツリークロマ(DUAL_TREE_CHROMA)と呼ばれることができる。P及びBスライス/タイルグループに対して、一つのCTU内のルマブロック及びクロマブロックは、同じコーディングツリー構造を持つように制限されることができる。しかし、Iスライス/タイルグループに対して、ルマブロック及びクロマブロックは、互いに個別ブロックツリー構造を持つことができる。もし個別ブロックツリー構造が適用される場合、ルマCTB(Coding Tree Block)は、特定のコーディングツリー構造に基づいてCUに分割され、クロマCTBは、他のコーディングツリー構造に基づいてクロマCUに分割されることができる。すなわち、個別ブロックツリー構造が適用されるIスライス/タイルグループ内のCUは、ルマ成分のコーディングブロック又は2つのクロマ成分のコーディングブロックで構成され、P又はBスライス/タイルグループのCUは、三つのカラー成分(ルマ成分及び二つのクロマ成分)のブロックで構成され得ることを意味することができる。
上記において、マルチタイプツリーを伴った四分木コーディングツリー構造について説明したが、CUが分割される構造はこれに限定されない。例えば、BT構造及びTT構造は、多数の分割ツリー(Multiple Partitioning Tree、MPT)構造に含まれる概念と解釈されることができ、CUはQT構造及びMPT構造によって分割されると解釈することができる。QT構造及びMPT構造によってCUが分割される一例において、QT構造のリーフノードが幾つかのブロックに分割されるかに関する情報を含むシンタックス要素(例えば、MPT_split_type)及びQT構造のリーフノードが垂直及び水平のうちのどの方向に分割されるかに関する情報を含むシンタックス要素(例えば、MPT_split_mode)がシグナリングされることにより、分割構造が決定されることができる。
別の例において、CUは、QT構造、BT構造又はTT構造とは異なる方法で分割されることができる。つまり、QT構造によって下位デプスのCUが上位デプスのCUの1/4サイズに分割されるか、或いはBT構造によって下位デプスのCUが上位デプスのCUの1/2サイズに分割されるか、或いはTT構造によって下位デプスのCUが上位デプスのCUの1/4又は1/2サイズに分割されるのとは異なり、下位デプスのCUは、場合によって、上位デプスのCUの1/5、1/3、3/8、3/5、2/3又は5/8のサイズに分割されることができ、CUが分割される方法は、これに限定されない。
このように、前記マルチタイプツリーを伴った四分木コーディングブロック構造は、非常に柔軟なブロック分割構造を提供することができる。一方、マルチタイプツリーに支援される分割タイプのために、場合によって、異なる分割パターンが潜在的に同一のコーディングブロック構造の結果を導出することができる。符号化装置と復号化装置は、このような冗長(redundant)分割パターンの発生を制限することにより、分割情報のデータ量を減らすことができる。
例えば、図8は二分木分割及び三分木分割で発生しうる冗長分割パターンを例示的に示す。図8に示されているように、2ステップレベルの一方向に対する連続バイナリ分割810と820は、ターナリ分割後のセンターパーティションに対するバイナリ分割と同じコーディングブロック構造を持つ。このような場合、三分木分割のセンターブロック830、840に対する二分木分割は禁止できる。このような禁止は、すべてのピクチャのCUに対して適用できる。このような特定の分割が禁止される場合、対応するシンタックス要素のシグナリングは、このように禁止される場合を反映して修正でき、これにより、分割のためにシグナリングされるビット数を減らすことができる。例えば、図8に示されている例のように、CUのセンターブロックに対する二分木分割が禁止される場合、分割がバイナリ分割であるかターナリ分割であるかを示すmtt_split_cu_binary_flagシンタックス要素はシグナリングされず、その値は0に復号化装置によって誘導されることができる。
インター予測の概要
以下、本開示によるインター予測について説明する。
本開示による画像符号化装置/画像復号化装置の予測部は、ブロック単位でインター予測を行って予測サンプルを導出することができる。インター予測は、現在ピクチャ以外のピクチャのデータ要素(例えば、サンプル値、又は動き情報など)に依存的な方法で導出される予測を示すことができる。現在ブロックにインター予測が適用される場合、参照ピクチャインデックスが指す参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)を基に、現在ブロックに対する予測されたブロック(予測ブロック又は予測サンプルアレイ)を誘導することができる。この時、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現在ブロックとの動き情報の相関性に基づいて現在ブロックの動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測が適用される場合、前記周辺ブロックは、現在ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と、参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)を含むことができる。前記参照ブロックを含む参照ピクチャと、前記時間周辺ブロックを含む参照ピクチャとは、同一でもよく、異なってもよい。前記時間周辺ブロックは、コロケート参照ブロック(collocated reference block)、コロケートCU(colCU)、colブロック(colBlock)などの名前で呼ばれることができ、前記時間周辺ブロックを含む参照ピクチャは、コロケートピクチャ(collocated picture、colPic)、colピクチャ(col Picture)などの名前で呼ばれることができる。例えば、現在ブロックの周辺ブロックを基に動き情報候補リストが構成でき、前記現在ブロックの動きベクトル及び/又は参照ピクチャインデックスを導出するために、どの候補が選択(使用)されるかを指し示すフラグ又はインデックス情報がシグナリングされることができる。
インター予測は、様々な予測モードに基づいて行われることができる。例えば、スキップモードとマージモードの場合、現在ブロックの動き情報は、選択された周辺ブロックの動き情報と同一であってもよい。スキップモードの場合、マージモードとは異なり、レジデュアル信号が伝送されないことができる。動き情報予測(motion vector prediction、MVP)モードの場合、選択された周辺ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として用い、動きベクトル差分(motion vector difference)はシグナリングされることができる。この場合、前記動きベクトル予測子及び動きベクトル差分の和を用いて前記現在ブロックの動きベクトルを導出することができる。本開示において、MVPモードは、AMVP(Advanced Motion Vector Prediction)と同じ意味で使用されることができる。
前記動き情報は、インター予測タイプ(L0予測、L1予測、Bi予測など)に基づいてL0動き情報及び/又はL1動き情報を含むことができる。L0方向の動きベクトルは、L0動きベクトル又はMVL0と呼ばれることができ、L1方向の動きベクトルは、L1動きベクトル又はMVL1と呼ばれることができる。L0動きベクトルに基づいた予測はL0予測と呼ばれることができ、L1動きベクトルに基づいた予測はL1予測と呼ばれることができ、前記L0動きベクトル及び前記L1動きベクトルの両方ともに基づいた予測は双(Bi)予測と呼ばれることができる。ここで、L0動きベクトルは、参照ピクチャリストL0(L0)に関連した動きベクトルを示すことができ、L1動きベクトルは、参照ピクチャリストL1(L1)に関連した動きベクトルを示すことができる。参照ピクチャリストL0は、前記現在ピクチャよりも出力順序において以前のピクチャを参照ピクチャとして含むことができ、参照ピクチャリストL1は、前記現在ピクチャよりも出力順序において以後のピクチャを含むことができる。前記以前のピクチャは、順方向(参照)ピクチャと呼ばれることができ、前記以後のピクチャは、逆方向(参照ピクチャ)と呼ばれることができる。前記参照ピクチャリストL0は、前記現在ピクチャよりも出力順序において以後のピクチャを参照ピクチャとしてさらに含むことができる。この場合、前記参照ピクチャリストL0内で前記前ピクチャが先にインデックス化され、前記以後のピクチャは、その次にインデックス化されることができる。前記参照ピクチャリストL1は、前記現在ピクチャよりも出力順序において以前のピクチャを参照ピクチャとしてさらに含むことができる。この場合、前記参照ピクチャリストL1内で前記以後のピクチャが先にインデックス化され、前記以前のピクチャはその次にインデックス化されることができる。ここで、出力順序は、POC(picture order count)順序(order)に対応することができる。
図9はインター予測ベースのビデオ/画像符号化方法を示すフローチャートである。
図10は本開示によるインター予測部180の構成を例示的に示す図である。
図9の符号化方法は、図2の画像符号化装置によって行われることができる。具体的には、ステップS610は、インター予測部180によって行われることができ、ステップS620は、レジデュアル処理部によって行われることができる。具体的には、ステップS620は、減算部115によって行われることができる。ステップS630は、エントロピー符号化部190によって行われることができる。ステップS630の予測情報はインター予測部180によって導出され、ステップS630のレジデュアル情報はレジデュアル処理部によって導出されることができる。前記レジデュアル情報は前記レジデュアルサンプルに関する情報である。前記レジデュアル情報は、前記レジデュアルサンプルに対する量子化された変換係数に関する情報を含むことができる。前述したように、前記レジデュアルサンプルは、画像符号化装置の変換部120を介して変換係数として導出され、前記変換係数は、量子化部130を介して量子化された変換係数として導出されることができる。前記量子化された変換係数に関する情報がレジデュアルコーディング手順を介してエントロピー符号化部190で符号化されることができる。
画像符号化装置は、現在ブロックに対するインター予測を行うことができる(S610)。画像符号化装置は、現在ブロックのインター予測モード及び動き情報を導出し、前記現在ブロックの予測サンプルを生成することができる。ここで、インター予測モード決定、動き情報導出及び予測サンプル生成手順は、同時に行われてもよく、いずれか一つの手順が他の手順よりも先に行われてもよい。例えば、図10に示されているように、画像符号化装置のインター予測部180は、予測モード決定部181、動き情報導出部182、及び予測サンプル導出部183を含むことができる。予測モード決定部181で前記現在ブロックに対する予測モードを決定し、動き情報導出部182で前記現在ブロックの動き情報を導出し、予測サンプル導出部183で前記現在ブロックの予測サンプルを導出することができる。例えば、画像符号化装置のインター予測部180は、動き推定(motion estimation)を介して参照ピクチャの一定の領域(探索領域)内で前記現在ブロックと類似のブロックを探索し、前記現在ブロックとの差が最小又は一定の基準以下である参照ブロックを導出することができる。これに基づいて、前記参照ブロックが位置する参照ピクチャを指す参照ピクチャインデックスを導出し、前記参照ブロックと前記現在ブロックとの位置差に基づいて動きベクトルを導出することができる。画像符号化装置は、様々な予測モードのうち、前記現在ブロックに対して適用されるモードを決定することができる。画像符号化装置は、前記様々な予測モードに対するレート歪みコスト(Rate-Distortion(RD) cost)を比較し、前記現在ブロックに対する最適の予測モードを決定することができる。しかし、画像符号化装置が現在ブロックに対する予測モードを決定する方法は、上記の例に限定されず、様々な方法が利用できる。
例えば、現在ブロックにスキップモード又はマージモードが適用される場合、画像符号化装置は、前記現在ブロックの周辺ブロックからマージ候補を誘導し、誘導されたマージ候補を用いてマージ候補リストを構成することができる。また、画像符号化装置は、前記マージ候補リストに含まれているマージ候補が指す参照ブロックのうち、現在ブロックとの差が最小又は一定の基準以下である参照ブロックを導出することができる。この場合、前記導出された参照ブロックに関連するマージ候補が選択され、前記選択されたマージ候補を示すマージインデックス情報が生成されて画像復号化装置にシグナリングされることができる。前記選択されたマージ候補の動き情報を用いて前記現在ブロックの動き情報を導出することができる。
他の例として、前記現在ブロックにMVPモードが適用される場合、画像符号化装置は、前記現在ブロックの周辺ブロックからmvp(motion vector predictor)候補を誘導し、誘導されたmvp候補を用いてmvp候補リストを構成することができる。また、画像符号化装置は、前記mvp候補リストに含まれているmvp候補のうち、選択されたmvp候補の動きベクトルを前記現在ブロックのmvpとして用いることができる。この場合、例えば、前述した動き推定によって導出された参照ブロックを指す動きベクトルが前記現在ブロックの動きベクトルとして用いられることができ、前記mvp候補のうち、前記現在ブロックの動きベクトルとの差が最も小さい動きベクトルを持つmvp候補が、前記選択されたmvp候補になることができる。前記現在ブロックの動きベクトルから前記mvpを差し引いた差分であるMVD(motion vector difference)が導出されることができる。この場合、前記選択されたmvp候補を示すインデックス情報、及び前記MVDに関する情報が画像復号化装置にシグナリングされることができる。また、MVPモードが適用される場合、前記参照ピクチャインデックスの値は、参照ピクチャインデックス情報で構成されて別途に前記画像復号化装置にシグナリングされることができる。
画像符号化装置は、前記予測サンプルに基づいてレジデュアルサンプルを導出することができる(S620)。画像符号化装置は、前記現在ブロックの原本サンプルと前記予測サンプルとの比較によって前記レジデュアルサンプルを導出することができる。例えば、前記レジデュアルサンプルは、原本サンプルから対応する予測サンプルを減算することにより導出されることができる。
画像符号化装置は、予測情報及びレジデュアル情報を含む画像情報を符号化することができる(S630)。画像符号化装置は、符号化された画像情報をビットストリーム形式で出力することができる。前記予測情報は、前記予測手順に関連した情報であって、予測モード情報(例えば、skip flag、merge flag又はmode indexなど)及び動き情報に関する情報を含むことができる。前記予測モード情報のうち、skip flagは、現在ブロックに対してスキップモードが適用されるか否かを示す情報であり、merge flagは、現在ブロックに対してマージモードが適用されるか否かを示す情報である。又は、予測モード情報は、mode indexのように、複数の予測モードのうちのいずれか一つを指示する情報であってもよい。前記skip flagとmerge flagがそれぞれ0である場合、現在ブロックに対してMVPモードが適用されると決定されることができる。前記動き情報に関する情報は、動きベクトルを導出するための情報である候補選択情報(例えば、merge index、mvp flag又はmvp index)を含むことができる。前記候補選択情報のうち、merge indexは、現在ブロックに対してマージモードが適用される場合にシグナリングされることができ、マージ候補リストに含まれているマージ候補のうちのいずれか一つを選択するための情報であることができる。前記候補選択情報のうち、mvp flag又はmvp indexは、現在ブロックに対してMVPモードが適用される場合にシグナリングされることができ、mvp候補リストに含まれているmvp候補のうちのいずれか一つを選択するための情報であることができる。また、前記動き情報に関する情報は、上述したMVDに関する情報及び/又は参照ピクチャインデックス情報を含むことができる。また、前記動き情報に関する情報は、L0予測、L1予測、又は双(Bi)予測が適用されるか否かを示す情報を含むことができる。前記レジデュアル情報は、前記レジデュアルサンプルに関する情報である。前記レジデュアル情報は、前記レジデュアルサンプルに対する量子化された変換係数に関する情報を含むことができる。
出力されたビットストリームは、(デジタル)記憶媒体に保存されて画像復号化装置に伝達されることができ、又はネットワークを介して画像復号化装置に伝達されることもできる。
一方、前述したように、画像符号化装置は、前記参照サンプル及び前記レジデュアルサンプルに基づいて復元ピクチャ(復元サンプル及び復元ブロックを含むピクチャ)を生成することができる。これは、画像復号化装置で行われるのと同じ予測結果を画像符号化装置で導出するためであり、これによりコーディング効率を高めることができるからである。したがって、画像符号化装置は、復元ピクチャ(又は復元サンプル、復元ブロック)をメモリに保存し、インター予測のためのピクチャとして活用することができる。前記復元ピクチャにインループフィルタリング手順などがさらに適用できるのは、上述したとおりである。
図11はインター予測ベースのビデオ/画像復号化方法を示すフローチャートである。
図12は本開示によるインター予測部260の構成を例示的に示す図である。
画像復号化装置は、前記画像符号化装置で行われた動作と対応する動作を行うことができる。画像復号化装置は、受信された予測情報に基づいて現在ブロックに対する予測を行い、予測サンプルを導出することができる。
図11の復号化方法は、図3の画像復号化装置によって行われることができる。ステップS810乃至S830は、インター予測部260によって行われることができ、ステップS810の予測情報及びステップS840のレジデュアル情報は、エントロピー復号化部210によってビットストリームから取得されることができる。画像復号化装置のレジデュアル処理部は、前記レジデュアル情報に基づいて、現在ブロックに対するレジデュアルサンプルを導出することができる(S840)。具体的には、前記レジデュアル処理部の逆量子化部220は、前記レジデュアル情報に基づいて導出された、量子化された変換係数に基づいて、逆量子化を行って変換係数を導出し、前記レジデュアル処理部の逆変換部230は、前記変換係数に対する逆変換を行って前記現在ブロックに対するレジデュアルサンプルを導出することができる。ステップS850は、加算部235又は復元部によって行われることができる。
具体的には、画像復号化装置は、受信された予測情報に基づいて、前記現在ブロックに対する予測モードを決定することができる(S810)。画像復号化装置は、前記予測情報内の予測モード情報に基づいて、前記現在ブロックにどのインター予測モードが適用されるかを決定することができる。
例えば、前記skip flagに基づいて、前記現在ブロックに前記スキップモードが適用されるか否かを決定することができる。また、前記merge flagに基づいて、前記現在ブロックに前記マージモードが適用されるか或いはMVPモードが決定されるか否かを決定することができる。又は、前記mode indexに基づいて、多様なインター予測モード候補のうちのいずれか一つを選択することができる。前記インター予測モード候補は、スキップモード、マージモード及び/又はMVPモードを含むことができ、又は後述する様々なインター予測モードを含むことができる。
画像復号化装置は、前記決定されたインター予測モードに基づいて前記現在ブロックの動き情報を導出することができる(S820)。例えば、画像復号化装置は、前記現在ブロックにスキップモード又はマージモードが適用される場合、後述するマージ候補リストを構成し、前記マージ候補リストに含まれているマージ候補のうちのいずれか一つを選択することができる。前記選択は、前述した候補選択情報(merge index)に基づいて行われることができる。前記選択されたマージ候補の動き情報を用いて前記現在ブロックの動き情報を導出することができる。例えば、前記選択されたマージ候補の動き情報が前記現在ブロックの動き情報として用いられることができる。
他の例として、画像復号化装置は、前記現在ブロックにMVPモードが適用される場合、mvp候補リストを構成し、前記mvp候補リストに含まれているmvp候補の中から選ばれたmvp候補の動きベクトルを前記現在ブロックのmvpとして用いることができる。前記選択は、前述した候補選択情報(mvp flag又はmvp index)に基づいて行われることができる。この場合、前記MVDに関する情報に基づいて、前記現在ブロックのMVDを導出することができ、前記現在ブロックのmvpと前記MVDに基づいて前記現在ブロックの動きベクトルを導出することができる。また、前記参照ピクチャインデックス情報に基づいて前記現在ブロックの参照ピクチャインデックスを導出することができる。前記現在ブロックに関する関連参照ピクチャリスト内で前記参照ピクチャインデックスが指すピクチャが、前記現在ブロックのインター予測のために参照される参照ピクチャとして導出されることができる。
画像復号化装置は、前記現在ブロックの動き情報に基づいて、前記現在ブロックに対する予測サンプルを生成することができる(S830)。この場合、前記現在ブロックの参照ピクチャインデックスに基づいて前記参照ピクチャを導出し、前記現在ブロックの動きベクトルが前記参照ピクチャ上で指す参照ブロックのサンプルを用いて前記現在ブロックの予測サンプルを導出することができる。場合に応じて、前記現在ブロックの予測サンプルのうち、全部又は一部に対する予測サンプルフィルタリング手順がさらに行われることができる。
例えば、図12に示されているように、画像復号化装置のインター予測部260は、予測モード決定部261、動き情報導出部262及び予測サンプル導出部263を含むことができる。画像復号化装置のインター予測部260は、予測モード決定部261から受信された予測モード情報に基づいて、前記現在ブロックに対する予測モードを決定し、動き情報導出部262から受信された動き情報に関する情報に基づいて前記現在ブロックの動き情報(動きベクトル及び/又は参照ピクチャインデックスなど)を導出し、予測サンプル導出部263で前記現在ブロックの予測サンプルを導出することができる。
画像復号化装置は、受信されたレジデュアル情報に基づいて、前記現在ブロックに対するレジデュアルサンプルを生成することができる(S840)。画像復号化装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックに対する復元サンプルを生成し、これに基づいて復元ピクチャを生成することができる(S850)。以後、前記復元ピクチャにインループフィルタリング手順などがさらに適用できるのは、前述したとおりである。
前述したように、インター予測手順は、インター予測モード決定ステップ、決定された予測モードによる動き情報導出ステップ、導出された動き情報に基づく予測実行(予測サンプルの生成)ステップを含むことができる。前記インター予測手順は、前述したように画像符号化装置及び画像復号化装置で行われることができる。
以下、予測モードによる動き情報導出ステップについてより詳細に説明する。
前述したように、インター予測は、現在ブロックの動き情報を用いて行われることができる。画像符号化装置は、動き推定(motion estimation)手順を介して、現在ブロックに対する最適の動き情報を導出することができる。例えば、画像符号化装置は、現在ブロックに対する原本ピクチャ内の原本ブロックを用いて相関性の高い類似な参照ブロックを参照ピクチャ内の定められた探索範囲内で分数ピクセル単位にて探索することができ、これにより動き情報を導出することができる。ブロックの類似性は、現在ブロックと参照ブロック間のSAD(sum of absolute differences)に基づいて計算できる。この場合、探索領域内のSADが最も小さい参照ブロックを基に、動き情報を導出することができる。導出された動き情報は、インター予測モードに基づいて、様々な方法によって画像復号化装置にシグナリングされることができる。
現在ブロックに対してマージモード(merge mode)が適用される場合、現在ブロックの動き情報が直接伝送されず、周辺ブロックの動き情報を用いて前記現在ブロックの動き情報を誘導する。よって、マージモードを用いたことを知らせるフラグ情報及びどの周辺ブロックをマージ候補として用いたかを知らせる候補選択情報(例えば、マージインデックス)を伝送することにより、現在予測ブロックの動き情報を指示することができる。本開示において、現在ブロックは予測実行の単位であるので、現在ブロックは現在予測ブロックと同じ意味で使用され、周辺ブロックは周辺予測ブロックと同じ意味で使用されることができる。
画像符号化装置は、マージモードを行うために現在ブロックの動き情報を誘導するのに用いられるマージ候補ブロック(merge candidate block)を探索することができる。例えば、前記マージ候補ブロックは、最大5個まで使用できるが、これに限定されない。前記マージ候補ブロックの最大個数は、スライスヘッダー又はタイルグループヘッダーから伝送されることができるが、これに限定されない。前記マージ候補ブロックを見つけた後、画像符号化装置はマージ候補リストを生成することができ、これらのうち、RDコストが最も小さいマージ候補ブロックを最終マージ候補ブロックとして選択することができる。
本開示は、前記マージ候補リストを構成するマージ候補ブロックに対する様々な実施例を提供する。前記マージ候補リストは、例えば5つのマージ候補ブロックを用いることができる。例えば、4つの空間マージ候補(spatial merge candidate)と1つの時間マージ候補(temporal merge candidate)を用いることができる。
図13は空間マージ候補として用いることができる周辺ブロックを例示する図である。
図14は本開示の一例によるマージ候補リスト構成方法を概略的に示す図である。
画像符号化装置/画像復号化装置は、現在ブロックの空間周辺ブロックを探索して導出された空間マージ候補をマージ候補リストに挿入することができる(S1110)。例えば、前記空間周辺ブロックは、図13に示されているように、前記現在ブロックの左下側コーナー周辺ブロックA、左側周辺ブロックA、右上側コーナー周辺ブロックB、上側周辺ブロックB、及び左上側コーナー周辺ブロックBを含むことができる。ただし、これは例示に過ぎず、前述した空間周辺ブロック以外にも右側周辺ブロック、下側周辺ブロック、右下側周辺ブロックなどの追加的な周辺ブロックがさらに前記空間周辺ブロックとして使用できる。画像符号化装置/画像復号化装置は、前記空間周辺ブロックを優先順位に基づいて探索することにより、利用可能なブロックを検出し、検出されたブロックの動き情報を前記空間マージ候補として導出することができる。例えば、画像符号化装置/画像復号化装置は、図13に示されている5つのブロックをA、B、B、A、Bの順に探索し、利用可能な候補を順次インデックス化することにより、マージ候補リストを構成することができる。
画像符号化装置/画像復号化装置は、前記現在ブロックの時間周辺ブロックを探索して導出された時間マージ候補を前記マージ候補リストに挿入することができる(S1120)。前記時間周辺ブロックは、前記現在ブロックが位置する現在ピクチャとは異なるピクチャである参照ピクチャ上に位置することができる。前記時間周辺ブロックが位置する参照ピクチャは、コロケート(collocated)ピクチャ又はcolピクチャと呼ばれることができる。前記時間周辺ブロックは、前記colピクチャ上における前記現在ブロックに対するコロケートブロック(colocated block)の右下側コーナー周辺ブロック及び右下側センターブロックの順に探索できる。一方、メモリ負荷を減らすためにmotion data compressionが適用される場合、前記colピクチャに対して、一定の保存単位ごとに特定の動き情報を代表動き情報として保存することができる。この場合、前記一定の保存ユニット内のすべてのブロックに対する動き情報を保存する必要がなく、これによりmotion data compression効果を得ることができる。この場合、一定の保存単位は、例えば16×16サンプル単位、又は8×8サンプル単位などに予め定められることもでき、又は画像符号化装置から画像復号化装置へ前記一定の保存単位に対するサイズ情報がシグナリングされることもできる。前記motion data compressionが適用される場合、前記時間周辺ブロックの動き情報は、前記時間周辺ブロックが位置する前記一定の保存単位の代表動き情報に置き換えられることができる。つまり、この場合、実現の観点からみると、前記時間周辺ブロックの座標に位置する予測ブロックロックではなく、前記時間周辺ブロックの座標(左上端サンプルポジション)に基づいて一定の値だけ算術右シフトした後、算術左シフトした位置をカバーする予測ブロックの動き情報に基づいて前記時間マージ候補が導出されることができる。例えば、前記一定の保存単位が2×2サンプル単位である場合、前記時間周辺ブロックの座標が(xTnb、yTnb)であるとすれば、修正された位置である((xTnb>>n)<<n)、(yTnb>>n)<<n))に位置する予測ブロックの動き情報が前記時間マージ候補のために使用できる。具体的には、例えば、前記一定の保存単位が16×16サンプル単位である場合、前記時間周辺ブロックの座標が(xTnb、yTnb)であるとすれば、修正された位置である((xTnb>>4)<<4)、(yTnb>>4)<<4))に位置する予測ブロックの動き情報が前記時間マージ候補のために使用できる。又は、例えば、前記一定の保存単位が8×8サンプル単位である場合、前記時間周辺ブロックの座標が(xTnb、yTnb)であるとすれば、修正された位置である((xTnb>>3)<<3)、(yTnb>>3)<<3))に位置する予測ブロックの動き情報が前記時間マージ候補のために使用できる。
再び図14を参照すると、画像符号化装置/画像復号化装置は、現在マージ候補の個数が最大マージ候補の個数よりも小さいか否かを確認することができる(S1130)。前記最大マージ候補の個数は、予め定義されるか、或いは画像符号化装置から画像復号化装置にシグナリングされることができる。例えば、画像符号化装置は、前記最大マージ候補の個数に関する情報を生成し、符号化してビットストリーム形式で前記画像復号化装置に伝達することができる。前記最大マージ候補の個数が全て満たされると、以後の候補追加過程(S1140)は行われないことができる。
ステップS1130の確認結果、前記現在マージ候補の個数が前記最大マージ候補の個数よりも小さい場合、画像符号化装置/画像復号化装置は、所定の方式に基づいて追加マージ候補を誘導した後、前記マージ候補リストに挿入することができる(S1140)。
ステップS1130の確認結果、前記現在マージ候補の個数が前記最大マージ候補の個数よりも小さくない場合、画像符号化装置/画像復号化装置は、前記マージ候補リストの構成を終了することができる。この場合、画像符号化装置は、RDコストに基づいて、前記マージ候補リストを構成するマージ候補の中から最適のマージ候補を選択することができ、前記選択されたマージ候補を指す候補選択情報(例えば、merge index)を画像復号化装置にシグナリングすることができる。画像復号化装置は、前記マージ候補リスト及び前記候補選択情報に基づいて前記最適のマージ候補を選択することができる。
前記選択されたマージ候補の動き情報が前記現在ブロックの動き情報として使用されることができ、前記現在ブロックの動き情報に基づいて前記現在ブロックの予測サンプルを導出することができるのは、前述したとおりである。画像符号化装置は、前記予測サンプルに基づいて前記現在ブロックのレジデュアルサンプルを導出することができ、前記レジデュアルサンプルに関するレジデュアル情報を画像復号化装置にシグナリングすることができる。画像復号化装置は、前記レジデュアル情報に基づいて導出されたレジデュアルサンプル及び前記予測サンプルに基づいて復元サンプルを生成し、これに基づいて復元ピクチャを生成することができるのは、前述したとおりである。
現在ブロックに対してスキップモード(skip mode)が適用される場合、前でマージモードが適用される場合と同様の方法で前記現在ブロックの動き情報を導出することができる。ただし、スキップモードが適用される場合、当該ブロックに対するレジデュアル信号が省略される。よって、予測サンプルが直ちに復元サンプルとして使用できる。
現在ブロックに対してMVPモードが適用される場合、復元された空間周辺ブロック(例えば、図13に示されている周辺ブロック)の動きベクトル及び/又は時間周辺ブロック(又はColブロック)に対応する動きベクトルを用いて、動きベクトル予測子(motion vector predictor、mvp)候補リストが生成できる。つまり、復元された空間周辺ブロックの動きベクトル及び/又は時間周辺ブロックに対応する動きベクトルが現在ブロックの動きベクトル予測子候補として使用できる。双予測が適用される場合、L0動き情報導出のためのmvp候補リストとL1動き情報導出のためのmvp候補リストが個別に生成されて利用できる。現在ブロックに対する予測情報(又は予測に関する情報)は、前記mvp候補リストに含まれている動きベクトル予測子候補の中から選択された最適の動きベクトル予測子候補を指示する候補選択情報(例えば、MVPフラグ又はMVPインデックス)を含むことができる。このとき、予測部は、前記候補選択情報を用いて、mvp候補リストに含まれている動きベクトル予測子候補の中から、現在ブロックの動きベクトル予測子を選択することができる。画像符号化装置の予測部は、現在ブロックの動きベクトルと動きベクトル予測子との動きベクトル差分(MVD)を求めることができ、これを符号化してビットストリーム形式で出力することができる。つまり、MVDは現在ブロックの動きベクトルから前記動きベクトル予測子を差し引いた値で求められることができる。画像復号化装置の予測部は、前記予測に関する情報に含まれている動きベクトル差分を取得し、前記動きベクトル差分と前記動きベクトル予測子との加算を介して、現在ブロックの前記動きベクトルを導出することができる。画像復号化装置の予測部は、参照ピクチャを指示する参照ピクチャインデックスなどを前記予測に関する情報から取得又は誘導することができる。
図15は本開示の一例による動きベクトル予測子候補リスト構成方法を概略的に示す図である。
まず、現在ブロックの空間候補ブロックを探索して、利用可能な候補ブロックをmvp候補リストに挿入することができる(S1210)。その後、mvp候補リストに含まれているmvp候補が2つ未満であるか否かが判断され(S1220)、2つである場合、mvp候補リストの構成を完了することができる。
ステップS1220で、利用可能な空間候補ブロックが2つ未満である場合、現在ブロックの時間候補ブロックを探索して、利用可能な候補ブロックをmvp候補リストに挿入することができる(S1230)。時間候補ブロックが利用可能でなければ、ゼロ動きベクトルをmvp候補リストに挿入(S1240)することにより、mvp候補リストの構成を完了することができる。
一方、MVPモードが適用される場合、参照ピクチャインデックスが明示的にシグナリングされることができる。この場合、L0予測のためのピクチャインデックス(refidxL0)とL1予測のための参照ピクチャインデックス(refidxL1)が区分されてシグナリングされることができる。例えば、MVPモードが適用され、双予測(BI prediction)が適用される場合、前記refidxL0に関する情報及びrefidxL1に関する情報が両方ともシグナリングされることができる。
前述したように、MVPモードが適用される場合、画像符号化装置から導出されたMVDに関する情報が画像復号化装置にシグナリングされることができる。MVDに関する情報は、例えばMVD絶対値及び符号に対するx、y成分を示す情報を含むことができる。この場合、MVD絶対値が0よりも大きいか、及び1よりも大きいか否か、MVDの残りを示す情報が段階的にシグナリングされることができる。例えば、MVD絶対値が1よりも大きいか否かを示す情報は、MVD絶対値が0よりも大きいか否かを示すflag情報の値が1である場合に限ってシグナリングされることができる。
図16は本開示の一例によって画像符号化装置から画像復号化装置へMVDを伝送するためのシンタックス構造を示す図である。
図16において、abs_mvd_greater0_flag[0]は、MVDのx成分の絶対値が0よりも大きいか否かを示し、abs_mvd_greater0_flag[1]は、MVDのy成分の絶対値が0よりも大きいか否かを示す。同様に、abs_mvd_greater1_flag[0]は、MVDのx成分の絶対値が1よりも大きいか否かを示し、abs_mvd_greater1_flag[1]は、MVDのy成分の絶対値が1よりも大きいか否かを示す。図16に示されているように、abs_mvd_greater1_flagは、abs_mvd_greater0_flagが1であるときにのみ伝送されることができる。図16において、abs_mvd_minus2は、MVDの絶対値から2を差し引いた値を示し、mvd_sign_flagは、MVDの符号がプラスであるかマイナスであるかを示す。図16に示されたシンタックス構造を用いて、MVDは次の数式のように導出できる。
〔数1〕
MVD[compIdx]=abs_mvd_greater0_flag[compIdx]*(abs_mvd_minus2[compIdx]+2)*(1-2*mvd_sign_flag[compIdx])
一方、L0予測のためのMVD(MVDL0)とL1予測のためのMVD(MVDL1)が区分されてシグナリングされることもでき、前記MVDに関する情報は、MVDL0に関する情報及び/又はMVDL1に関する情報を含むことができる。例えば、現在ブロックにMVPモードが適用され且つBI予測が適用される場合、前記MVDL0に関する情報及びMVDL1に関する情報が両方ともシグナリングされることができる。
IBC(Intra Block Copy)予測の概要
以下、本開示によるIBC予測について説明する。
IBC予測は、画像符号化装置/画像復号化装置の予測部で行われることができる。IBC予測は、簡単に「IBC」と呼ばれることができる。前記IBCは、例えばSCC(screen content coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。前記IBCは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出するという点で、インター予測と同様に行われることができる。つまり、IBCは、本開示で説明されたインター予測技法のうちの少なくとも一つを用いることができる。例えば、IBCでは、前述した動き情報(動きベクトル)導出方法のうちの少なくとも一つを用いることができる。前記インター予測技法のうちの少なくとも一つは、前記IBC予測を考慮して一部修正されて用いられることもできる。前記IBCは、現在ピクチャを参照することができる。よって、CPR(current picture referencing)とも呼ばれることができる。
IBCのために、画像符号化装置は、ブロックマッチングBMを行って現在ブロック(例えば、CU)に対する最適のブロックベクトル(又は動きベクトル)を導出することができる。前記導出されたブロックベクトル(又は動きベクトル)は、前述したインター予測での動き情報(動きベクトル)シグナリングと同様の方法を用いて、ビットストリームを介して画像復号化装置にシグナリングされることができる。画像復号化装置は、前記シグナリングされたブロックベクトル(動きベクトル)を介して、現在ピクチャ内で前記現在ブロックに対する参照ブロックを導出することができ、これにより前記現在ブロックに対する予測信号(予測されたブロック又は予測サンプル)を導出することができる。ここで、前記ブロックベクトル(又は動きベクトル)は、現在ブロックから現在ピクチャ内の既に復元された領域に位置する参照ブロックまでの変位(displacement)を示すことができる。よって、前記ブロックベクトル(又は動きベクトル)は、変位ベクトルと呼ばれることもできる。以下、IBCにおける前記動きベクトルは、前記ブロックベクトル又は前記変位ベクトルに対応することができる。現在ブロックの動きベクトルは、ルマ成分に対する動きベクトル(ルマ動きベクトル)又はクロマ成分に対する動きベクトル(クロマ動きベクトル)を含むことができる。例えば、IBCコーディングされたCUに対するルマ動きベクトルも、整数サンプル単位(すなわち、integer precision)であることができる。クロマ動きベクトルも、整数サンプル単位でクリッピング(clipped)できる。前述したように、IBCは、インター予測技法のうちの少なくとも一つを用いることができ、例えば、ルマ動きベクトルは、前述したマージモード又はMVPモードを用いて符号化/復号化されることができる。
ルマIBCブロックに対してマージモードが適用される場合、ルマIBCブロックに対するマージ候補リストは、図14を参照して説明したインターモードでのマージ候補リストと同様に構成されることができる。ただし、ルマIBCブロックの場合、マージ候補として、時間周辺ブロックは利用されなくてもよい。
ルマIBCブロックに対してMVPモードが適用される場合、ルマIBCブロックに対するmvp候補リストは、図15を参照して説明したインターモードでのmvp候補リストと同様に構成されることができる。ただし、ルマIBCブロックの場合、mvp候補として時間候補ブロックは利用されなくてもよい。
IBCは、現在ピクチャ内の既に復元された領域から参照ブロックを導出する。このとき、メモリの消費と画像復号化装置の複雑度を減少させるために、現在ピクチャ内の既に復元された領域のうち、既に定義された領域(predefined area)のみが参照できる。前記既に定義された領域は、現在ブロックが含まれている現在CTUを含むことができる。このように、参照可能な復元領域を既に定義された領域に制限することにより、IBCモードは、ローカルオンチップメモリ(local on-chip memory)を用いてハードウェア的に実現できる。
IBCを実行する画像符号化装置は、前記既に定義された領域を探索して、最も小さいRDコストを持つ参照ブロックを決定し、参照ブロックと現在ブロックの位置に基づいて動きベクトル(ブロックベクトル)を導出することができる。
現在ブロックに対してIBCを適用するか否かは、CUレベルで、IBC実行情報としてシグナリングされることができる。現在ブロックの動きベクトルのシグナリング方法(IBC MVPモード又はIBCスキップ/マージモード)に関する情報がシグナリングされることができる。IBC実行情報は、現在ブロックの予測モードを決定するのに使用できる。よって、IBC実行情報は、現在ブロックの予測モードに関する情報に含まれることができる。
IBCスキップ/マージモードの場合、マージ候補インデックスがシグナリングされてマージ候補リストに含まれているブロックベクトルのうち、現在ルマブロックの予測に使用されるブロックベクトルを指示するために使用できる。このとき、マージ候補リストは、IBCで符号化された周辺ブロックを含むことができる。マージ候補リストは、空間マージ候補を含むことができ、時間マージ候補は含まないように構成できる。また、マージ候補リストは、さらにHMVP(Histrory-based motion vector predictor)候補及び/又はペアワイズ(pairwise)候補を含むことができる。
IBC MVPモードの場合、ブロックベクトル差分値が前述のインターモードの動きベクトル差分値と同様の方法で符号化できる。ブロックベクトル予測方法は、インターモードのMVPモードと同様に、2つの候補を予測子として含むmvp候補リストを構成して用いることができる。前記2つの候補のうちのいずれか一つは、左側周辺ブロックから誘導され、残りの一つは、上側周辺ブロックから誘導されることができる。このとき、左側又は上側周辺ブロックがIBCで符号化された場合にのみ、当該周辺ブロックから候補を誘導することができる。もし左側又は上側周辺ブロックが利用可能でない場合、例えば、IBCで符号化されていない場合、デフォルトブロックベクトルが予測子としてmvp候補リストに含まれることができる。また、2つのブロックベクトル予測子のうちのいずれか一つを指示するための情報(例えば、フラグ)が候補選択情報としてシグナリングされ、利用されるのは、インターモードのMVPモードと同様である。前記mvp候補リストは、デフォルトブロックベクトルとしてHMVP候補及び/又はゼロ動きベクトルを含むことができる。
前記HMVP候補は、ヒストリベースのMVP候補と呼ばれることもあり、現在ブロックの符号化/復号化の以前に使用されたMVP候補、マージ候補又はブロックベクトル候補は、HMVP候補としてHMVPリストに保存されることができる。以後、現在ブロックのマージ候補リスト又はmvp候補リストが最大個数の候補を含まない場合、HMVPリストに保存された候補がHMVP候補として現在ブロックのマージ候補リスト又はmvp候補リストに追加されることができる。
前記ペアワイズ(pairwise)候補は、現在ブロックのマージ候補リストに既に含まれている候補の中から、予め決められた順序に従って2つの候補を選択し、選択された2つの候補を平均することにより誘導される候補を意味する。
図17はIBCベースのビデオ/画像符号化方法を示すフローチャートである。
図18は本開示によるIBCベースのビデオ/画像符号化方法を実行する予測部の構成を例示的に示す図である。
図17の符号化方法は、図2の画像符号化装置によって行われることができる。具体的には、ステップS1410は予測部によって行われることができ、ステップS1420はレジデュアル処理部によって行われることができる。具体的には、ステップS1420は減算部115によって行われることができる。ステップS1430はエントロピー符号化部190によって行われることができる。ステップS1430の予測情報は、予測部によって導出され、ステップS1430のレジデュアル情報は、レジデュアル処理部によって導出されることができる。前記レジデュアル情報は、前記レジデュアルサンプルに関する情報である。前記レジデュアル情報は、前記レジデュアルサンプルに対する量子化された変換係数に関する情報を含むことができる。前述したように、前記レジデュアルサンプルは、画像符号化装置の変換部120を介して変換係数として導出され、前記変換係数は、量子化部130を介して量子化された変換係数として導出されることができる。前記量子化された変換係数に関する情報がレジデュアルコーディング手順を介してエントロピー符号化部190で符号化されることができる。
画像符号化装置は、現在ブロックに対するIBC予測(IBCに基づく予測)を行うことができる(S1410)。画像符号化装置は、現在ブロックの予測モード及び動きベクトル(ブロックベクトル)を導出し、前記現在ブロックの予測サンプルを生成することができる。前記予測モードは、前述したインター予測モードのうちの少なくとも一つを含むことができる。ここで、予測モード決定、動きベクトル導出及び予測サンプル生成手順は、同時に行われてもよく、いずれか一つの手順が他の手順よりも先に行われてもよい。例えば、図18に示されているように、IBCに基づくビデオ/画像符号化方法を行う画像符号化装置の予測部は、予測モード決定部、動きベクトル導出部、予測サンプル導出部を含むことができる。予測モード決定部で前記現在ブロックに対する予測モードを決定し、動きベクトル導出部で前記現在ブロックの動きベクトルを導出し、予測サンプル導出部で前記現在ブロックの予測サンプルを導出することができる。例えば、画像符号化装置の予測部は、現在ピクチャの復元された領域(又は復元された領域のうちの一定の領域(探索領域))内で前記現在ブロックと類似のブロックを探索し、前記現在ブロックとの差が最小又は一定の基準以下である参照ブロックを導出することができる。画像符号化装置は、前記参照ブロックと前記現在ブロックとの変位差に基づいて動きベクトルを導出することができる。画像符号化装置は、様々な予測モードのうち、前記現在ブロックに対して適用されるモードを決定することができる。画像符号化装置は、前記様々な予測モードに対するレート歪みコスト(RDコスト)を比較し、前記現在ブロックに対する最適の予測モードを決定することができる。しかし、画像符号化装置が現在ブロックに対する予測モードを決定する方法は、上記の例に限定されず、様々な方法が使用できる。
例えば、現在ブロックにスキップモード又はマージモードが適用される場合、画像符号化装置は、前記現在ブロックの周辺ブロックからマージ候補を誘導し、誘導されたマージ候補を用いてマージ候補リストを構成することができる。また、画像符号化装置は、前記マージ候補リストに含まれているマージ候補が指す参照ブロックのうち、前記現在ブロックとの差が最小又は一定の基準以下である参照ブロックを導出することができる。この場合、前記導出された参照ブロックに関連するマージ候補が選択され、前記選択されたマージ候補を指すマージインデックス情報が生成されて画像復号化装置にシグナリングされることができる。前記選択されたマージ候補の動きベクトルを用いて前記現在ブロックの動きベクトルが導出することができる。
他の例として、前記現在ブロックにMVPモードが適用される場合、画像符号化装置は、前記現在ブロックの周辺ブロックからmvp(motion vector predictor)候補を誘導し、誘導されたmvp候補を用いてmvp候補リストを構成することができる。また、画像符号化装置は、前記mvp候補リストに含まれているmvp候補の中から選ばれたmvp候補の動きベクトルを前記現在ブロックのmvpとして用いることができる。この場合、例えば、前述した動き推定によって導出された参照ブロックを指す動きベクトルが前記現在ブロックの動きベクトルとして使用でき、前記mvp候補のうち、前記現在ブロックの動きベクトルとの差が最も小さい動きベクトルを有するmvp候補が、前記選択されたmvp候補になることができる。前記現在ブロックの動きベクトルから前記mvpを差し引いた差分であるMVD(motion vector difference)が導出されることができる。この場合、前記選択されたmvp候補を指すインデックス情報、及び前記MVDに関する情報が画像復号化装置にシグナリングされることができる。
画像符号化装置は、前記予測サンプルに基づいてレジデュアルサンプルを導出することができる(S1420)。画像符号化装置は、前記現在ブロックの原本サンプルと前記予測サンプルとの比較を介して前記レジデュアルサンプルを導出することができる。例えば、前記レジデュアルサンプルは、原本サンプルから対応する予測サンプルを減算することにより導出されることができる。
画像符号化装置は、予測情報及びレジデュアル情報を含む画像情報を符号化することができる(S1430)。画像符号化装置は、符号化された画像情報をビットストリーム形式で出力することができる。前記予測情報は、前記予測手順に関連した情報として予測モード情報(例えば、skip flag、merge flag又はmode indexなど)及び動きベクトルに関する情報を含むことができる。前記予測モード情報のうち、skip flagは、現在ブロックに対してスキップモードが適用されるかど否かを示す情報であり、merge flagは、現在ブロックに対してマージモードが適用されるか否かを示す情報である。又は、予測モード情報は、mode indexのように、複数の予測モードのうちのいずれか一つを指示する情報であってもよい。前記skip flagとmerge flagがそれぞれ0である場合、現在ブロックに対してMVPモードが適用されると決定できる。前記動きベクトルに関する情報は、動きベクトルを導出するための情報である候補選択情報(例えば、merge index、mvp flag又はmvp index)を含むことができる。前記候補選択情報のうちのmerge indexは、現在ブロックに対してマージモードが適用される場合にシグナリングされることができ、マージ候補リストに含まれているマージ候補のうちのいずれか一つを選択するための情報であることができる。前記候補選択情報のうちのmvp flag又はmvp indexは、現在ブロックに対してMVPモードが適用される場合にシグナリングされることができ、mvp候補リストに含まれているmvp候補のうちのいずれか一つを選択するための情報であることができる。また、前記動きベクトルに関する情報は、上述したMVDに関する情報を含むことができる。また、前記動きベクトルに関する情報は、L0予測、L1予測、又は双(bi)予測が適用されるか否かを示す情報を含むことができる。前記レジデュアル情報は、前記レジデュアルサンプルに関する情報である。前記レジデュアル情報は、前記レジデュアルサンプルに対する量子化された変換係数に関する情報を含むことができる。
出力されたビットストリームは、(デジタル)記憶媒体に保存されて画像復号化装置に伝達されることもでき、又はネットワークを介して画像復号化装置に伝達されることもできる。
一方、前述したように、画像符号化装置は、前記参照サンプル及び前記レジデュアルサンプルを基に、復元ピクチャ(復元サンプル及び復元ブロックを含むピクチャ)を生成することができる。これは、画像復号化装置で行われるのと同じ予測結果を画像符号化装置で導出するためであり、これによりコーディング効率を高めることができるからである。よって、画像符号化装置は、復元ピクチャ(又は復元サンプル、復元ブロック)をメモリに保存し、インター予測のための参照ピクチャとして活用することができる。前記復元ピクチャにインループフィルタリング手順などがさらに適用できるのは、上述したとおりである。
図19はIBCベースのビデオ/画像復号化方法を示すフローチャートである。
図20は本開示によるIBCベースのビデオ/画像復号化方法を実行する予測部の構成を例示的に示す図である。
画像復号化装置は、前記画像符号化装置で行われた動作と対応する動作を行うことができる。画像復号化装置は、受信された予測情報に基づいて、現在ブロックに対するIBC予測を行い、予測サンプルを導出することができる。
図19の復号化方法は、図3の画像復号化装置によって行われることができる。ステップS1610乃至S1630は予測部によって行われることができ、ステップS1610の予測情報及びステップS1640のレジデュアル情報はエントロピー復号化部210によってビットストリームから取得されることができる。画像復号化装置のレジデュアル処理部は、前記レジデュアル情報に基づいて、現在ブロックに対するレジデュアルサンプルを導出することができる(S1640)。具体的には、前記レジデュアル処理部の逆量子化部220は、前記レジデュアル情報に基づいて導出された量子化された変換係数を基に、逆量子化を行って変換係数を導出し、前記レジデュアル処理部の逆変換部230は、前記変換係数に対する逆変換を行って前記現在ブロックに対するレジデュアルサンプルを導出することができる。ステップS1650は加算部235又は復元部によって行われることができる。
具体的には、画像復号化装置は、受信された予測情報に基づいて前記現在ブロックに対する予測モードを決定することができる(S1610)。画像復号化装置は、前記予測情報内の予測モード情報に基づいて、前記現在ブロックにどの予測モードが適用されるかを決定することができる。
例えば、前記skip flagに基づいて、前記現在ブロックに前記スキップモードが適用されか否かを決定することができる。また、前記merge flagに基づいて、前記現在ブロックに前記マージモードが適用されるか、又はMVPモードが決定されるか否かを決定することができる。又は、前記mode indexに基づいて、様々な予測モード候補のうちのいずれか一つを選択することができる。前記予測モード候補は、スキップモード、マージモード及び/又はMVPモードを含むことができ、又は前述した様々なインター予測モードを含むことができる。
画像復号化装置は、前記決定された予測モードを基に、前記現在ブロックの動きベクトルを導出することができる(S1620)。例えば、画像復号化装置は、前記現在ブロックにスキップモード又はマージモードが適用される場合、前述したマージ候補リストを構成し、前記マージ候補リストに含まれているマージ候補のうちのいずれか一つを選択することができる。前記選択は、前述した候補選択情報(merge index)に基づいて行われることができる。前記選択されたマージ候補の動きベクトルを用いて前記現在ブロックの動きベクトルが導出することができる。例えば、前記選択されたマージ候補の動きベクトルが前記現在ブロックの動きベクトルとして使用できる。
他の例として、画像復号化装置は、前記現在ブロックにMVPモードが適用される場合、mvp候補リストを構成し、前記mvp候補リストに含まれているmvp候補の中から選択されたmvp候補の動きベクトルを前記現在ブロックのmvpとして用いることができる。前記選択は、前述した候補選択情報(mvp flag or mvp index)に基づいて行われることができる。この場合、前記MVDに関する情報に基づいて前記現在ブロックのMVDを導出することができ、前記現在ブロックのmvpと前記MVDに基づいて前記現在ブロックの動きベクトルを導出することができる。
画像復号化装置は、前記現在ブロックの動きベクトルに基づいて前記現在ブロックに対する予測サンプルを生成することができる(S1630)。前記現在ブロックの動きベクトルが前記現在ピクチャ上で指す参照ブロックのサンプルを用いて、前記現在ブロックの予測サンプルを導出することができる。場合に応じて、前記現在ブロックの予測サンプルのうちの全部又は一部に対する予測サンプルフィルタリング手順がさらに行われることができる。
例えば、図20に示されているように、IBCベースのビデオ/画像復号化方法を実行する画像復号化装置の予測部は、予測モード決定部、動きベクトル導出部及び予測サンプル導出部を含むことができる。画像復号化装置の予測部は、受信された予測モード情報に基づいて前記現在ブロックに対する予測モードを予測モード決定部で決定し、受信された動きベクトルに関する情報に基づいて前記現在ブロックの動きベクトルを動きベクトル導出部で導出し、予測サンプル導出部で前記現在ブロックの予測サンプルを導出することができる。
画像復号化装置は、受信されたレジデュアル情報に基づいて前記現在ブロックに対するレジデュアルサンプルを生成することができる(S1640)。画像復号化装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックに対する復元サンプルを生成し、これに基づいて復元ピクチャを生成することができる(S1650)。その後、前記復元ピクチャにインループフィルタリング手順などがさらに適用できるのは、前述したとおりである。
前述したように、一つのユニット(例えば、コーディングユニットCU)は、ルマブロック(ルマCB(coding block))とクロマブロック(クロマCB)を含むことができる。このとき、ルマブロックとこれに対応するクロマブロックは、同じ動き情報(例えば、動きベクトル)を持つこともでき、又は異なる動き情報を持つこともできる。一例として、クロマブロックの動き情報は、ルマブロックの動き情報に基づいて導出されることにより、ルマブロックと対応するクロマブロックが同じ動き情報を持つことができる。
クロマブロックに対するイントラ予測
現在ブロックにイントラ予測が行われる場合、現在ブロックのルマ成分ブロック(ルマブロック)に対する予測及びクロマ成分ブロック(クロマブロック)に対する予測が行われることができ、この場合、クロマブロックに対するイントラ予測モードは、ルマブロックに対するイントラ予測モードとは個別に設定されることができる。
例えば、クロマブロックに対するイントラ予測モードは、イントラクロマ予測モード情報に基づいて指示されることができ、前記イントラクロマ予測モード情報は、intra_chroma_pred_modeシンタックス要素の形態でシグナリングされることができる。一例として、前記イントラクロマ予測モード情報は、Planarモード、DCモード、垂直(vertical)モード、水平(horizontal)モード、DM(Derived Mode)、CCLM(Cross-component linear model)モードのうちのいずれか一つを指し示すことができる。ここで、Planarモードは0番イントラ予測モード、前記DCモードは1番イントラ予測モード、前記垂直モードは26番イントラ予測モード、前記水平モードは10番イントラ予測モードをそれぞれ示すことができる。DMはdirect modeと呼ばれることもできる。CCLMはLM(linear model)とも呼ばれることができる。
一方、DMとCCLMは、ルマブロックの情報を用いてクロマブロックを予測する従属的なイントラ予測モードである。前記DMは、前記ルマ成分に対するイントラ予測モードと同じイントラ予測モードが前記クロマ成分に対するイントラ予測モードとして適用されるモードを示すことができる。また、前記CCLMは、クロマブロックに対する予測ブロックを生成する過程でルマブロックの復元されたサンプルをサブサンプリングした後、サブサンプリングされたサンプルにCCLMパラメータα及びβを適用して導出されたサンプルを前記クロマブロックの予測サンプルとして使用するイントラ予測モードを示すことができる。
Figure 2022530287000003
ここで、pred(i,j)は、現在CU内の前記現在クロマブロックの(i,j)座標の予測サンプルを示すことができる。rec(i,j)は、前記CU内の前記現在ルマブロックの(i,j)座標の復元サンプルを示すことができる。例えば、rec’(i,j)は、前記現在ルマブロックのダウンサンプリング(down-sampled)された復元サンプルを示すことができる。線形モデル係数α及びβは、シグナリングされることもできるが、周辺サンプルから誘導されることもできる。
2×N及びN×2ブロックの符号化効率低下の問題
VVC標準の場合、符号化ターゲット画像は、UHDやFHDなどの高解像度画像である。このような高解像度画像を処理するためのハードウェア構成は、ますます複雑になっている。一実施例において、VVC spec及び標準ソフトウェアVTMは、画面内予測の際に128×128サイズのCTUを使用することができる。このような場合でも、最小CUブロックとして、ルマブロックの場合には、4×4ブロックが使用でき、クロマブロックの場合には、現在ブロックのツリー構造がシングルツリーであれば2×2ブロックが使用でき、デュアルツリーであれば2×8、8×2、4×4ブロックが使用できる。
したがって、3840×2160の解像度を有するUHD画像を、VTMソフトウェアを介して画面内予測を行って符号化する場合、ルマブロックがすべて4×4ブロックに符号化され、クロマブロックがデュアルツリーに応じてすべて4×4ブロックに符号化される場合が発生する可能性がある。このような場合、UHD画像は、518,400個の4×4ルマブロックとクロマブロックに分けられる。VTMのハードウェア実現の際に、当該ハードウェアは、最悪の場合に発生するデータスループット(throughput)にも駆動可能でなければならない。よって、このような場合が発生する場合、これに備えるためにハードウェア製作コストが増加するのはもとより、符号化及び復号化過程の処理遅延が発生する。
CCLMのようにルマブロックとクロマブロックとの相関度を利用する技術の場合、ルマブロックの符号化が全て完了した後にクロマブロックの符号化を行わなければならないため、図21に示すようにハードウェア実現におけるパイプライニング遅延(pipelining delay)問題が発生する。
また、シングルツリーとは異なり、デュアルツリーの場合は、ルマブロックの符号化がすべて完了した後、クロマブロックの符号化を行わなければならない。このため、ルマブロックの符号化が完了するまでクロマブロックの符号化を遅延させることにより、ハードウェア実現時のパイプライニング遅延問題が発生する。特に、デュアルツリーにおけるクロマブロックは、2×8、2×16、2×32構造を生成するため、1クロック(clock)あたり4×1単位で符号化及び復号化を行っていた従来のハードウェア構造を利用することができず、これにより1クロックあたり2×2又は1×4単位でプロセスを行う新しいハードウェア構造が必要とされる。
本開示は、前述したハードウェア実現上の問題点を解決するために、適応的に色差ブロックサイズを制限するか、或いはCCLM予測ブロックの適用ブロックサイズを制限又は調節する方法を提案する。これにより、符号化効率の損失を最小限に抑えながらハードウェア実現上の複雑さを大幅に減らすことができる。
以下の説明において、特定のブロックサイズを制限するというのは、当該特定のサイズを有するブロックへの分割が許可されないことを示すことができる。このように特定のサイズを有するブロックへの分割を許可しないよう、特定の条件での分割を制限することができる。これは、特定の条件での分割が利用可能でないように設定されることを示すことができる。この場合、上位ブロックは、前記特定のブロックサイズを除く他のブロックサイズに分割されることができ、その後、当該分割されたブロックを現在ブロックとして、一連のコーディング手順(予測、レジデュアル処理、ブロック復元、画像/ビデオ情報符号化/復号化など)が行われることができる。前記画像/ビデオ情報は、パーティショニング情報を含むことができ、前記パーティショニング情報は、前記制限された分割サイズを除いた他のブロックサイズへの分割を指示する情報を含むことができる。
ブロック分割制限に基づく実現性能の改善
一実施例による符号化装置及び復号化装置は、現在画像のCTUがシングルツリー構造に応じて分割されるか、或いはデュアルツリー構造に応じて分割されるかによって、適応的にCTUで分割されるブロックサイズを制限することにより、ハードウェア実現上の複雑さを実現することができる。
前述したように、デュアルツリーの場合、一定サイズのルマブロックの符号化又は復号化がすべて完了した後、ルマブロックに対応するクロマブロックの符号化が行われることができる。これにより、H.264及びHEVCで使用されるシングルツリーハードウェアとは異なるパイプライン方法を使用する必要がある。
VVC標準を活用する場合、デュアルツリーが適用されるとき、カラーフォーマットが4:2:0である場合、64×64ルマブロックの符号化が行われた後、32×32クロマブロックの符号化が行われる。よって、ルマブロック及びクロマブロックの符号化及び復号化が順次行われなければならない。ルマブロックの場合、従来のハードウェアで使用される1クロックあたり4×1ピクセル処理方法をそのまま使用することができるが、クロマブロックは、2×8、2×16、2×32構造を生成するため、4×1単位で符号化及び復号化を行う従来のハードウェア構造を使用することができなくなる。
既存のハードウェア構造をそのまま使用するために、既存の符号化及び復号化単位でクロマブロックのサイズを制限することができる。例えば、符号化及び復号化単位が1クロックあたりA×1単位でプロセスを行う場合、このような構造でクロマブロックが符号化/復号化できるように、クロマブロックのB×Nブロックサイズを制限することができる。ここで、Aは、0より大きくブロックの最大幅以下である整数であり、Bは、0より大きくAよりも小さい整数であり、Nは、1より大きい2の累乗で表される数(例えば、2、4、8、16、32、64、128、256、...)であり得る。ここで、ブロックサイズを制限するという意味は、当該ブロックサイズへの分割を禁止するという意味であり得る。よって、当該ブロックサイズに分割される直前までのブロックサイズにクロマブロックが分割されることができる。
例えば、符号化及び復号化単位が1クロックあたり4×1単位でプロセスを行う場合、このような構造でクロマブロックが符号化/復号化できるように、クロマブロックの2×Nブロックサイズを制限することができる。ここで、Nは、1より大きい2の累乗で表される数であり得る。
例えば、クロマブロックは、2×Nブロックに分割されることが禁止できる。一実施例において、クロマブロックがこのようなサイズに分割されることを禁止するために、現在ブロックを分割することにより2×Nサイズのクロマブロックを生成させるク四分木分割、水平二分木分割、垂直二分木分割、水平三分木分割又は垂直ターナリ分割の実行が制限できる。
このような分割の制限は、現在ブロックがデュアルツリー構造である場合にのみ適用されるか、或いは現在ブロックがシングルツリーである場合にのみ適用されるか、或いは現在ブロックがデュアルツリー又はシングルツリーである場合にいずれも適用されることができる。
一方、現在ブロックがルマブロックであり、現在ブロックのツリー構造がシングルツリーであり、現在ブロックのカラーフォーマットが4:2:2又は4:2:0である場合、2xNクロマブロックが生成されることを制限するために、現在ブロックを分割して4×Nルマブロックが生成されることを制限することができる。例えば、現在ブロックを分割することにより4×Nサイズのルマブロックを生成させる四分木分割、水平二分木分割、垂直二分木分割、水平三分木分割、又は垂直ターナリ分割の実行が制限できる。
図22は現在ブロックがデュアルツリー構造を持つとき、2×Nクロマブロックにクロマブロックが分割されることを制限した場合に測定される符号化率を示す表である。図22の実験結果から分かるように、all intra実験上では、Y0.02%、Cb0.34%、Cr0.38%の符号化損失を得た。すなわち、2×Nブロックを制限することにより、既存のハードウェアの4×1ピクセルプロセスをそのままクロマブロックに適用することができながらも、符号化損失も最小限に抑えることができる効果を導出することができる。
一方、上述の説明による実施例は、1クロックあたり1×A単位で符号化/復号化プロセスを行う場合にも適用できる。例えば、1クロックあたり1×A単位で符号化/復号化プロセスを行う符号化/復号化構造において、クロマブロックが符号化/復号化できるように、クロマブロックのN×Bブロックサイズを制限することができる。ここで、Aは、0より大きくブロックの最大高さ以下である整数であり、Bは、0より大きくAよりも小さい整数であり、Nは、1より大きい2の累乗で表される数(例えば、2、4、8、16、32、64、128、256、...)であり得る。ここで、ブロックサイズを制限するという意味は、当該ブロックサイズへの分割を禁止するという意味であり得る。よって、当該ブロックサイズに分割される直前までのブロックサイズにクロマブロックが分割されることができる。
例えば、符号化及び復号化単位が1クロックあたり1×4単位でプロセスを行う場合、このような構造でクロマブロックが符号化/復号化できるように、クロマブロックのN×2ブロックサイズを制限することができる。ここで、Nは、1より大きい2の累乗で表される数であり得る。
例えば、クロマブロックは、N×2ブロックに分割されることが禁止できる。一実施例において、クロマブロックがこのようなサイズに分割されることを禁止するために、現在ブロックを分割することにより、N×2サイズのクロマブロックを生成させる四分木分割、水平二分木分割、垂直二分木分割、水平三分木分割又は垂直ターナリ分割の実行が制限できる。
このような分割の制限は、現在ブロックがデュアルツリー構造である場合にのみ適用されるか、或いは現在ブロックがシングルツリーである場合にのみ適用されるか、或いは現在ブロックがデュアルツリー又はシングルツリーである場合にいずれも適用されることができる。
一方、現在ブロックがルマブロックであり、現在ブロックのツリー構造がシングルツリーであり、現在ブロックのカラーフォーマットが4:2:2又は4:2:0である場合、N×2クロマブロックが生成されることを制限するために、現在ブロックを分割してN×4ルマブロックが生成されることを制限することができる。例えば、現在ブロックを分割することによりN×4サイズのルマブロックを生成させる四分木分割、水平二分木分割、垂直二分木分割、水平三分木分割、又は垂直ターナリ分割の実行が制限できる。
実施例1
前述したように、符号化装置及び復号化装置は、クロマブロックが2×Nのサイズに分割されることを制限することができる。例えば、符号化/復号化装置は、クロマブロックの最小幅を4サンプル長さに制限することができる。このために、一実施例による符号化/復号化装置は、現在ブロックがクロマブロックであるか否かと、現在ブロックの幅に基づいて現在ブロックに対して所定の分割タイプが許可されるかを決定することができる。以下、復号化装置について説明するが、以下の説明は、符号化装置に対しても対応して適用できる。
図23は復号化装置が現在ブロックに対して垂直ターナリ分割(SPLIT_TT_VER)が許可されるか否かを決定する方法を説明する図である。一実施例による復号化装置は、現在ブロックがクロマブロックであるか否かを決定することができる(S2310)。復号化装置は、現在ブロックがクロマブロックであるか否かを決定するために、現在ブロックのカラー成分(color component)を示すcIdxパラメータの値を確認することができる。復号化装置は、cIdxの値が0であれば、現在ブロックがルマブロックであることを決定することができる。復号化装置は、cIdxの値が0より大きい値であれば、現在ブロックがルマブロックであることを決定することができる。より詳細には、復号化装置は、cIdxの値が1又は2であれば、現在ブロックがクロマcbブロックであることを決定することができる。復号化装置は、cIdxの値が2であれば、現在ブロックがクロマcrブロックであることを決定することができる。
これに加えて、一実施例による復号化装置は、現在ブロックのツリー構造がデュアルツリーであるか否かをさらに判断することができる。復号化装置は、現在ブロックのツリー構造を示すツリー情報(例えば、treeType)がクロマ成分に対するデュアルツリータイプ(例えば、DUAL_TREE_CHROMA)である場合、現在ブロックがクロマブロックであり且つツリータイプがデュアルツリータイプであることを決定することができる。
次に、復号化装置は、現在ブロックの幅が8サンプル長さ以下であるか否かを決定することができる(S2320)。復号化装置は、現在ブロックの幅を示すパラメータの値が8以下の値を持てば、現在ブロックの幅が8以下であることを決定することができる。
一方、クロマブロックの場合、対応するルマブロックの幅に基づいてクロマブロックの幅が決定されることができる。この場合、ルマブロックの幅と現在画像のカラーフォーマットに基づいて、現在クロマブロックの幅が決定されることもできる。例えば、カラーフォーマットが4:4:4である場合、クロマブロックの幅と高さは、ルマブロックの幅と高さに設定されることができる。カラーフォーマットが4:2:2である場合、クロマブロックの幅はルマブロックの幅の半分に設定され、クロマブロックの高さはルマブロックの高さに設定されることができる。カラーフォーマットが4:2:0である場合、クロマブロックの幅はルマブロックの幅の半分に設定され、クロマブロックの高さはルマブロックの高さの半分に設定されることができる。
これにより、復号化装置は、現在ブロックのカラーフォーマットが4:4:4である場合、ルマブロックの幅が8以下である場合であるか否かを決定することによりS2320ステップを行うことができる。同様の方法で、復号化装置は、現在ブロックのカラーフォーマットが4:2:2又は4:2:0である場合、ルマブロックの幅が16以下である場合であるか否かを決定することによりS2320ステップを行うことができる。一方、S2310ステップとS2320ステップの実行の先後は変更できる。
最後に、復号化装置は、上述した条件を全て満たす場合、現在ブロックに対して垂直ターナリ分割が許可されないことを決定することができる(S2330)。例えば、復号化装置は、現在ブロックがクロマブロックであり、幅が8以下であれば、現在ブロックに対して垂直ターナリ分割が許可されないことを決定することができる。又は、復号化装置は、現在ブロックがクロマブロックであり、現在ブロックのツリータイプがデュアルツリータイプであり、幅が8以下であれば、現在ブロックに対して垂直ターナリ分割が許可されないことを決定することができる。
一方、復号化装置は、このような条件に該当しない場合、現在ブロックに垂直ターナリ分割が許可されることを決定することができる。このとき、復号化装置は、垂直ターナリ分割で現在ブロックが分割できない付加条件を判断することにより、現在ブロックに対して垂直ターナリ分割が許可されるか否かを決定することができる(S2340)。例えば、復号化装置は、現在ブロックが四分木のリーフノードから分割された回数が、四分木のリーフノードから分割されるマルチタイプツリーの最大許容階層深さ(maximum allowed hierarchy depth)を示すパラメータであるMaxMttDepthの値以上であれば、現在ブロックに対して垂直ターナリ分割が許可されないことを決定することができ、MaxMttDepthの値以下である場合に現在ブロックに対して垂直ターナリ分割が許可されることを決定することができる。
実施例2
前述したように、クロマブロックの最小高さを4サンプル長さに制限する必要がある。以下、クロマブロックの最小高さを制限するために、一実施例による符号化/復号化装置が現在ブロックに対して水平ターナリ分割を制限する方法について、図24を参照して説明する。以下、復号化装置について説明するが、以下の説明は、符号化装置に対しても対応して適用できる。
図24は復号化装置が現在ブロックに水平ターナリ分割(SPLIT_TT_HOR)が許可されるか否かを決定する方法を説明する図である。一実施例による復号化装置は、現在ブロックがクロマブロックであるか否かを決定することができる(S2410)。復号化装置は、前述した説明のように現在ブロックがクロマブロックであるか否かを決定するために、現在ブロックのカラー要素を示すcIdxパラメータの値を確認することができる。
これに加えて、一実施例による復号化装置は、現在ブロックのツリー構造がデュアルツリーであるか否かをさらに判断することができる。復号化装置は、現在ブロックのツリー構造を示すツリー情報(例えば、treeType)がクロマ成分に対するデュアルツリータイプ(例えば、DUAL_TREE_CHROMA)である場合、現在ブロックがクロマブロックであり、ツリータイプがデュアルツリータイプであることを決定することができる。
次に、一実施例による復号化装置は、現在ブロックの高さが8サンプル長さ以下であるか否かを決定することができる(S2420)。復号化装置は、現在ブロックの高さを示すパラメータの値が8以下の値を持てば、現在ブロックの高さが8以下であることを決定することができる。又は、復号化装置は、上述したように現在ブロックのカラーフォーマットに応じてルマブロックの高さが8又は16以下であるかに基づいてS2420ステップを行うこともできる。
上述したように、クロマブロックの場合、対応するルマブロックの高さに基づいてクロマブロックの高さが決定されることができる。例えば、復号化装置は、現在ブロックのカラーフォーマットが4:4:4又は4:2:2である場合、ルマブロックの高さが8以下であるか否かを決定することによりS2420ステップを行うことができる。同様の方法で、復号化装置は、現在ブロックのカラーフォーマットが4:2:2である場合、ルマブロックの高さが16以下であるか否かを決定することによりS2420ステップを行うことができる。一方、S2410ステップとS2420ステップの実行の先後は変更できる。
最後に、復号化装置は、上述した条件を全て満たす場合、現在ブロックに対して水平ターナリ分割が許可されないことを決定することができる(S2430)。例えば、復号化装置は、現在ブロックがクロマブロックであり、高さが8以下であれば、現在ブロックに対して水平ターナリ分割が許可されないことを決定することができる。又は、復号化装置は、現在ブロックがクロマブロックであり、現在ブロックのツリータイプがデュアルツリータイプであり、高さが8以下であれば、現在ブロックに対して水平ターナリ分割が許可されないことを決定することができる。
一方、復号化装置は、このような条件に該当しない場合、現在ブロックに水平ターナリ分割が許可されることを決定することができる。このとき、復号化装置は、前述したように現在ブロックに水平ターナリ分割が許可できない付加条件を判断することにより、現在ブロックに水平ターナリ分割が許可されるか否かを決定することができる(S2440)。例えば、復号化装置は、現在ブロックが四分木のリーフノードから分割された回数が、四分木のリーフノードから分割されるマルチタイプツリーの最大許容階層深さ(maximum allowed hierarchy depth)を示すパラメータであるMaxMttDepthの値以上であれば、現在ブロックに水平ターナリ分割が許可されないことを決定することができ、MaxMttDepthの値以下である場合に水平ターナリ分割が許可されることを決定することができる。
実施例3
前述した説明のように、クロマブロックの最小高さを4サンプル長さに制限する必要がある。以下、クロマブロックの最小高さを制限するために、一実施例による符号化/復号化装置が現在ブロックの水平バイナリ分割を制限する方法について図25を参照して説明する。以下、復号化装置について説明するが、以下の説明は、符号化装置に対しても対応して適用できる。
図25は復号化装置が現在ブロックに水平バイナリ分割(SPLIT_BT_HOR)が許可されるか否かを決定する方法を説明する図である。一実施例による復号化装置は、現在ブロックがクロマブロックであるか否かを決定することができる(S2510)。復号化装置は、前述した説明のように、現在ブロックがクロマブロックであるか否かを決定するために、現在ブロックのカラー要素を示すcIdxパラメータの値を確認することができる。
これに加えて、一実施例による復号化装置は、現在ブロックのツリー構造がデュアルツリーであるか否かをさらに判断することができる。復号化装置は、現在ブロックのツリー構造を示すツリー情報(例えば、treeType)がクロマ成分に対するデュアルツリータイプ(例えば、DUAL_TREE_CHROMA)である場合、現在ブロックがクロマブロックであり、ツリータイプがデュアルツリータイプであることを決定することができる。
次に、一実施例による復号化装置は、現在ブロックの高さが4サンプル長さ以下であるか否かを決定することができる(S2520)。復号化装置は、現在ブロックの高さを示すパラメータの値が4以下の値を持てば、現在ブロックの高さが4以下であることを決定することができる。或いは、復号化装置は、前述したように現在ブロックのカラーフォーマットに応じてルマブロックの高さが4又は8以下であるかに基づいてS2520ステップを行うことができる。例えば、復号化装置は、現在ブロックのカラーフォーマットが4:4:4又は4:2:2である場合、ルマブロックの高さが4以下であるか否かを決定することによりS2520ステップを行うことができる。同様の方法で、復号化装置は、現在ブロックのカラーフォーマットが4:2:2である場合、ルマブロックの高さが8以下であるか否かを決定することによりS2520ステップを行うことができる。一方、ステップS2510とステップS2520の実行の先後は変更できる。
最後に、復号化装置は、上述した条件を全て満たす場合、現在ブロックに対して水平バイナリ分割が許可されないことを決定することができる(S2530)。例えば、復号化装置は、現在ブロックがクロマブロックであり、高さが4以下であれば、現在ブロックに対して水平バイナリ分割が許可されないことを決定することができる。或いは、復号化装置は、現在ブロックがクロマブロックであり、現在ブロックのツリータイプがデュアルツリータイプであり、高さが4以下であれば、現在ブロックに対して水平バイナリ分割が許可されないことを決定することができる。
一方、復号化装置は、このような条件に該当しない場合、現在ブロックに対して水平バイナリ分割が許可されることを決定することができる。このとき、復号化装置は、前述したように現在ブロックに対して水平バイナリ分割が許可できない付加条件を判断することにより、現在ブロックに対して水平バイナリ分割が許可されるか否かを決定することができる(S2540)。例えば、復号化装置は、現在ブロックが四分木のリーフノードから分割された回数が、四分木のリーフノードから分割されるマルチタイプツリーの最大許容階層深さ(maximum allowed hierarchy depth)を示すパラメータであるMaxMttDepthの値以上であれば、現在ブロックに対して水平バイナリ分割が許可されないことを決定することができ、MaxMttDepthの値以下であれば、水平バイナリ分割が許可されることを決定することができる。
実施例4
前述した説明のように、クロマブロックの最小幅を4画素単位に制限する必要がある。以下、クロマブロックの最小幅を制限するために、一実施例による符号化/復号化装置が現在ブロックの垂直バイナリ分割を制限する方法について、図26を参照して説明する。以下、復号化装置について説明するが、以下の説明は、符号化装置に対しても対応して適用できる。
図26は復号化装置が現在ブロックに対して垂直バイナリ分割(SPLIT_BT_VER)が許可されるか否かを決定する方法を説明する図である。一実施例による復号化装置は、現在ブロックがクロマブロックであるか否かを決定することができる(S2610)。復号化装置は、前述した説明のように、現在ブロックがクロマブロックであるか否かを決定するために、現在ブロックのカラー要素を表すcIdxパラメータの値を確認することができる。
これに加えて、一実施例による復号化装置は、現在ブロックのツリー構造がデュアルツリーであるか否かをさらに判断することができる。復号化装置は、現在ブロックのツリー構造を表すツリー情報(例えば、treeType)がクロマ成分に対するデュアルツリータイプ(例えば、DUAL_TREE_CHROMA)である場合、現在ブロックがクロマブロックであり、ツリータイプがデュアルツリータイプであることを決定することができる。
次に、一実施例による復号化装置は、現在ブロックの幅が4サンプル長さ以下であるか否かを決定することができる(S2620)。復号化装置は、現在ブロックの幅を示すパラメータの値が4以下の値を持てば、現在ブロックの幅が4以下であることを決定することができる。或いは、復号化装置は、前述したように現在ブロックのカラーフォーマットに応じてルマブロックの幅が4又は8以下であるかに基づいてS2620ステップを行うことができる。例えば、復号化装置は、現在ブロックのカラーフォーマットが4:4:4である場合、ルマブロックの幅が4以下である場合であるか否かを決定することによりS2620ステップを行うことができる。同様の方法で、復号化装置は、現在ブロックのカラーフォーマットが4:2:2又は4:2:0である場合、ルマブロックの幅が8以下である場合であるか否かを決定することによりS2620ステップを行うことができる。一方、ステップS2610とステップS2620の実行の先後は変更できる。
最後に、復号化装置は、上述した条件を全て満たす場合、現在ブロックに対して垂直バイナリ分割が許可されないことを決定することができる(S2630)。例えば、復号化装置は、現在ブロックがクロマブロックであり、幅が4以下であれば、現在ブロックに対して垂直バイナリ分割が許可されないことを決定することができる。或いは、復号化装置は、現在ブロックがクロマブロックであり、現在ブロックのツリータイプがデュアルツリータイプであり、幅が4以下であれば、現在ブロックに対して垂直バイナリ分割が許可されないことを決定することができる。
一方、復号化装置は、このような条件に該当しない場合、現在ブロックに対して垂直バイナリ分割が許可されることを決定することができる。このとき、復号化装置は、前述したように現在ブロックに対して垂直バイナリ分割が許可されない付加条件を判断することにより、現在ブロックに対して垂直バイナリ分割が許可されるか否かを決定することができる(S2640)。例えば、復号化装置は、現在ブロックが四分木のリーフノードから分割された回数が、四分木のリーフノードから分割されるマルチタイプツリーの最大許容階層深さを示すパラメータであるMaxMttDepthの値以上であれば、現在ブロックに対して垂直バイナリ分割が許可されないことを決定することができ、MaxMttDepthの値以下であれば、垂直バイナリ分割が許可されることを決定することができる。
実施例5
前述した説明のように、クロマブロックの最小幅又は高さを4画素単位に制限する必要がある。以下、クロマブロックの最小幅及び高さを制限するために、一実施例による符号化/復号化装置が現在ブロックの四分木分割を制限する方法について、図27を参照して説明する。以下、復号化装置について説明するが、以下の説明は、符号化装置に対しても対応して適用できる。
図27は、復号化装置が、現在ブロックに対して四分木分割が許可されるか否かを決定する方法を説明する図である。一実施例による復号化装置は、現在ブロックがクロマブロックであるか否かを決定することができる(S2710)。復号化装置は、前述した説明のように、現在ブロックがクロマブロックであるか否かを決定するために現在ブロックのカラー要素を示すパラメータcIdxパラメータの値を確認することができる。
これに加えて、一実施例による復号化装置は、現在ブロックのツリー構造がデュアルツリーであるか否かをさらに判断することができる。復号化装置は、現在ブロックのツリー構造を表すツリー情報(例えば、treeType)がクロマ成分に対するデュアルツリータイプ(例えば、DUAL_TREE_CHROMA)である場合、現在ブロックがクロマブロックであり、ツリータイプがデュアルツリータイプであることを決定することができる。
次に、一実施例による復号化装置は、現在ブロックの幅又は高さが4サンプル長さ以下であるか否かを決定することができる(S2720)。復号化装置は、現在ブロックの幅を示すパラメータの値が4以下の値を持てば、現在ブロックの幅が4以下であることを決定することができる。或いは、復号化装置は、前述したように現在ブロックのカラーフォーマットに応じてルマブロックの幅が4又は8以下であるかに基づいてS2720ステップを行うことができる。例えば、復号化装置は、現在ブロックのカラーフォーマットが4:4:4である場合、ルマブロックの幅が4以下である場合であるか否かを決定することにより、S2720ステップを行うことができる。同様の方法で、復号化装置は、現在ブロックのカラーフォーマットが4:2:2又は4:2:0である場合、ルマブロックの幅が8以下である場合であるか否かを決定することによりS2720ステップを行うことができる。一方、S2710ステップとS2720ステップの実行の先後は変更できる。
最後に、復号化装置は、上述した条件を全て満たす場合、現在ブロックに対して四分木分割が許可されないことを決定することができる(S2730)。例えば、復号化装置は、現在ブロックがクロマブロックであり、幅又は高さが4以下であれば、現在ブロックに対して四分木分割が許可されないことを決定することができる。或いは、復号化装置は、現在ブロックがクロマブロックであり、現在ブロックのツリータイプがデュアルツリータイプであり、幅又は高さが4以下であれば、現在ブロックに対して四分木分割が許可されないことを決定することができる。
一方、復号化装置は、このような条件に該当しない場合、現在ブロックに対して四分木分割が許可されることを決定することができる。このとき、復号化装置は、前述したように、現在ブロックに対して四分木分割が許可されない付加条件を判断することにより、現在ブロックに対して四分木分割が許可されるか否かを決定することができる(S2740)。例えば、復号化装置は、現在ブロックが四分木のリーフノードから分割された回数が、四分木のリーフノードから分割されるマルチタイプツリーの最大許容階層深さを表すパラメータであるMaxMttDepthの値以上であれば、現在ブロックに対して四分木分割が許可されないことを決定することができ、MaxMttDepthの値以下であれば、四分木分割が許可されることを決定することができる。
CCLM適用制限に基づく実現性能の改善
一実施例による符号化装置及び復号化装置は、クロマブロックのサイズに応じて適応的にCCLM予測を行うことができる。前述したように、CCLM予測は、ルマブロックのサンプル値に基づいてクロマブロックのサンプル値を生成するので、対応する(例えば、co-located)ルマサンプルを参照しなければならず、ルマサンプルの符号化/復号化が全て完了した後にCCLM予測を行うことができるため、ハードウェアパイプラインでの遅延が必然的に発生する。
また、ルマブロックの符号化/復号化後、同一位置のクロマブロックの符号化/復号化が行われるシングルツリーブロックとは異なり、一定サイズ以上のルマブロックとクロマブロックが独立して符号化されるデュアルツリーにおけるCCLM予測は、ハードウェアパイプライン遅延問題をさらに悪化させる。最悪の場合、デュアルツリーCTUは、256個のCUでCCLM予測を行うが、これは、ハードウェアの実現時に処理率(例えば、データスループット)に相当な影響を与える。
これにより、CCLM予測のためのデータスループットを減らすために、一実施例による符号化装置及び復号化装置は、CCLM予測を行うにあたり、クロマブロックのサイズに応じて、CCLM予測を行うか否かを決定することができる。これに加えて、符号化装置及び復号化装置は、クロマブロックのサイズと共に、クロマブロックのツリー構造がシングルツリーであるかデュアルツリーであるかによって、CCLM予測を行うか否かを決定することができる。
より詳細には、一実施例による符号化装置及び復号化装置は、CCLM予測を行うにあたり、クロマブロックの画素(サンプル)個数が16個以下である場合、CCLM予測を制限(例えば、使用禁止)することができる(第1制限条件)。例えば、符号化装置及び復号化装置は、2×2、2×4、2×8、4×2、4×4、8×2のサイズを有するクロマブロックに対してCCLM予測を行わないことができる。このようにCCLM予測を行うことにより、クロマブロックに対するサイズ制限なしに全てのクロマブロックを対象にCCLM予測を行う場合よりも、データスループットを半分に減らすことができることが実験的に確認された。
又は、符号化装置及び復号化装置は、CCLM予測を行うにあたり、クロマブロックの幅が2サンプル長さである場合(例えば、2×Nクロマブロック)CCLM予測を制限するか(第2制限条件)、或いはクロマブロックの高さが2サンプル長さである場合(例えば、N×2クロマブロック)、CCLM予測を制限することができる(第3制限条件)。
一実施例において、符号化装置及び復号化装置は、前述した第1、第2及び第3制限条件を選択的に組み合わせて使用することができる。例えば、符号化装置は、第1及び第2制限条件を組み合わせて使用するか、第1及び第3制限条件を組み合わせて使用するか、第2及び第3制限条件を組み合わせて使用するか、或いは第1~第3制限条件をすべて組み合わせて使用することもできる。
これらの組み合わせによる符号化損失率の例が図28及び図29に示されている。図28は第1制限条件のみを適用した場合に得られた実験結果を示す。図29は第1、第2及び第3制限条件を全て適用した場合に得られた実験結果を示す。当該実験は、VTM5ソフトウェア上で行われたとともに、Dual treeベースのAll Intraに対して行われた。図28の実験結果から分かるように、第1制限条件のみを適用したAll intra実験上では、Y0.03%、Cb0.53%、Cr0.60%の符号化損失を得た。
また、図29の実験結果から分かるように、第1~3制限条件を全て適用したAll intra実験上では、Y0.05%、Cb0.75%、Cr0.83%の符号化損失を得た。図29の実験結果において、CCLM予測が行われない色差ブロックは、2×N、N×2、4×4の色差ブロックである。図28及び図29の実験例のように所定のサイズの色差ブロックにおけるCCLM予測を制限することにより、色差ブロックの符号化のためのデータスループットを減少させることができ、符号化損失も最小限に抑えることができる。
符号化方法
図30は一実施例に係る符号化装置が画像を符号化する方法を説明するフローチャートである。一実施例による符号化装置は、メモリ、及び少なくとも一つのプロセッサを含むことができ、符号化装置は、少なくとも一つのプロセッサを用いて下記の符号化方法を行うことができる。以下、図30を参照して、上述した実施例を行う符号化方法について説明する。
一実施例による符号化装置は、現在ブロックの分割タイプとして用いられる利用可能分割タイプを決定することができる(S3010)。ここで、現在ブロックはクロマブロックであり得る。一実施例において、符号化装置は、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを、現在ブロックを分割することができる利用可能分割タイプとして許可しないことができる。これにより、符号化装置は、前記複数の分割タイプのうち、前記所定の分割タイプ以外の利用可能分割タイプに前記現在ブロックの分割タイプを決定することができる。前記所定の値は、0より大きく、前記画像符号化装置のクロックあたり処理ブロックのサイズよりも小さい値を持つことができる。このとき、符号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して、前記所定の分割タイプが利用可能分割タイプとして許可されるか否かを決定することができる。
現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅とカラーフォーマットに基づいて決定されることができる。例えば、現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅をカラーフォーマットに基づいて導出されるクロマサンプルとルマサンプルの成分比で割った値に決定されることができる。下位ブロックの幅は、前記現在ブロックの分割タイプに応じて前記現在ブロックの幅を分割することにより決定されることができる。
例えば、符号化装置は、前記画像符号化装置のクロックあたり処理ブロックのサイズが4×1である場合、前記現在ブロックの幅が4であれば、四分木分割タイプ及び垂直バイナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができ、前記現在ブロックの幅が8であれば、垂直ターナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。
より詳細には、符号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であり、前記現在ブロックの幅が4である場合、四分木分割タイプ及び垂直バイナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。
また、符号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であり、前記現在ブロックの幅が8である場合、垂直ターナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。
また、符号化装置は、前記画像符号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが4であれば、四分木分割タイプ及び水平バイナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。このとき、符号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して、分割タイプの許否を判断することもできる。
また、符号化装置は、前記画像符号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが8であれば、水平ターナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。このとき、符号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して、分割タイプの許否を判断することもできる。
次に、符号化装置は、上述したように決定された前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割することができる(S3020)。符号化装置は、前述した四分木、マルチツリー分割タイプのうち、許可される分割タイプを適用して現在ブロックの符号化を行うことができ、各分割タイプに応じたRDコストを計算することができる。符号化装置は、各分割タイプに応じて決定されるRDコストによって、現在ブロックに適用される分割タイプを決定することができる。例えば、符号化装置は、現在ブロックに対して水平ターナリタイプの分割が許可され、当該タイプに現在ブロックを分割して符号化するときに最も良いRDコストが計算される場合、現在ブロックの分割タイプとして水平ターナリタイプが適用されることを決定することができる。
次に、符号化装置は、前記下位ブロックを符号化することにより、前記現在ブロックを符号化することができる(S3030)。符号化装置は、現在ブロックの分割タイプを示すために、現在ブロックの分割に関する情報を符号化することができる。
一実施例において、符号化装置は、現在ブロックが四分木構造に分割されるか否かを、前述したようにqt_split_flagを用いて示すことができる。符号化装置は、現在ブロックが四分木に分割される場合には、qt_split_flagを第1値(例えば、1)に設定して符号化することができる。符号化装置は、現在ブロックが四分木に分割されない場合には、qt_split_flagを第2値(例えば、0)に設定して符号化することができる。
このような実施例において、符号化装置は、現在ブロックが四分木に分割されないが、マルチツリーに分割される場合、符号化装置は、マルチツリーに分割されるか否かを、マルチツリー分割情報であるmtt_split_cu_flagを用いて示すことができる。
符号化装置は、現在ブロックがマルチツリーに分割される場合には、mtt_split_cu_flagを第1値(例えば、1)に設定して符号化することができる。符号化装置は、現在ブロックがマルチツリーに分割されない場合には、mtt_split_cu_flagを第2値(例えば、0)に設定して符号化することができる。
そして、符号化装置は、現在ブロックのマルチツリー分割タイプとマルチツリー分割方向を示すために、mtt_split_cu_verticla_flagとmtt_split_cu_binary_flagを符号化することができる。例えば、mtt_split_cu_vertical_flagは、現在ブロックが水平方向に分割される場合には、第1値(例えば、0)に設定されることができ、現在ブロックが垂直方向に分割される場合には、第2値(例えば、1)に設定されることができる。mtt_split_cu_binary_flagは、現在ブロックが三分木に分割される場合には、第1値(例えば、0)に設定されることができ、現在ブロックが二分木に分割される場合には、第2値(例えば、1)に設定されることができる。
一方、符号化装置は、図31に示すように、現在ブロックの分割が行われるか否かを示す分割実行情報であるsplit_cu_flag(3110)、現在ブロックの四分木分割が行われるか否かを示す四分木分割情報であるsplit_qt_flag(3120)、マルチツリー構造で現在ブロックの分割方向を示す分割方向情報であるmtt_split_cu_vertical_flag(3130)、及びマルチツリー構造で現在ブロックの分割タイプがバイナリ分割タイプであるかターナリ分割タイプであるかを示す分割タイプ情報であるmtt_split_cu_binary_flag(3140)を符号化することにより、現在ブロックの分割に関する情報を符号化することができる。
前述したように、split_cu_flag(3110)は、現在ブロックが分割されない場合には、第1値(例えば、0)に設定されることができ、現在ブロックが下位ブロックに分割される場合には、第2値(例えば、1)に設定されることができる。split_qt_flag(3120)は、現在ブロックが四分木に分割される場合には、第1値(例えば、1)に設定されることができ、四分木に分割されずにマルチツリーに分割される場合には、第2値(例えば、0)に設定されることができる。mtt_split_cu_vertical_flag(3130)は、現在ブロックが水平方向に分割される場合には、第1値(例えば、0)に設定されることができ、現在ブロックが垂直方向に分割される場合には、第2値(例えば、1)に設定されることができる。mtt_split_cu_binary_flag(3140)は、現在ブロックが三分木に分割される場合には、第1値(例えば、0)に設定されることができ、現在ブロックが二分木に分割される場合には、第2値(例えば、1)に設定されることができる。
符号化装置は、現在ブロックに対する所定の分割が許可されるか否かに基づいて、現在ブロックの分割に関する情報を符号化することができる。例えば、符号化装置は、現在ブロックに対して四分木分割とマルチツリー分割が全て許可されない場合にsplit_cu_flagを符号化しないことができる。このような場合、復号化装置は、split_cu_flagを所定の値に誘導することができる。
また、符号化装置は、現在ブロックに対して四分木分割が許可されるが、マルチツリー分割が全て許可されない場合、qt_split_flagを符号化しないことができる。このような場合、復号化装置は、qt_split_flagを所定の値に誘導することができる。
また、符号化装置は、qt_split_flagが、四分木による分割が行われることを示すか、現在ブロックに対して水平バイナリ分割及び水平ターナリ分割が許可されないか、或いは垂直バイナリ分割及び垂直ターナリ分割が許可されないことを示す場合、mtt_split_cu_vertical_flagを符号化しないことができる。このような場合、復号化装置は、mtt_split_cu_vertical_flagを所定の値に誘導することができる。
また、符号化装置は、qt_split_flagが、四分木による分割が行われることを示す場合、又は現在ブロックに対して垂直バイナリ分割又は垂直ターナリ分割が許可されないか、mtt_split_cu_verticalが水平方向分割を示し、現在ブロックに対して水平バイナリ分割又は水平ターナリ分割が許可されないか、或いはmtt_split_cu_vertical_flagが垂直方向分割を示す場合、mtt_split_cu_binary_flagを符号化しないことができる。このような場合、復号化装置は、mtt_split_cu_binary_flagを所定の値に誘導することができる。
そして、符号化装置は、現在ブロックを分割した下位ブロックを用いて現在ブロックを符号化することができる。符号化装置は、下位ブロックを基準に前述したイントラ/インター/IBC予測を行って予測情報を生成し、予測の結果に基づいて残差情報を生成し、予測情報と残差情報を符号化することにより現在ブロックを符号化することができる。
ビットストリーム
図31を参照して、符号化装置がビットストリームを生成する方法をより詳細に説明する。符号化装置は、前述した実施例に基づいて、現在ブロックを分割するか否かを決定することができる。より詳細には、符号化装置は、現在ブロックに対して垂直ターナリ分割が許可されるか否かに応じて、当該如何を示すパラメータallowSplitTtVerの値を決定することができ、分割が許可されれば、第1値(例えば、1)に決定し、分割が許可されなければ、第2値(例えば、0)に決定することができる。
また、符号化装置は、現在ブロックに対して水平ターナリ分割が許可されるか否かに応じて、当該如何を示すパラメータallowSplitTtHorの値を決定することができ、分割が許可されれば、第1値(例えば、1)に決定し、分割が許可されなければ、第2値(例えば、0)に決定することができる。
また、符号化装置は、現在ブロックに対して垂直バイナリ分割が許可されるか否かに応じて、当該如何を示すパラメータallowSplitBtVerの値を決定することができ、分割が許可されれば、第1値(例えば、1)に決定し、分割が許可されなければ、第2値(例えば、0)に決定することができる。
また、符号化装置は、現在ブロックに対して水平バイナリ分割が許可されるか否かに応じて、当該如何を示すパラメータallowSplitBtHorの値を決定することができ、分割が許可されれば、第1値(例えば、1)に決定し、分割が許可されなければ、第2値(例えば、0)に決定することができる。
前記決定によって、符号化装置は、現在ブロックの分割情報であるsplit_cu_flag(3110)、qt_split_flag(3120)、mtt_split_cu_vertical_flag(3130)及びmtt_split_cu_binary_flag(3140)のうちの少なくとも一つをビットストリームとして出力するか否かを、図31を参照して前述したように決定することができる。
復号化方法
図32は一実施例による復号化装置が画像を復号化する方法を説明するフローチャートである。以下、図32を参照して、前述した実施例を行う復号化方法について説明する。一実施例による復号化装置は、メモリ、及び少なくとも一つのプロセッサを含むことができ、復号化装置は、少なくとも一つのプロセッサを用いて下記の復号化方法を行うことができる。
一実施例による復号化装置は、現在ブロックの分割タイプを決定することができる(S3210)。ここで、現在ブロックはクロマブロックであり得る。一実施例において、復号化装置は、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを、現在ブロックを分割することができる利用可能分割タイプとして許可しないことができる。これにより、復号化装置は、前記複数の分割タイプのうち、前記所定の分割タイプ以外の利用可能分割タイプに前記現在ブロックの分割タイプを決定することができる。前記所定の値は、0より大きく、前記画像復号化装置のクロックあたり処理ブロックのサイズよりも小さい値を持つことができる。このとき、復号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して、前記所定の分割タイプが利用可能分割タイプとして許可されるか否かを決定することができる。
現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅とカラーフォーマットに基づいて決定されることができる。例えば、現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅をカラーフォーマットに基づいて導出されるクロマサンプルとルマサンプルの成分比で割った値に決定されることができる。下位ブロックの幅は、前記現在ブロックの分割タイプに応じて前記現在ブロックの幅を分割することにより決定されることができる。
例えば、復号化装置は、前記画像復号化装置のクロックあたり処理ブロックのサイズが4×1である場合、前記現在ブロックの幅が4であれば、四分木分割タイプ及び垂直バイナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができ、前記現在ブロックの幅が8であれば、垂直ターナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。
より詳細には、復号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であり、前記現在ブロックの幅が4である場合、四分木分割タイプ及び垂直バイナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。
また、復号化装置は、前記現在ブロックの分割構造がデュアルツリー構造であり、前記現在ブロックの幅が8である場合、垂直ターナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。
また、復号化装置は、前記画像復号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが4であれば、四分木分割タイプ及び水平バイナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。この時、復号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して、分割タイプの許否を判断することもできる。
また、復号化装置は、前記画像復号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが8であれば、水平ターナリ分割タイプを前記現在ブロックの分割タイプとして許可しないことができる。このとき、復号化装置は、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して、分割タイプの許否を判断することもできる。
上述した決定によって、復号化装置は、前記複数の分割タイプのうち、前記所定の分割タイプ以外の利用可能分割タイプを決定することにより、前記現在ブロックの分割タイプを決定することができる。例えば、復号化装置は、所定の分割の許否に基づいて、現在ブロックの分割に関する情報をビットストリームから取得又は誘導することができる。復号化装置は、図31を参照して前述したように、所定の分割が許可される場合、ビットストリームをパーシングして現在ブロックの分割に関する情報であるsplit_cu_flag(3110)、split_qt_flag(3120)、mtt_split_cu_vertical_flag(3130)及びmtt_split_cu_binary_flag(3140)のうちの少なくとも一つをビットストリームから取得することができる。
一方、復号化装置は、所定の分割が許可されない場合、現在ブロックの分割に関する情報を、前記所定の分割以外の分割を示す値に決定することができる。例えば、所定の分割が許可されない場合、現在ブロックの分割に関する情報は、ビットストリームから取得されず、所定の値に誘導されることができる。例えば、分割を行うか否かを示すsplit_cu_flagは0に誘導されることができる。
一実施例において、四分木分割を行うか否かを示すsplit_qt_flagは、split_cu_flagの値が1であり、前述した実施例に基づいて現在ブロックに対して垂直ターナリ分割、水平ターナリ分割、垂直バイナリ分割及び水平バイナリ分割が全て許可されないものと決定される場合には、1に誘導されることができ、そうでない場合には、0に誘導されることができる。
分割方向情報であるmtt_split_cu_vertical_flagは、現在ブロックに水平ターナリ分割又は水平バイナリ分割が許可される場合には、0に誘導されることができ、そうでない場合には、1に誘導されることができる。
分割タイプ情報であるmtt_split_cu_binary_flagは、現在ブロックに垂直バイナリ分割及び水平バイナリ分割が許可されない場合には、0に誘導されることができ、現在ブロックに垂直ターナリ分割及び水平ターナリ分割が許可されない場合には、1に誘導されることができ、現在ブロックに水平バイナリ分割及び垂直ターナリ分割が許可される場合には、1-mtt_split_cu_vertical_flagの値に誘導されることができ、現在ブロックに垂直バイナリ分割及び水平ターナリ分割が許可される場合には、mtt_split_cu_vertical_flagの値に誘導されることができる。
復号化装置は、前述したように、split_qt_flag(3120)、mtt_split_cu_vertical_flag(3130)及びmtt_split_cu_binary_flag(3140)と表1に基づいて、現在ブロックの分割タイプを四分木又はマルチツリーのうちのいずれか一つに該当する分割タイプに決定することができる。
次に、一実施例による復号化装置は、前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割することができる(S3220)。そして、復号化装置は、前記下位ブロックを復号化することができる(S3230)。例えば、復号化装置は、下位ブロックを基準に前述したイントラ/インター/IBC予測を行って画像を復号化することができる。一実施例において、復号化装置は、IBC予測を行ってクロマブロックの予測を行う場合、前述した実施例を適用してクロマブロックの動きベクトルをルマブロックから誘導することができる。
応用実施例
本開示の例示的な方法は、説明の明確性のために動作のシリーズで表現されているが、これは、ステップが行われる順序を制限するためのものではなく、必要な場合には、それぞれのステップが同時に又は異なる順序で行われることもできる。本開示による方法を実現するために、例示するステップにさらに他のステップを含むか、一部のステップを除いて残りのステップを含むか、又は一部のステップを除いて追加の他のステップを含むこともできる。
本開示において、所定の動作(ステップ)を行う画像符号化装置又は画像復号化装置は、当該動作(ステップ)の実行条件や状況を確認する動作(ステップ)を行うことができる。例えば、所定の条件が満足される場合、所定の動作を行うと記載された場合、画像符号化装置又は画像復号化装置は、前記所定の条件が満足されるか否かを確認する動作を行った後、前記所定の動作を行うことができる。
本開示の様々な実施例は、すべての可能な組み合わせを羅列したものではなく、本開示の代表的な態様を説明するためのものであり、様々な実施例で説明する事項は、独立して適用されてもよく、2つ以上の組み合わせで適用されてもよい。
また、本開示の様々な実施例は、ハードウェア、ファームウェア(firmware)、ソフトウェア、又はそれらの組み合わせなどによって実現できる。ハードウェアによる実現の場合、1つ又はそれ以上のASICs(Application Specific Integrated Circuits)、DSPs(Digital Signal Processors)、DSPDs(Digital Signal Processing Devices)、PLDs(Programmable Logic Devices)、FPGAs(Field Programmable Gate Arrays)、汎用プロセッサ(general processor)、コントローラ、マイクロコントローラ、マイクロプロセッサなどによって実現できる。
また、本開示の実施例が適用された画像復号化装置及び画像符号化装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ会話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、記憶媒体、カムコーダ、注文型ビデオ(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、画像電話ビデオ装置、及び医療用ビデオ装置などに含まれることができ、ビデオ信号又はデータ信号を処理するために使用できる。例えば、OTTビデオ(Over the top video)装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recoder)などを含むことができる。
図33は本開示の実施例が適用できるコンテンツストリーミングシステムを例示する図である。
図33に示されているように、本開示の実施例が適用されたコンテンツストリーミングシステムは、大きく、符号化サーバ、ストリーミングサーバ、Webサーバ、メディアストレージ、ユーザ装置及びマルチメディア入力装置を含むことができる。
前記符号化サーバは、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに伝送する役割を果たす。他の例として、スマートフォン、カメラ、ビデオカメラなどのマルチメディア入力装置がビットストリームを直接生成する場合、前記符号化サーバは省略できる。
前記ビットストリームは、本開示の実施例が適用された画像符号化方法及び/又は画像符号化装置によって生成でき、前記ストリーミングサーバは、前記ビットストリームを伝送又は受信する過程で一時的に前記ビットストリームを保存することができる。
前記ストリーミングサーバは、Webサーバを介してユーザの要求に基づいてマルチメディアデータをユーザ装置に伝送し、前記Webサーバは、ユーザにどんなサービスがあるかを知らせる媒介体の役割を果たすことができる。ユーザが前記Webサーバに所望のサービスを要求すると、前記Webサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを伝送することができる。この時、前記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割を果たすことができる。
前記ストリーミングサーバは、メディアストレージ及び/又は符号化サーバからコンテンツを受信することができる。例えば、前記符号化サーバからコンテンツを受信する場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間保存することができる。
前記ユーザ装置の例としては、携帯電話、スマートフォン(smart phone)、ノートパソコン(laptop computer)、デジタル放送用端末、PDA(personal digital assistants)、PMP(portable multimedia player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device)、例えば、スマートウォッチ(smartwatch)、スマートグラス(smart glass)、HMD(head mounted display)、デジタルTV、デスクトップコンピュータ、デジタルサイネージなどがあり得る。
前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバから受信するデータは、分散処理されることができる。
本開示の範囲は、様々な実施例の方法による動作が装置又はコンピュータ上で実行されるようにするソフトウェア又はマシン-実行可能なコマンド(例えば、オペレーティングシステム、アプリケーション、ファームウェア(firmware)、プログラムなど)、及びこのようなソフトウェア又はコマンドなどが保存されて装置又はコンピュータ上で実行できる非一時的なコンピュータ可読媒体(non-transitory computer-readable medium)を含む。
本開示による実施例は、画像を符号化/復号化するために利用可能である。

Claims (15)

  1. 画像復号化装置によって行われる画像復号化方法であって、
    現在ブロックの分割タイプを決定するステップと、
    前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割するステップと、
    前記下位ブロックを復号化するステップと、を含み、
    前記現在ブロックは、クロマブロックであり、
    前記現在ブロックの分割タイプを決定するステップは、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを許可しないことにより行われる、画像復号化方法。
  2. 前記所定の値は、0より大きく、前記画像復号化装置のクロックあたり処理ブロックのサイズよりも小さい値を有する、請求項1に記載の画像復号化方法。
  3. 前記現在ブロックの分割タイプを決定するステップは、前記現在ブロックのツリー構造がデュアルツリー構造であるか否かをさらに考慮して行われる、請求項1に記載の画像復号化方法。
  4. 前記現在ブロックの幅が4である場合、四分木分割タイプ及び垂直バイナリ分割タイプは、前記現在ブロックの分割タイプとして許可されない、請求項1に記載の画像復号化方法。
  5. 前記現在ブロックのツリー構造がデュアルツリー構造であり、前記現在ブロックの幅が4である場合、四分木分割タイプ及び垂直バイナリ分割タイプは、前記現在ブロックの分割タイプとして許可されない、請求項3に記載の画像復号化方法。
  6. 前記現在ブロックの幅が8である場合、垂直ターナリ分割タイプは、前記現在ブロックの分割タイプとして許可されない、請求項1に記載の画像復号化方法。
  7. 前記現在ブロックのツリー構造がデュアルツリー構造であり、前記現在ブロックの幅が8である場合、垂直ターナリ分割タイプは、前記現在ブロックの分割タイプとして許可されない、請求項3に記載の画像復号化方法。
  8. 前記画像復号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが4である場合、四分木分割タイプ及び水平バイナリ分割タイプは、前記現在ブロックの分割タイプとして許可されない、請求項1に記載の画像復号化方法。
  9. 前記画像復号化装置のクロックあたり処理ブロックのサイズが1×4であり、前記現在ブロックの高さが8である場合、水平ターナリ分割タイプは、前記現在ブロックの分割タイプとして許可されない、請求項1に記載の画像復号化方法。
  10. 前記下位ブロックの幅は、前記現在ブロックの分割タイプに応じて前記現在ブロックの幅を分割することにより決定され、
    前記現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅とカラーフォーマットに基づいて決定される、請求項1に記載の画像復号化方法。
  11. 前記現在ブロックの幅は、前記現在ブロックに対応するルマブロックの幅をカラーフォーマットに基づいて導出されるクロマサンプルとルマサンプルの成分比で割った値に決定される、請求項10に記載の画像復号化方法。
  12. 前記現在ブロックの分割タイプを決定するステップは、前記複数の分割タイプのうち、前記所定の分割タイプ以外の分割タイプに前記現在ブロックの分割タイプを決定することにより行われる、請求項1に記載の画像復号化方法。
  13. メモリと少なくとも一つのプロセッサとを含む画像復号化装置であって、
    前記少なくとも一つのプロセッサは、
    現在ブロックの分割タイプを決定し、
    前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割し、
    前記下位ブロックを復号化するが、
    前記現在ブロックは、クロマブロックであり、
    前記プロセッサは、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを除いて現在ブロックの分割タイプを決定する、画像復号化装置。
  14. 画像符号化装置によって行われる画像符号化方法であって、
    現在ブロックの分割タイプとして用いられる利用可能分割タイプを決定するステップと、
    前記分割タイプに基づいて前記現在ブロックを複数の下位ブロックに分割するステップと、
    前記下位ブロックを符号化することにより前記現在ブロックを符号化するステップと、を含み、
    前記利用可能分割タイプは、複数の分割タイプのうち、前記下位ブロックの幅又は高さが所定の値となる所定の分割タイプを除いた分割タイプに決定される、画像符号化方法。
  15. 請求項14に記載の画像符号化方法によって生成されたビットストリームを伝送する方法。
JP2021576161A 2019-06-19 2020-06-19 クロマブロックのサイズを制限する画像符号化/復号化方法、装置、及びビットストリームを伝送する方法 Pending JP2022530287A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962863840P 2019-06-19 2019-06-19
US62/863,840 2019-06-19
PCT/KR2020/008001 WO2020256488A1 (ko) 2019-06-19 2020-06-19 크로마 블록의 크기를 제한하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법

Publications (1)

Publication Number Publication Date
JP2022530287A true JP2022530287A (ja) 2022-06-28

Family

ID=74040581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021576161A Pending JP2022530287A (ja) 2019-06-19 2020-06-19 クロマブロックのサイズを制限する画像符号化/復号化方法、装置、及びビットストリームを伝送する方法

Country Status (7)

Country Link
US (1) US11917147B2 (ja)
EP (1) EP3989555A4 (ja)
JP (1) JP2022530287A (ja)
KR (2) KR20230013158A (ja)
CN (1) CN114145015A (ja)
MX (1) MX2021016163A (ja)
WO (1) WO2020256488A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113660490A (zh) * 2021-06-24 2021-11-16 浙江大华技术股份有限公司 编码单元的划分方法、编码方法、电子装置及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013152736A1 (en) 2012-04-12 2013-10-17 Mediatek Singapore Pte. Ltd. Method and apparatus for block partition of chroma subsampling formats
WO2017008263A1 (en) * 2015-07-15 2017-01-19 Mediatek Singapore Pte. Ltd. Conditional binary tree block partitioning structure
US10212444B2 (en) 2016-01-15 2019-02-19 Qualcomm Incorporated Multi-type-tree framework for video coding
CN108713320B (zh) * 2016-03-16 2022-05-17 寰发股份有限公司 视频编码中限制块尺寸的视频数据处理方法与装置
CA3025490A1 (en) * 2016-05-28 2017-12-07 Mediatek Inc. Method and apparatus of current picture referencing for video coding using affine motion compensation
ES2711230R1 (es) 2016-09-20 2021-04-07 Kt Corp Metodo y aparato para procesar una senal de video
US10779004B2 (en) 2016-10-12 2020-09-15 Mediatek Inc. Methods and apparatuses of constrained multi-type-tree block partition for video coding
US10911756B2 (en) 2016-10-28 2021-02-02 Electronics And Telecommunications Research Institute Video encoding/decoding method and apparatus, and recording medium in which bit stream is stored
WO2018128466A1 (ko) * 2017-01-09 2018-07-12 에스케이텔레콤 주식회사 영상 부호화 또는 복호화하기 위한 장치 및 방법
US20180367818A1 (en) * 2017-06-15 2018-12-20 Futurewei Technologies, Inc. Block Partition Structure in Video Compression
CA3071370A1 (en) * 2017-09-12 2019-03-21 Samsung Electronics Co., Ltd. Method for encoding and decoding motion information and device for encoding and decoding motion information
US11350118B2 (en) * 2018-05-30 2022-05-31 Digitalinsights Inc. Image encoding/decoding method and device

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS, ET AL.: "Versatile Video Coding (Draft 5)", JOINT VIDE O EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-N1001-v8, JPN6022031279, 11 June 2019 (2019-06-11), pages 16 - 18, ISSN: 0004966411 *
HYEONGMUN JANG, ET AL.: "CE3-related : Restrict 2xN, Nx2 chroma proce ssing for dual tree structure", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-N0465, JPN6023000936, 21 March 2019 (2019-03-21), ISSN: 0004966412 *
TIANYANG ZHOU AND TOMOHIRO IKAI: "CE3-2.1: Intra chroma partitioning and prediction restriction", JOINT VIDE O EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-N0137_r1, JPN6022031278, 17 March 2019 (2019-03-17), ISSN: 0004966413 *

Also Published As

Publication number Publication date
CN114145015A (zh) 2022-03-04
WO2020256488A1 (ko) 2020-12-24
EP3989555A4 (en) 2023-05-10
EP3989555A1 (en) 2022-04-27
US11917147B2 (en) 2024-02-27
US20220360777A1 (en) 2022-11-10
KR20230013158A (ko) 2023-01-26
KR20220002688A (ko) 2022-01-06
MX2021016163A (es) 2022-03-11
KR102488861B1 (ko) 2023-01-13

Similar Documents

Publication Publication Date Title
KR102502175B1 (ko) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
JP2022532114A (ja) Mip及びlfnstを行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
KR102500091B1 (ko) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
JP2023130427A (ja) クロマ変換ブロックの最大サイズ制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
KR102496711B1 (ko) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
JP2024023441A (ja) クロマブロックの分割条件を制限する画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP7462094B2 (ja) ビデオ/映像コーディングシステムにおける重複シグナリング除去方法及び装置
JP2023126891A (ja) クロマブロックの最大変換サイズ設定を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP2023126900A (ja) クロマ成分符号化ブロックの最大変換サイズ制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
KR102488861B1 (ko) 크로마 블록의 크기를 제한하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
JP2022530286A (ja) クロマブロックの適応的サイズ制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP2022524441A (ja) クロマブロックに対する分割制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
RU2809033C2 (ru) Способ и оборудование кодирования/декодирования изображений с использованием матрицы квантования и способ для передачи потока битов
RU2795473C1 (ru) Способ и оборудование кодирования/декодирования изображений с использованием матрицы квантования и способ для передачи потока битов
JP7444998B2 (ja) リーフノードの再設定された予測モードタイプに基づいて予測を行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
US20220345694A1 (en) Image encoding/decoding method and apparatus using quantization matrix, and method for transmitting bitstream
US20240073458A1 (en) Image encoding/decoding method and apparatus for performing in-loop filtering on basis of sub-picture structure, and method for transmitting bitstream

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220215

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220215

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230908

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231212