JP2024023789A - イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法 - Google Patents

イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法 Download PDF

Info

Publication number
JP2024023789A
JP2024023789A JP2023215983A JP2023215983A JP2024023789A JP 2024023789 A JP2024023789 A JP 2024023789A JP 2023215983 A JP2023215983 A JP 2023215983A JP 2023215983 A JP2023215983 A JP 2023215983A JP 2024023789 A JP2024023789 A JP 2024023789A
Authority
JP
Japan
Prior art keywords
intra prediction
block
prediction mode
intra
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023215983A
Other languages
English (en)
Inventor
ヒョン ムン チャン
Hyeong Moon Jang
チン ホ
Jin Heo
チョン ハク ナム
Jung Hak Nam
チャンウォン チェ
Jangwon Choi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2024023789A publication Critical patent/JP2024023789A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画像符号化/復号方法および装置の提供。【解決手段】本開示による画像復号方法は、現クロマブロックの予測に関する情報に基づいて、上記現クロマブロックにイントラ予測が適用されるか否かを決定するステップと、上記現クロマブロックにイントラ予測が適用される場合、上記現クロマブロックに対応する対応ルマブロックのイントラ予測モードおよび上記現クロマブロックのイントラクロマ予測モード情報に基づいて、上記現クロマブロックのイントラ予測モードを導出するステップと、上記現クロマブロックのイントラ予測モードに基づいてイントラ予測を行うことにより、上記現クロマブロックに対する予測ブロックを生成するステップと、を有し、上記対応ルマブロックのイントラ予測モードが存在しない場合、上記現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードに基づいて導出されることができる。【選択図】図17

Description

本開示は、画像符号化/復号方法および装置に係り、より詳細には、イントラ予測を用いて画像を符号化/復号する方法、装置、および本開示の画像符号化方法/装置によって生成されたビットストリームを伝送(送信)する方法に関する。
最近、高解像度、高品質の画像、例えばHD(High Definition)画像およびUHD(Ultra High Definition)画像への需要が多様な分野で増加している。画像データが高解像度、高品質になるほど、従来の画像データに比べて、伝送される情報量またはビット量が相対的に増加する。伝送される情報量またはビット量の増加は、伝送コスト(費用)および記憶(保存)コストの増加をもたらす。
これにより、高解像度、高品質画像の情報を効果的に伝送または記憶し、再生するための高効率の画像圧縮技術が求められる。
本開示は、符号化/復号効率が向上した画像符号化/復号方法および装置を提供することを目的とする。
また、本開示は、イントラ予測を用いて画像を符号化/復号する方法および装置を提供することを目的とする。
また、本開示は、クロマブロックのイントラ予測モードを対応ルマブロックのイントラ予測モードまたはデフォルトイントラ予測モードに基づいて導出した後、クロマブロックに対するイントラ予測を行う画像符号化/復号方法および装置を提供することを目的とする。
また、本開示は、本開示による画像符号化方法または装置によって生成されたビットストリームを伝送する方法を提供することを目的とする。
また、本開示は、本開示による画像符号化方法または装置によって生成されたビットストリームを記憶した記録媒体を提供することを目的とする。
また、本開示は、本開示による画像復号装置によって受信され、復号されて画像の復元に利用されるビットストリームを記憶した記録媒体を提供することを目的とする。
本開示で解決しようとする技術的課題は、上述した技術的課題に制限されず、上述していない別の技術的課題は、以降の記載から本開示の属する技術分野における通常の知識を有する者に明確に理解できるであろう。
本開示の一態様による画像復号方法は、現(現在)クロマブロックの予測に関する情報に基づいて、現クロマブロックにイントラ予測が適用されるか否かを決定するステップと、現クロマブロックにイントラ予測が適用される場合、現クロマブロックに対応する対応ルマブロックのイントラ予測モードおよび現クロマブロックのイントラクロマ予測モード情報に基づいて、現クロマブロックのイントラ予測モードを導出するステップと、現クロマブロックのイントラ予測モードに基づいてイントラ予測を行うことにより、現クロマブロックに対する予測ブロックを生成するステップと、を有し、対応ルマブロックのイントラ予測モードが存在しない場合、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードに基づいて導出されることができる。
本開示による画像復号方法において、現クロマブロックのイントラ予測モードを導出するステップは、対応ルマブロックの所定の位置の予測方法を判断するステップを有することができる。
本開示による画像復号方法において、対応ルマブロックの所定の位置の予測方法がイントラ予測である場合、現クロマブロックのイントラ予測モードは、対応ルマブロックの所定の位置のイントラ予測モードに基づいて導出され、対応ルマブロックの所定の位置の予測方法がイントラ予測ではない場合、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードに基づいて導出されることができる。
本開示による画像復号方法において、対応ルマブロックの所定の位置の予測方法がIBC(Intra Block Copy)予測である場合、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードに基づいて導出されることができる。
本開示による画像復号方法において、所定の位置は、対応ルマブロックの中心位置であることができる。
本開示による画像復号方法において、デフォルトイントラ予測モードは、PlanarモードまたはDCモードであることができる。
本開示による画像復号方法において、現クロマブロックのツリー構造は、デュアルツリー(DUAL_TREE)構造であることができる。
本開示による画像復号方法において、現クロマブロックのイントラ予測モード情報がDM(Direct Mode)モードを示し、対応ルマブロックのイントラ予測モードが存在する場合には、現クロマブロックのイントラ予測モードは、対応ルマブロックのイントラ予測モードで導出され、現クロマブロックのイントラ予測モード情報がDMモードを示し、対応ルマブロックのイントラ予測モードが存在しない場合には、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードで導出されることができる。
本開示の他の態様による画像復号装置は、メモリと、少なくとも一つのプロセッサと、を有し、少なくとも一つのプロセッサは、現クロマブロックの予測に関する情報に基づいて、現クロマブロックにイントラ予測が適用されるか否かを決定し、現クロマブロックにイントラ予測が適用される場合には、現クロマブロックに対応する対応ルマブロックのイントラ予測モードおよび現クロマブロックのイントラクロマ予測モード情報に基づいて現クロマブロックのイントラ予測モードを導出し、現クロマブロックのイントラ予測モードに基づいてイントラ予測を行うことにより、現クロマブロックに対する予測ブロックを生成し、対応ルマブロックのイントラ予測モードが存在しない場合には、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードに基づいて導出されることができる。
本開示の別の態様による画像符号化方法は、現クロマブロックにイントラ予測が適用されるか否かを決定するステップと、現クロマブロックにイントラ予測が適用される場合には、現クロマブロックに対応する対応ルマブロックのイントラ予測モードに基づいて現クロマブロックのイントラ予測モードを導出するステップと、現クロマブロックのイントラ予測モードに基づいてイントラ予測を行うことにより、現クロマブロックに対する予測ブロックを生成するステップと、対応ルマブロックのイントラ予測モードに基づいて現クロマブロックのイントラ予測モードを符号化するステップと、を有し、対応ルマブロックのイントラ予測モードが存在しない場合には、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードに基づいて導出されることができる。
本開示による画像符号化方法において、現クロマブロックのイントラ予測モードを導出するステップは、対応ルマブロックの所定の位置の予測方法を判断するステップを有することができる。
本開示による画像符号化方法において、対応ルマブロックの所定の位置の予測方法がイントラ予測である場合、現クロマブロックのイントラ予測モードは、対応ルマブロックの所定の位置のイントラ予測モードに基づいて導出され、対応ルマブロックの所定の位置の予測方法がイントラ予測ではない場合には、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードに基づいて導出されることができる。
本開示による画像符号化方法において、所定の位置は、対応ルマブロックの中心位置であることができる。
本開示による画像符号化方法において、デフォルトイントラ予測モードは、PlanarモードまたはDCモードであることができる。
本開示の別の態様による伝送方法は、本開示の画像符号化装置または画像符号化方法によって生成されたビットストリームを伝送することができる。
本開示の別の態様によるコンピュータ読み取り可能記録媒体は、本開示の画像符号化方法または画像符号化装置によって生成されたビットストリームを記憶することができる。
本開示について簡略に要約して上述した特徴は、後述する本開示の詳細な説明の例示的な態様に過ぎず、本開示の範囲を制限するものではない。
本開示によれば、符号化/復号効率が向上した画像符号化/復号方法および装置が提供されることができる。
また、本開示によれば、イントラ予測を用いて画像を符号化/復号する方法および装置が提供されることができる。
また、本開示によれば、クロマブロックのイントラ予測モードを対応ルマブロックのイントラ予測モードまたはデフォルトイントラ予測モードに基づいて導出した後、クロマブロックに対するイントラ予測を行う画像符号化/復号方法および装置が提供されることができる。
また、本開示によれば、本開示による画像符号化方法または装置によって生成されたビットストリームを伝送する方法が提供されることができる。
また、本開示によれば、本開示による画像符号化方法または装置によって生成されたビットストリームを記憶した記録媒体が提供されることができる。
また、本開示によれば、本開示による画像復号装置によって受信され、復号されて画像の復元に利用されるビットストリームを記憶した記録媒体が提供されることができる。
本開示で得られる効果は、上述した効果に限定されず、上述していない別の効果は、以降の記載から、本開示の属する技術分野における通常の知識を有する者に明確に理解できるだろう。
本開示による実施例が適用されることができるビデオコーディング(符号化)システムを概略的に示す図である。 本開示による実施例が適用されることができる画像符号化装置を概略的に示す図である。 本開示による実施例が適用されることができる画像復号装置を概略的に示す図である。 マルチタイプツリー構造によるブロックの分割タイプを示す図である。 本開示によるマルチタイプツリーを伴う四分木(quadtree with nested multi-type tree)構造のパーティション分割情報のシグナリングメカニズムを例示する図である。 イントラ予測ベースのビデオ/画像符号化方法を示すフローチャートである。 本開示によるイントラ予測部185の構成を例示的に示す図である。 イントラ予測ベースのビデオ/画像復号方法を示すフローチャートである。 本開示によるイントラ予測部265の構成を例示的に示す図である。 画像符号化装置におけるイントラ予測モードシグナリング手順を示すフローチャートである。 画像復号装置におけるイントラ予測モード決定手順を示すフローチャートである。 イントラ予測モード導出手順をより具体的に説明するフローチャートである。 本開示の一実施例によるイントラ予測方向を示す図である。 本開示の他の実施例によるイントラ予測方向を示す図である。 DMモードの場合、現クロマブロックのイントラ予測モードを導出するための所定の位置を示す図である。 対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する従来の方法を説明するフローチャートである。 対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する本開示の一実施例を説明するフローチャートである。 対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する本開示の他の実施例を説明するフローチャートである。 対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する本開示の他の実施例を説明するフローチャートである。 対応するブロックに基づいて現ブロックのイントラ予測モードを導出する本開示の一実施例を説明するフローチャートである。 対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出し、クロマブロックを符号化する本開示の別の実施例を説明するフローチャートである。 本開示の実施例に適用できるコンテンツストリーミングシステムを例示する図である。
以下、添付図面を参照して、本開示の実施例について、本開示の属する技術分野における通常の知識を有する者が容易に実施し得るように詳細に説明する。しかしながら、本開示は、様々な異なる形態で実現でき、ここで説明する実施例に限定されない。
本開示の実施例を説明するにあたり、公知の構成または機能についての具体的な説明が本開示の要旨を不明確にするおそれがあると判断される場合には、それについての詳細な説明は省略する。そして、図面において、本開示についての説明と関係ない部分は省略し、同様の部分には同様の図面符号を付した。
本開示において、ある構成要素が他の構成要素と「連結」、「結合」または「接続」されているとするとき、これは、直接的な連結関係だけでなく、それらの間に別の構成要素が存在する間接的な連結関係も含むことができる。また、ある構成要素が他の構成要素を「含む」または「有する」とするとき、これは、特に反対される記載がない限り、別の構成要素を排除するものではなく、別の構成要素をさらに含むことができることを意味する。
本開示において、「第1」、「第2」などの用語は、一つの構成要素を他の構成要素から区別する目的のみで使用され、特に言及されない限り、構成要素間の順序または重要度などを限定しない。したがって、本開示の範囲内において、一実施例の第1構成要素は、他の実施例で第2構成要素と呼んでもよく、これと同様に、一実施例の第2構成要素を、他の実施例で第1構成要素と呼んでもよい。
本開示において、互いに区別される構成要素は、それぞれの特徴を明確に説明するためのものであり、構成要素が必ずしも分離されることを意味するものではない。つまり、複数の構成要素が統合されて一つのハードウェアまたはソフトウェア単位で構成されてもよく、一つの構成要素が分散されて複数のハードウェアまたはソフトウェア単位で構成されてもよい。よって、別に言及しなくても、このように統合されたまたは分散された実施例も本開示の範囲に含まれる。
本開示において、様々な実施例で説明する構成要素が必ず必要不可欠な構成要素を意味するものではなく、一部は選択的な構成要素であり得る。したがって、一実施例で説明する構成要素の部分集合で構成される実施例も本開示の範囲に含まれる。また、様々な実施例で説明する構成要素にさらに他の構成要素を含む実施例も、本開示の範囲に含まれる。
本開示は、画像の符号化および復号に関するものであって、本開示で使用される用語は、本開示で新たに定義されない限り、本開示の属する技術分野における通常の意味を持つことができる。
本開示において、「ピクチャ(picture)」は、一般的に、特定の時間帯のいずれか一つの画像を示す単位を意味し、スライス(slice)/タイル(tile)は、ピクチャの一部を構成する符号化単位であって、一つのピクチャは、一つまたは複数のスライス/タイルで構成できる。また、スライス/タイルは、一つまたは複数のCTU(Coding Tree Unit)を含むことができる。
本開示において、「ピクセル(pixel)」または「ペル(pel)」は、一つのピクチャ(または画像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用されることができる。サンプルは、一般的に、ピクセルまたはピクセルの値を示すことができ、ルマ(luma)成分のピクセル/ピクセル値のみを示すこともでき、クロマ(chroma)成分のピクセル/ピクセル値のみを示すこともできる。
本開示において、「ユニット(unit)」は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定の領域および当該領域に関連する情報のうちの少なくとも一つを含むことができる。ユニットは、場合に応じて、「サンプルアレイ」、「ブロック(block)」または「領域(area)」などの用語と混用できる。一般な場合、M×Nブロックは、M個の列およびN個の行からなるサンプル(またはサンプルアレイ)または変換係数(transform coefficient)のセット(またはアレイ(行列、配列))を含むことができる。
本開示において、「現ブロック」は、「現符号化ブロック」、「現コーディングユニット」、「符号化対象ブロック」、「復号対象ブロック」または「処理対象ブロック」のうちのいずれか一つを意味することができる。予測が行われる場合、「現ブロック」は、「現予測ブロック」または「予測対象ブロック」を意味することができる。変換(逆変換)/量子化(逆量子化)が行われる場合、「現ブロック」は、「現変換ブロック」または「変換対象ブロック」を意味することができる。フィルタリングが行われる場合、「現ブロック」は「フィルタリング対象ブロック」を意味することができる。
また、本開示において、「現ブロック」は、クロマブロックという明示的な記載がない限り、ルマ成分ブロックおよびクロマ成分ブロックをすべて含むブロックまたは「現ブロックのルマブロック」を意味することができる。現ブロックのクロマブロックは、明示的に「クロマブロック」または「現クロマブロック」のようにクロマブロックという明示的な記載を含んで表現できる。
本開示において、「/」と「、」は「および/または」と解釈されることができる。例えば、「A/B」と「A、B」は「Aおよび/またはB」と解釈されることができる。また、「A/B/C」と「A、B、C」は、「A、Bおよび/またはCのうちの少なくとも一つ」を意味することができる。
本開示において、「または」は、「および/または」と解釈されることができる。例えば、「AまたはB」は、1)「A」のみを意味するか、2)「B」のみを意味するか、3)「AおよびB」を意味することができる。あるいは、本開示において、「または」は、「追加的にまたは代替として(additionally or alternatively)」を意味することができる。
ビデオコーディングシステムの概要
図1は、本開示によるビデオコーディングシステムを示す図である。
一実施例によるビデオコーディングシステムは、符号化装置10および復号装置20を含むことができる。符号化装置10は、符号化されたビデオ(video)および/もしくは画像(image)情報またはデータを、ファイルまたはストリーミング形式でデジタル記憶媒体またはネットワークを介して復号装置20へ伝達することができる。
一実施例よる符号化装置10は、ビデオソース生成部11、符号化部12および伝送部13を含むことができる。一実施例による復号装置20は、受信部21、復号部22およびレンダリング部23を含むことができる。上記符号化部12は、ビデオ/画像符号化部と呼ばれることができ、上記復号部22は、ビデオ/画像復号部と呼ばれることができる。伝送部13は、符号化部12に含まれることができる。受信部21は、復号部22に含まれることができる。レンダリング部23は、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイスまたは外部コンポーネントとして構成されることもできる。
ビデオソース生成部11は、ビデオ/画像のキャプチャ、合成または生成過程などを介してビデオ/画像を取得することができる。ビデオソース生成部11は、ビデオ/画像キャプチャデバイスおよび/またはビデオ/画像生成デバイスを含むことができる。ビデオ/画像キャプチャデバイスは、例えば、一つまたは複数のカメラ、以前にキャプチャされたビデオ/画像を含むビデオ/画像アーカイブなどを含むことができる。ビデオ/画像生成デバイスは、例えば、コンピュータ、タブレットおよびスマートフォンなどを含むことができ、(電子的に)ビデオ/画像を生成することができる。例えば、コンピュータなどを介して、仮想のビデオ/画像が生成されることができ、この場合、ビデオ/画像キャプチャ過程は、関連データが生成される過程に置き換えられることができる。
符号化部12は、入力ビデオ/画像を符号化することができる。符号化部12は、圧縮および符号化効率のために、予測、変換、量子化などの一連の手順を行うことができる。符号化部12は、符号化されたデータ(符号化されたビデオ/画像情報)をビットストリーム(bitstream)形式で出力することができる。
伝送部13は、ビットストリーム形式で出力された、符号化されたビデオ/画像情報またはデータを、ファイルまたはストリーミング形式でデジタル記憶媒体またはネットワークを介して復号装置20の受信部21に伝達することができる。デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray(登録商標)、HDD、SSDなどの様々な記憶媒体を含むことができる。伝送部13は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送/通信ネットワークを介して伝送するためのエレメントを含むことができる。受信部21は、上記記憶媒体またはネットワークから上記ビットストリームを抽出/受信して復号部22に伝達することができる。
復号部22は、符号化部12の動作に対応する逆量子化、逆変換、予測などの一連の手順を行ってビデオ/画像を復号することができる。
レンダリング部23は、復号されたビデオ/画像をレンダリングすることができる。レンダリングされたビデオ/画像は、ディスプレイ部を介して表示されることができる。
画像符号化装置の概要
図2は、本開示による実施例が適用されることができる画像符号化装置を概略的に示す図である。
図2に示されているように、画像符号化装置100は、画像分割部110、減算部115、変換部120、量子化部130、逆量子化部140、逆変換部150、加算部155、フィルタリング部160、メモリ170、インター予測部180、イントラ予測部185およびエントロピ符号化部190を含むことができる。インター予測部180およびイントラ予測部185は、合わせて「予測部」と呼ばれることができる。変換部120、量子化部130、逆量子化部140および逆変換部150は、残差(レジデュアル)(residual)処理部に含まれることができる。残差処理部は、減算部115をさらに含むこともできる。
画像符号化装置100を構成する複数の構成部の全部または少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、エンコーダまたはプロセッサ)で実現されることができる。また、メモリ170は、DPB(Decoded Picture Buffer)を含むことができ、デジタル記憶媒体によって実現できる。
画像分割部110は、画像符号化装置100に入力された入力画像(または、ピクチャ、フレーム)を一つまたは複数の処理ユニット(processing unit)に分割することができる。一例として、上記処理ユニットは、コーディングユニット(Coding Unit、CU)と呼ばれることができる。コーディングユニットは、コーディングツリーユニット(Coding Tree Unit、CTU)または最大コーディングユニット(Largest Coding Unit、LCU)をQT/BT/TT(Quad-Tree/Binary-Tree/Ternary-Tree)構造によって再帰的に(recursively)分割することにより取得されることができる。例えば、一つのコーディングユニットは、四分木構造、二分木構造および/または三分木構造に基づいて、下位(deeper)デプスの複数のコーディングユニットに分割されることができる。コーディングユニットの分割のために、四分木構造が先に適用され、二分木構造および/または三分木構造が後で適用されることができる。それ以上分割されない最終コーディングユニットを基に、本開示による符号化手順が行われることができる。最大コーディングユニットが最終コーディングユニットとして使用されることができ、最大コーディングユニットを分割して取得した下位デプスのコーディングユニットが最終コーディングユニットとして使用されることもできる。ここで、コーディング手順とは、後述する予測、変換および/または復元などの手順を含むことができる。他の例として、上記コーディング手順の処理ユニットは、予測ユニット(PU:Prediction Unit)または変換ユニット(TU:Transform Unit)であることができる。上記予測ユニットおよび上記変換ユニットは、それぞれ上記最終コーディングユニットから分割またはパーティショニングされることができる。上記予測ユニットは、サンプル予測の単位であることができ、上記変換ユニットは、変換係数を導出(誘導)する単位、および/または変換係数から残差信号(residual signal)を導出する単位であることができる。
予測部(インター予測部180またはイントラ予測部185)は、処理対象ブロック(現ブロック)に対する予測を行い、上記現ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、現ブロックまたはCU単位でイントラ予測が適用されるか、またはインター予測が適用されるかを決定することができる。予測部は、現ブロックの予測に関する様々な情報を生成してエントロピ符号化部190に伝達することができる。予測に関する情報は、エントロピ符号化部190で符号化されてビットストリーム形式で出力されることができる。
イントラ予測部185は、現ピクチャ内のサンプルを参照して現ブロックを予測することができる。参照される上記サンプルは、イントラ予測モードおよび/またはイントラ予測技法に従って、上記現ブロックの周辺(neighbor)に位置することもでき、または離れて位置することもできる。イントラ予測モードは、複数の非方向性モードおよび複数の方向性モードを含むことができる。非方向性モードは、例えば、DCモードおよび平面(プランナ)モード(Planarモード)を含むことができる。方向性モードは、予測方向の細密な程度に応じて、例えば33個の方向性予測モードまたは65個の方向性予測モードを含むことができる。ただし、これは例示に過ぎず、設定に基づいてそれ以上またはそれ以下の個数の方向性予測モードが使用されることができる。イントラ予測部185は、周辺ブロックに適用された予測モードを用いて、現ブロックに適用される予測モードを決定することもできる。
インター予測部180は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現ブロックに対する予測されたブロックを導出することができる。このとき、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロックまたはサンプル単位で予測することができる。上記動き情報は、動きベクトルおよび参照ピクチャインデックスを含むことができる。上記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合、周辺ブロックは、現ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と、参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)と、を含むことができる。上記参照ブロックを含む参照ピクチャと上記時間周辺ブロックを含む参照ピクチャとは、同一でもよく、互いに異なってもよい。上記時間周辺ブロックは、コロケート参照ブロック(collocated reference block)、コロケートCU(colCU)などの名前で呼ばれることができる。上記時間周辺ブロックを含む参照ピクチャは、コロケートピクチャ(collocated picture、colPic)と呼ばれることができる。例えば、インター予測部180は、周辺ブロックに基づいて動き情報候補リストを構成し、上記現ブロックの動きベクトルおよび/または参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われることができ、例えばスキップモードおよびマージモードの場合に、インター予測部180は、周辺ブロックの動き情報を現ブロックの動き情報として用いることができる。スキップモードの場合、マージモードとは異なり、残差信号が伝送されないことができる。動き情報予測(Motion Vector Prediction、MVP)モードの場合、周辺ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として用い、動きベクトル差分(motion vector difference)および動きベクトル予測子に対するインジケータ(indicator)を符号化することにより、現ブロックの動きベクトルをシグナリングすることができる。動きベクトル差分は、現ブロックの動きベクトルと動きベクトル予測子との差を意味することができる。
予測部は、後述する様々な予測方法および/または予測技法に基づいて予測信号を生成することができる。例えば、予測部は、現ブロックの予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。現ブロックの予測のためにイントラ予測とインター予測とを同時に適用する予測方法は、CIIP(Combined Inter And Intra Prediction)と呼ばれることができる。また、予測部は、現ブロックの予測のためにイントラブロックコピー(Intra Block Copy、IBC)を行うこともできる。イントラブロックコピーは、例えば、SCC(Screen Content Coding)などのようにゲームなどのコンテンツ画像/動画コーディングのために使用できる。IBCは、現ブロックから所定の距離だけ離れた位置の現ピクチャ内の既に復元された参照ブロックを用いて現ブロックを予測する方法である。IBCが適用される場合、現ピクチャ内の参照ブロックの位置は、上記所定の距離に該当するベクトル(ブロックベクトル)として符号化されることができる。IBCは、基本的には、現ピクチャ内で予測を行うが、現ピクチャ内で参照ブロックを導出するという点において、インター予測と同様に行われることができる。すなわち、IBCは、本開示で説明されるインター予測技法のうちの少なくとも一つを用いることができる。
予測部によって生成された予測信号は、復元信号を生成するために用いられるか、または残差信号を生成するために用いられることができる。減算部115は、入力画像信号(オリジナル(原本)ブロック、オリジナルサンプルアレイ)から、予測部から出力された予測信号(予測されたブロック、予測サンプルアレイ)を減算して、残差信号(residual signal、残差(残余)ブロック、残差サンプルアレイ)を生成することができる。生成された残差信号は、変換部120に伝送されることができる。
変換部120は、残差信号に変換技法を適用して変換係数(transform coefficients)を生成することができる。例えば、変換技法は、DCT(Discrete Cosine Transform)、DST(Discrete Sine Transform)、KLT(Karhunen-Loeve Transform)、GBT(Graph-Based Transform)、およびCNT(Conditionally Non-linear Transform)のうちの少なくとも一つを含むことができる。ここで、GBTは、ピクセル間の関係情報をグラフで表現するとするとき、このグラフから得られた変換を意味する。CNTは、以前に復元されたすべてのピクセル(all previously reconstructed pixel)を用いて予測信号を生成し、それに基づいて取得される変換を意味する。変換過程は、正方形の同じサイズを有するピクセルブロックに適用されることもでき、正方形ではない可変サイズのブロックにも適用されることができる。
量子化部130は、変換係数を量子化してエントロピ符号化部190に伝送することができる。エントロピ符号化部190は、量子化された信号(量子化された変換係数に関する情報)を符号化してビットストリーム形式で出力することができる。上記量子化された変換係数に関する情報は、残差情報と呼ばれることができる。量子化部130は、係数スキャン順序(scan order)に基づいて、ブロック形式の量子化された変換係数を1次元ベクトル形式で再整列することができ、上記1次元ベクトル形式の量子化された変換係数に基づいて、上記量子化された変換係数に関する情報を生成することもできる。
エントロピ符号化部190は、例えば、指数ゴロム(exponential Golomb)、CAVLC(Context-Adaptive Variable Length Coding)、CABAC(Context-Adaptive Binary Arithmetic Coding)などの様々な符号化方法を行うことができる。エントロピ符号化部190は、量子化された変換係数の他に、ビデオ/画像の復元に必要な情報(例えば、シンタックス要素(syntax elements)の値など)を一緒にまたは別々に符号化することもできる。符号化された情報(例えば、符号化されたビデオ/画像情報)は、ビットストリーム形式でNAL(Network Abstraction Layer)ユニット単位で伝送または記憶されることができる。上記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、上記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。本開示で言及されたシグナリング情報、伝送される情報および/またはシンタックス要素は、上述した符号化手順を介して符号化されて上記ビットストリームに含まれることができる。
上記ビットストリームは、ネットワークを介して伝送されることができ、またはデジタル記憶媒体に記憶されることができる。ここで、ネットワークは、放送網および/または通信網などを含むことができ、デジタル記憶媒体は、USB、SD、CD、DVD、Blu-ray(登録商標)、HDD、SSDなどの様々な記憶媒体を含むことができる。エントロピ符号化部190から出力された信号を伝送する伝送部(図示せず)および/もしくは記憶する記憶部(図示せず)が画像符号化装置100の内/外部要素として備えられることができ、または伝送部は、エントロピ符号化部190の構成要素として備えられることもできる。
量子化部130から出力された、量子化された変換係数は、残差信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部140および逆変換部150を介して逆量子化および逆変換を適用することにより、残差信号(残差ブロックまたは残差サンプル)を復元することができる。
加算部155は、復元された残差信号をインター予測部180またはイントラ予測部185から出力された予測信号に加えることにより、復元(reconstructed)信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対する残差がない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部155は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
フィルタリング部160は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部160は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、上記修正された復元ピクチャをメモリ170、具体的にはメモリ170のDPBに記憶することができる。上記様々なフィルタリング方法は、例えば、デブロックフィルタリング、サンプル適応オフセット(sample adaptive offset)、適応ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。フィルタリング部160は、各フィルタリング方法についての説明で後述するようにフィルタリングに関する様々な情報を生成してエントロピ符号化部190に伝達することができる。フィルタリングに関する情報は、エントロピ符号化部190で符号化されてビットストリーム形式で出力されることができる。
メモリ170に伝送された、修正された復元ピクチャは、インター予測部180で参照ピクチャとして使用されることができる。画像符号化装置100は、これを介してインター予測が適用される場合、画像符号化装置100と画像復号装置とにおける予測ミスマッチを回避することができ、符号化効率も向上させることができる。
メモリ170内のDPBは、インター予測部180における参照ピクチャとして使用するために、修正された復元ピクチャを記憶することができる。メモリ170は、現ピクチャ内の動き情報が導出された(または符号化された)ブロックの動き情報および/または既に復元されたピクチャ内ブロックの動き情報を記憶することができる。上記記憶された動き情報は、空間周辺ブロックの動き情報または時間周辺ブロックの動き情報として活用するためにインター予測部180に伝達されることができる。メモリ170は、現ピクチャ内の復元されたブロックの復元サンプルを記憶することができ、イントラ予測部185に伝達することができる。
画像復号装置の概要
図3は、本開示による実施例が適用されることができる画像復号装置を概略的に示す図である。
図3に示されるように、画像復号装置200は、エントロピ復号部210、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260およびイントラ予測部265を含んで構成できる。インター予測部260およびイントラ予測部265を合わせて「予測部」と呼ばれることができる。逆量子化部220、逆変換部230は、残差処理部に含まれることができる。
画像復号装置200を構成する複数の構成部の全部または少なくとも一部は、実施例によって一つのハードウェアコンポーネント(例えば、デコーダまたはプロセッサ)で実現されることができる。また、メモリ170は、DPBを含むことができ、デジタル記憶媒体によって実現できる。
ビデオ/画像情報を含むビットストリームを受信した画像復号装置200は、図2の画像符号化装置100で行われたプロセスに対応するプロセスを実行して画像を復元することができる。例えば、画像復号装置200は、画像符号化装置で適用された処理ユニットを用いて復号を行うことができる。したがって、復号の処理ユニットは、例えばコーディングユニットであることができる。コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットを分割して取得できる。そして、画像復号装置200を介して復号および出力された復元画像信号は、再生装置(図示せず)を介して再生できる。
画像復号装置200は、図2の画像符号化装置から出力された信号をビットストリーム形式で受信することができる。受信した信号は、エントロピ復号部210を介して復号できる。例えば、エントロピ復号部210は、上記ビットストリームをパージングして画像復元(またはピクチャ復元)に必要な情報(例えば、ビデオ/画像情報)を導出することができる。上記ビデオ/画像情報は、適応パラメータセット(APS)、ピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)またはビデオパラメータセット(VPS)などの様々なパラメータセットに関する情報をさらに含むことができる。また、上記ビデオ/画像情報は、一般制限情報(general constraint information)をさらに含むことができる。画像復号装置は、画像を復号するために、上記パラメータセットに関する情報および/または上記一般制限情報をさらに用いることができる。本開示で言及されたシグナリング情報、受信される情報および/またはシンタックス要素は、上記復号手順を介して復号されることにより、上記ビットストリームから取得されることができる。例えば、エントロピ復号部210は、指数ゴロム符号化、CAVLCまたはCABACなどのコーディング方法に基づいてビットストリーム内の情報を復号し、画像の復元に必要なシンタックス要素の値、残差に関する変換係数の量子化された値を出力することができる。より詳細には、CABACエントロピ復号方法は、ビットストリームから各シンタックス要素に該当するビン(bin)を受信し、復号対象シンタックス要素情報ならびに周辺ブロックおよび復号対象ブロックの復号情報、または以前ステップで復号されたシンボル/ビンの情報を用いてコンテキスト(context)モデルを決定し、決定されたコンテキストモデルに基づいてビン(bin)の発生確率を予測してビンの算術復号(arithmetic decoding)を行うことにより、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、CABACエントロピ復号方法は、コンテキストモデルの決定後、次のシンボル/ビンのコンテキストモデルのために、復号されたシンボル/ビンの情報を用いてコンテキストモデルを更新することができる。エントロピ復号部210で復号された情報のうち、予測に関する情報は、予測部(インター予測部260およびイントラ予測部265)に提供され、エントロピ復号部210でエントロピ復号が行われた残差値、すなわち量子化された変換係数および関連パラメータ情報は、逆量子化部220に入力されることができる。また、エントロピ復号部210で復号された情報のうち、フィルタリングに関する情報は、フィルタリング部240に提供されることができる。一方、画像符号化装置から出力された信号を受信する受信部(図示せず)が画像復号装置200の内/外部要素としてさらに備えられることができ、または、受信部は、エントロピ復号部210の構成要素として備えられることもできる。
一方、本開示による画像復号装置は、ビデオ/画像/ピクチャ復号装置と呼ばれることができる。上記画像復号装置は、情報デコーダ(ビデオ/画像/ピクチャ情報デコーダ)および/またはサンプルデコーダ(ビデオ/画像/ピクチャサンプルデコーダ)を含むこともできる。上記情報デコーダは、エントロピ復号部210を含むことができ、上記サンプルデコーダは、逆量子化部220、逆変換部230、加算部235、フィルタリング部240、メモリ250、インター予測部260およびイントラ予測部265のうちの少なくとも一つを含むことができる。
逆量子化部220では、量子化された変換係数を逆量子化して変換係数を出力することができる。逆量子化部220は、量子化された変換係数を2次元のブロック形式で再整列することができる。この場合、上記再整列は、画像符号化装置で行われた係数スキャン順序に基づいて行われることができる。逆量子化部220は、量子化パラメータ(例えば、量子化ステップサイズ情報)を用いて、量子化された変換係数に対する逆量子化を行い、変換係数(transform coefficient)を取得することができる。
逆変換部230では、変換係数を逆変換して残差信号(残差ブロック、残差サンプルアレイ)を取得することができる。
予測部は、現ブロックに対する予測を行い、上記現ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部は、エントロピ復号部210から出力された上記予測に関する情報に基づいて、上記現ブロックにイントラ予測が適用されるか、またはインター予測が適用されるかを決定することができ、具体的なイントラ/インター予測モード(予測技法)を決定することができる。
予測部が後述の様々な予測方法(技法)に基づいて予測信号を生成することができるのは、画像符号化装置100の予測部についての説明で述べたのと同様である。
イントラ予測部265は、現ピクチャ内のサンプルを参照して現ブロックを予測することができる。イントラ予測部185についての説明は、イントラ予測部265に対しても同様に適用されることができる。
インター予測部260は、参照ピクチャ上で動きベクトルによって特定される参照ブロック(参照サンプルアレイ)に基づいて、現ブロックに対する予測されたブロックを導出することができる。このとき、インター予測モードで伝送される動き情報の量を減らすために、周辺ブロックと現ブロックとの動き情報の相関性に基づいて動き情報をブロック、サブブロックまたはサンプル単位で予測することができる。上記動き情報は、動きベクトルおよび参照ピクチャインデックスを含むことができる。上記動き情報は、インター予測方向(L0予測、L1予測、Bi予測など)情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現ピクチャ内に存在する空間周辺ブロック(spatial neighboring block)と参照ピクチャに存在する時間周辺ブロック(temporal neighboring block)とを含むことができる。例えば、インター予測部260は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて上記現ブロックの動きベクトルおよび/または参照ピクチャインデックスを導出することができる。様々な予測モード(技法)に基づいてインター予測が行われることができ、上記予測に関する情報は、上記現ブロックに対するインター予測のモード(技法)を指示する情報を含むことができる。
加算部235は、取得された残差信号を予測部(インター予測部260および/またはイントラ予測部265を含む)から出力された予測信号(予測されたブロック、予測サンプルアレイ)に加えることにより、復元信号(復元ピクチャ、復元ブロック、復元サンプルアレイ)を生成することができる。スキップモードが適用された場合のように処理対象ブロックに対する残差がない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部155についての説明は、加算部235に対しても同様に適用されることができる。加算部235は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するようにフィルタリングを経て次のピクチャのインター予測のために使用されることもできる。
フィルタリング部240は、復元信号にフィルタリングを適用して主観的/客観的画質を向上させることができる。例えば、フィルタリング部240は、復元ピクチャに様々なフィルタリング方法を適用して、修正された(modified)復元ピクチャを生成することができ、上記修正された復元ピクチャを、メモリ250、具体的にはメモリ250のDPBに記憶することができる。上記様々なフィルタリング方法は、例えば、デブロックフィルタリング、サンプル適応オフセット(sample adaptive offset)、適応ループフィルタ(adaptive loop filter)、双方向フィルタ(bilateral filter)などを含むことができる。
メモリ250のDPBに記憶された(修正された)復元ピクチャは、インター予測部260で参照ピクチャとして使用されることができる。メモリ250は、現ピクチャ内の動き情報が導出された(または復号された)ブロックの動き情報および/または既に復元されたピクチャ内のブロックの動き情報を記憶することができる。上記記憶された動き情報は、空間周辺ブロックの動き情報または時間周辺ブロックの動き情報として活用するために、インター予測部260に伝達することができる。メモリ250は、現ピクチャ内の復元されたブロックの復元サンプルを記憶することができ、イントラ予測部265に伝達することができる。
本明細書において、画像符号化装置100のフィルタリング部160、インター予測部180およびイントラ予測部185で説明された実施例は、それぞれ画像復号装置200のフィルタリング部240、インター予測部260およびイントラ予測部265にも、同様にまたは対応するように適用されることができる。
CTU分割の概要
前述したように、コーディングユニットは、コーディングツリーユニット(CTU)または最大コーディングユニット(LCU)をQT/BT/TT(Quad-Tree/Binary-Tree/Ternary-Tree)構造によって再帰的に分割することにより取得できる。例えば、CTUは、まず、四分木構造に分割されることができる。その後、四分木構造のリーフノードは、マルチタイプツリー構造によってさらに分割されることができる。
四分木による分割は、現CU(またはCTU)を4等分する分割を意味する。四分木による分割によって、現CUは、同じ幅および同じ高さを有する4つのCUに分割されることができる。現CUがそれ以上四分木構造に分割されない場合、現CUは、四分木構造のリーフノードに該当する。四分木構造のリーフノードに該当するCUは、それ以上分割されず、前述した最終コーディングユニットとして使用できる。あるいは、四分木構造のリーフノードに該当するCUは、マルチタイプツリー構造によってさらに分割されることができる。
図4は、マルチタイプツリー構造によるブロックの分割タイプを示す図である。マルチタイプツリー構造による分割は、二分木構造による2つの分割と三分木構造による2つの分割とを含むことができる。
二分木構造による2つの分割は、垂直二分割(バイナリ分割)(Vertical Binary Splitting、SPLIT_BT_VER)と水平二分割(Horizontal Binary Splitting、SPLIT_BT_HOR)とを含むことができる。垂直二分割(SPLIT_BT_VER)は、現CUを垂直方向に二等分する分割を意味する。図4に示されるように、垂直二分割によって、現CUの高さと同じ高さおよび現CUの幅の半分の幅を有する2つのCUが生成されることができる。水平二分割(SPLIT_BT_HOR)は、現CUを水平方向に二等分する分割を意味する。図4に示されるように、水平二分割によって、現CUの高さの半分の高さおよび現CUの幅と同じ幅を有する2つのCUが生成されることができる。
三分木構造による2つの分割は、垂直三分木(ターナリ)分割(Vertical Ternary Splitting、SPLIT_TT_VER)と水平三分木分割(Horizontal Ternary Splitting、SPLIT_TT_HOR)とを含むことができる。垂直三分木分割(SPLIT_TT_VER)は、現CUを垂直方向に1:2:1の割合で分割する。図4に示されているように、垂直三分木分割によって、現CUの高さと同じ高さおよび現CUの幅の1/4の幅を有する2つのCUと、現CUの高さと同じ高さおよび現CUの幅の半分の幅を有するCUと、が生成されることができる。水平三分木分割(SPLIT_TT_HOR)は、現CUを水平方向に1:2:1の割合で分割する。図4に示されているように、水平三分木分割によって、現CUの高さの1/4の高さおよび現CUの幅と同じ幅を有する2つのCUと、現CUの高さの半分の高さおよび現CUの幅と同じ幅を有する1つのCUと、が生成されることができる。
図5は、本開示によるマルチタイプツリーを伴う四分木(quadtree with nested multi-type tree)構造のパーティション分割情報のシグナリングメカニズムを例示する図である。
ここで、CTUは、四分木のルート(root)ノードとして扱われ、四分木構造に初めてパーティショニングされる。現CU(CTUまたは四分木のノード(QT_node))に対して四分木分割を行うか否かを指示する情報(例えば、qt_split_flag)がシグナリングされることができる。例えば、qt_split_flagが第1値(例えば、「1」)であれば、現CUは、四分木に分割されることができる。また、qt_split_flagが第2値(例えば、「0」)であれば、現CUは、四分木に分割されず、四分木のリーフノード(QT_leaf_node)になる。各四分木のリーフノードは、以後、マルチタイプツリー構造にさらにパーティショニングされることができる。つまり、四分木のリーフノードは、マルチタイプツリーのノード(MTT_node)になることができる。マルチタイプツリー構造で、現ノードがさらにパーティショニングされるかを指示するために、第1フラグ(a first flag、例えば、mtt_split_cu_flag)がシグナリングされることができる。当該ノードがさらにパーティショニングされる場合(例えば、第1フラグが1である場合)には、分割方向(splitting direction)を指示するために、第2フラグ(a second flag、例えば、mtt_split_cu_verticla_flag)がシグナリングされることができる。例えば、第2フラグが1である場合には、分割方向は垂直方向であり、第2フラグが0である場合には、分割方向は水平方向であることができる。その後、分割タイプが二分割タイプであるか三分木分割タイプであるかを指示するために、第3フラグ(a third flag、例えば、mtt_split_cu_binary_flag)がシグナリングされることができる。例えば、第3フラグが1である場合には、分割タイプは二分割タイプであり、第3フラグが0である場合には、分割タイプは三分木分割タイプであることができる。二分割または三分木分割によって取得されたマルチタイプツリーのノードは、マルチタイプツリー構造にさらにパーティショニングされることができる。しかしながら、マルチタイプツリーのノードは、四分木構造にパーティショニングされることはできない。上記第1フラグが0である場合、マルチタイプツリーの該当ノードは、それ以上分割されず、マルチタイプツリーのリーフノード(MTT_leaf_node)になる。マルチタイプツリーのリーフノードに該当するCUは、前述した最終コーディングユニットとして使用できる。
前述したmtt_split_cu_vertical_flagおよびmtt_split_cu_binary_flagに基づいて、CUのマルチタイプツリー分割モード(multi-type tree splitting mode、MttSplitMode)が表1の通りに導出されることができる。
Figure 2024023789000002
一つのCTUは、ルマサンプルのコーディングブロック(以下、「ルマブロック」という)と、これに対応するクロマサンプルの2つの符号化ブロック(以下、「クロマブロック」という)と、を含むことができる。前述したコーディングツリースキームは、現CUのルマブロックおよびクロマブロックに対して同様に適用されることもでき、個別に(separate)適用されることもできる。具体的には、一つのCTU内のルマブロックおよびクロマブロックが同じブロックツリー構造に分割されることができ、この場合のツリー構造は、シングルツリー(SINGLE_TREE)と表すことができる。あるいは、一つのCTU内のルマブロックおよびクロマブロックは、個別ブロックツリー構造に分割されることができ、この場合のツリー構造は、デュアルツリー(DUAL_TREE)と表すことができる。つまり、CTUがデュアルツリーに分割される場合、ルマブロックに対するブロックツリー構造とクロマブロックに対するブロックツリー構造とが別個に存在することができる。このとき、ルマブロックに対するブロックツリー構造は、デュアルツリールマ(DUAL_TREE_LUMA)と呼ばれることができ、クロマブロックに対するブロックツリー構造は、デュアルツリークロマ(DUAL_TREE_CHROMA)と呼ばれることができる。PおよびBスライス/タイルグループに対して、一つのCTU内のルマブロックおよびクロマブロックは、同じコーディングツリー構造を持つように制限されることができる。しかしながら、Iスライス/タイルグループに対して、ルマブロックおよびクロマブロックは、互いに個別ブロックツリー構造を持つことができる。個別ブロックツリー構造が適用される場合、ルマCTB(Coding Tree Block)は、特定のコーディングツリー構造に基づいてCUに分割され、クロマCTBは、他の符号化ツリー構造に基づいてクロマCUに分割されることができる。すなわち、個別ブロックツリー構造が適用されるIスライス/タイルグループ内のCUは、ルマ成分のコーディングブロックまたは2つのクロマ成分のコーディングブロックで構成されることができる。また、同一ブロックツリー構造が適用されるIスライス/タイルグループ内のCUとPまたはBスライス/タイルグループのCUとは、3つのカラー成分(ルマ成分および2つのクロマ成分)のブロックで構成されることができる。上記において、マルチタイプツリーを伴う四分木コーディングツリー構造について説明したが、CUが分割される構造はこれに限定されない。例えば、BT構造およびTT構造は、多数の分割ツリー(Multiple Partitioning Tree、MPT)構造に含まれる概念と解釈されることができ、CUは、QT構造およびMPT構造によって分割されると解釈することができる。QT構造およびMPT構造によってCUが分割される一例において、QT構造のリーフノードが幾つのブロックに分割されるかに関する情報を含むシンタックス要素(例えば、MPT_split_type)ならびにQT構造のリーフノードが垂直および水平のうちのどの方向に分割されるかに関する情報を含むシンタックス要素(例えば、MPT_split_mode)がシグナリングされることにより、分割構造が決定されることができる。
別の例において、CUは、QT構造、BT構造またはTT構造とは異なる方法で分割されることができる。つまり、QT構造によって下位デプスのCUが上位デプスのCUの1/4サイズに分割されるか、またはBT構造によって下位デプスのCUが上位デプスのCUの1/2サイズに分割されるか、またはTT構造によって下位デプスのCUが上位デプスのCUの1/4もしくは1/2サイズに分割されるのとは異なり、下位デプスのCUは、場合によって、上位デプスのCUの1/5、1/3、3/8、3/5、2/3または5/8のサイズに分割されることができ、CUが分割される方法は、これに限定されない。
イントラ予測の概要
以下、本開示によるイントラ予測について説明する。
イントラ予測は、現ブロックの属するピクチャ(以下、現ピクチャ)内の参照サンプルに基づいて現ブロックに対する予測サンプルを生成する予測を示すことができる。現ブロックにイントラ予測が適用される場合、現ブロックのイントラ予測に使用する周辺参照サンプルが導出されることができる。上記現ブロックの周辺参照サンプルは、サイズnW×nHの現ブロックの左側(left)境界に隣接するサンプルおよび左下側(bottom-left)に隣接する合計2×nH個のサンプル、現ブロックの上側(top)境界に隣接するサンプルおよび右上側(top-right)に隣接する合計2×nW個のサンプル、ならびに現ブロックの左上側(top-left)に隣接する1つのサンプルを含むことができる。あるいは、上記現ブロックの周辺参照サンプルは、複数列の上側周辺サンプルおよび複数行の左側周辺サンプルを含むこともできる。また、上記現ブロックの周辺参照サンプルは、サイズnW×nHの現ブロックの右側(right)境界に隣接する合計nH個のサンプル、現ブロックの下側(bottom)境界に隣接する合計nW個のサンプル、および現ブロックの右下側(bottom-right)に隣接する1つのサンプルを含むこともできる。
ただし、現ブロックの周辺参照サンプル中の一部は、未だ復号されていないか、または利用可能でないことができる。この場合、デコーダは、利用可能なサンプルとして利用可能でないサンプルを代替(substitution)して、予測に使用する周辺参照サンプルを構成することができる。あるいは、利用可能なサンプルの補間(interpolation)を介して、予測に使用する周辺参照サンプルを構成することができる。
周辺参照サンプルが導出された場合、(i)現ブロックの周辺(neighboring)参照サンプルの平均(average)または補間(interpolation)に基づいて予測サンプルを導出することができ、(ii)現ブロックの周辺参照サンプルのうちの予測サンプルに対して、特定の(予測)方向に存在する参照サンプルに基づいて上記予測サンプルを導出することもできる。(i)の場合は、非方向性モードまたは非角度モード、(ii)の場合は、方向性(directional)モードまたは角度(angular)モードと呼ばれることができる。
また、上記周辺参照サンプルのうち、上記現ブロックの予測対象サンプルを基準に、上記現ブロックのイントラ予測モードの予測方向に位置する第1周辺サンプルとその反対方向に位置する第2周辺サンプルとの補間を介して上記予測サンプルが生成されることもできる。上述した場合は、線形補間イントラ予測(Linear Interpolation Intra Prediction、LIP)と呼ばれることができる。
また、線形モデル(linear model)を用いてルマサンプルに基づいてクロマ予測サンプルが生成されることもできる。この場合は、LM(Linear Model)モードと呼ばれることができる。
また、フィルタリングされた周辺参照サンプルに基づいて上記現ブロックの一時予測サンプルを導出し、上記従来の周辺参照サンプル、すなわち、フィルタリングされていない周辺参照サンプルのうち、上記イントラ予測モードに応じて導出された少なくとも一つの参照サンプルと上記一時予測サンプルとを加重和(weighted sum)して、上記現ブロックの予測サンプルを導出することもできる。この場合は、PDPC(Position Dependent Intra Prediction)と呼ばれることができる。
また、現ブロックの周辺多重参照サンプルラインのうち、最も予測精度が高い参照サンプルラインを選択して、当該ラインから予測方向に位置する参照サンプルを用いて予測サンプルを導出することができる。このとき、使用された参照サンプルラインに関する情報(例えば、intra_luma_ref_idx)は、ビットストリームに符号化されてシグナリングされることができる。この場合は、MRL(Multi-Reference Line Intra Prediction)またはMRLベースのイントラ予測と呼ばれることができる。MRLが適用されない場合、現ブロックに直接隣接する参照サンプルラインから参照サンプルが導出されることができ、この場合、参照サンプルラインに関する情報は、シグナリングされないことができる。
また、現ブロックを垂直または水平のサブパーティションに分割し、各サブパーティションに対して同一のイントラ予測モードに基づいてイントラ予測を行うことができる。このとき、イントラ予測の周辺参照サンプルは、各サブパーティション単位で導出されることができる。すなわち、符号化/復号の順序上、以前のサブパーティションの復元されたサンプルが現サブパーティションの周辺参照サンプルとして用いられることができる。この場合、現ブロックに対するイントラ予測モードが上記サブパーティションに同一に適用されるが、上記サブパーティション単位で周辺参照サンプルを導出して用いることにより、場合によってはイントラ予測性能を向上させることができる。このような予測方法は、ISP(Intra Sub-Partitions)またはISPベースのイントラ予測と呼ばれることができる。
前述したイントラ予測技法は、方向性または非方向性のイントラ予測モードと区分してイントラ予測タイプまたは付加イントラ予測モードなどの様々な用語で呼ばれることができる。例えば、上記イントラ予測技法(イントラ予測タイプまたは付加イントラ予測モードなど)は、上述したLIP、LM、PDPC、MRL、ISPのうちの少なくとも一つを含むことができる。上記LIP、LM、PDPC、MRL、ISPなどの特定のイントラ予測タイプを除いた一般イントラ予測方法は、ノーマルイントラ予測タイプと呼ばれることができる。ノーマルイントラ予測タイプは、上述したような特定のイントラ予測タイプが適用されない場合に一般的に適用でき、前述したイントラ予測モードに基づいて予測が行われることができる。一方、必要に応じて導出された予測サンプルに対する後処理フィルタリングが行われることもできる。
具体的には、イントラ予測手順は、イントラ予測モード/タイプ決定ステップ、周辺参照サンプル導出ステップ、イントラ予測モード/タイプベースの予測サンプル導出ステップを含むことができる。また、必要に応じて、導出された予測サンプルに対する後処理フィルタリング(post-filtering)ステップが行われることもできる。
図6は、イントラ予測ベースのビデオ/画像符号化方法を示すフローチャートである。
図6の符号化方法は、図2の画像符号化装置によって行われることができる。具体的には、ステップS610は、イントラ予測部185によって行われることができ、ステップS620は、残差処理部によって行われることができる。具体的には、ステップS620は、減算部115によって行われることができる。ステップS630は、エントロピ符号化部190によって行われることができる。ステップS630の予測情報は、イントラ予測部185によって導出され、ステップS630の残差情報は、残差処理部によって導出されることができる。上記残差情報は、上記残差サンプルに関する情報である。上記残差情報は、上記残差サンプルに対する量子化された変換係数に関する情報を含むことができる。前述したように、上記残差サンプルは、画像符号化装置の変換部120を介して変換係数として導出され、上記変換係数は、量子化部130を介して量子化された変換係数として導出されることができる。上記量子化された変換係数に関する情報が、残差コーディング手順を介してエントロピ符号化部190で符号化されることができる。
画像符号化装置は、現ブロックに対するイントラ予測を行うことができる(S610)。画像符号化装置は、現ブロックに対するイントラ予測モード/タイプを決定し、現ブロックの周辺参照サンプルを導出した後、上記イントラ予測モード/タイプ、および上記周辺参照サンプルに基づいて上記現ブロック内の予測サンプルを生成することができる。ここで、イントラ予測モード/タイプの決定、周辺参照サンプルの導出および予測サンプルの生成手順は、同時に行われてもよく、いずれか一つの手順が他の手順よりも先に行われてもよい。
図7は、本開示によるイントラ予測部185の構成を例示的に示す図である。
図7に示すように、画像符号化装置のイントラ予測部185は、イントラ予測モード/タイプ決定部186、参照サンプル導出部187および/または予測サンプル導出部188を含むことができる。イントラ予測モード/タイプ決定部186は、上記現ブロックに対するイントラ予測モード/タイプを決定することができる。参照サンプル導出部187は、上記現ブロックの周辺参照サンプルを導出することができる。予測サンプル導出部188は、上記現ブロックの予測サンプルを導出することができる。一方、図示されてはいないが、後述する予測サンプルフィルタリング手順が行われる場合、イントラ予測部185は、予測サンプルフィルタ部(図示せず)をさらに含むこともできる。
画像符号化装置は、複数のイントラ予測モード/タイプのうち、上記現ブロックに対して適用されるモード/タイプを決定することができる。画像符号化装置は、上記イントラ予測モード/タイプに対するレート歪みコスト(RD cost)を比較し、上記現ブロックに対する最適なイントラ予測モード/タイプを決定することができる。
一方、画像符号化装置は、予測サンプルフィルタリング手順を行うこともできる。予測サンプルフィルタリングは、ポストフィルタリングと呼ばれることができる。上記予測サンプルフィルタリング手順によって、上記予測サンプルのうちの一部または全部がフィルタリングされることができる。場合によっては、上記予測サンプルフィルタリング手順は省略できる。
再び図6を参照して、画像符号化装置は、予測サンプルまたはフィルタリングされた予測サンプルに基づいて、上記現ブロックに対する残差サンプルを生成することができる(S620)。画像符号化装置は、現ブロックのオリジナルサンプルから上記予測サンプルを減算して上記残差サンプルを導出することができる。つまり、画像符号化装置は、オリジナルサンプル値から対応する予測サンプル値を減算することにより、残差サンプル値を導出することができる。
画像符号化装置は、上記イントラ予測に関する情報(予測情報)、および上記残差サンプルに関する残差情報を含む画像情報を符号化することができる(S630)。上記予測情報は、上記イントラ予測モード情報および/または上記イントラ予測技法情報を含むことができる。画像符号化装置は、符号化された画像情報をビットストリーム形式で出力することができる。出力されたビットストリームは、記憶媒体またはネットワークを介して画像復号装置へ伝達されることができる。
上記残差情報は、後述する残差コーディングシンタックスを含むことができる。画像符号化装置は、上記残差サンプルを変換/量子化し、量子化された変換係数を導出することができる。上記残差情報は、上記量子化された変換係数に関する情報を含むことができる。
一方、前述したように、画像符号化装置は、復元ピクチャ(復元サンプルおよび復元ブロックを含む)を生成することができる。このために、画像符号化装置は、上記量子化された変換係数をさらに逆量子化/逆変換処理して(修正された)残差サンプルを導出することができる。このように残差サンプルを変換/量子化した後、再び逆量子化/逆変換を行う理由は、画像復号装置から導出される残差サンプルと同一の残差サンプルを導出するためである。画像符号化装置は、上記予測サンプルと、上記(修正された)残差サンプルと、に基づいて、上記現ブロックに対する復元サンプルを含む復元ブロックを生成することができる。上記復元ブロックに基づいて、上記現ピクチャに対する復元ピクチャが生成されることができる。上記復元ピクチャにインループフィルタリング手順などがさらに適用できるのは、前述した通りである。
図8はイントラ予測ベースのビデオ/画像復号方法を示すフローチャートである。
画像復号装置は、上記画像符号化装置で行われた動作と対応する動作を行うことができる。
図8の復号方法は、図3の画像復号装置によって行われることができる。ステップS810ないしS830は、イントラ予測部265によって行われることができ、ステップS810の予測情報およびステップS840の残差情報は、エントロピ復号部210によってビットストリームから取得されることができる。画像復号装置の残差処理部は、上記残差情報に基づいて、現ブロックに対する残差サンプルを導出することができる(S840)。具体的には、上記残差処理部の逆量子化部220は、上記残差情報に基づいて導出された、量子化された変換係数に基づいて、逆量子化を行って変換係数を導出し、上記残差処理部の逆変換部230は、上記変換係数に対する逆変換を行って上記現ブロックに対する残差サンプルを導出することができる。ステップS850は、加算部235または復元部によって行われることができる。
具体的には、画像復号装置は、受信した予測情報(イントラ予測モード/タイプ情報)に基づいて、現ブロックに対するイントラ予測モード/タイプを導出することができる(S810)。また、画像復号装置は、上記現ブロックの周辺参照サンプルを導出することができる(S820)。画像復号装置は、上記イントラ予測モード/タイプおよび上記周辺参照サンプルに基づいて上記現ブロック内の予測サンプルを生成することができる(S830)。この場合、画像復号装置は、予測サンプルフィルタリング手順を行うことができる。予測サンプルフィルタリングは、ポストフィルタリングと呼ばれることができる。上記予測サンプルフィルタリング手順によって、上記予測サンプルのうちの一部または全部がフィルタリングされることができる。場合によっては、予測サンプルフィルタリング手順は省略できる。
画像復号装置は、受信した残差情報に基づいて、上記現ブロックに対する残差サンプルを生成することができる(S840)。画像復号装置は、上記予測サンプルおよび上記残差サンプルに基づいて上記現ブロックに対する復元サンプルを生成し、上記復元サンプルを含む復元ブロックを導出することができる(S850)。上記復元ブロックに基づいて上記現ピクチャに対する復元ピクチャが生成されることができる。上記復元ピクチャに基づいてインループフィルタリング手順などがさらに適用できるのは、前述した通りである。
図9は、本開示によるイントラ予測部265の構成を例示的に示す図である。
図9に示すように、画像復号装置のイントラ予測部265は、イントラ予測モード/タイプ決定部266、参照サンプル導出部267および予測サンプル導出部268を含むことができる。イントラ予測モード/タイプ決定部266は、画像符号化装置のイントラ予測モード/タイプ決定部186で生成されてシグナリングされたイントラ予測モード/タイプ情報に基づいて、上記現ブロックに対するイントラ予測モード/タイプを決定し、参照サンプル導出部266は、現ピクチャ内の復元された参照領域から上記現ブロックの周辺参照サンプルを導出することができる。予測サンプル導出部268は、上記現ブロックの予測サンプルを導出することができる。一方、図示されてはいないが、前述した予測サンプルフィルタリング手順が行われる場合、イントラ予測部265は、予測サンプルフィルタ部(図示せず)をさらに含むこともできる。
上記イントラ予測モード情報は、例えばMPM(Most Probable Mode)が上記現ブロックに適用されるか、またはリメイニングモード(remaining mode)が適用されるかを示すフラグ情報(例えば、intra_luma_mpm_flag)を含むことができ、上記MPMが上記現ブロックに適用される場合、上記イントラ予測モード情報は、上記イントラ予測モード候補(MPM候補)のうちのいずれか一つを指すインデックス情報(例えば、intra_luma_mpm_idx)をさらに含むことができる。上記イントラ予測モード候補(MPM候補)は、MPM候補リストまたはMPMリストで構成されることができる。また、上記MPMが上記現ブロックに適用されない場合、上記イントラ予測モード情報は、上記イントラ予測モード候補(MPM候補)を除いた残りのイントラ予測モードのうちのいずれか一つを指すリメイニングモード情報(例えば、intra_luma_mpm_remainder)をさらに含むことができる。画像復号装置は、上記イントラ予測モード情報に基づいて、上記現ブロックのイントラ予測モードを決定することができる。MPM候補モードは、現ブロックの周辺ブロック(例えば、左側周辺ブロックおよび上側周辺ブロック)のイントラ予測モードおよび追加的な候補モードを含むことができる。
また、上記イントラ予測技法は、様々な形態で実現できる。一例として、上記イントラ予測技法情報は、上記イントラ予測技法のうちのいずれか一つを指示するイントラ予測技法のインデックス情報を含むことができる。他の例として、上記イントラ予測技法情報は、上記MRLが上記現ブロックに適用されるか、および、適用される場合には何番目の参照サンプルラインが用いられるかを示す参照サンプルライン情報(例えば、intra_luma_ref_idx)、上記ISPが上記現ブロックに適用されるかを示すISPフラグ情報(例えば、intra_subpartitions_mode_flag)、上記ISPが適用される場合にサブパーティションの分割タイプを指示するISPタイプ情報(例えば、intra_subpartitions_split_flag)、PDPCを適用するか否かを示すフラグ情報、ならびにLIPを適用するか否かを示すフラグ情報のうちの少なくとも一つを含むことができる。本開示において、ISPフラグ情報は、ISP適用インジケータと呼ばれることができる。
上記イントラ予測モード情報および/または上記イントラ予測技法情報は、本開示で説明されたコーディング方法を介して符号化/復号されることができる。例えば、上記イントラ予測モード情報および/または上記イントラ予測技法情報は、truncated(rice)binary codeに基づいてエントロピコーディング(例えば、CABAC、CAVLC)を介して符号化/復号できる。
以下、本開示によるイントラ予測モード/タイプ決定方法についてより詳細に説明する。
現ブロックにイントラ予測が適用される場合、周辺ブロックのイントラ予測モードを用いて、現ブロックに適用されるイントラ予測モードが決定されることができる。例えば、画像復号装置は、現ブロックの周辺ブロック(例えば、左側および/または上側周辺ブロック)のイントラ予測モードおよび追加的な候補モードに基づいて導出されたmpm(most probable mode)リストを構成し、受信したmpmインデックスに基づいてmpmリスト内のmpm候補のうちのいずれかを選択することができる。あるいは、画像復号装置は、上記mpmリストに含まれていない残りのイントラ予測モードのうちのいずれか一つをリメイニングイントラ予測モード情報に基づいて選択することができる。例えば、現ブロックに適用されるイントラ予測モードがmpm候補の中にあるか(すなわち、mpmリストに含まれているか)、またはリメイニングモードの中にあるかは、mpm flag(例えば、intra_luma_mpm_flag)に基づいて指示できる。mpm flagの値1は、上記現ブロックに対するイントラ予測モードがmpm候補(mpmリスト)内にあることを示すことができ、mpm flagの値0は、上記現ブロックに対するイントラ予測モードがmpm候補(mpmリスト)内にないことを示すことができる。上記mpmインデックスは、mpm_idxまたはintra_luma_mpm_idxシンタックス要素の形態でシグナリングされることができ、上記リメイニングイントラ予測モード情報は、rem_intra_luma_pred_modeまたはintra_luma_mpm_remainderシンタックス要素の形態でシグナリングされることができる。例えば、上記リメイニングイントラ予測モード情報は、全体イントラ予測モードのうち、上記mpm候補(mpmリスト)に含まれない残りのイントラ予測モードを予測モード番号の順にインデキシングして(インデックスを付けて)その中のいずれか一つを指すことができる。上記イントラ予測モードは、ルマ成分(サンプル)に対するイントラ予測モードであることができる。以下、イントラ予測モード情報は、上記mpm flag(例えば、intra_luma_mpm_flag)、上記mpmインデックス(例えば、mpm_idxまたはintra_luma_mpm_idx)、上記リメイニングイントラ予測モード情報(rem_intra_luma_pred_modeまたはintra_luma_mpm_remainder)のうちの少なくとも一つを含むことができる。本開示において、MPMリストは、MPM候補リストやcandModeListなどの様々な用語で呼ばれることができる。
図10は、画像符号化装置におけるイントラ予測モードシグナリング手順を示すフローチャートである。
図10を参照すると、画像符号化装置は、現ブロックに対するMPMリストを構成することができる(S1010)。上記MPMリストは、上記現ブロックに適用される可能性が高い候補イントラ予測モード(MPM候補)を含むことができる。上記MPMリストは、周辺ブロックのイントラ予測モードを含むこともでき、予め定められた方法に基づいて特定のイントラ予測モードをさらに含むこともできる。
画像符号化装置は、現ブロックのイントラ予測モードを決定することができる(S1020)。画像符号化装置は、様々なイントラ予測モードに基づいて予測を行うことができ、これに基づいたRDO(Rate-Distortion Optimization)を行って最適なイントラ予測モードを決定することができる。画像符号化装置は、この場合、上記MPMリストに含まれているMPM候補のみを用いて上記最適なイントラ予測モードを決定することもでき、または上記MPMリストに含まれているMPM候補だけでなく、残りのイントラ予測モードをさらに用いて上記最適なイントラ予測モードを決定することもできる。具体的には、例えば、上記現ブロックのイントラ予測タイプがノーマルイントラ予測タイプではない特定のタイプ(例えば、LIP、MRLまたはISP)である場合には、画像符号化装置は、上記MPM候補のみを用いて上記最適なイントラ予測モードを決定することができる。つまり、この場合には、上記現ブロックに対するイントラ予測モードは、上記MPM候補のみの中から決定されることができ、この場合には、上記mpm flagを符号化/シグナリングしないことができる。画像復号装置は、上記特定のタイプの場合には、mpm flagのシグナリングを別途受けなくても、mpm flagが1であると推定することができる。
一方、一般的に上記現ブロックのイントラ予測モードが上記MPMリスト内にあるMPM候補のうちのいずれか一つである場合、画像符号化装置は、上記MPM候補のうちのいずれか一つを指すmpmインデックス(mpm idx)を生成することができる。上記現ブロックのイントラ予測モードが上記MPMリスト内にない場合には、上記MPMリストに含まれていない残りのイントラ予測モードのうち、上記現ブロックのイントラ予測モードと同じモードを指すリメイニングイントラ予測モード情報を生成することができる。
画像符号化装置は、イントラ予測モード情報を符号化してビットストリーム形式で出力することができる(S1030)。上記イントラ予測モード情報は、前述したmpm flag、mpmインデックスおよび/またはリメイニングイントラ予測モード情報を含むことができる。一般に、mpmインデックスとリメイニングイントラ予測モード情報とは、alternativeな(二者択一)関係で一つのブロックに対するイントラ予測モードを指示するにあたり、同時にはシグナリングされない。つまり、mpm flag値が1であるとき、mpmインデックスがシグナリングされ、mpm flag値が0であるとき、リメイニングイントラ予測モード情報がシグナリングされることができる。ただし、前述したように、現ブロックに特定のイントラ予測タイプが適用される場合には、mpm flagがシグナリングされず、その値が1に推論(infer)され、mpmインデックスのみシグナリングされることもできる。すなわち、この場合には、上記イントラ予測モード情報は、上記mpmインデックスのみを含むこともできる。
図10に示されている例において、S1020は、S1010よりも後で行われると図示されたが、これは一つの例示であり、S1020は、S1010よりも先に行われてもよく、同時に行われてもよい。
図11は、画像復号装置におけるイントラ予測モード決定手順を示すフローチャートである。
画像復号装置は、画像符号化装置で決定およびシグナリングされたイントラ予測モード情報に基づいて、現ブロックのイントラ予測モードを決定することができる。
図11を参照すると、画像復号装置は、ビットストリームからイントラ予測モード情を取得することができる(S1110)。上記イントラ予測モード情報は、前述したようにmpm flag、mpmインデックス、およびリメイニングイントラ予測モードのうちの少なくとも一つを含むことができる。
画像復号装置は、MPMリストを構成することができる(S1120)。上記MPMリストは、上記画像符号化装置で構成されたMPMリストと同様に構成される。すなわち、上記MPMリストは、周辺ブロックのイントラ予測モードを含むこともでき、予め定められた方法に従って特定のイントラ予測モードをさらに含むこともできる。
図11に示された例において、S1120は、S1110よりも後で行われると図示されたが、これは一つの例示であり、S1120は、S1110よりも先に行われてもよく、同時に行われてもよい。
画像復号装置は、上記MPMリストおよび上記イントラ予測モード情報に基づいて現ブロックのイントラ予測モードを決定する(S1130)。ステップS1130は、図12を参照してより具体的に説明する。
図12は、イントラ予測モード導出手順をより具体的に説明するフローチャートである。
図12のステップS1210およびS1220は、それぞれ図11のステップS1110およびS1120に対応することができる。よって、ステップS1210およびS1220についての具体的な説明は省略する。
画像復号装置は、ビットストリームからイントラ予測モード情報を取得し、MPMリストを構成した後(S1210、S1220)、所定の条件を判断することができる(S1230)。具体的には、図12に示すように、mpm flagの値が1である場合(S1230でYes)、画像復号装置は、上記MPMリスト内のMPM候補のうち、上記mpmインデックスが指し示す候補を、上記現ブロックのイントラ予測モードとして導出することができる(S1240)。他の例として、上記mpm flagの値が0である場合(S1230でNo)、画像復号装置は、上記MPMリストに含まれていない残りのイントラ予測モードのうち、上記リメイニングイントラ予測モード情報が指すイントラ予測モードを上記現ブロックのイントラ予測モードとして導出することができる(S1250)。一方、別の例として、上記現ブロックのイントラ予測タイプが特定のタイプ(例えば、LIP、MRLまたはISPなど)である場合(S1230でYes)、画像復号装置は、上記mpm flagの確認がなくても、上記MPMリスト内で上記mpmインデックスが指し示す候補を上記現ブロックのイントラ予測モードとして導出することもできる(S1240)。
図13は、本開示の一実施例に係るイントラ予測方向を示す図である。
イントラ予測モードは、一例として、2つの非方向性イントラ予測モードと、33個の方向性イントラ予測モードと、を含むことができる。上記非方向性イントラ予測モードは、平面(planar)イントラ予測モードおよびDCイントラ予測モードを含むことができ、上記方向性イントラ予測モードは、2番ないし34番のイントラ予測モードを含むことができる。上記平面イントラ予測モードは、平面モードと呼ばれることができ、上記DCイントラ予測モードは、DCモードと呼ばれることができる。
あるいは、自然画像(natural video)で提示された任意のエッジ方向(edge direction)をキャプチャするために、図13に示すように、イントラ予測モードは、2つの非方向性イントラ予測モードと、65個の拡張された方向性イントラ予測モードと、を含むことができる。上記非方向性イントラ予測モードは、平面モードおよびDCモードを含むことができ、上記方向性イントラ予測モードは、2番ないし66番のイントラ予測モードを含むことができる。上記拡張されたイントラ予測モードは、すべてのサイズのブロックに適用されることができ、ルマ成分(ルマブロック)およびクロマ成分(クロマブロック)の両方に適用されることができる。
あるいは、上記イントラ予測モードは、2つの非方向性イントラ予測モードと129個の方向性イントラ予測モードとを含むことができる。上記非方向性イントラ予測モードは、平面モードおよびDCモードを含むことができ、上記方向性イントラ予測モードは、2番ないし130番のイントラ予測モードを含むことができる。
一方、上記イントラ予測モードは、前述したイントラ予測モードの他にも、クロマサンプルのためのCCLM(Cross-Component Linear Model)モードをさらに含むことができる。CCLMモードは、LMパラメータの導出のために、左側サンプルを考慮するか、上側サンプルを考慮するか、両方を考慮するかによってL_CCLM、T_CCLM、LT_CCLMに分けられることができ、クロマ成分に対してのみ適用されることができる。
イントラ予測モードは、例えば、下記表2に示すようにインデキシングできる。
Figure 2024023789000003
図14は、本開示の他の実施例に係るイントラ予測方向を示す図である。図14において、破線方向は、正方形ではないブロックのみに適用される広角(wide angle)モードを示す。図14に示すように、自然画像(natural video)で提示された任意のエッジ方向(edge direction)をキャプチャするために、一実施例によるイントラ予測モードは、2つの非方向性イントラ予測モードと共に93個の方向性イントラ予測モードを含むことができる。非方向性イントラ予測モードは、平面モードおよびDCモードを含むことができる。方向性イントラ予測モードは、図14の矢印で示すように、2番ないし80番と-1番ないし-14番とで構成されるイントラ予測モードを含むことができる。上記平面モードはINTRA_PLANAR、DCモードはINTRA_DC、とそれぞれ表記されることができる。そして、方向性イントラ予測モードは、INTRA_ANGULAR-14ないしINTRA_ANGULAR-1、およびINTRA_ANGULAR2ないしINTRA_ANGULAR80のように表記されることができる。以下、本開示によるクロマ成分ブロックの予測サンプル導出方法について詳細に説明する。
現ブロックにイントラ予測が行われる場合、現ブロックのルマ成分ブロック(ルマブロック)に対する予測およびクロマ成分ブロック(クロマブロック)に対する予測が行われることができ、この場合、クロマ成分(クロマブロック)に対するイントラ予測モードは、ルマ成分(ルマブロック)に対するイントラ予測モードとは個別に設定されることができる。
例えば、クロマブロックに対するイントラ予測モード(イントラクロマ予測モード)は、イントラクロマ予測モード情報に基づいて指示されることができ、上記イントラクロマ予測モード情報は、intra_chroma_pred_modeシンタックス要素の形でシグナリングされることができる。一例として、上記イントラクロマ予測モード情報は、平面(Planar)モード、DCモード、垂直(vertical)モード、水平(horizontal)モード、DM(Derived Mode)およびCCLMモードのうちのいずれか一つを指し示すことができる。一例として、イントラ予測モードが2つの非方向性イントラ予測モードと33個の方向性イントラ予測モードとを含む場合、上記平面モードは0番イントラ予測モード、上記DCモードは1番イントラ予測モード、上記垂直モードは26番イントラ予測モード、上記水平モードは10番イントラ予測モード、をそれぞれ示すことができる。他の例として、イントラ予測モードが2つの非方向性イントラ予測モードと65個の方向性イントラ予測モードとを含む場合、上記平面モードは0番イントラ予測モード、上記DCモードは1番イントラ予測モード、上記垂直モードは50番イントラ予測モード、上記水平モードは18番イントラ予測モード、をそれぞれ示すことができる。DMは、direct modeと呼ばれることもできる。CCLMは、LMと呼ばれることができる。
一方、DMおよびCCLMは、ルマブロックの情報を用いてクロマブロックを予測する従属的なイントラ予測モードである。上記DMは、上記ルマ成分(ルマブロック)に対するイントラ予測モードと同じイントラ予測モードが上記クロマ成分(クロマブロック)に対するイントラ予測モードとして適用されるモードを示すことができる。また、上記CCLMは、クロマブロックに対する予測ブロックを生成する過程でルマブロックの復元されたサンプルをサブサンプリングした後、サブサンプリングされたサンプルにCCLMパラメータαおよびβを適用して導出されたサンプルを上記クロマブロックの予測サンプルとして使用するイントラ予測モードを示すことができる。
DMモードの概要
現クロマブロックがDMで予測された場合、現クロマブロックのイントラ予測モードは、対応するルマブロックのイントラ予測モードで導出されることができる。例えば、対応ルマブロックの所定の位置のイントラ予測モードを現クロマブロックのイントラ予測モードとして使用することができる。
図15は、DMモードの場合、現クロマブロックのイントラ予測モードを導出するための所定の位置を示す図である。
図15において、例えば、クロマブロックは垂直二分割され、現クロマブロックは斜線領域のブロックであることができる。このとき、現クロマブロックに対応するルマブロックは、ルマブロック内の斜線領域のブロックであることができる。
図15において、DMで予測された現クロマブロックのイントラ予測モード(イントラクロマ予測モード)は、対応ルマブロック内の所定の位置のイントラ予測モード(イントラルマ予測モード)で導出されることができる。例えば、対応ルマブロック内の中央右下側サンプル(中心位置)(CR)をカバーするブロックのイントラ予測モードが現クロマブロックのイントラ予測モードと決定されることができる。しかしながら、上記所定の位置は、上記中心位置に限定されず、例えば、左上端位置(TL)のように対応ルマブロック内の他の位置であってもよい。
あるいは、現クロマブロックに多重DM(Multiple Direct modes、MDM)が適用されることもできる。
多重DMは、上記単一DMモードを複数のモードに拡張して使用するモードであって、現クロマブロックの画面内予測モードを導出するために、複数のDMモードを含むDM候補リストを構成し、DM候補リストに含まれている候補のうちのいずれか一つを、現クロマブロックのイントラ予測モードとして導出することができる。多重DMが適用される場合、DM候補リストは、次の複数のDM候補を含むことができる。
-対応ルマブロックのCR、TL、TR、BL、BR位置のイントラ予測モード
-現クロマブロックの周辺ブロックであるL、A、BL、AR、AL位置のイントラ予測モード
-PLANARモードおよびDCモード
-既に含まれている方向性モードにオフセット(例えば、1)を加減して導出された方向性モード
-デフォルトDM候補モード:垂直モード、水平モード、2、34、66、10、26番モード(65個の方向性モードの場合)
-4つのデフォルトDM候補(PLANARモード、DCモード、垂直モードおよび水平モード)がDM候補リストに含まれていない場合、含まれていないデフォルトDM候補で、リストに既に含まれているDM候補を代替
クロマブロックのイントラ予測モードのシグナリングの概要
クロマブロックのイントラ予測モードは、合計8つのイントラ予測モードを用いて符号化できる。上記8つのイントラ予測モードは、従来の5つのイントラ予測モードおよびCCLM(Cross-Component Linear Model mode)モードを含むことができる。
CCLMが利用可能であるか否かは、上位レベルでシグナリングされる情報(例えば、シーケンスレベルで伝送されるsps_cclm_enabled_flag)に基づいて判断できる。表3は、CCLMが利用可能でない場合(sps_cclm_enabled_flag=0)の現クロマブロックのイントラ予測モード導出のためのマッピングテーブルを示す。
Figure 2024023789000004
表3に示すように、クロマブロックのイントラ予測モードは、イントラクロマ予測モード情報(intra_chroma_pred_mode)および/または対応ルマブロックのイントラ予測モード(IntraPredModeY)に基づいて導出されることができる。対応ルマブロックのイントラ予測モードは、現ブロックまたはクロマブロックの中央右下側サンプル(中心位置)をカバーするルマブロックのイントラ予測モードと決定されることができる。上記中央右下側サンプルの位置は、(xCb+cbWidth/2、yCb+cbHeight/2)で導出され、このとき、(xCb、yCb)は、対応ルマブロックの左上端サンプル(top-left sample)の座標を意味し、cbWidthおよびcbHeightは、それぞれ対応ルマブロックの幅および高さを意味する。例えば、表4において、intra_chroma_pred_modeが0であれば、クロマブロックのイントラ予測モードは0(平面モード)と決定され、intra_chroma_pred_modeが1であれば、クロマブロックのイントラ予測モードは50(垂直モード)と決定されることができる。また、intra_chroma_pred_modeが2であれば、クロマブロックのイントラ予測モードは18(水平モード)と決定され、intra_chroma_pred_modeが3であれば、クロマブロックのイントラ予測モードは1(DCモード)と決定されることができる。また、intra_chroma_pred_modeが4であれば、クロマブロックのイントラ予測モードは、対応ルマブロックのイントラ予測モードと同じ値に決定されることができる。つまり、intra_chroma_pred_modeが4であることは、クロマブロックのイントラ予測モードがDMで導出されることを示す。表3に基づいて導出されるクロマブロックのイントラ予測モード(IntraPredModeC[xCb][yCb])のインデックスは、上記表2に示したイントラ予測モードのインデックスと対応することができる。
表4によれば、intra_chroma_pred_mode値が0ないし3であるとき、IntraPredModeY値に応じて、クロマブロックのイントラ予測モードが前述のイントラ予測モード(平面モード、垂直モード、水平モード、DCモード)ではない66と決定される場合がある。例えば、intra_chroma_pred_mode値0は平面モードを示すが、このとき、IntraPredModeYが0(平面モード)であれば、クロマブロックのイントラ予測モードは66と決定される。しかしながら、上述したように、クロマブロックのイントラ予測モードと対応ルマブロックのイントラ予測モードとがいずれも平面モードと等しい場合、intra_chroma_pred_mode値は、0ではなく、DMを指示する4と決定される。よって、intra_chroma_pred_mode値が0ないし3であるとき、クロマブロックのイントラ予測モードが66と決定される場合は、実質的に発生しない。つまり、intra_chroma_pred_modeが0ないし3である場合には、クロマブロックのイントラ予測モードは、intra_chroma_pred_mode値に基づいて、平面モード、垂直モード、水平モードおよびDCモードのうちのいずれか一つで導出されることができ、intra_chroma_pred_modeが4である場合には、クロマブロックのイントラ予測モードは、intra_chroma_pred_mode値および対応ルマブロックのイントラ予測モードに基づいて導出されることができる。ただし、本開示は、前述した例に限定されず、intra_chroma_pred_modeが0ないし3である場合にも、クロマブロックのイントラ予測モードがイントラクロマ予測モード情報(例えば、intra_chroma_pred_mode)および対応ルマブロックのイントラ予測モードに基づいて導出される実施例を含むことができる。
表4は、CCLMが利用可能な場合(sps_cclm_enabled_flag=1)のクロマブロックのイントラ予測モード導出のためのマッピングテーブルを示す。
Figure 2024023789000005
表4は、CCLMが利用可能な場合であって、表3のモードに加えてさらにCCLMモードをシグナリングするためのモードを含む。表4において、intra_chroma_pred_modeが4ないし6である場合、それぞれINTRA_LT_CCLM、INTRA_L_CCLM、INTRA_T_CCLMを示すことができる。表4において、intra_chroma_pred_modeが0ないし3および7である場合は、表3における、intra_chroma_pred_modeが0ないし4である場合にそれぞれ対応することができる。つまり、intra_chroma_pred_modeが7であることは、クロマブロックのイントラ予測モードがDMで導出されることを示す。
表3および表4を参照して説明したように、クロマブロックのイントラ予測モードは、イントラクロマ予測モード情報(intra_chroma_pred_mode)および/または対応ルマブロックのイントラ予測モードに基づいて導出されることができる。例えば、イントラクロマ予測モード情報がDMモードを示す場合、クロマブロックのイントラ予測モードは、対応ルマブロックのイントラ予測モードと同様に決定されることができる。
図16は、対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する従来の方法を説明するフローチャートである。
イントラ予測された現クロマブロックが入力されると(S1610)、対応するルマブロックのイントラルマ予測モードを取得することができる(S1620)。イントラルマ予測モードは、例えば、前述したように、対応ルマブロック内の所定の位置(中心位置)から取得されることができる。イントラルマ予測モードが取得された後、ビットストリームから取得されたイントラクロマ予測モード情報および/またはイントラルマ予測モードに基づいて表3または表4を参照することにより、現クロマブロックのイントラ予測モードが導出されることができる(S1630)。その後、導出されたイントラクロマ予測モードを用いて現クロマブロックに対するイントラ予測を行うことにより、現クロマブロックの予測ブロックを生成することができる(S1640)。
ステップS1630において、イントラクロマ予測モード情報がDMを示す場合、現クロマブロックのイントラ予測モードは、対応ルマブロックのイントラルマ予測モードと同一の値として導出されることができる。イントラクロマ予測モード情報がDMモード以外のモードを示す場合、現クロマブロックのイントラ予測モードは、イントラクロマ予測モード情報に基づいて平面モード、DCモード、垂直モード、水平モードおよびCCLMモードのうちのいずれか一つで導出されることができる。
しかしながら、図16を参照して説明した従来の方法は、対応ルマブロックのイントラルマ予測モードが存在しない場合について考慮していない。例えば、前述したように、一つのCTU内のルマブロックおよびクロマブロックは、同じブロックツリー構造(SINGLE_TREE)に分割されるか、または個別ブロックツリー構造(DUAL_TREE)に分割されることができるが、デュアルツリーの場合、ルマブロックとこれに対応するクロマブロックとは、同一の予測モードで符号化されてもよく、異なる予測モードで符号化されてもよい。つまり、イントラ予測されたクロマブロックに対応するルマブロックは、イントラ予測されてもよく、他の予測モードで符号化されてもよい。対応するルマブロックがイントラ予測されていない場合、ステップS1620で対応ルマブロックのイントラルマ予測モードを取得することができず、それにより例えばDMモードでイントラ予測されたクロマブロックのイントラ予測モードを導出することができないという問題が発生することができる。
以下、上記従来の方法による問題点を解決するための本開示の実施例を説明する。
図17は、対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する本開示の一実施例を説明するフローチャートである。
図17に示された本開示の一実施例によれば、対応ルマブロックのイントラ予測モードが利用可能でない場合、デフォルトイントラ予測モードを使用することにより、前述した従来の方法の問題点を解決することができる。
図17を参照すると、まず、イントラ予測された現クロマブロックが入力される(S1710)。その後、現クロマブロックのイントラ予測モードを導出するために必要な対応ルマブロックのイントラルマ予測モードが利用可能であるか否かが判断できる(S1720)。前述したように、対応ルマブロックのイントラルマ予測モードは、対応ルマブロックの所定の位置(例えば、中心位置)から取得されることができる。したがって、ステップS1720の判断は、対応ルマブロックの上記所定の位置の予測モードを確認することにより行われることができる。例えば、対応ルマブロックの上記所定の位置の予測モードがイントラモードである場合、イントラルマ予測モードは利用可能であると判断することができる。あるいは、対応ルマブロックの上記所定の位置の予測モードがイントラモード以外のモード(例えば、IBCモード)である場合、イントラルマ予測モードは利用可能でないと判断されることができる。他の例として、ステップS1720の判断は、対応ルマブロックの上記所定の位置がイントラルマ予測モードを有するか否かに基づいて判断されることもできる。
ステップS1720で、イントラルマ予測モードが利用可能であると判断される場合、ステップS1730、S1740およびS1760が順次行われることができる。ステップS1730、S1740およびS1760は、図16のステップS1620、S1630およびS1640にそれぞれ対応し、具体的な説明は省略する。
ステップS1720で、イントラルマ予測モードが利用可能でないと判断される場合、デフォルトイントラ予測モードが使用されることができる。つまり、現クロマブロックのイントラ予測モードは、イントラクロマ予測モード情報および/またはデフォルトイントラ予測モードに基づいて導出できる(S1750)。このとき、利用可能でないイントラルマ予測モードの代わりに、デフォルトイントラ予測モードが使用されることができる。一例として、イントラクロマ予測モード情報がDMを示す場合、現クロマブロックのイントラ予測モードは、デフォルトイントラ予測モードで導出されることができる。また、イントラクロマ予測モード情報がDMモード以外のモードを示す場合、現クロマブロックのイントラ予測モードは、イントラクロマ予測モード情報に基づいて平面モード、DCモード、垂直モード、水平モードおよびCCLMモードのうちのいずれか一つで導出されることができる。以後、導出されたイントラクロマ予測モードを用いて現クロマブロックに対するイントラ予測を行うことにより、現クロマブロックの予測ブロックを生成することができる(S1760)。
ステップS1750で、デフォルトイントラ予測モードとしてDCモードまたはPlanarモードが使用されることができる。しかしながら、これに限定されず、デフォルトイントラ予測モードとして、既に定義された所定のイントラ予測モード、またはビットストリームを介してシグナリングされるイントラ予測モードが使用されてもよい。
図18は、対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する本開示の他の実施例を説明するフローチャートである。
図18に示された実施例によれば、対応ルマブロックのイントラ予測モードが利用可能でない場合、デフォルトイントラ予測モードを使用することにより、前述した従来の方法の問題点を解決することができる。また、図18に示された実施例によれば、対応ルマブロックのイントラ予測モードが利用可能であるか否かの判断は、現ブロックのツリー構造がデュアルツリーである場合にのみ行う。
図18を参照すると、まず、イントラ予測された現クロマブロックが入力される(S1810)。その後、現ブロックのツリー構造がデュアルツリー構造であるか否かを判断する(S1815)。現ブロックのツリー構造がデュアルツリー構造ではない場合、すなわち、シングルツリー構造である場合、クロマブロックおよび対応ルマブロックは、同様にイントラ予測されたものと見做すことができるので、対応ルマブロックのイントラルマ予測モードは、利用可能であると判断されることができる。したがって、この場合、ステップS1820の判断は、スキップされることができる。言い換えれば、現ブロックのツリー構造がシングルツリー構造である場合、直ちにステップS1830、S1840およびS1860のステップを順次行って現クロマブロックの予測ブロックを生成することができる。
ステップS1815で、現ブロックのツリー構造がデュアルツリー構造である場合、ステップS1820の判断が行われることができ、ステップS1820の判断結果に基づく処理は、図17を参照して説明したのと同様なので、反復的な説明は省略する。つまり、ステップS1820ないしS1860は、図17のステップS1720ないしS1760のそれぞれに対応することができる。
図18のステップS1815およびS1820の判断は、図17のステップS1720の具体的な実施例であることができる。
図19は、対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出する本開示の他の実施例を説明するフローチャートである。
図19に示された実施例によれば、対応ルマブロックのイントラ予測モードが利用可能でない場合、デフォルトイントラ予測モードを使用することにより、前述した従来の方法の問題点を解決することができる。また、図19に示された実施例によれば、対応ルマブロックのイントラ予測モードが利用可能であるか否かの判断は、現ブロックのツリー構造がデュアルツリーであり、IBCが許容される場合にのみ行う。
図19を参照すると、まず、イントラ予測された現クロマブロックが入力される(S1910)。その後、現ブロックのツリー構造がデュアルツリー構造であるか否かを判断する(S1915)。現ブロックのツリー構造がデュアルツリー構造ではない場合、すなわち、シングルツリー構造である場合、図18を参照して説明したように、対応ルマブロックのイントラルマ予測モードは利用可能であると見做すことができるので、ステップS1917およびステップS1920の判断は、スキップされることができる。よって、シングルツリー構造の場合、直ちにステップS1930、S1940およびS1960のステップを順次行うことにより、現クロマブロックの予測ブロックを生成することができる。
ステップS1915で、現ブロックのツリー構造がデュアルツリー構造である場合、IBCが許容されるか否かが判断できる(S1917)。IBCが許容されるか否かは、現ブロックの上位レベル(例えば、シーケンス)でシグナリングされる情報(例えば、sps_ibc_enabled_flag)に基づいて判断されることができる。例えば、sps_ibc_enabled_flagが1であれば、IBCは許容されると判断されることができ、sps_ibc_enabled_flagが0であれば、IBCは許容されないと判断されることができる。
前述したように、PおよびBスライス/タイルグループに対してシングルツリーのみが許容され、Iスライス/タイルグループに対してシングルツリーおよびデュアルツリーの両方ともが許容されることができる。したがって、現ブロックのツリー構造がデュアルツリー構造であれば、現ブロックは、Iスライス/タイルグループに属する。Iスライス/タイルグループに含まれるブロックに対する予測がイントラ予測およびIBC予測に制限されると仮定したときに、現ブロックは、イントラ予測またはIBC予測のうちのいずれか一つで予測されることができる。よって、IBCが許容されない場合には、現ブロックは、イントラ予測されると判断されることができる。つまり、ステップS1917でIBCが許容されないと判断されると、対応ルマブロックはイントラ予測されたと見做すことができるので、ステップS1920の判断はスキップされ、直ちにステップS1930、S1940およびS1960のステップが行われることができる。ステップS1917でIBCが許容されると判断されると、対応ルマブロックは、イントラ予測またはIBC予測されることができるので、この場合、ステップS1920の判断が行われることができる。ステップS1920の判断結果に基づく処理は、図17を参照して説明したのと同様なので、反復的な説明は省略する。すなわち、ステップS1920ないしS1960は、図17のステップS1720ないしS1760のそれぞれに対応することができる。
図19に示された例において、Iスライス/タイルグループに属するブロックに対しては、イントラ予測またはIBC予測のみ可能であると仮定するので、ステップS1917でIBCが許容されるか否かだけを判断する。しかしながら、Iスライス/タイルグループに属するブロックに対してイントラ予測またはIBC予測の他に、他の第3予測モードが可能な場合には、ステップS1917でIBCが許容されるか否かだけでなく、第3予測モードが許容されるか否かに対する判断も行われることができる。この場合、IBCおよび第3予測モードの両方とも許容されないときにのみ、ステップS1920がスキップされることができる。つまり、IBCおよび第3予測モードのうちのいずれか一つでも許容される場合、ステップS1920およびそれによる後続処理が前述のように行われることができる。
図19のステップS1915、S1917およびS1920の判断は、図17のステップS1720の具体的な実施例であることができる。
図18および図19の変形例として、現ブロックのツリー構造がデュアルツリー構造であるか否かの判断に先行して、現ブロックのスライス/タイルグループのタイプが判断されることができる。現ブロックのスライス/タイルグループのタイプがPまたはBスライス/タイルグループである場合、現ブロックのツリー構造はシングルツリー構造と決定されるので、現ブロックのツリー構造がデュアルツリー構造であるか否かの判断(S1815またはS1915)が行われる必要がない。したがって、PまたはBスライス/タイルグループである場合、すぐに対応するイントラルマ予測モードを取得した後、これに基づいてイントラクロマ予測モードを導出することができる。また、現ブロックのスライス/タイルグループのタイプがIスライス/タイルグループである場合、現ブロックのツリー構造はシングルツリー構造またはデュアルツリー構造であり得るので、S1815またはS1915を含んで図18および図19のステップが行われることができる。
図20は、対応するブロックに基づいて現ブロックのイントラ予測モードを導出する本開示の一実施例を説明するフローチャートである。
まず、符号化/復号の対象である現ブロックが入力されることができる(S2010)。現ブロックは、イントラ予測されたブロックであって、現ブロックのイントラ予測モードは、直接シグナリングされず、対応するブロックのイントラ予測モードから導出されることができる。例えば、現ブロックは、クロマブロックであることができる。現ブロックが入力されると、現ブロックに対応する対応ブロックが特定され、対応ブロックのイントラ予測モードが利用可能であるか否かが判断されることができる(S2020)。例えば、対応ブロックは、クロマブロックに対応する対応ルマブロックであることができる。ステップS2020は、対応ブロックがイントラ予測されたか否かの判断に基づいて行われることができる。あるいは、対応ブロックの予測モードがイントラモード以外のモード(例えば、IBCモード)であるか否かの判断に基づいて行われることもできる。あるいは、ステップS2020は、対応ブロックがイントラ予測モードを有するか否かの判断に基づいて行われることができる。例えば、対応ブロックがイントラ予測されたか、またはイントラ予測モードを持つ場合、対応ブロックのイントラ予測モードは、利用可能であると判断されることができる。そうではなく、対応ブロックがイントラモード以外のモードと予測されたか、またはイントラ予測モードを有しない場合、対応ブロックのイントラ予測モードは、利用可能ではないと判断されることができる。あるいは、前述したように、ステップS2020は、現ブロックが含まれているスライス/タイルグループのタイプについての判断、現ブロックのツリー構造についての判断、ならびに現ブロックに対してイントラ予測の他にIBCもしくは第3予測モードが許容されるかについての判断のうちの少なくとも一つを含むこともできる。
上記において、現ブロックおよび対応ブロックは、クロマブロックおよび対応ルマブロックであると例示されているが、これに限定されない。例えば、現ブロックがルマブロックであり、対応ブロックが対応クロマブロックであってもよい。あるいは、現ブロックが第1色成分ブロックであり、対応ブロックが第2色成分ブロックであってもよい。このとき、第1色成分は、例えばルマ成分および複数のクロマ成分のうちのいずれか一つであり、第2色成分は、第1色成分とは異なる色成分であってもよい。例えば、第1色成分ブロックは第1クロマ成分ブロックであり、第2色成分ブロックは第2クロマ成分ブロックであってもよい。
再び図20を参照して、ステップS2020で、対応ブロックのイントラ予測モードが利用可能であれば、対応ブロックのイントラ予測モードが取得され(S2030)、対応ブロックのイントラ予測モードに基づいて現ブロックのイントラ予測モードが導出されることができる(S2040)。ステップS2020で、対応ブロックのイントラ予測モードが利用可能でなければ、デフォルトイントラ予測モードが決定され(S2050)、デフォルトイントラ予測モードに基づいて現ブロックのイントラ予測モードが導出されることができる(S2060)。ステップS2050のデフォルトイントラ予測モードとしてDCモードまたはPlanarモードが使用されることができる。しかしながら、これに限定されず、デフォルトイントラ予測モードとして、既に定義された所定のイントラ予測モード、またはビットストリームを介してシグナリングされるイントラ予測モードが使用されてもよい。
本開示によれば、現ブロックのイントラ予測モードを対応ブロックのイントラ予測モードから導出する場合において、対応ブロックのイントラ予測モードが存在しない場合には、デフォルトイントラ予測モードに基づいて現ブロックのイントラ予測モードを導出することができるので、対応ブロックのイントラ予測モードが存在しない場合にも、現ブロックに対するイントラ予測が効果的に行われることができる。
図21は、対応ルマブロックに基づいてクロマブロックのイントラ予測モードを導出し、クロマブロックを符号化する本開示の他の実施例を説明するフローチャートである。
図21は、図17を参照して説明した実施例に対応する画像符号化装置における動作に関するものである。
図21を参照すると、まず、現クロマブロックが入力される(S2110)。現クロマブロックに対してイントラ予測を行うために、画像符号化装置は、現クロマブロックのイントラ予測モードを決定することができる。画像符号化装置は、現クロマブロックに適用可能なイントラ予測モードのうちの全部または少なくとも一部に対してイントラ予測を行い、最適なモードを現クロマブロックのイントラ予測モードとして決定することができる。したがって、画像符号化装置は、現クロマブロックにDMモードを適用するか否かを判断する必要があり、このために対応するルマブロックのイントラ予測モードを取得する必要がある。しかしながら、対応ルマブロックのイントラ予測モードが利用可能でないこともあるので、画像符号化装置は、対応ルマブロックのイントラルマ予測モードが利用可能であるか否かをまず判断することができる(S2120)。ステップS2120の判断は、ステップS1720の判断と実質的に同様なので、反復的な説明は省略する。あるいは、前述したように、ステップS2120は、現ブロックが含まれているスライス/タイルグループのタイプについての判断、現ブロックのツリー構造についての判断、ならびに現ブロックに対してイントラ予測の他にIBCもしくは第3予測モードが許容されるかについての判断のうちの少なくとも一つを含むこともできる。
ステップS2120で、イントラルマ予測モードが利用可能であると判断される場合、画像符号化装置は、対応ルマブロックの所定の位置からイントラルマ予測モードを取得し(S2130)、イントラルマ予測モード含んで現クロマブロックのイントラ予測モードを導出することができる(S2140)。例えば、画像符号化装置は、イントラルマ予測モードを含んで現クロマブロックに適用可能な一つまたは複数のイントラ予測モードのうちのいずれか一つのイントラ予測モードを、前述したRD-costの比較によって選択することができる。しかしながら、画像符号化装置が現クロマブロックのイントラ予測モードを選択する方法は、上記の例に限定されない。現クロマブロックのイントラ予測モードが導出されると、導出されたイントラ予測モードに基づいて現クロマブロックに対してイントラ予測を行い、予測ブロックを生成することができる。また、イントラルマ予測モードに基づいて現クロマブロックのイントラ予測モードを符号化することができる(S2160)。例えば、イントラルマ予測モードが現クロマブロックのイントラ予測モードとして決定される場合、イントラクロマ予測モード情報は、DMを示す値に符号化されることができる。
ステップS2120で、対応ルマブロックのイントラルマ予測モードが利用可能でない場合、イントラルマ予測モードの代わりにデフォルトイントラ予測モードを用いて現クロマブロックのイントラ予測モードを導出することができる(S2150)。現クロマブロックのイントラ予測モードが導出されると、導出されたイントラ予測モードに基づいて現クロマブロックに対してイントラ予測を行い、予測ブロックを生成することができる。また、デフォルトイントラ予測モードに基づいて現クロマブロックのイントラ予測モードを符号化することができる(S2160)。
ステップS2150で、デフォルトイントラ予測モードとしてDCモードまたはPlanarモードが使用されることができる。しかしながら、これに限定されず、デフォルトイントラ予測モードとして、既に定義された所定のイントラ予測モードを使用するか、または画像符号化装置でデフォルトイントラ予測モードが決定され、決定されたデフォルトイントラ予測モードに関する情報がビットストリームを介してシグナリングされることもできる。
本開示の例示的な方法は、説明の明確性のために動作のシリーズで表現されているが、これは、ステップが行われる順序を制限するためのものではなく、必要な場合には、それぞれのステップが同時にまたは異なる順序で行われることもできる。本開示による方法を実現するために、例示するステップにさらに他のステップを含むか、一部のステップを除いて残りのステップを含むか、または一部のステップを除いて追加の他のステップを含むこともできる。
本開示において、所定の動作(ステップ)を行う画像符号化装置または画像復号装置は、当該動作(ステップ)の実行条件や状況を確認する動作(ステップ)を行うことができる。例えば、所定の条件が満足される場合、所定の動作を行うと記載された場合、画像符号化装置または画像復号装置は、上記所定の条件が満足されるか否かを確認する動作を行った後、上記所定の動作を行うことができる。
本開示の様々な実施例は、すべての可能な組み合わせを羅列したものではなく、本開示の代表的な態様を説明するためのものであり、様々な実施例で説明する事項は、独立して適用されてもよく、2つ以上の組み合わせで適用されてもよい。
また、本開示の様々な実施例は、ハードウェア、ファームウェア(firmware)、ソフトウェア、またはそれらの組み合わせなどによって実現できる。ハードウェアによる実現の場合、1つまたは複数のASICs(Application Specific Integrated Circuits)、DSPs(Digital Signal Processors)、DSPDs(Digital Signal Processing Devices)、PLDs(Programmable Logic Devices)、FPGAs(Field Programmable Gate Arrays)、汎用プロセッサ(general processor)、コントローラ、マイクロコントローラ、マイクロプロセッサなどによって実現できる。
また、本開示の実施例が適用された画像復号装置および画像符号化装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ会話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、記憶媒体、カムコーダ、ビデオオンデマンド(VoD)サービス提供装置、OTTビデオ(Over the top video)装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、画像電話ビデオ装置、および医療用ビデオ装置などに含まれることができ、ビデオ信号またはデータ信号を処理するために使用されることができる。例えば、OTTビデオ(Over the top video)装置としては、ゲームコンソール、ブルーレイプレーヤ、インターネット接続TV、ホームシアターシステム、スマートフォン、タブレットPC、DVR(Digital Video Recorder)などを含むことができる。
図22は、本開示の実施例が適用されることができるコンテンツストリーミングシステムを例示する図である。
図22に示されているように、本開示の実施例が適用されたコンテンツストリーミングシステムは、概して、符号化サーバ、ストリーミングサーバ、Webサーバ、メディアストレージ、ユーザ装置およびマルチメディア入力装置を含むことができる。
上記符号化サーバは、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを上記ストリーミングサーバに伝送する役割を果たす。他の例として、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置がビットストリームを直接生成する場合、上記符号化サーバは省略できる。
上記ビットストリームは、本開示の実施例が適用された画像符号化方法および/または画像符号化装置によって生成でき、上記ストリーミングサーバは、上記ビットストリームを伝送または受信する過程で一時的に上記ビットストリームを記憶することができる。
上記ストリーミングサーバは、Webサーバを介してユーザの要求に基づいてマルチメディアデータをユーザ装置に伝送し、上記Webサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体の役割を果たすことができる。ユーザが上記Webサーバに所望のサービスを要求すると、上記Webサーバは、これをストリーミングサーバに伝達し、上記ストリーミングサーバは、ユーザにマルチメディアデータを伝送することができる。このとき、上記コンテンツストリーミングシステムは、別途の制御サーバを含むことができ、この場合、上記制御サーバは、上記コンテンツストリーミングシステム内の各装置間の命令/応答を制御する役割を果たすことができる。
上記ストリーミングサーバは、メディアストレージおよび/または符号化サーバからコンテンツを受信することができる。例えば、上記符号化サーバからコンテンツを受信する場合、上記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、上記ストリーミングサーバは、上記ビットストリームを一定時間の間記憶することができる。
上記ユーザ装置の例としては、携帯電話、スマートフォン(smart phone)、ノートパソコン(laptop computer)、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、ナビゲーション、スレートPC(slate PC)、タブレットPC(tablet PC)、ウルトラブック(ULTRABOOK(登録商標))、ウェアラブルデバイス(wearable device、例えば、スマートウォッチ(smartwatch)、スマートグラス(smart glass)、HMD(Head Mounted Display))、デジタルTV、デスクトップコンピュータ、デジタルサイネージなどがあり得る。
上記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運用されることができ、この場合、各サーバから受信するデータは、分散処理されることができる。
本開示の範囲は、様々な実施例の方法による動作が装置もしくはコンピュータ上で実行されるようにするソフトウェアもしくはマシン実行可能なコマンド(例えば、オペレーティングシステム、アプリケーション、ファームウェア(firmware)、プログラムなど)、ならびにこのようなソフトウェアもしくはコマンドなどが記憶されて装置もしくはコンピュータ上で実行できる、非一時的なコンピュータ読み取り可能媒体(non-transitory computer-readable medium)を含む。
本開示による実施例は、画像を符号化/復号するのに利用可能である。

Claims (14)

  1. 画像復号装置によって行われる画像復号方法であって、
    現クロマブロックの予測に関する情報に基づいて、前記現クロマブロックにイントラ予測を適用するかどうかを決定するステップと、
    前記現クロマブロックにイントラ予測が適用される場合、前記現クロマブロックに対応する対応ルマブロックのイントラ予測モードおよび前記現クロマブロックのイントラクロマ予測モード情報に基づいて、前記現クロマブロックのイントラ予測モードを導出するステップと、
    前記現クロマブロックの前記イントラ予測モードに基づいてイントラ予測を行うことにより、前記現クロマブロックの予測ブロックを生成するステップと、を含み、
    前記対応ルマブロックの前記イントラ予測モードが存在しない場合、前記現クロマブロックの前記イントラ予測モードは、デフォルトイントラ予測モードに基づいて導出される、画像復号方法。
  2. 前記現クロマブロックの前記イントラ予測モードを導出するステップは、前記対応ルマブロックの所定の位置における予測方法を判断するステップを含む、請求項1に記載の画像復号方法。
  3. 前記対応ルマブロックの前記所定の位置における前記予測方法がイントラ予測である場合、前記現クロマブロックの前記イントラ予測モードは、前記対応ルマブロックの所定の位置におけるイントラ予測モードに基づいて導出され、
    前記対応ルマブロックの前記所定の位置における前記予測方法がイントラ予測ではない場合、前記現クロマブロックの前記イントラ予測モードは、前記デフォルトイントラ予測モードに基づいて導出される、請求項2に記載の画像復号方法。
  4. 前記対応ルマブロックの前記所定の位置における前記予測方法がIBC(Intra Block Copy)予測である場合、前記現クロマブロックの前記イントラ予測モードは、前記デフォルトイントラ予測モードに基づいて導出される、請求項2に記載の画像復号方法。
  5. 前記所定の位置は、前記対応ルマブロックの中心位置である、請求項2に記載の画像復号方法。
  6. 前記デフォルトイントラ予測モードは、PlanarモードまたはDCモードである、請求項1に記載の画像復号方法。
  7. 前記現クロマブロックのツリー構造は、デュアルツリー(DUAL_TREE)構造である、請求項1に記載の画像復号方法。
  8. 前記現クロマブロックの前記イントラクロマ予測モード情報がDM(Direct Mode)を示し、前記対応ルマブロックの前記イントラ予測モードが存在する場合、前記現クロマブロックの前記イントラ予測モードは、前記対応ルマブロックの前記イントラ予測モードとして導出され、
    前記現クロマブロックの前記イントラクロマ予測モード情報がDMを示し、前記対応ルマブロックの前記イントラ予測モードが存在しない場合、前記現クロマブロックの前記イントラ予測モードは、前記デフォルトイントラ予測モードとして導出される、請求項1に記載の画像復号方法。
  9. メモリと、少なくとも一つのプロセッサと、を備える画像復号装置であって、
    前記少なくとも一つのプロセッサは、
    現クロマブロックの予測に関する情報に基づいて、前記現クロマブロックにイントラ予測を適用するかどうかを決定し、
    前記現クロマブロックにイントラ予測が適用される場合、前記現クロマブロックに対応する対応ルマブロックのイントラ予測モードおよび前記現クロマブロックのイントラクロマ予測モード情報に基づいて、前記現クロマブロックのイントラ予測モードを導出し、
    前記現クロマブロックの前記イントラ予測モードに基づいてイントラ予測を行うことにより、前記現クロマブロックの予測ブロックを生成する、ように構成され、
    前記対応ルマブロックの前記イントラ予測モードが存在しない場合、前記現クロマブロックの前記イントラ予測モードは、デフォルトイントラ予測モードに基づいて導出される、画像復号装置。
  10. 画像符号化装置によって行われる画像符号化方法であって、
    現クロマブロックにイントラ予測を適用するかどうかを決定するステップと、
    前記現クロマブロックにイントラ予測が適用される場合、前記現クロマブロックに対応する対応ルマブロックのイントラ予測モードに基づいて、前記現クロマブロックのイントラ予測モードを導出するステップと、
    前記現クロマブロックの前記イントラ予測モードに基づいてイントラ予測を行うことにより、前記現クロマブロックの予測ブロックを生成するステップと、
    前記対応ルマブロックの前記イントラ予測モードに基づいて前記現クロマブロックの前記イントラ予測モードを符号化するステップと、を含み、
    前記対応ルマブロックの前記イントラ予測モードが存在しない場合、前記現クロマブロックの前記イントラ予測モードは、デフォルトイントラ予測モードに基づいて導出される、画像符号化方法。
  11. 前記現クロマブロックの前記イントラ予測モードを導出するステップは、前記対応ルマブロックの所定の位置における予測方法を判断するステップを含む、請求項10に記載の画像符号化方法。
  12. 前記対応ルマブロックの前記所定の位置における前記予測方法がイントラ予測である場合、前記現クロマブロックの前記イントラ予測モードは、前記対応ルマブロックの所定の位置におけるイントラ予測モードに基づいて導出され、
    前記対応ルマブロックの前記所定の位置における前記予測方法がイントラ予測ではない場合、前記現クロマブロックの前記イントラ予測モードは、前記デフォルトイントラ予測モードに基づいて導出される、請求項11に記載の画像符号化方法。
  13. 前記所定の位置は、前記対応ルマブロックの中心位置である、請求項11に記載の画像符号化方法。
  14. 前記デフォルトイントラ予測モードは、PlanarモードまたはDCモードである、請求項10に記載の画像符号化方法。
JP2023215983A 2019-03-14 2023-12-21 イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法 Pending JP2024023789A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962818730P 2019-03-14 2019-03-14
US62/818,730 2019-03-14
PCT/KR2020/003562 WO2020185047A1 (ko) 2019-03-14 2020-03-13 인트라 예측을 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
JP2021555280A JP7410168B2 (ja) 2019-03-14 2020-03-13 イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021555280A Division JP7410168B2 (ja) 2019-03-14 2020-03-13 イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法

Publications (1)

Publication Number Publication Date
JP2024023789A true JP2024023789A (ja) 2024-02-21

Family

ID=72428011

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021555280A Active JP7410168B2 (ja) 2019-03-14 2020-03-13 イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法
JP2023215983A Pending JP2024023789A (ja) 2019-03-14 2023-12-21 イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021555280A Active JP7410168B2 (ja) 2019-03-14 2020-03-13 イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法

Country Status (5)

Country Link
US (2) US11770537B2 (ja)
EP (1) EP3941046A4 (ja)
JP (2) JP7410168B2 (ja)
KR (1) KR20210116676A (ja)
WO (1) WO2020185047A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10687071B2 (en) * 2018-02-05 2020-06-16 Tencent America LLC Method and apparatus for video coding
CN118120229A (zh) * 2021-08-11 2024-05-31 抖音视界有限公司 用于视频处理的方法、装置和介质
WO2023132590A1 (ko) * 2022-01-04 2023-07-13 엘지전자 주식회사 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011019383A2 (en) * 2009-08-12 2011-02-17 Thomson Licensing Methods and apparatus for improved intra chroma encoding and decoding
EP2661882B1 (en) 2011-01-05 2015-06-24 Koninklijke Philips N.V. Video coding and decoding devices and methods preserving ppg relevant information
KR101707088B1 (ko) 2011-03-06 2017-02-15 엘지전자 주식회사 휘도 샘플을 이용한 색차 블록의 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
MX2014000163A (es) 2011-06-28 2014-02-19 Samsung Electronics Co Ltd Metodo y aparato de prediccion para componente de croma de imagen que utiliza componente de luma de imagen.
CN103220508B (zh) * 2012-01-20 2014-06-11 华为技术有限公司 编解码方法和装置
CN107547901B (zh) * 2012-04-16 2021-07-20 韩国电子通信研究院 用于解码视频信号的方法
US10567759B2 (en) * 2016-03-21 2020-02-18 Qualcomm Incorporated Using luma information for chroma prediction with separate luma-chroma framework in video coding
KR20190042090A (ko) * 2016-09-30 2019-04-23 엘지전자 주식회사 영상 코딩 시스템에서 블록 분할 및 인트라 예측 방법 및 장치
CN109792516B (zh) * 2016-10-04 2021-05-25 联发科技股份有限公司 图像和视频编解码中用于帧内色度编解码的方法及装置
US10750169B2 (en) * 2016-10-07 2020-08-18 Mediatek Inc. Method and apparatus for intra chroma coding in image and video coding
US11025903B2 (en) * 2017-01-13 2021-06-01 Qualcomm Incorporated Coding video data using derived chroma mode
EP3422717A1 (en) * 2017-06-26 2019-01-02 Thomson Licensing Method and apparatus for most probable mode (mpm) sorting and signaling in video encoding and decoding
MX2020001290A (es) * 2017-08-03 2020-03-12 Sharp Kk Sistemas y metodos para particionar bloques de video en un corte de interprediccion de datos de video.
JP2021010046A (ja) * 2017-10-06 2021-01-28 シャープ株式会社 画像符号化装置及び画像復号装置
US10687071B2 (en) * 2018-02-05 2020-06-16 Tencent America LLC Method and apparatus for video coding
US10567801B2 (en) * 2018-03-07 2020-02-18 Tencent America LLC Method and apparatus for video coding with primary and secondary transforms
CN116647681A (zh) * 2018-04-01 2023-08-25 Oppo广东移动通信有限公司 使用帧内预测的图像编码/解码方法和装置
KR20220045049A (ko) * 2019-09-21 2022-04-12 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
WO2021054787A1 (ko) * 2019-09-21 2021-03-25 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
CN114521328A (zh) * 2019-09-23 2022-05-20 Lg电子株式会社 使用调色板模式的图像编码/解码方法和装置及发送比特流的方法

Also Published As

Publication number Publication date
KR20210116676A (ko) 2021-09-27
US20220279189A1 (en) 2022-09-01
US20230388512A1 (en) 2023-11-30
JP2022525600A (ja) 2022-05-18
EP3941046A1 (en) 2022-01-19
US11770537B2 (en) 2023-09-26
EP3941046A4 (en) 2022-12-21
WO2020185047A1 (ko) 2020-09-17
JP7410168B2 (ja) 2024-01-09

Similar Documents

Publication Publication Date Title
JP7422917B2 (ja) Mip及びlfnstを行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
KR102476280B1 (ko) 인트라 예측 기반 영상/비디오 코딩 방법 및 그 장치
JP7362786B2 (ja) 単純化されたmpmリスト生成方法を用いる画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP7197728B2 (ja) 変換インデックスを利用する映像コーディング
JP7410168B2 (ja) イントラ予測を行う画像符号化/復号方法、装置、およびビットストリームを伝送する方法
KR20220019242A (ko) 적응적 루프 필터를 적용하는 비디오 또는 영상 코딩
JP7362910B2 (ja) パレットモードを用いた画像符号化/復号化方法、装置、及びビットストリームの伝送方法
JP2023516172A (ja) 残差コーディングに関する映像デコード方法およびその装置
KR20210158386A (ko) Mip 모드 매핑이 단순화된 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
JP7490797B2 (ja) 長方形スライスのサイズ情報を選択的に符号化する画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法
JP2024063219A (ja) ビデオまたは画像コーディング方法及びその装置
JP2024023441A (ja) クロマブロックの分割条件を制限する画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP2022539750A (ja) クロマ変換ブロックの最大サイズ制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
CN112567749A (zh) 使用仿射运动预测来处理视频信号的方法和装置
JP7502322B2 (ja) クロマブロックに対する分割制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP2023513788A (ja) フィルタ利用可能情報を選択的にシグナリングする画像符号化/復号化方法及び装置、並びにビットストリームを伝送する方法
JP2023515132A (ja) 映像デコーディング方法及びその装置
JP2022540025A (ja) クロマブロックの最大変換サイズ設定を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP2022539749A (ja) クロマ成分符号化ブロックの最大変換サイズ制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
JP2022530286A (ja) クロマブロックの適応的サイズ制限を用いた画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
RU2803147C2 (ru) Способ и оборудование кодирования/декодирования изображений для выполнения внутреннего предсказания и способ для передачи потока битов
JP7444998B2 (ja) リーフノードの再設定された予測モードタイプに基づいて予測を行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
RU2810123C2 (ru) Способ и оборудование кодирования/декодирования изображений для выполнения внутреннего предсказания и способ для передачи потока битов
KR20220079974A (ko) Pdpc를 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240109