JP2024509216A - イントラ予測モード誘導を用いるビデオコーディングのためのイントラ予測方法及び装置 - Google Patents

イントラ予測モード誘導を用いるビデオコーディングのためのイントラ予測方法及び装置 Download PDF

Info

Publication number
JP2024509216A
JP2024509216A JP2023553749A JP2023553749A JP2024509216A JP 2024509216 A JP2024509216 A JP 2024509216A JP 2023553749 A JP2023553749 A JP 2023553749A JP 2023553749 A JP2023553749 A JP 2023553749A JP 2024509216 A JP2024509216 A JP 2024509216A
Authority
JP
Japan
Prior art keywords
current block
prediction
block
mode
prediction mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023553749A
Other languages
English (en)
Inventor
ジュ ヒョン ビョン,
シ ネ パク,
ドン ギュ シム,
スン ウク パク,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industry Academic Collaboration Foundation of Kwangwoon University
Original Assignee
Industry Academic Collaboration Foundation of Kwangwoon University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220026549A external-priority patent/KR20220125175A/ko
Application filed by Industry Academic Collaboration Foundation of Kwangwoon University filed Critical Industry Academic Collaboration Foundation of Kwangwoon University
Publication of JP2024509216A publication Critical patent/JP2024509216A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】イントラ予測モードの誘導を用いるビデオコーディングのためのイントラ予測方法及び装置を提供する。【解決手段】本発明のイントラ予測方法は、予め復元された周辺参照サンプル値を用いて現在ブロックのイントラ予測モードを誘導した後、誘導された予測モードに基づいて現在ブロックの予測ブロックを生成する。【選択図】図6

Description

本発明は、イントラ予測モードの誘導を用いるビデオコーディングのためのイントラ予測方法及び装置に関する。
以下に記述する内容は、単に本発明に関連する背景情報のみを提供するだけであって、従来技術を構成するものではない。
ビデオデータは、音声データや静止画データなどに比べて多くのデータ量を有するため、圧縮のための処理なしにそれ自体を保存又は伝送するためにはメモリを含む多くのハードウェアリソースを必要とする。
従って、通常ビデオデータを保存又は伝送する際には、符号化器を用いてビデオデータを圧縮して保存又は伝送し、復号化器で圧縮されたビデオデータを受信して圧縮を解除して再生する。このようなビデオ圧縮技術としては、H.264/AVC、HEVC(High Efficiency Video Coding)などをはじめ、HEVCに比べて約30%以上の符号化効率を向上させたVVC(Versatile Video Coding)が存在する。
しかし、映像のサイズ及び解像度、フレームレートが徐々に増加しており、これに伴い符号化すべきデータ量も増加しているため、従来の圧縮技術よりも符号化効率が良く画質改善効果も高い新たな圧縮技術が要求されている。特に、符号化効率の側面で現在ブロックのイントラ予測モードを解析する代わりに誘導する方法を考慮する必要がある。
本発明は、上記従来技術に鑑みてなされたものであって、本発明の目的は、現在ブロックの予測ブロックを生成するビデオコーディングのためのイントラ予測方法及び装置を提供することにある。
上記目的を達成するためになされた本発明の一態様によるイントラ予測方法は、映像復号化装置によって遂行される現在ブロックのイントラ予測方法であって、ビットストリームから前記現在ブロックの予測モードの誘導(derivation)の可否を示す予測モード誘導フラグを解析するステップと、前記予測モード誘導フラグを確認するステップと、を有し、前記予測モード誘導フラグが真である場合、前記現在ブロックの周辺復元サンプルから勾配(gradient)値の算定に用いられる算定領域を決定するステップと、前記現在ブロックに対して、前記算定領域で方向性モードの勾配のヒストグラム(histogram)を算定するステップと、前記勾配のヒストグラムに基づいて前記現在ブロックの予測モードを誘導するステップと、前記誘導された予測モードを用いてイントラ予測を遂行することで、前記現在ブロックの予測ブロックを生成するステップと、を含むことを特徴とする。
上記目的を達成するためになされた本発明の一態様によるイントラ予測装置は、ビットストリームから予測モード誘導フラグを解析して、現在ブロックの予測モードの誘導(derivation)の可否を決定する予測モード誘導可否決定部と、前記現在ブロックの周辺復元サンプルから勾配(gradient)値の算定に用いられる算定領域を決定する勾配算定領域決定部と、前記現在ブロックに対して、前記算定領域で方向性モードの勾配のヒストグラムを算定するヒストグラム算定部と、前記勾配のヒストグラムに基づいて前記現在ブロックの予測モードを誘導する予測モード誘導部と、前記誘導された予測モードを用いてイントラ予測を遂行することで、前記現在ブロックの予測ブロックを生成するイントラ予測遂行部と、を備えることを特徴とする。
本発明によると、予め復元された周辺参照サンプル値を用いて現在ブロックのイントラ予測モードを誘導した後、誘導された予測モードに基づいて現在ブロックの予測ブロックを生成するビデオコーディングのためのイントラ予測方法及び装置を提供することで、符号化効率を向上させる効果がある。
本発明の技術を具現する映像符号化装置の例示的なブロック図である。 QTBTTT構造を用いてブロックを分割する方法を説明するための図である。 広角イントラ予測モードを含む複数のイントラ予測モードを示す図である。 広角イントラ予測モードを含む複数のイントラ予測モードを示す図である。 現在ブロックの周辺ブロックに関する例示図である。 本発明の技術を具現する映像復号化装置の例示的なブロック図である。 本発明の一実施形態による予測モード誘導を用いるイントラ予測装置を示すブロック図である。 本発明の一実施形態による勾配値の算定に用いられる算定領域を示す例示図である。 本発明の一実施形態による方向性モードの勾配のヒストグラムを示す例示図である。 本発明の一実施形態による勾配値が算定されるサブサンプリングされたピクセルを示す例示図である。 本発明の一実施形態による行列形態の重み値を示す例示図である。 本発明の一実施形態によるサブブロック分割時の予測モードの誘導を示す例示図である。 本発明の一実施形態による予測モード誘導を用いるイントラ予測方法を示すフローチャートである。
以下、本発明を実施するための形態の具体例を、図面を参照しながら詳細に説明する。各図面の構成要素に参照符号を付加するにあたり、同一の構成要素に対しては、他の図面に表示された場合でも可能な限り同一の符号を有するようにしていることに留意されたい。なお、本実施形態を説明するにあたり、関連する公知の構成又は機能についての具体的な説明が本発明の要旨を曖昧にすると判断される場合には、その詳しい説明は省く。
図1は、本発明の技術を具現する映像符号化装置の例示的なブロック図である。以下では、図1を参照して映像符号化装置及びこの装置の下位構成について説明する。
映像符号化装置は、ピクチャ分割部110、予測部120、減算器130、変換部140、量子化部145、並べ替え部150、エントロピー符号化部155、逆量子化部160、逆変換部165、加算器170、ループフィルタ部180、及びメモリ190を含むように構成される。
映像符号化装置の各構成要素は、ハードウェア又はソフトウェアで具現されるか、或いはハードウェア及びソフトウェアの組み合わせで具現される。更に、各構成要素の機能がソフトウェアで具現されて、マイクロプロセッサが各構成要素に対応するソフトウェアの機能を実行するように具現され得る。
1つの映像(ビデオ)は、複数のピクチャを含む1つ以上のシーケンスで構成される。各ピクチャは、複数の領域に分割され、領域毎に符号化が遂行される。例えば、1つのピクチャは、1つ以上のタイル(Tile)又は/及びスライス(Slice)に分割される。ここで、1つ以上のタイルをタイルグループ(Tile Group)として定義する。各タイル又は/及びスライスは、1つ以上のCTU(Coding Tree Unit)に分割される。そして、各CTUはツリー構造によって1つ以上のCU(Coding Unit)に分割される。各CUに適用される情報はCUのシンタックスとして符号化され、1つのCTUに含まれるCUに共通に適用される情報はCTUのシンタックスとして符号化される。更に、1つのスライス内の全てのブロックに共通に適用される情報はスライスヘッダのシンタックスとして符号化され、1つ以上のピクチャを構成する全てのブロックに適用される情報はピクチャパラメータセット(PPS:Picture Parameter Set)或いはピクチャヘッダに符号化される。更に、複数のピクチャが共通に参照する情報は、シーケンスパラメータセット(SPS:Sequence Parameter Set)に符号化される。そして、1つ以上のSPSが共通に参照する情報は、ビデオパラメータセット(VPS:Video Parameter Set)に符号化される。更に、1つのタイル又はタイルグループに共通に適用される情報は、タイル又はタイルグループヘッダのシンタックスとして符号化される。SPS、PPS、スライスヘッダ、タイル、又はタイルグループヘッダに含まれるシンタックスは、上位水準(high level)のシンタックスと称する。
ピクチャ分割部110は、CTU(Coding Tree Unit)のサイズを決定する。CTUのサイズに関する情報(CTU size)は、SPS又はPPSのシンタックスとして符号化されて映像復号化装置に伝達される。
ピクチャ分割部110は、映像を構成する各ピクチャ(picture)を予め決定されたサイズを有する複数のCTU(Coding Tree Unit)に分割した以降に、ツリー構造(tree structure)を用いてCTUを繰り返し(recursively)分割する。ツリー構造におけるリーフノード(leaf node)が符号化の基本単位であるCU(coding unit)となる。
ツリー構造では、上位ノード(或いは親ノード)が同じサイズの4つの下位ノード(或いは子ノード)に分割されるクワッドツリー(QuadTree:QT)、又は上位ノードが2つの下位ノードに分割されるバイナリツリー(BinaryTree:BT)、又は上位ノードが1:2:1の比率で3つの下位ノードに分割されるターナリーツリー(TernaryTree:TT)、或いはこれらのQT構造、BT構造、及びTT構造のうちの2つ以上を混用した構造である。例えば、QTBT(QuadTree plus BinaryTree)構造が用いられるか、或いはQTBTTT(QuadTree plus BinaryTree TernaryTree)構造が用いられる。ここで、BTTTを合わせてMTT(Multiple-Type Tree)と称する。
図2は、QTBTTT構造を用いてブロックを分割する方法を説明するための図である。
図2に示すように、CTUは最初にQT構造に分割される。クワッドツリー分割は、分割ブロック(splitting block)のサイズがQTで許容されるリーフノードの最小ブロックサイズMinQTSizeに到達するまで繰り返される。QT構造の各ノードが下位レイヤの4つのノードに分割されるか否かを示す第1のフラグQT_split_flagは、エントロピー符号化部155によって符号化されて映像復号化装置にシグナリングされる。QTのリーフノードがBTで許容されるルートノードの最大ブロックサイズMaxBTSizeよりも大きくない場合、BT構造又はTT構造のうちのいずれか1つ以上に更に分割される。BT構造及び/又はTT構造では、複数の分割方向が存在する。例えば、該当ノードのブロックが横に分割される方向及び縦に分割される方向の2つが存在する。図2に示すように、MTT分割が開始されると、ノードが分割されたか否かを示す第2のフラグmtt_split_flagと、分割された場合に追加的に分割方向(vertical或いはhorizontal)を示すフラグ及び/又は分割タイプ(Binary或いはTernary)を示すフラグとがエントロピー符号化部155によって符号化されて映像復号化装置にシグナリングされる。
代替的に、各ノードが下位レイヤの4つのノードに分割されるか否かを示す第1のフラグQT_split_flagを符号化する前に、そのノードが分割されるか否かを示すCU分割フラグsplit_cu_flagが符号化される。CU分割フラグsplit_cu_flag値が分割されていないことを示す場合、該当ノードのブロックが分割ツリー構造におけるリーフノード(leaf node)になり、符号化の基本単位であるCU(coding unit)になる。CU分割フラグsplit_cu_flag値が分割されることを示す場合、映像符号化装置は、上述した方式で第1のフラグから符号化を開始する。
ツリー構造の他の例示としてQTBTが使用される場合、該当ノードのブロックを同一サイズの2つのブロックに横に分割するタイプ(即ち、symmetric horizontal splitting)及び縦に分割するタイプ(即ち、symmetric vertical splitting)の2つが存在する。BT構造の各ノードが下位レイヤのブロックに分割されるか否かを示す分割フラグsplit_flag及び、分割されるタイプを示す分割タイプ情報がエントロピー符号化部155によって符号化されて映像復号化装置に伝達される。一方、該当ノードのブロックを互いに非対称形態の2つのブロックに分割するタイプが追加で更に存在する。非対称形態には、該当ノードのブロックを1:3のサイズ比率を有する2つの長方形ブロックに分割する形態が含まれるか、或いは該当ノードのブロックを対角線方向に分割する形態が含まれる。
CUは、CTUからのQTBT又はQTBTTT分割に応じて様々なサイズを有する。以下では、符号化又は復号しようとするCU(即ち、QTBTTTのリーフノード)に該当するブロックを「現在ブロック」と称する。QTBTTT分割の採用に応じ、現在ブロックの形状は正方形だけでなく長方形であってもよい。
予測部120は、現在ブロックを予測して予測ブロックを生成する。予測部120は、イントラ予測部122及びインター予測部124を含む。
一般に、ピクチャ内の現在ブロックはそれぞれ予測的にコーディングされる。一般に、現在ブロックの予測は(現在ブロックを含むピクチャからのデータを使用する)イントラ予測技術又は(現在ブロックを含むピクチャの前にコーディングされたピクチャからのデータを使用する)インター予測技術を使用して遂行される。インター予測は、一方向予測及び双方向予測の両方を含む。
イントラ予測部122は、現在ブロックが含まれる現在ピクチャ内で現在ブロックの周辺に位置するピクセル(参照ピクセル)を用いて現在ブロック内のピクセルを予測する。予測方向によって複数のイントラ予測モードが存在する。例えば、図3aに見られるように、複数のイントラ予測モードは、プラナー(planar)モード及びDCモードを含む2つの非方向性モードと65個の方向性モードとを含む。各予測モードによって使用される周辺ピクセルとは演算式が異なるように定義される。
長方形形状の現在ブロックに対する効率的な方向性予測のために、図3bに破線の矢印で示した方向性モード(67~80番、-1~-14番イントラ予測モード)が追加で使用される。これらは、「広角イントラ予測モード(wide angle intra-prediction modes)」と称される。図3bで、矢印は、予測に使用される対応する参照サンプルを指すものであり、予測方向を示すものではない。予測方向は、矢印が指す方向とは反対である。広角イントラ予測モードは、現在ブロックが長方形の場合に追加のビットの伝送なしに特定の方向性モードを反対方向で予測を遂行するモードである。このとき、広角イントラ予測モードのうちから、長方形の現在ブロックの幅と高さとの比率により、現在ブロックに利用可能な一部の広角イントラ予測モードが決定される。例えば、45度よりも小さい角度を有する広角イントラ予測モード(67~80番イントラ予測モード)は、現在ブロックが、高さが幅よりも小さい長方形の形態である場合に利用可能であり、-135度よりも大きい角度を有する広角イントラ予測モード(-1~-14番イントラ予測モード)は、現在ブロックが、幅が高さよりも大きい長方形の形態である場合に利用可能である。
イントラ予測部122は、現在ブロックを符号化するのに使用されるイントラ予測モードを決定する。一部の例で、イントラ予測部122は、様々なイントラ予測モードを使用して現在ブロックをエンコーディングし、テストされたモードから使用される適切なイントラ予測モードを選択する。例えば、イントラ予測部122は、様々なテストされたイントラ予測モードに対するビットレート歪み(rate-distortion)分析を用いてビットレート歪み値を計算し、テストされたモードの中の最善のビットレート歪み特徴を有するイントラ予測モードを選択する。
イントラ予測部122は、複数のイントラ予測モードの中から1つのイントラ予測モードを選択し、選択されたイントラ予測モードによって決定される周辺ピクセル(参照ピクセル)及び演算式を用いて現在ブロックを予測する。選択されたイントラ予測モードに関する情報は、エントロピー符号化部155によって符号化されて映像復号化装置に伝達される。
インター予測部124は、動き補償プロセスを用いて現在ブロックに対する予測ブロックを生成する。インター予測部124は、現在ピクチャよりも先に符号化及び復号化された参照ピクチャ内で現在ブロックに最も類似したブロックを探索し、その探索されたブロックを用いて現在ブロックに対する予測ブロックを生成する。そして、現在ピクチャ内の現在ブロックと参照ピクチャ内の予測ブロックとの間の変位(displacement)に該当する動きベクトル(Motion Vector:MV)を生成する。一般に、動き推定はルーマ(luma)成分に対して遂行され、ルーマ成分に基づいて計算された動きベクトルはルーマ成分及びクロマ成分の両方に対して使用される。現在ブロックを予測するために使用された参照ピクチャに関する情報及び動きベクトルに関する情報を含む動き情報は、エントロピー符号化部155によって符号化されて映像復号化装置に伝達される。
インター予測部124は、予測の正確性を高めるために、参照ピクチャ又は参照ブロックに対する補間を遂行する。即ち、連続する2つの整数サンプル間のサブサンプルは、その2つの整数サンプルを含む連続した複数の整数サンプルにフィルタ係数を適用して補間される。補間された参照ピクチャに対して現在ブロックに最も類似したブロックを検索するステップを遂行すると、動きベクトルは整数サンプル単位の精度(precision)ではなく小数単位の精度まで表現される。動きベクトルの精度又は解像度(resolution)は、符号化しようとする対象領域、例えばスライス、タイル、CTU、CUなどの単位毎に異なるように設定される。このような適応的動きベクトル解像度(Adaptive Motion Vector Resolution:AMVR)が適用される場合、各対象領域に適用される動きベクトル解像度に関する情報は、対象領域毎にシグナリングされなければならない。例えば、対象領域がCUである場合、CU毎に適用された動きベクトル解像度に関する情報がシグナリングされる。動きベクトル解像度に関する情報は、後述する差分動きベクトルの精度を示す情報である。
一方、インター予測部124は、双方向予測(bi-prediction)を用いてインター予測を遂行する。双方向予測の場合、2つの参照ピクチャと、各参照ピクチャ内で現在ブロックに最も類似したブロック位置を表す2つの動きベクトルとが用いられる。インター予測部124は、参照ピクチャリスト0(RefPicList0)及び参照ピクチャリスト1(RefPicList1)からそれぞれ第1の参照ピクチャ及び第2の参照ピクチャを選択し、各参照ピクチャ内で現在ブロックに類似したブロックを探索して第1の参照ブロック及び第2の参照ブロックを生成する。そして、第1の参照ブロックと第2の参照ブロックとを平均又は加重平均して現在ブロックに対する予測ブロックを生成する。そして、現在ブロックを予測するために使用した2つの参照ピクチャに関する情報及び2つの動きベクトルに関する情報を含む動き情報を符号化部150に伝達する。ここで、参照ピクチャリスト0は、予め復元されたピクチャのうち、ディスプレイ順序で現在ピクチャの前のピクチャで構成され、参照ピクチャリスト1は、予め復元されたピクチャのうち、ディスプレイ順序で現在ピクチャ以降のピクチャで構成される。しかし、必ずしもこれに限定されるわけではなく、ディスプレイ順序上で現在ピクチャ以降の既復元のピクチャが参照ピクチャリスト0に追加で更に含まれるか、又は逆に現在ピクチャの前の既復元のピクチャが参照ピクチャリスト1に追加で更に含まれる。
動き情報を符号化するのに所要されるビット量を最小化するために多様な方法が用いられる。
例えば、現在ブロックの参照ピクチャ及び動きベクトルが周辺ブロックの参照ピクチャ及び動きベクトルと同一の場合には、その周辺ブロックを識別できる情報を符号化することで、現在ブロックの動き情報を映像復号化装置に伝達する。この方法を「マージモード(merge mode)」とする。
マージモードで、インター予測部124は、現在ブロックの周辺ブロックから予め決定された個数のマージ候補ブロック(以下、「マージ候補」という)を選択する。
マージ候補を誘導するための周辺ブロックとしては、図4に示すように、現在ピクチャ内で現在ブロックに隣接する左側ブロックA0、左下段ブロックA1、上段ブロックB0、右上段ブロックB1、及び左上段ブロックA2のうちの全部又は一部が使用される。更に、現在ブロックが位置する現在ピクチャではなく、参照ピクチャ(現在ブロックを予測するために使用された参照ピクチャと同一であるか又は異なる)内に位置するブロックがマージ候補として使用される。例えば、参照ピクチャ内で現在ブロックと同一の位置にあるブロック(co-located block)又はその同一の位置のブロックに隣接するブロックがマージ候補として追加で更に使用される。以上で記述した方法によって選定されたマージ候補の個数が予め設定された個数よりも小さい場合、0ベクトルをマージ候補に追加する。
インター予測部124は、このような周辺ブロックを用いて予め決定された個数のマージ候補を含むマージリストを構成する。マージリストに含まれるマージ候補の中から現在ブロックの動き情報として使用されるマージ候補を選択し、選択された候補を識別するためのマージインデックス情報を生成する。生成されたマージインデックス情報は、符号化部150によって符号化されて映像復号化装置に伝達される。
マージスキップ(merge skip)モードは、マージモードの特別な場合であり、量子化を遂行した後、エントロピー符号化のための変換係数が全て零(zero)に近い場合、残差信号の伝送なしに周辺ブロック選択情報のみを伝送する。マージスキップモードを用いることで、動きの少ない映像、静止画、スクリーンコンテンツ映像などで相対的に高い符号化効率を達成することができる。
以下、マージモード及びマージスキップモードを総称して、マージ/スキップモードで表す。
動き情報を符号化するためのまた別の方法は、AMVP(Advanced Motion Vector Prediction)モードである。
AMVPモードで、インター予測部124は、現在ブロックの周辺ブロックを用いて現在ブロックの動きベクトルに対する予測動きベクトル候補を誘導する。予測動きベクトル候補を誘導するために使用される周辺ブロックとしては、図4に示した現在ピクチャ内で現在ブロックに隣接する左側ブロックA0、左下段ブロックA1、上段ブロックB0、右上段ブロックB1、及び左上段ブロックA2のうち、全部又は一部が用いられる。更に、現在ブロックが位置する現在ピクチャではなく、参照ピクチャ(現在ブロックを予測するために使用された参照ピクチャと同じであるか又は異なる)内に位置するブロックが、予測動きベクトル候補を誘導するために使用される周辺ブロックとして使用される。例えば、参照ピクチャ内で現在ブロックと同じ位置にあるブロック(collocated block)、又はその同じ位置のブロックに隣接するブロックが使用される。以上で記述した方法によって動きベクトル候補の個数が予め設定された個数よりも小さい場合、0ベクトルを動きベクトル候補に追加する。
インター予測部124は、この周辺ブロックの動きベクトルを用いて予測動きベクトル候補を誘導し、予測動きベクトル候補を用いて現在ブロックの動きベクトルに対する予測動きベクトルを決定する。そして、現在ブロックの動きベクトルから予測動きベクトルを減算して差分動きベクトルを算出する。
予測動きベクトルは、予測動きベクトル候補に予め定義された関数(例えば、中央値、平均値演算など)を適用して求める。この場合、映像復号化装置も予め定義された関数を知っている。また、予測動きベクトル候補を誘導するために使用される周辺ブロックは既に符号化及び復号化が完了されたブロックであるため、映像復号化装置もその周辺ブロックの動きベクトルも既に知っている。従って、映像符号化装置は、予測動きベクトル候補を識別するための情報を符号化する必要がない。従って、この場合には、差分動きベクトルに関する情報と、現在ブロックを予測するために使用した参照ピクチャに関する情報とが符号化される。
一方、予測動きベクトルは、予測動きベクトル候補のうちのいずれか1つを選択する方式で決定される。この場合には、差分動きベクトルに関する情報及び現在ブロックを予測するために使用された参照ピクチャに関する情報と共に、選択された予測動きベクトル候補を識別するための情報が追加で符号化される。
減算器130は、現在ブロックからイントラ予測部122又はインター予測部124によって生成された予測ブロックを減算して残差ブロックを生成する。
変換部140は、空間領域のピクセル値を有する残差ブロック内の残差信号を周波数ドメインの変換係数に変換する。変換部140は、残差ブロックの全体サイズを変換単位として使用して残差ブロック内の残差信号を変換するか、或いは残差ブロックを複数個のサブブロックに分割してそのサブブロックを変換単位として使用して変換する。或いは、変換領域及び非変換領域である2つのサブブロックに区分し、変換領域サブブロックのみを変換単位として使用して残差信号を変換する。ここで、変換領域サブブロックは、横軸(又は縦軸)基準に1:1のサイズ比率を有する2つの長方形ブロックのうちの1つである。この場合、サブブロックのみを変換したことを示すフラグcu_sbt_flag、方向性(vertical/horizontal)情報cu_sbt_horizontal_flag、及び/又は位置情報cu_sbt_pos_flagがエントロピー符号化部155によって符号化されて映像復号化装置にシグナリングされる。また、変換領域のサブブロックのサイズは、横軸(或いは縦軸)基準に1:3のサイズ比率を有し、このような場合、該当分割を区分するフラグcu_sbt_quad_flagが追加的にエントロピー符号化部155によって符号化されて映像復号化装置にシグナリングされる。
一方、変換部140は、残差ブロックに対して横方向及び縦方向に個別に変換を遂行する。変換のために、様々なタイプの変換関数又は変換行列が用いられる。例えば、横方向変換及び縦方向変換のための変換関数の対をMTS(Multiple Transform Set)と定義する。変換部140は、MTSのうちから変換効率が最も良い1つの変換関数対を選択し、横及び縦方向にそれぞれ残差ブロックを変換する。MTSのうちから選択された変換関数対に関する情報mts_idxは、エントロピー符号化部155によって符号化されて映像復号化装置にシグナリングされる。
量子化部145は、変換部140から出力される変換係数を、量子化パラメータを用いて量子化し、量子化された変換係数をエントロピー符号化部155に出力する。量子化部145は、任意のブロック又はフレームに対して、変換なしに関連する残差ブロックを直ちに量子化する。量子化部145は、変換ブロック内の変換係数の位置に応じて互いに異なる量子化係数(スケーリング値)を適用する。二次元に配置された量子化された変換係数に適用される量子化行列は符号化されて映像復号化装置にシグナリングされる。
並べ替え部150は、量子化された残差値に対して係数値の並べ替えを遂行する。
並べ替え部150は、係数走査(coefficient scanning)を用いて2次元の係数アレイを1次元の係数シーケンスに変更する。例えば、並べ替え部150では、千鳥状スキャン(zig-zag scan)又は対角線スキャン(diagonal scan)を用いてDC係数から高周波数領域の係数までスキャンして1次元の係数シーケンスを出力する。変換単位のサイズ及びイントラ予測モードによって千鳥状スキャンの代わりに2次元の係数アレイを列方向にスキャンする垂直スキャン、及び2次元のブロック形態係数を行方向にスキャンする水平スキャンが使用され得る。即ち、変換単位のサイズ及びイントラ予測モードによって千鳥状スキャン、対角線スキャン、垂直方向スキャン、及び水平方向スキャンのうちから使用されるスキャン方法が決定される。
エントロピー符号化部155は、CABAC(Context-based Adaptive Binary Arithmetic Code)、指数ゴロム(Exponential Golomb)などの様々な符号化方式を用いて、並べ替え部150から出力された1次元の量子化された変換係数のシーケンスを符号化することによってビットストリームを生成する。
また、エントロピー符号化部155は、ブロック分割に関連するCTUサイズ、CU分割フラグ、QT分割フラグ、MTT分割タイプ、MTT分割方向などの情報を符号化し、映像復号化装置が映像符号化装置と同様にブロックを分割できるようにする。また、エントロピー符号化部155は、現在ブロックがイントラ予測によって符号化されたか、それともインター予測によって符号化されたかの如何を示す予測タイプに関する情報を符号化し、予測タイプによってイントラ予測情報(即ち、イントラ予測モードに関する情報)又はインター予測情報(動き情報の符号化モード(マージモード又はAMVPモード)、マージモードの場合はマージインデックス、AMVPモードの場合は参照ピクチャインデックス及び差分動きベクトルに関する情報)を符号化する。また、エントロピー符号化部155は、量子化に関連する情報、即ち量子化パラメータに関する情報及び量子化行列に関する情報を符号化する。
逆量子化部160は量子化部145から出力される量子化された変換係数を逆量子化して変換係数を生成する。逆変換部165は、逆量子化部160から出力される変換係数を周波数ドメインから空間ドメインに変換して残差ブロックを復元する。
加算部170は、復元された残差ブロックと予測部120によって生成された予測ブロックとを加算して現在ブロックを復元する。復元された現在ブロック内のピクセルは、次の順序のブロックをイントラ予測するときに参照ピクセルとして使用される。
ループ(loop)フィルタ部180は、ブロックベースの予測及び変換/量子化によって発生するブロッキングアーチファクト(blocking artifacts)、リンギングアーチファクト(ringing artifacts)、ぼかしアーチファクト(blurring artifacts)等を減らすために復元されたピクセルに対するフィルタリングを遂行する。フィルタ部180は、インループ(in-loop)フィルタとしてデブロックフィルタ182、SAO(Sample Adaptive Offset)フィルタ184、及びALF(Adaptive Loop Filter)186の全部又は一部を含む。
デブロックフィルタ182は、ブロック単位の符号化/復号化によって発生するブロッキング現象(blocking artifact)を除去するために復元されたブロック間の境界をフィルタリングし、SAOフィルタ184及びalf186は、デブロックフィルタリングされた映像に対して追加のフィルタリングを遂行する。SAOフィルタ184及びalf186は、損失符号化(lossy coding)によって発生する復元されたピクセルと元本ピクセルとの間の差を補償するために使用されるフィルタである。SAOフィルタ184は、CTU単位でオフセットを適用することで主観的な画質だけでなく符号化効率も向上させる。これに比べて、ALF186はブロック単位のフィルタリングを遂行し、該当ブロックのエッジ及び変化量の程度を区分して異なるフィルタを適用して歪みを補償する。ALFに使用されるフィルタ係数に関する情報は符号化されて映像復号化装置にシグナリングされる。
デブロックフィルタ182、SAOフィルタ184、及びALF186を介してフィルタリングされた復元ブロックはメモリ190に保存される。あるピクチャ内の全てのブロックが復元されると、復元されたピクチャは、後に符号化しようとするピクチャ内のブロックをインター予測するための参照ピクチャとして使用される。
図5は、本発明の技術を具現する映像復号化装置の例示的なブロック図である。以下では、図5を参照して映像復号化装置及びこの装置の下位構成について説明する。
映像復号化装置は、エントロピー復号化部510、並べ替え部515、逆量子化部520、逆変換部530、予測部540、加算器550、ループフィルタ部560、及びメモリ570を含むように構成される。
図1の映像符号化装置と同様に、映像復号化装置の各構成要素は、ハードウェア又はソフトウェアで具現されるか、或いはハードウェア及びソフトウェアの組み合わせで具現される。更に、各構成要素の機能がソフトウェアで具現され、マイクロプロセッサが各構成要素に対応するソフトウェアの機能を実行するように具現され得る。
エントロピー復号化部510は、映像符号化装置によって生成されたビットストリームを復号化してブロック分割に関連する情報を抽出することで復号化しようとする現在ブロックを決定し、現在ブロックを復元するために必要な予測情報や残差信号に関する情報などを抽出する。
エントロピー復号化部510は、SPS(Sequence Parameter Set)又はPPS(Picture Parameter Set)からCTUサイズに関する情報を抽出してCTUのサイズを決定し、ピクチャを決定されたサイズのCTUに分割する。そして、CTUをツリー構造の最上位レイヤ、即ちルートノードとして決定し、CTUに関する分割情報を抽出することで、ツリー構造を用いてCTUを分割する。
例えば、QTBTTT構造を用いてCTUを分割する場合、先ずQTの分割に関連する第1のフラグQT_split_flagを抽出して各ノードを下位レイヤの4つのノードに分割する。そして、QTのリーフノードに該当するノードに対しては、MTTの分割に関連する第2のフラグMTT_split_flag及び分割方向(vertical/horizontal)及び/又は分割タイプ(binary/ternary)情報を抽出して該当リーフノードをMTT構造に分割する。これにより、QTのリーフノード以下の各ノードをBT又はTT構造に繰り返し(recursively)分割する。
また他の例として、QTBTTT構造を用いてCTUを分割する場合、先ずCUの分割可否を示すCU分割フラグsplit_cu_flagを抽出し、該当ブロックが分割された場合、第1のフラグQT_split_flagを抽出する。分割の過程で、各ノードは、0回以上の繰り返しのQT分割後に0回以上の繰り返しのMTT分割が発生する。例えば、CTUはすぐにMTT分割が発生するか、逆に複数回のQT分割のみが発生する。
別の例として、QTBT構造を用いてCTUを分割する場合、QTの分割に関連する第1のフラグQT_split_flagを抽出して各ノードを下位レイヤの4つのノードに分割する。そして、QTのリーフノードに該当するノードに対しては、BTで更に分割されるか否かを示す分割フラグsplit_flag及び分割方向情報を抽出する。
一方、エントロピー復号化部510は、ツリー構造の分割を用いて復号化しようとする現在ブロックを決定すると、現在ブロックがイントラ予測されたかそれともインター予測されたかを示す予測タイプに関する情報を抽出する。予測タイプ情報がイントラ予測を示す場合、エントロピー復号化部510は、現在ブロックのイントラ予測情報(イントラ予測モード)に関するシンタックス要素を抽出する。予測タイプ情報がインター予測を示す場合、エントロピー復号化部510は、インター予測情報に関するシンタックス要素、即ち動きベクトル及びその動きベクトルが参照する参照ピクチャを表す情報を抽出する。
また、エントロピー復号化部510は、量子化関連の情報及び残差信号に関する情報として現在ブロックの量子化された変換係数に関する情報を抽出する。
並べ替え部515は、映像符号化装置によって遂行された係数走査順序の逆順で、エントロピー復号化部510でエントロピー復号化された1次元の量子化された変換係数のシーケンスを再び2次元の係数アレイ(即ち、ブロック)に変更する。
逆量子化部520は、量子化された変換係数を逆量子化し、量子化パラメータを用いて量子化された変換係数を逆量子化する。逆量子化部520は、二次元に配列された量子化された変換係数に対して互いに異なる量子化係数(スケーリング値)を適用する。逆量子化部520は、映像符号化装置から量子化係数(スケーリング値)の行列を量子化された変換係数の2次元アレイに適用して逆量子化を遂行する。
逆変換部530は、逆量子化された変換係数を周波数ドメインから空間ドメインに逆変換して残差信号を復元することで、現在ブロックに対する残差ブロックを生成する。
また、逆変換部530は、変換ブロックの一部領域(サブブロック)のみを逆変換する場合、変換ブロックのサブブロックのみを変換したことを示すフラグcu_sbt_flag、サブブロックの方向性(vertical/horizontal)情報cu_sbt_ horizontal_ flag、及び/又はサブブロックの位置情報cu_sbt_pos_flagを抽出し、該当サブブロックの変換係数を周波数ドメインから空間ドメインに逆変換することによって残差信号を復元し、逆変換されない領域に対しては残差信号で「0」値を満たすことによって現在ブロックに対する最終残差ブロックを生成する。
また、MTSが適用された場合、逆変換部530は、映像符号化装置からシグナリングされたMTS情報mts_idxを用いて横及び縦方向にそれぞれ適用される変換関数又は変換行列を決定し、決定された変換関数を用いて横及び縦方向に変換ブロック内の変換係数に対して逆変換を遂行する。
予測部540は、イントラ予測部542及びインター予測部544を含む。イントラ予測部542は、現在ブロックの予測タイプがイントラ予測である場合に活性化され、インター予測部544は、現在ブロックの予測タイプがインター予測である場合に活性化される。
イントラ予測部542は、エントロピー復号化部510から抽出されたイントラ予測モードに対するシンタックス要素から複数のイントラ予測モードのうちの現在ブロックのイントラ予測モードを決定し、イントラ予測モードに応じて現在ブロック周囲の参照ピクセルを用いて現在ブロックを予測する。
インター予測部544は、エントロピー復号化部510から抽出されたインター予測モードに対するシンタックス要素を用いて現在ブロックの動きベクトル、及びその動きベクトルが参照する参照ピクチャを決定し、動きベクトル及び参照ピクチャを用いて現在ブロックを予測する。
加算器550は、逆変換部から出力される残差ブロックと、インター予測部又はイントラ予測部から出力される予測ブロックとを加算して現在ブロックを復元する。復元された現在ブロック内のピクセルは、後で復号化するブロックをイントラ予測するときの参照ピクセルとして活用される。
ループフィルタ部560は、インループフィルタとしてデブロックフィルタ562、SAOフィルタ564、及びALF566を含む。デブロックフィルタ562は、ブロック単位の復号化に因って発生するブロッキング現象(blocking artifact)を除去するために、復元されたブロック間の境界をデブロックフィルタリングする。SAOフィルタ564及びALF566は、損失符号化(lossy coding)に因って発生する復元されたピクセルと元本ピクセルとの間の差を補償するために、デブロックフィルタリング以降の復元されたブロックに対して追加のフィルタリングを遂行する。ALFのフィルタ係数は、ビットストリームから復号されたフィルタ係数に関する情報を用いて決定される。
デブロックフィルタ562、SAOフィルタ564、及びALF566を介してフィルタリングされた復元ブロックはメモリ570に保存される。あるピクチャ内の全てのブロックが復元されると、復元されたピクチャは、後で符号化しようとするピクチャ内のブロックをインター予測するための参照ピクチャとして使用される。
本実施形態は、以上で説明したような映像(ビデオ)の符号化及び復号化に関する。より詳しくは、予め復元された周辺参照サンプル値を用いて現在ブロックのイントラ予測モードを誘導した後、誘導された予測モードに基づいて現在ブロックの予測ブロックを生成するビデオコーディング方法及び装置を提供する。
以下の実施形態は、映像復号化装置内のエントロピー復号化部510及びイントラ予測部542に適用される。また、映像符号化装置内のイントラ予測部122に適用される。
以下の説明で、ブロックのアスペクト比(aspect ratio)は、ブロックの横の長さ(W:Width)を縦の長さ(H:Height)で割った値、即ち横の長さと縦の長さとの間の比として定義される。
以下、特定フラグが真であるということは該当するフラグの値が1であることを示し、特定フラグが偽であるということは該当するフラグの値が0であることを示す。
以下、映像復号化装置を中心にイントラ予測を記述し、便宜上必要である場合、映像符号化装置に言及する。なお、以下に記述する内容は、映像符号化装置にも同様に適用される。
映像復号化装置又は映像復号化装置内のエントロピー復号化部510がビットストリームからデータを復号化するというフレーズとデータを解析するというフレーズとは互換的に用いられる。
≪I.イントラ予測及びISP(Intra Sub-Partitions)≫
VVC技術で、ルーマブロックのイントラ予測モードは、図3aに例示したように、非方向性モード(即ち、Planar及びDC)の外、細分化された方向性モード(即ち、2~66)を有する。更に、図3bの例に追加したように、ルーマブロックのイントラ予測モードは、広角イントラ予測に応じた方向性モード(-14~-1、及び67~80)を有する。
ルーマブロックの予測モードに基づき、イントラ予測の符号化効率向上のための様々な技術が存在する。ISP技術は、現在ブロックを同じサイズの小さなブロックにサブ分割した後、サブブロック全体にイントラ予測モードを共有させるが、サブブロックのそれぞれに変換を適用する。このとき、ブロックのサブ分割は、水平又は垂直方向の分割である。
以下の説明で、サブ分割される前の大きなブロックを現在ブロックといい、サブ分割された小さなブロックのそれぞれをサブブロックと表現する。
ISP技術の動作は次の通りである。
映像符号化装置は、上位ステップであるSPS上のISP活性化フラグsps_isp_enabled_flagが真の場合、intra_subpartitions_mode_flag及びintra_subpartitions_split_flagを伝送する。映像復号化装置は、ISP活性化フラグsps_isp_enabled_flagをビットストリームから最初に解析する。ISP活性化フラグが真である場合、映像復号化装置は、intra_subpartitions_mode_flag及びintra_subpartitions_split_flagをビットストリームから復号化する。
映像符号化装置は、ISPの適用可否を示すintra_subpartitions_mode_flag及びサブ分割方法を示すintra_subpartitions_split_flagを映像復号装置にシグナリングする。intra_subpartitions_mode_flag及びintra_subpartitions_split_flagによるサブ分割形態IntraSubPartitionsSplitTypeは表1に示す通りである。
Figure 2024509216000002
ISP技術は、次のように分割形態IntraSubPartitionsSplitTypeを設定する。
intra_subpartitions_mode_flagが0の場合、IntraSubPartitionsSplitTypeは0に設定され、サブブロック分割が遂行されない(ISP_NO_SPLIT)。即ち、ISPは適用されない。
intra_subpartitions_mode_flagが0でない場合、ISPが適用される。この場合、IntraSubPartitionsSplitTypeは1+intra_subpartitions_split_flagの値に設定され、分割形態に応じてサブブロック分割が遂行される。IntraSubPartitionsSplitType=1である場合に横方向にサブブロック分割(ISP_HOR_SPLIT)を遂行し、IntraSubPartitionsSplitType=2である場合に縦方向にサブブロック分割(ISP_VER_SPLIT)を遂行する。即ち、intra_subpartitions_split_flagはサブブロック分割方向を示す。
例えば、水平方向にサブ分割されるISPモードが現在ブロックに適用される場合、IntraSubPartitionsSplitTypeは1であり、intra_subpartitions_mode_flagは1であり、intra_subpartitions_split_flagは0である。
以下の説明で、intra_subpartitions_mode_flagをサブブロック分割適用フラグで表現し、intra_subpartitions_split_flagをサブブロック分割方向フラグで表現し、IntraSubPartitionsSplitTypeをサブブロック分割形態で表現する。
≪II.イントラ予測モードの誘導≫
以下、図6を用いて、予測モード誘導を用いるイントラ予測装置を記述する。
図6は、本発明の一実施形態による予測モード誘導を用いるイントラ予測装置を示すブロック図である。
本実施形態によるイントラ予測装置は、予め復元された周辺参照サンプル値の勾配(gradient)からヒストグラムを算定し、算定されたヒストグラムを用いて現在ブロックのイントラ予測モードを誘導した後、誘導された予測モードに基づいて現在ブロックの予測ブロックを生成する。イントラ予測装置は、予測モード誘導可否決定部602、勾配算定領域決定部604、ヒストグラム算定部606、予測モード誘導部608、及びイントラ予測遂行部610の全部又は一部を含む。
予測モード誘導可否決定部602は、現在ブロックの予測モードの誘導可否を示すフラグを解析してイントラ予測モードの誘導可否を決定する。以下、このようなフラグを予測モード誘導フラグと称する。予測モード誘導フラグは、ビットレート歪み最適化の観点から映像符号化装置によって設定された後、映像復号化装置に伝達される。映像復号化装置は、ビットストリームから予測モード誘導フラグを復号化した後、以降に記載するステップを遂行する。一方、映像符号化装置は、上位ステップ(high level)から予測モード誘導フラグを獲得して以降のステップを遂行する。
予測モード誘導フラグが真である場合、イントラ予測装置は、現在ブロックのイントラ予測モードの解析を省略したまま、現在ブロックの周辺復元サンプルに基づいてイントラ予測モードを誘導する。この場合、現在ブロックがピクチャ境界、スライス境界、タイル境界などを含んで左側及び/又は上段参照サンプルを使用できない場合、予測モード誘導フラグの復号化は暗黙的に(implicitly)省略される。
別の実施形態として、イントラ予測装置は、予測モードを誘導するか否かを決定する前に、現在ブロックの予測モードがプラナー(Planar)、DCモード、行列基盤モードなどの非方向性モードであるか否かを決定する1つ又は多数のフラグをビットストリームから解析する。該当フラグが全て0である場合、予測モード誘導可否決定部602は、予測モード誘導フラグを解析した後、予測モードの誘導可否を決定する。
また、予測モード誘導可否決定部602によって予測モードを誘導することに決定された後、イントラ予測装置はサブブロック分割適用フラグをビットストリームから復号化し、ISP技術の適用可否、即ち現在ブロックのサブブロックの分割可否を決定する。
図7は、本発明の一実施形態による勾配値の算定に用いられる算定領域を示す例示図である。
勾配算定領域決定部604は、イントラ予測モードを誘導するために、現在ブロックの周辺復元サンプルから勾配値の算定に用いられる算定領域を決定する。図7に例示したように、復元領域のうちの現在ブロックを基準に左側及び上段のそれぞれに位置する3行の復元参照ピクセルが勾配算定領域として用いられる。図7の例で、上段参照サンプルの長さM、及び左側参照サンプルの長さNは、現在ブロックの幅W及び高さHに基づいて設定される。例えば、現在ブロックの左上段に位置する(-3,-3)ピクセルを基準に、MはW+3、2×W+3、W+H+3などの値に設定され、NはH+3、2×H+3、W+H+3などの値に設定される。
他の実施形態として、勾配算定領域決定部604は、算定領域を示すフラグをビットストリームから解析し、現在ブロックを基準に左側又は上段の中から算定領域として使用する領域を設定する。或いは、勾配算定領域決定部604は、算定領域を示すインデックスをビットストリームから解析し、現在ブロックを基準に左側、上段、又は左側/上段の中から算定領域として使用する領域を決定する。
また他の実施形態として、映像符号化装置と映像復号化装置との間の約束によって算定領域を暗黙的に決定する。このような場合、勾配算定領域決定部604の動作が省かれる。
ヒストグラム算定部606は、勾配算定領域で方向性モードの勾配のヒストグラム(Histogram:H())を算定する。先ず、現在ブロックに対して2番目のラインに位置する復元参照サンプルを基準に、3×3領域、3×1領域、又は1×3領域で垂直方向及び水平方向の勾配値が計算される。ヒストグラム算定部606は、ソベルフィルタ(Sobel filter)、プリウィットフィルタ(Prewitt filter)などのような境界検出フィルタ(edge detection filter)を用いて勾配を算出する。表2は、勾配の計算に用いられるフィルタの実施形態を示す。
Figure 2024509216000003
ヒストグラム算定部606は、計算された垂直/水平方向勾配Gv/Ghに基づいて、式1に示すように、該当ピクセルにおける勾配方向θ及び勾配サイズIを決定する。
Figure 2024509216000004
図8は、本発明の一実施形態による方向性モードの勾配のヒストグラムを示す例示図である。
ヒストグラム算定部606は、算定領域内のピクセルに対して勾配方向θに応じて該当方向に最も近いイントラ予測の方向性モードを計算した後、該当方向性モードのヒストグラムに勾配サイズIを累積することで、図8に例示したように、方向性モードの勾配のヒストグラム(H)を生成する。
ヒストグラム算定部606は、勾配のヒストグラムを計算するとき、図9の例のように、予め設定されたサンプリング間隔を基準にピクセルをサブサンプリングした後、サブサンプリングされたピクセルに対して勾配のヒストグラムを計算する。このとき、ピクセクのサンプリング間隔及びサブサンプリング位置は、映像符号化装置と映像復号化装置との間の約束に応じて定義される。或いは、現在ブロックのサイズ及び/又は現在ブロックのアスペクト比(aspect ratio)に基づいてピクセクのサンプリング間隔及びサブサンプリング位置が決定される。
予測モード誘導部608は、図8に例示したように、勾配のヒストグラムに基づいて現在ブロックの予測モードを誘導する。このとき、誘導されるイントラ予測モードは、方向性モード又は非方向性モードである。更に、誘導されるイントラ予測モードは、方向性モード及び非方向性モードの両方を含む。
予測モード誘導部608は、次のように方向性モードを誘導する。
予測モード誘導部608は、算定されたヒストグラムのうち、最も大きい値を有するモードMを現在ブロックのイントラ予測モードとして決定する。
或いは、予測モード誘導部608は、1番目に大きな値を有するモードMと2番目に大きな値を有するモードMを現在ブロックのイントラ予測モードとして決定する。このような2つのモードM及びMを用いて予測された予測信号P及びPに対し、イントラ予測装置は、2つのモードのヒストグラム値に応じた重み値を用いて予測信号を加重することで、最終予測信号を生成する。
別の実施形態として、予測モード誘導部608は、勾配のヒストグラム値が最も大きいモードM及び2番目に大きいモードMのうちの1つを示すフラグを追加で解析し、解析されたフラグ値に応じて現在ブロックの予測モードを決定する。以下、このフラグを予測モード指示フラグと称する。予測モード誘導部608は、2つのモードのヒストグラム値間の差が予め設定された閾値以下である場合、予測モード指示フラグをビットストリームから解析する。一方、2つのモードのヒストグラム値間の差が予め設定された閾値よりも大きい場合、予測モード誘導部608は、予測モード指示フラグの解析を省略する。或いは、式2に示すように、2つのヒストグラムの値間の差が全体ヒストグラム値の和と比べて予め設定された比率以上である場合、予測モード誘導部608は予測モード指示フラグの解析を省略する。
Figure 2024509216000005
別の実施形態として、予測モード誘導部608は、ヒストグラムの値が最も大きいモードである基本モードに対してデルタモードのインデックスをビットストリームから解析して予測モードを決定する。例えば、デルタモードは基本モードに対するオフセットである。従って、予測モード誘導部608は、基本モードにデルタモードを加算して予測モードを決定する。このとき、デルタモードを示すインデックスは、映像符号化装置と映像復号化装置との間の約束に応じて設定される。また、基本モードに応じてデルタモードが変更される。
一方、予測モード誘導部608は、次のように非方向性モードを誘導する。
最も大きい値を有する方向性モードのヒストグラム値が予め設定された閾値よりも小さい場合、又は全体ヒストグラム値の和が予め設定された閾値よりも小さい場合、予測モード誘導部608は、非方向性モードを現在ブロックの予測モードとして決定する。このとき、非方向性モードはDCモード又はプラナーモードであり、予測モード誘導部608は常にDCモード(又は、プラナーモード)で現在ブロックの予測モードを決定する。或いは、予測モード誘導部608は、これらのうちの1つを示すフラグをビットストリームから解析した後、解析されたフラグに応じて2つのモードのうちの1つのモードに決定する。一方、予め設定された閾値は、映像符号化装置と映像復号化装置との間の約束に応じて設定され、上位水準のピクチャ、スライスなどの単位毎に映像符号化装置から映像復号化装置に伝達される。
別の実施形態として、式3に示すように、最も大きい値を有する方向性モードのヒストグラム値が全体ヒストグラム値の和と比べて予め設定された比率よりも小さい場合、予測モード誘導部608は非方向性モードを現在ブロックの予測モードとして決定する。
Figure 2024509216000006
このとき、予め設定された閾値は、現在ブロックのサイズに基づいて決定される。
また別の実施形態として、全体ヒトグラム値の和を勾配算定に用いられたピクセルの個数で割った値が予め設定された閾値よりも小さい場合、予測モード誘導部608は非方向性モードを現在ブロックの予測モードとして決定する。また、最も大きい値を有する方向性モードのヒストグラム値を勾配算定に用いられたピクセルの個数で割った値が予め設定された閾値よりも小さい場合、予測モード誘導部608は非方向性モードを現在ブロックの予測モードとして決定する。
また、全体ヒストグラム値の和をヒストグラム算定に用いられた勾配の個数で割った値が予め設定された閾値よりも小さい場合、予測モード誘導部608は非方向性モードを現在ブロックの予測モードとして決定する。また、最も大きい値を有する方向性モードのヒストグラム値をヒストグラム算定に用いられた勾配の個数で割った値が予め設定された閾値よりも小さい場合、予測モード誘導部608は、非方向性モードを現在ブロックの予測モードとして決定する。
一方、表2に例示したところによると、勾配算定に用いられたピクセルの個数は、ヒストグラム算定に用いられた勾配の個数の9倍又は3倍である。
また別の実施形態として、誘導された現在ブロックの予測モードが方向性モードである場合、予測モード誘導部608は、非方向性モードを現在ブロックの予測モードとして追加する。このとき、追加される非方向性モードは、映像符号化装置と映像復号化装置との間の約束に応じて設定される。
イントラ予測遂行部610は、誘導された予測モードを用いてイントラ予測を遂行することで現在ブロックの予測ブロックを生成する。イントラ予測遂行部610は、追加の解析なしで左側及び上段の復元参照サンプルのうち、現在ブロックに最も近い左側及び上段ラインに含まれる参照サンプルを用いてイントラ予測を遂行する。或いは、イントラ予測遂行部610は、マルチラインの参照サンプルのうちのどの参照サンプルラインを使用するかを指定するインデックスを解析してイントラ予測に使用される参照サンプルラインを決定する。
一実施形態として、イントラ予測遂行部610は、勾配のヒストグラムのうちの最も大きい値を有する方向性モードMで予測された信号Pを予測信号Pとして生成する。また、上述したように、イントラ予測遂行部610は、勾配のヒストグラムのうちの最も大きい値を有する方向性モードMで予測された信号Pと、2番目に大きな値を有するモードMで予測された予測信号Pとを加重和して予測信号Pを生成する。このとき、各モードのヒストグラム値に比例して重み値が決定される。
別の実施形態として、イントラ予測遂行部610は、上述したように誘導されたモードが方向性モードである場合、予め設定された非方向性モード(例えば、プラナー)を追加的に利用する。イントラ予測遂行部610は、式4に示すように、方向性モード予測に従って生成された予測信号Pと、非方向性モードで予測された予測信号Pndとを加重和して最終予測信号Pを生成する。
Figure 2024509216000007
ここで、bは整数型演算のためのシフト値を表す。更に、加重和に使用される重み値w、wは、スカラー又は行列の形態である。このような重み値は、映像符号化装置と映像復号化装置との間の約束に応じて設定される。
図10は、本発明の一実施形態による行列形態の重み値を示す例示図である。
一方、行列形態の重み付け値は、方向性モードに基づいて決定される。例えば、予測モードに応じて予測に使用される参照サンプルで、現在ブロックのサンプルが離れるほど重み値が減少する方式で行列が具現される。
別の実施形態として、イントラ予測遂行部610は、予め定義されたk個の重み値又は行列のうちの1つを示すインデックスをビットストリームから解析し、重み値又は重み行列を決定する。
また別の実施形態として、ISP技術が適用される場合、分割されたサブブロックは同じイントラ予測モードとして、現在ブロックの誘導された予測モードを共有する。或いは、イントラ予測装置は、復元された前のサブブロックの復元サンプルに基づいて現在サブブロックの予測モードを誘導した後、誘導された予測モードを用いて現在サブブロックに対してイントラ予測を遂行する。このとき、サブブロックのサイズに基づいてサブブロック別予測モード誘導の可否が暗黙的に決定される。
図11に例示したように、現在ブロックが2つのサブブロックに垂直方向の分割がなされた場合、イントラ予測装置は、前のサブブロックの復元サンプルに基づいて現在サブブロックの予測モードを誘導する。一方、図11の例は垂直方向の分割がなされたサブブロックを示しているが、水平方向の分割がなされたサブブロックに対しても同様に現在サブブロックの予測モードが誘導される。
また、ISP技術が適用される場合、イントラ予測装置は、それぞれのサブブロックを順次復元し、前のサブブロックで復元された復元参照サンプルを用いて現在サブブロックのイントラ予測を遂行する。
図12は、本発明の一実施形態による予測モード誘導を用いるイントラ予測方法を示すフローチャートである。
映像復号化装置は、ビットストリームから現在ブロックの予測モードの誘導可否を示す予測モード誘導フラグを解析する(S1200)。一方、予測モード誘導フラグは、ビットレート歪み最適化の観点から映像符号化装置によって設定された後、映像復号化装置に伝達される。
現在ブロックがピクチャ境界、スライス境界、タイル境界などを含んで左側及び/又は上段参照サンプルを使用できない場合、予測モード誘導フラグの解析は暗黙的に省略される。
別の実施形態として、映像復号化装置は、予測モード誘導の可否を決定する前に、現在ブロックの予測モードがプラナー、DCモード、行列基盤モードなどの非方向性モードであるか否かを示す1つ又は多数のフラグをビットストリームから解析する。該当フラグが全て偽である場合、予測モード誘導フラグが解析される。
映像復号化装置は予測モード誘導フラグを確認する(S1202)。
予測モード誘導フラグが偽である場合、映像復号化装置は現在ブロックの予測モードをビットストリームから解析した後、解析された予測モードを用いて現在ブロックの予測ブロックを生成する(S1204)。
一方、予測モード誘導フラグが真である場合、映像復号化装置は現在ブロックのイントラ予測モードの解析を省略したまま、次のステップ(S1210~S1216)を遂行する。
映像復号化装置は、現在ブロックの周辺復元サンプルから勾配値の算定に用いられる算定領域を決定する(S1210)。
映像復号化装置は、現在ブロックを基準に左側及び上段のそれぞれに位置する3行の復元参照ピクセルを算定領域として決定する。このとき、左側及び上段に位置する算定領域の長さは、現在ブロックの幅及び高さに基づいて設定される。
別の実施形態として、映像復号化装置は、算定領域を示すフラグをビットストリームから解析し、現在ブロックを基準に左側又は上段の中から算定領域として使用する領域を設定する。
また別の実施形態として、映像符号化装置と映像復号化装置との間の約束に応じて算定領域が暗黙的に決定される。この場合、算定領域を決定するステップが省略される。
映像復号化装置は、現在ブロックに対して、算定領域で方向性モードの勾配のヒストグラムを算定する(S1212)。
映像復号化装置は、現在ブロックを基準に2番目のラインに位置する復元参照サンプルに対し、予め設定された境界検出フィルタを用いて垂直方向及び水平方向の勾配値を計算する。映像復号化装置は、垂直方向及び水平方向の勾配値を用いて、2番目のラインに位置する復元参照サンプルにおける勾配方向及び勾配サイズを計算する。映像復号化装置は、勾配方向に最も近いイントラ予測の方向性モードを計算した後、算定された方向性モードに該当するヒストグラムに勾配サイズを累積することで方向性モードの勾配のヒストグラムを算定する。
映像復号化装置は、予め設定されたサンプリング間隔を基準に2番目のラインに位置する復元参照サンプルをサブサンプリングした後、サブサンプリングされたピクセルに対して勾配のヒストグラムを算定する。このとき、予め設定されたサンプリング間隔及びサブサンプリングされる画素の位置は、映像符号化装置と映像復号化装置との間の約束に応じて定義される。或いは、現在ブロックサイズ及び/又は現在ブロックのアスペクト比に基づいてピクセルのサンプリング間隔及びサブサンプリング位置が決定される。
映像復号化装置は、勾配のヒストグラムに基づいて現在ブロックの予測モードを誘導する(S1214)。このとき、誘導されるイントラ予測モードは、方向性モード又は非方向性モードである。
映像復号化装置は、次のように方向性モードを誘導する。
映像復号化装置は、勾配のヒストグラムのうち、最も大きい値を有する第1の方向性モードを現在ブロックの予測モードとして決定する。
或いは、映像復号化装置は、勾配のヒストグラムのうち、最も大きい値を有する第1の方向性モード、及び2番目に大きな値を有する第2の方向性モードを現在ブロックの予測モードとして決定する。
別の実施形態として、映像復号化装置は、第1の方向性モード及び第2の方向性モードのうちのいずれかを示す予測モード指示フラグを追加で解析し、解析されたフラグ値に応じて現在ブロックの予測モードを決定する。映像復号化装置は、第1の方向性モードと第2の方向性モードとのヒストグラム値間の差が予め設定された閾値以下である場合、予測モード指示フラグをビットストリームから解析する。一方、2つのモードのヒストグラム値間の差が予め設定された閾値よりも大きい場合、映像復号化装置は予測モード指示フラグの解析を省略する。或いは、2つのヒストグラムの値間の差と全体ヒストグラム値の和との間の比率が予め設定された比率以上である場合、映像復号化装置は予測モード指示フラグの解析を省略する。
映像復号化装置は、以下のように非方向性モードを誘導する。
第1の方向性モードのヒストグラム値が予め設定された第1の閾値よりも小さい場合、又は勾配のヒストグラムの値の和が予め設定された第2の閾値よりも小さい場合、映像復号化装置は非方向性予測モードを現在ブロックの予測モードとして決定する。このとき、非方向性モードはDCモード又はプラナー(planar)モードである。
他の実施形態として、第1の方向性モードのヒストグラム値と勾配のヒストグラムの値の和との間の比率が予め設定された比率よりも小さい場合、映像復号化装置は、非方向性予測モードを現在ブロックの予測モードとして決定する。
また他の実施形態として、勾配のヒストグラムの値の和と勾配値との算定に用いられたピクセルの個数間の比率が予め設定された第1の比率よりも小さい場合、又は第1の方向性モードのヒストグラム値及び勾配値の算定に用いられたピクセルの個数間の比率が予め設定された第2の比率よりも小さい場合、映像復号化装置は、非方向性予測モードを現在ブロックの予測モードとして決定する。
映像復号化装置は、誘導された予測モードを用いてイントラ予測を遂行することで、現在ブロックの予測ブロックを生成する(S1216)。
映像復号化装置は、追加の解析なしに、左側及び上段の復元参照サンプルのうちから、現在ブロックに最も近い左側及び上段ラインに含まれる参照サンプルを使用してイントラ予測を遂行する。或いは、映像復号化装置は、マルチラインの参照サンプルのうちのどの参照サンプルラインを使用するかを指定するインデックスをビットストリームから解析してイントラ予測に使用される参照サンプルラインを決定する。
別の実施形態として、映像復号化装置は、第1の方向性モードを用いて現在ブロックの第1の予測ブロックを生成し、第2の方向性モードを用いて現在ブロックの第2の予測ブロックを生成した後、第1の予測ブロックと第2の予測ブロックとを加重和し、現在ブロックの予測ブロックを生成する。このとき、各モードのヒストグラム値に比例して重み値が決定される。
本明細書のフローチャート/タイミング図では、各ステップを順次遂行するものとして記載しているが、これは、本発明の実施形態の技術思想を例示的に説明したに過ぎない。言い換えると、本発明の実施形態が属する技術分野で通常の知識を有する者であれば、本発明の実施形態の本質的な特性から逸脱しない範囲でフローチャート/タイミング図に記載された順序を変更して実行するか、又は各ステップのうちの1つ以上のステップを並列的に実行することによって様々に修正及び変形して適用可能であるため、フローチャート/タイミング図は時系列的な順序に限定されるものではない。
以上の説明における例示的な実施形態は、多くの異なる方式で具現されることを理解しなければならない。1つ以上の例示で説明した機能又は方法は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組み合わせで具現される。本明細書で記載した機能的コンポーネントは、それらの具現独立性を特に強調するために「部(unit)」とラベル付けされることを理解しなければならない。
一方、本実施形態で説明した様々な機能又は方法は、1つ以上のプロセッサによって読み取られて実行される非一時的記録媒体に保存された命令語で具現される。非一時的記録媒体は、例えばコンピュータシステムによって読み取り可能な形態でデータが保存されるあらゆる種類の記録装置を含む。例えば、非一時的記録媒体は、EPROM(erasable programmable read only memory)、フラッシュドライブ、光学ドライブ、磁気ハードドライブ、ソリッドステートドライブ(SSD)のような保存媒体を含む。
以上の説明は、本発明の技術思想を例示的に説明したにすぎず、本発明が属する技術分野で通常の知識を有する者であれば、本発明の本質的な特性から逸脱しない範囲で様々な修正及び変形が可能であろう。従って、本実施形態は、本発明の技術思想を限定するものではなく説明するためのものであり、このような実施形態によって本発明の技術思想の範囲が限定されるものではない。本発明の保護範囲は、特許請求の範囲によって解釈されるべきであり、それと同等の範囲内にある全ての技術思想は、本発明の権利範囲に含まれるものと解釈すべきである。
CROSS-REFERENCE TO RELATED APPLICATION
本特許出願は、2021年3月4日付で韓国に出願した特許出願番号第10-2021-0028795号、2022年3月2日付で韓国に出願した特許出願番号第10-2022-0026549号に対して優先権を主張し、その全ての内容は参考文献として本特許出願に併合される。
110 ピクチャ分割部
120、540 予測部
122、542 イントラ予測部
124、544 インター予測部
130 減算器
140 変換部
145 量子化部
150、515 並べ替え部
155 エントロピー符号化部
160、520 逆量子化部
165、530 逆変換部
170、550 加算器
180、560 ループフィルタ部
182、562 デブロックフィルタ
184、564 SAO(Sample Adaptive Offset)フィルタ
186、566 ALF(Adaptive Loop Filter)
190、570 メモリ
510 エントロピー復号化部
542 イントラ予測部
602 予測モード誘導可否決定部
604 勾配算定領域決定部
606 ヒストグラム算定部
608 予測モード誘導部
610 イントラ予測遂行部

マージ候補を誘導するための周辺ブロックとしては、図4に示すように、現在ピクチャ内で現在ブロックに隣接する左側ブロックA0、左下段ブロックA1、上段ブロックB0、右上段ブロックB1、及び左上段ブロック2のうちの全部又は一部が使用される。更に、現在ブロックが位置する現在ピクチャではなく、参照ピクチャ(現在ブロックを予測するために使用された参照ピクチャと同一であるか又は異なる)内に位置するブロックがマージ候補として使用される。例えば、参照ピクチャ内で現在ブロックと同一の位置にあるブロック(co-located block)又はその同一の位置のブロックに隣接するブロックがマージ候補として追加で更に使用される。以上で記述した方法によって選定されたマージ候補の個数が予め設定された個数よりも小さい場合、0ベクトルをマージ候補に追加する。
AMVPモードで、インター予測部124は、現在ブロックの周辺ブロックを用いて現在ブロックの動きベクトルに対する予測動きベクトル候補を誘導する。予測動きベクトル候補を誘導するために使用される周辺ブロックとしては、図4に示した現在ピクチャ内で現在ブロックに隣接する左側ブロックA0、左下段ブロックA1、上段ブロックB0、右上段ブロックB1、及び左上段ブロック2のうち、全部又は一部が用いられる。更に、現在ブロックが位置する現在ピクチャではなく、参照ピクチャ(現在ブロックを予測するために使用された参照ピクチャと同じであるか又は異なる)内に位置するブロックが、予測動きベクトル候補を誘導するために使用される周辺ブロックとして使用される。例えば、参照ピクチャ内で現在ブロックと同じ位置にあるブロック(collocated block)、又はその同じ位置のブロックに隣接するブロックが使用される。以上で記述した方法によって動きベクトル候補の個数が予め設定された個数よりも小さい場合、0ベクトルを動きベクトル候補に追加する。
デブロックフィルタ182は、ブロック単位の符号化/復号化によって発生するブロッキング現象(blocking artifact)を除去するために復元されたブロック間の境界をフィルタリングし、SAOフィルタ184及びALF186は、デブロックフィルタリングされた映像に対して追加のフィルタリングを遂行する。SAOフィルタ184及びALF186は、損失符号化(lossy coding)によって発生する復元されたピクセルと元本ピクセルとの間の差を補償するために使用されるフィルタである。SAOフィルタ184は、CTU単位でオフセットを適用することで主観的な画質だけでなく符号化効率も向上させる。これに比べて、ALF186はブロック単位のフィルタリングを遂行し、該当ブロックのエッジ及び変化量の程度を区分して異なるフィルタを適用して歪みを補償する。ALFに使用されるフィルタ係数に関する情報は符号化されて映像復号化装置にシグナリングされる。
ヒストグラム算定部606は、勾配算定領域で方向性モードの勾配のヒストグラム(Histogram:(H))を算定する。先ず、現在ブロックに対して2番目のラインに位置する復元参照サンプルを基準に、3×3領域、3×1領域、又は1×3領域で垂直方向及び水平方向の勾配値が計算される。ヒストグラム算定部606は、ソベルフィルタ(Sobel filter)、プリウィットフィルタ(Prewitt filter)などのような境界検出フィルタ(edge detection filter)を用いて勾配を算出する。表2は、勾配の計算に用いられるフィルタの実施形態を示す。

Claims (20)

  1. 映像復号化装置によって遂行される現在ブロックのイントラ予測方法であって、
    ビットストリームから前記現在ブロックの予測モードの誘導(derivation)の可否を示す予測モード誘導フラグを解析するステップと、
    前記予測モード誘導フラグを確認するステップと、を有し、
    前記予測モード誘導フラグが真である場合、
    前記現在ブロックの周辺復元サンプルから勾配(gradient)値の算定に用いられる算定領域を決定するステップと、
    前記現在ブロックに対して、前記算定領域で方向性モードの勾配のヒストグラム(histogram)を算定するステップと、
    前記勾配のヒストグラムに基づいて前記現在ブロックの予測モードを誘導するステップと、
    前記誘導された予測モードを用いてイントラ予測を遂行することで、前記現在ブロックの予測ブロックを生成するステップと、を含むことを特徴とするイントラ予測方法。
  2. 前記現在ブロックの予測モードが非方向性モードのうちの1つであるか否かを示す1つ又は多数のフラグを前記ビットストリームから解析するステップを更に含み、
    前記非方向性モードのうちの1つを示すフラグが全て偽である場合、前記予測モード誘導フラグを解析することを特徴とする請求項1に記載のイントラ予測方法。
  3. 前記予測モード誘導フラグが真である場合、サブブロック分割適用フラグを前記ビットストリームから解析して、前記現在ブロックのサブブロック分割の可否を決定することを特徴とする請求項1に記載のイントラ予測方法。
  4. 前記算定領域を決定するステップは、前記現在ブロックを基準に左側及び上段のそれぞれに位置する3行の復元参照ピクセルを前記算定領域として決定し、
    前記左側及び上段に位置する前記算定領域の長さは、前記現在ブロックの幅及び高さに基づいて設定されることを特徴とする請求項1に記載のイントラ予測方法。
  5. 前記算定領域を示すフラグを前記ビットストリームから解析するステップを更に含み、
    前記算定領域を示すフラグに応じて、前記現在ブロックを基準に左側又は上段の中から算定領域を設定することを特徴とする請求項1に記載のイントラ予測方法。
  6. 前記ヒストグラムを算定するステップは、前記現在ブロックを基準に2番目のラインに位置する復元参照サンプルに対して、予め設定された境界検出フィルタ(edge detection filter)を用いて垂直方向及び水平方向の勾配値を計算することを特徴とする請求項1に記載のイントラ予測方法。
  7. 前記ヒストグラムを算定するステップは、前記垂直方向及び水平方向の勾配値を用いて、前記2番目のラインに位置する復元参照サンプルにおける勾配方向及び勾配サイズを計算し、前記勾配方向に最も近いイントラ予測の方向性モードを計算し、前記方向性モードに該当するヒストグラムに前記勾配サイズを累積することを特徴とする請求項6に記載のイントラ予測方法。
  8. 前記ヒストグラムを算定するステップは、予め設定されたサンプリング間隔を基準に前記2番目のラインに位置する復元参照サンプルをサブサンプリングした後、前記サブサンプリングされたピクセルに対して前記勾配のヒストグラムを算定することを特徴とする請求項6に記載のイントラ予測方法。
  9. 前記予め設定されたサンプリング間隔及び前記サブサンプリングされるピクセルの位置は、前記現在ブロックのサイズ及び/又はアスペクト比(aspect ratio)に基づいて決定されることを特徴とする請求項8に記載のイントラ予測方法。
  10. 前記予測モードを誘導するステップは、前記勾配のヒストグラムのうちの最も大きい値を有する第1の方向性モードを前記現在ブロックの予測モードとして決定することを特徴とする請求項1に記載のイントラ予測方法。
  11. 前記予測モードを誘導するステップは、前記勾配のヒストグラムのうちの最も大きい値を有する第1の方向性モード、及び2番目に大きな値を有する第2の方向性モードを前記現在ブロックの予測モードとして決定することを特徴とする請求項1に記載のイントラ予測方法。
  12. 前記予測モードを誘導するステップは、前記第1の方向性モードのヒストグラム値が予め設定された第1の閾値よりも小さい場合、又は前記勾配のヒストグラムの値の和が予め設定された第2の閾値よりも小さい場合、非方向性予測モードを前記現在ブロックの予測モードとして決定することを特徴とする請求項10に記載のイントラ予測方法。
  13. 前記予測モードを誘導するステップは、前記第1の方向性モードのヒストグラム値と前記勾配のヒストグラムの値の和との間の比率が予め設定された比率よりも小さい場合、非方向性予測モードを前記現在ブロックの予測モードとして決定することを特徴とする請求項10に記載のイントラ予測方法。
  14. 前記サブブロック分割適用フラグが真である場合、前記現在ブロックをサブブロックに分割し、前記サブブロックの同一のイントラ予測モードとして前記現在ブロックの誘導された予測モードを共有することを特徴とする請求項3に記載のイントラ予測方法。
  15. 前記サブブロック分割適用フラグが真である場合、前記現在ブロックをサブブロックに分割し、復元された前のサブブロックの復元サンプルに基づいて現在サブブロックの予測モードを誘導し、前記サブブロックのサイズに基づいて各サブブロックの予測モード誘導の可否が暗黙的に決定されることを特徴とする請求項3に記載のイントラ予測方法。
  16. 前記予測ブロックを生成するステップは、前記第1の方向性モードを用いて前記現在ブロックの第1の予測ブロックを生成し、前記第2の方向性モードを用いて前記現在ブロックの第2の予測ブロックを生成した後、前記第1の予測ブロックと第2の予測ブロックとを加重和して、前記現在ブロックの予測ブロックを生成することを特徴とする請求項11に記載のイントラ予測方法。
  17. 前記予測ブロックを生成するステップは、前記現在ブロックの予測モードが方向性モードである場合、非方向性モードを追加的に用い、前記非方向性モードを用いて前記現在ブロックの第3の予測ブロックを生成した後、前記第1の予測ブロックと前記第2の予測ブロックと前記第3の予測ブロックとを加重和して、前記現在ブロックの予測ブロックを生成することを特徴とする請求項11に記載のイントラ予測方法。
  18. ビットストリームから予測モード誘導フラグを解析して、現在ブロックの予測モードの誘導(derivation)の可否を決定する予測モード誘導可否決定部と、
    前記現在ブロックの周辺復元サンプルから勾配(gradient)値の算定に用いられる算定領域を決定する勾配算定領域決定部と、
    前記現在ブロックに対して、前記算定領域で方向性モードの勾配のヒストグラムを算定するヒストグラム算定部と、
    前記勾配のヒストグラムに基づいて前記現在ブロックの予測モードを誘導する予測モード誘導部と、
    前記誘導された予測モードを用いてイントラ予測を遂行することで、前記現在ブロックの予測ブロックを生成するイントラ予測遂行部と、を備えることを特徴とするイントラ予測装置。
  19. 前記予測モード誘導可否決定部は、前記現在ブロックの予測モードが非方向性モードのうちの1つであるか否かを示す1つ又は多数のフラグを前記ビットストリームから解析するように更に構成され、
    前記非方向性モードのうちの1つを示すフラグが全て偽である場合、前記予測モード誘導フラグを解析することを特徴とする請求項18に記載のイントラ予測装置。
  20. 前記予測モード誘導可否決定部は、前記予測モード誘導フラグが真である場合、前記現在ブロックの予測モードの誘導を決定することを特徴とする請求項18に記載のイントラ予測装置。

JP2023553749A 2021-03-04 2022-03-03 イントラ予測モード誘導を用いるビデオコーディングのためのイントラ予測方法及び装置 Pending JP2024509216A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2021-0028795 2021-03-04
KR20210028795 2021-03-04
KR1020220026549A KR20220125175A (ko) 2021-03-04 2022-03-02 인트라 예측모드 유도를 이용하는 비디오 코딩방법 및 장치
KR10-2022-0026549 2022-03-02
PCT/KR2022/002985 WO2022186616A1 (ko) 2021-03-04 2022-03-03 인트라 예측모드 유도를 이용하는 비디오 코딩방법 및 장치

Publications (1)

Publication Number Publication Date
JP2024509216A true JP2024509216A (ja) 2024-02-29

Family

ID=83155500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023553749A Pending JP2024509216A (ja) 2021-03-04 2022-03-03 イントラ予測モード誘導を用いるビデオコーディングのためのイントラ予測方法及び装置

Country Status (3)

Country Link
US (1) US20230412799A1 (ja)
JP (1) JP2024509216A (ja)
WO (1) WO2022186616A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024080849A1 (ko) * 2022-10-14 2024-04-18 현대자동차주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN117956164A (zh) * 2022-10-21 2024-04-30 腾讯科技(深圳)有限公司 视频编解码方法、装置、计算机可读介质及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338351B (zh) * 2014-05-28 2019-11-12 华为技术有限公司 基于模板匹配的帧内预测编、解码、阵列扫描方法及装置
WO2018054269A1 (en) * 2016-09-22 2018-03-29 Mediatek Inc. Method and apparatus for video coding using decoder side intra prediction derivation
AU2019358651A1 (en) * 2018-10-12 2021-04-15 Guangdong Oppo Mobile Telecommunications Corp. , Ltd. Method for encoding/decoding image signal and device for same

Also Published As

Publication number Publication date
WO2022186616A1 (ko) 2022-09-09
US20230412799A1 (en) 2023-12-21

Similar Documents

Publication Publication Date Title
JP2024509216A (ja) イントラ予測モード誘導を用いるビデオコーディングのためのイントラ予測方法及び装置
KR20220077095A (ko) 인트라 예측을 이용하는 비디오 코딩 방법 및 장치
KR20220071939A (ko) 비디오 부호화 및 복호화를 위한 장치 및 방법
JP2024511887A (ja) 適応的イントラ予測精度を用いるビデオコーディング方法及び装置
KR20220125175A (ko) 인트라 예측모드 유도를 이용하는 비디오 코딩방법 및 장치
KR20230159260A (ko) 인트라 예측 블록에 대한 움직임벡터 저장방법 및 장치
KR20230161344A (ko) 인트라 예측에서 성분간 관계 모델 유도를 위한 참조샘플 선택방법
KR20220137549A (ko) 적응적 인트라 예측 정밀도를 이용하는 비디오 코딩방법 및 장치
KR20220017372A (ko) 영상 부/복호화 장치에서 이용하는 양자화 파라미터 예측 방법
KR20230159254A (ko) 양방향 예측을 이용하는 크로마 성분의 인터 예측방법
KR20230160171A (ko) 혼합 성분간 예측을 사용하는 비디오 코딩방법 및 장치
KR20220126226A (ko) 나선스캔 순서를 이용하는 비디오 코딩방법 및 장치
KR20230160175A (ko) 예측-변환 생략을 이용하는 비디오 코딩방법 및 장치
KR20240047298A (ko) 복수의 블록들 기반 인트라 템플릿 매칭 예측을 이용하는 비디오 코딩방법 및 장치
KR20240074642A (ko) 기하학적 분할에 기반하여 크로마 블록을 인트라 예측하는 비디오 코딩방법 및 장치
KR20220131178A (ko) 성분별 적응적 공간해상도를 갖는 움직임벡터를 이용하는 비디오 코딩방법 및 장치
KR20220066854A (ko) 크로마 인트라 방향성 예측모드를 적응적으로 결정하는 영상 부호화 및 복호화 방법
KR20230160170A (ko) 기하학적 움직임 예측을 사용하는 비디오 코딩방법 및 장치
KR20240078343A (ko) 코딩트리유닛의 분할구조를 예측하고 수정하는 비디오 부호화/복호화 방법 및 장치
KR20240021106A (ko) 템플릿 기반 예측을 이용하는 비디오 코딩방법 및 장치
KR20220071944A (ko) 성분 간 참조를 이용하는 잔차신호 생성방법과 장치
KR20220118349A (ko) 인터 예측 기반의 비디오 부호화 및 복호화
KR20240074645A (ko) 복원 참조샘플 기반 성분간 예측을 이용하는 비디오 코딩방법 및 장치
JP2024512785A (ja) 適応的空間解像度を有するブロックベクトルを用いるビデオコーディング方法及び装置
KR20220118334A (ko) 서브블록 분할 기반 인트라 예측을 이용하는 비디오 코딩방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230905