JP2021528877A - イントラ予測におけるplanarモード及びdcモードの境界フィルタリング - Google Patents

イントラ予測におけるplanarモード及びdcモードの境界フィルタリング Download PDF

Info

Publication number
JP2021528877A
JP2021528877A JP2020554486A JP2020554486A JP2021528877A JP 2021528877 A JP2021528877 A JP 2021528877A JP 2020554486 A JP2020554486 A JP 2020554486A JP 2020554486 A JP2020554486 A JP 2020554486A JP 2021528877 A JP2021528877 A JP 2021528877A
Authority
JP
Japan
Prior art keywords
predictor
sample
reference sample
block
adjacent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020554486A
Other languages
English (en)
Other versions
JPWO2019245650A5 (ja
JP7473478B2 (ja
Inventor
ビハリ ラス,ガガン
ラセぺ,ファビエン
アーバン,ファブリス
Original Assignee
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18306108.4A external-priority patent/EP3611920A1/en
Application filed by インターデジタル ヴイシー ホールディングス, インコーポレイテッド filed Critical インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Publication of JP2021528877A publication Critical patent/JP2021528877A/ja
Publication of JPWO2019245650A5 publication Critical patent/JPWO2019245650A5/ja
Application granted granted Critical
Publication of JP7473478B2 publication Critical patent/JP7473478B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ブロックがイントラ予測される時には、境界上で予測されたサンプルは、特定のモードに関する境界フィルタリングを受ける。勾配ベースのアプローチを使用してDCモード又はPLANARモードでのイントラ予測に関して境界フィルタリングを実行する様々な実施形態が提案されている。特定の参照サンプルに関する勾配は、特定の参照サンプルと、この特定の参照サンプルを予測する予測子と、の間の差に基づいて計算される。PLANARモードに関しては、上側(左側)の参照サンプルと、これら上側(左側)の参照サンプルを使用した線形補間と、の間の差が勾配として使用され、そのうちの分数部分が、減衰関数を使用して初期予測サンプルに対して伝搬される。DCモードに関しては、上側(左側)の参照サンプルと、参照サンプルの平均と、の差が勾配として使用される。平均は、上側の参照サンプル及び/又は左側の参照サンプルを使用して計算することができる。
【選択図】図6

Description

本実施形態は、一般に、映像の符号化又は復号の方法及び装置に関し、より詳細には、映像の符号化又は復号におけるイントラ予測の方法及び装置に関する。
高い圧縮効率を達成し得るよう、画像及び映像に対する符号化方式においては、通常、予測及び変換を使用することにより、映像コンテンツ内の空間的及び時間的な冗長性を利用している。一般に、イントラ予測又はインター予測を使用することで、フレーム内相関関係又はフレーム間相関関係が利用され、その後、オリジナルブロックと予測ブロックとの間の差であって多くの場合に予測エラー又は予測残差と称される差が、変換され、量子化され、そして、エントロピー符号化される。映像を再構成するに際しては、圧縮されたデータは、エントロピー符号化、量子化、変換、及び、予測、に対応した逆プロセスによって復号される。
一実施形態によれば、映像を復号する方法が提示され、この方法は、複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、サンプルを再構成することと、を含む。
他の実施形態によれば、映像を符号化する方法が提示され、この方法は、複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、ブロックを符号化することと、を含む。
他の実施形態によれば、映像を復号する装置が提示され、この装置は、1つ又は複数のプロセッサを含み、この1つ又は複数のプロセッサは、複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、サンプルを再構成することと、を実行するように構成されている。装置は、1つ又は複数のメモリをさらに含むことができる。
他の実施形態によれば、映像を符号化する装置が提示され、この装置は、1つ又は複数のプロセッサを含み、この1つ又は複数のプロセッサは、複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、ブロックを符号化することと、を実行するように構成されている。装置は、1つ又は複数のメモリをさらに含むことができる。
他の実施形態によれば、映像を復号する装置が提示され、この装置は、複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成する手段であって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとする手段と、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得する手段と、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成する手段と、形成された予測子に応答して、サンプルを再構成する手段と、を含む。
他の実施形態によれば、映像を符号化する装置が提示され、この装置は、複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成する手段であって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとする手段と、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得する手段と、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成する手段と、形成された予測子に応答して、ブロックを符号化する手段と、を含む。
他の実施形態によれば、ビットストリームは、複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、ブロックを符号化することと、を実行することによって、生成される。
図1は、映像エンコーダの一実施形態に関するブロック図を示す。 図2は、映像デコーダの一実施形態に関するブロック図を示す。 図3は、HEVCにおける現在のブロックをイントラ予測する参照サンプルを描写した図示例である。 図4は、planarモードでのイントラ予測を描写した図示例である。 図5は、一実施形態による、イントラ予測において境界フィルタリングを選択的に適用する方法を示す。 図6は、一実施形態による、イントラ予測における境界フィルタリングを使用した映像符号化の方法を示す。 図7は、一実施形態による、イントラ予測における境界フィルタリングを使用した映像復号の方法を示す。 図8は、本実施形態の態様が内部に実装され得るシステムに関するブロック図を示す。
図1は、映像エンコーダ100のブロック図を示している。図1は、高効率映像符号化(HEVC)エンコーダ、JVET(Joint Video Exploration Team)によって開発中のJEM(Joint Exploration Model)エンコーダ、あるいは、HEVC又はJEMで使用されているものと同様の技術を使用したエンコーダ、を例示することができる。
本出願では、「再構成された」及び「復号された」という用語は、互換的に使用することができ、「符号化された」又は「コード化された」という用語は、互換的に使用することができ、「画素」又は「サンプル」という用語は、互換的に使用することができ、そして、「画像」、「ピクチャ」及び「フレーム」という用語は、互換的に使用することができる。必ずしもそうとは限らないけれども、通常は、「再構成された」という用語は、エンコーダ側で使用され、「復号された」という用語は、デコーダ側で使用される。
符号化される前に、映像シーケンスは、事前符号化処理(101)を受けることができる、例えば、入力カラーピクチャに対して色変換を適用すること(例えば、RGB4:4:4から、YCbCr4:2:0への、変換)、あるいは、圧縮に対してより回復力のある信号分布を得るために、入力ピクチャ成分のリマッピングを実行すること(例えば、1つのカラー成分に対してのヒストグラム均等化を使用して)を、受けることができる。メタデータは、事前処理に関連付けられ得るとともに、ビットストリームに添付することができる。
1つ又は複数のピクチャで映像シーケンスを符号化するために、ピクチャは、分割される(102)。本出願では、「ブロック」という用語は、例えば、HEVC又はJEMにおいて使用された際の、CTU(符号化ツリーユニット)、CU(符号化ユニット)、PU(予測ユニット)、TU(変換ユニット)、CB(符号化ブロック)、PB(予測ブロック)、及びTB(変換ブロック)、のいずれかを参照するために使用することができる。加えて、「ブロック」は、また、H.264/AVC又は他の映像符号化規格において規定されているようなマクロブロック及びパーティションを参照するために使用することもでき、より一般的には、様々なサイズのデータからなる配列を参照するために使用することができる。
エンコーダ100では、後述するように、エンコーダ構成要素によってピクチャが符号化される。符号化されるべきピクチャは、例えばCUsの単位で処理される。各符号化ユニットは、イントラモード又はインターモードのいずれかを使用して符号化される。符号化ユニットがイントラモードで符号化される場合には、イントラ予測を行う(160)。インターモードでは、動き推定(175)と動き補償(170)とを行う。エンコーダは、符号化ユニットを符号化するためにイントラモードとインターモードのどちらを使用するかを決定し(105)、予測モードフラグによって、イントラ/インターに関する決定を示す。予測残差は、オリジナル画像ブロックから、予測されたブロックを減算すること(110)により計算される。
その後、予測残差は、変換され(125)、量子化される(130)。量子化された変換係数と、動きベクトルと、他のシンタックス要素とは、例えば、コンテキストベースの適応型2値算術符号化(CABAC)を使用して、エントロピー符号化され(145)、ビットストリームが出力される。
エンコーダは、変換をスキップすることができ、例えば4×4TUベースで、未変換の残差信号に対して直接的に量子化を適用することができる。エンコーダは、また、変換と量子化との双方をバイパスすることもできる、すなわち、残差は、変換プロセス又は量子化プロセスが適用されることなく、直接的に符号化される。直接的なPCM符号化では、予測は適用されず、符号化ユニットサンプルは、ビットストリームへと直接的に符号化される。
エンコーダは、さらなる予測の参照を提供するために、符号化されたブロックを復号する。量子化された変換係数は、逆量子化され(140)、逆変換され(150)、これにより、予測残差が復号される。復号された予測残差と、予測されたブロックと、を組み合わせることにより(155)、画像ブロックが再構成される。ループ内フィルタ(165)が、再構成された画像に対して適用され、これにより、例えば、符号化アーチファクトを低減するデブロッキング/SAO(画素適応オフセット)フィルタリングが実行される。フィルタリングされた画像は、参照ピクチャバッファ(180)に記憶される。
図2は、映像デコーダ200のブロック図を示している。図2は、HEVCデコーダ、JEMデコーダ、あるいは、HEVC又はJEMと同様の技術を使用したデコーダ、を例示することができる。デコーダ200において、ビットストリームは、以下に説明するようにして、デコーダ構成要素によって復号される。映像デコーダ200は、一般に、図1で説明したような符号化経路でありかつ映像データの符号化の一部として映像復号を実行する符号化経路に対して逆向きとされた、復号経路を実行する。
特に、デコーダの入力は、映像エンコーダ100によって生成され得る映像ビットストリームを含む。ビットストリームは、まず、エントロピー復号され(230)、これにより、変換係数、動きベクトル、ピクチャ分割情報、及び、他の符号化された情報、を得ることができる。
ピクチャ分割情報は、ピクチャがどのように分割されるかを示している。したがって、デコーダは、復号されたピクチャ分割情報に従ってピクチャを分割することができる(235)。変換係数を、逆量子化して(240)、逆変換することにより(250)、予測残差を復号する。
復号された予測残差と、予測されたブロックと、を組み合わせることにより(255)、画像ブロックが再構成される。予測されたブロックは、イントラ予測(260)から、あるいは、動き補償予測(すなわち、インター予測)(275)から、得ることができる(270)。ループ内フィルタ(265)が、再構成された画像に対して適用される。フィルタリングされた画像は、参照画像バッファ(280)に記憶される。
復号されたピクチャは、さらに、復号後の処理(285)を受けることができる、例えば、逆色変換(例えば、YCbCr4:2:0から、RGB4:4:4:4への、変換)を受けることができる、あるいは、事前符号化処理(101)で実行されたリマッピングプロセスとは逆の処理を実行する逆リマッピングを受けることができる。復号後の処理では、事前符号化処理で得られたメタデータを使用することができ、ビットストリーム内に信号送出することができる。
上述したように、ブロックは、イントラ予測されることができる。HEVC、H.264/AVCなどの映像符号化規格では、イントラ予測プロセスは、一般に、以下の3つのステップ、すなわち、(1)参照サンプルの生成、(2)イントラサンプルの予測、及び(3)予測サンプルの後処理、という3つのステップを含む。因果関係のある隣接ブロック(すなわち、既に符号化されたブロック、又は、既に復号されたブロック)からのサンプルは、参照サンプルとして使用される。図3は、HEVCで使用される参照サンプルの例を示しており、ここでは、現在のブロックの左上コーナーに対しての、座標(x,y)における画素値が、P(x,y)によって示されている。N×NというサイズのCUについては、上側の2N個の参照サンプルからなる行が、復号されたCUsから形成される。同様に、左側の2N個の参照サンプルからなる列は、復号されたCUsから形成される。左上の復号されたCUからのコーナー画素は、参照サンプルからなる上側の行と左側の列との間のギャップを埋めるために使用される。参照サンプルのいくつかが利用可能でない場合には、例えば、対応するCUsが同じスライス内にない時には、あるいは、現在のCUがフレーム境界にある時には、参照サンプルの置換が実行され、この場合、欠落したサンプルは、利用可能なサンプルから時計回りにコピーされる。その後、現在のCUのサイズと、予測モードと、に応じて、参照サンプルが、指定されたフィルタを使用してフィルタリングされる。
次なるステップ、すなわち、イントラサンプル予測は、参照サンプルに基づいてターゲットCUの画素を予測することからなる。異なる種類のコンテンツを効率的に予測し得るよう、HEVCは、様々な予測モードを支持している。特に、planar予測モード及びDC予測モードを使用することにより、滑らかで漸次的に変化する領域を予測することができ、他方、方向性予測モードを使用することにより、異なる方向性構造を捕捉することができる。HEVCは、2から34までのインデックスを有する33個の方向性予測モードを支持している。これらの予測モードは、異なる予測方向性に対応するものであり、ここで、数字は、イントラ予測モードのインデックスを示している。
JVETのJoint Exploration Model(JEM)コードでは、「Further Improvements to HMKTA−1.0」、J.Chen、W.−J.Chien、M.Karczewicz、X.Li、H.Liu、A.Said、L.Zhang、X.Zhao、VCEG−AZ07、ワルシャワ、ポーランド、2015年6月に記載されているように、予測モードの数は、67個へと増加しており、これは、1つのPLANARモードと、1つのDCモードと、65個の角度モードと、を含む。より多くの予測モードが含まれていることから、JEMにおいてより大きなブロックサイズを有したこのような角度構造の可能性を利用することが提案されている。
DCモード、直接的な水平方向モード、及び直接的な垂直方向モード、などのいくつかの予測モードは、予測サンプルのCU境界のところに不連続性を引き起こす可能性がある。したがって、そのような予測モードに続いて、後処理又は境界フィルタリングステップが行われ、予測サンプルの境界は、ローパスフィルタを使用して円滑化される。ここで、直接的な水平方向モードとは、ターゲットブロックの左側の参照サンプルがイントラ予測のために右側へと水平方向に繰り返される場合の予測モードを参照する。同様に、直接的な垂直方向モードとは、ターゲットブロックの上側の参照サンプルがイントラ予測のために下側へと垂直方向に繰り返される場合の予測モードを参照する。
境界フィルタリングの目的は、隣接する参照サンプルに対しての不連続性を低減することであり、これにより、ブロック境界でのブロッキングアーチファクトが間接的に低減するとともに、符号化効率が向上する。HEVCでは、DC予測モードに関し、予測ブロックの最初の列と最初の行とが、予測後にフィルタリングされる。JEMでは、DCモードにおける境界フィルタリングに加えて、PLANAR予測モードでも境界フィルタリングを行うことが提案されている。
本実施形態は、イントラ予測における境界フィルタリングに関する。特に、本出願人は、DC予測モード及びPLANAR予測モードにおいて勾配ベースの境界フィルタリングを適用することにより、複雑さの増大を低く抑えつつ、符号化性能の点で既存技術を改良することを提案する。
様々な実施形態では、本出願人は、PLANARイントラ予測モード及びDCイントラ予測モードの新規な境界フィルタリング方法を提案する。本出願人は、参照サンプルにおける勾配又は残差を計算し、計算された値の小数部分を、減衰関数を使用しつつ、隣接する行及び列へと伝搬する。本出願人は、隣接する行及び列における参照サンプルと予測サンプル値との間にわたって、強度値の漸次的な変化を生成することを、目的としている。
上述したように、PLANAR予測モード及びDC予測モード(それぞれ、モード0及びモード1としてインデックス付けされる)は、フレーム内の滑らかにかつ漸次的に変化する領域を予測するために使用される。DCモードでは、すべてのターゲット画素は、ターゲットブロックの上側及び左側の参照サンプルのDC値によって予測され、これに対し、PLANARモードでは、予測値は、上側の参照サンプルと左下の参照サンプルとを使用したもの(垂直補間)と、左側の参照サンプルと右上の参照サンプルとを使用した他のもの(水平補間)と、の2つの線形補間の平均である。前者の補間は、強度の漸次的な変化を垂直方向に沿ってモデル化することを目的としており、これに対し、後者の補間は、強度の漸次的な変化を水平方向に沿ってモデル化することを目的としている。
DCモードとPLANARモードとのいずれにおいても、計算による予測値と隣接する参照サンプルの値との間の不一致のために、ターゲットブロックの境界で不連続性が発生し得る。この影響は、上側の参照サンプルと左側の参照サンプルとが大きな分散を有している場合には、DCモードにおいて、より顕著になる。PLANARモードでは、不連続性が、補間のうちの一方だけによって引き起こされることのために、この影響は、それほど顕著ではない。垂直補間は、左側の境界に沿って不連続性を引き起こし得るものであり、他方、水平補間は、上側の境界に沿って不連続性を引き起こし得るものである。HEVCは、DCモードの境界フィルタリングを含み、これに対し、JEMでは、境界フィルタリング方法が、追加的にPLANARモードに関して提案されている。様々な実施形態では、本出願人は、勾配ベースのアプローチを使用して、DCモード及びPLANARモードの境界フィルタリングステップを改良することを目的としている。以下では、HEVC及びJEMにおける、DCモード及びPLANARモードについて、詳細に説明し、その後、境界フィルタリングに関する様々な実施形態を提供する。
HEVCにおけるDC予測
イントラ予測されるべき所与のターゲットブロックに対して、エンコーダ又はデコーダは、まず、図3に示すように、2つの参照配列(上側に1つ、及び、左側に1つ)を構築する。参照サンプルは、上側の、右上の、左側の、左下の、及び左上の、復号されたブロック内の復号されたサンプルから取られ、ブロックサイズ及び予測モードに応じてフィルタリングされることができる。図3の場合には、座標(x,y)における予測画素値は、P(x,y)で示され、参照画素値は、R(x,y)で示されている。双方の参照配列は、2N+1個の参照サンプルを有している。
DC予測モードでは、すべてのターゲット画素は、次式のように計算された単一の値を使用して予測される。
Figure 2021528877

式中、R(x,−1)は、上側の参照配列上の(x,−1)での参照サンプルを表し、R(−1,y)は、左側の参照配列上の(−1,y)での参照サンプルを表し、Nは、ターゲットブロックの幅又は高さ(HEVCでは、すべてのブロックは、正方形形状を有している)を表す。その後、ターゲットブロックの上側境界と左側境界との双方は、フィルタリングされる。ターゲットブロックの座標(0,0)での予測サンプルは、3タップ平滑化フィルタ[1 2 1]/4を使用して、次のようにフィルタリングされる。
P’(0,0)=(R(−1,0)+2×dcVal+R(0,−1)+2)>>2
式中、P’は、予測サンプルのフィルタリング値を表し、R(−1,0)は、座標(−1,0)での参照サンプルを表し、R(0,−1)は、座標(0,−1)での参照サンプルを表す。
上側境界と左側境界とにおける残りの予測サンプルは、2タップフィルタ[3,1]/4を使用して、次のようにフィルタリングされる。
P’(x,0)=(3×dcVal+R(x,−1)+2)>>2,1<=x<N(上側境界)
P’(0,y)=(3×dcVal+R(−1,y)+2)>>2,1<=y<N(左側境界)
複雑さを低く抑えるために、上記の境界フィルタリングは、サイズが16×16以下のルマブロックに対してのみ適用される。
HEVCにおけるPLANAR予測
PLANARモードでは、ターゲット画素での予測は、次のように2つの補間から得られる。
P(x,y)=(P(x,y)+P(x,y)+N)>>(log2(N)+1),0<=x,y<N (2)
式中、P(x,y)及びP(x,y)は、次のようにして得られる垂直補間及び水平補間である。
(x,y)=(N−1−y)×R(x,−1)+(1+y)×R(−1,N), 0<=x,y<N (3)
(x,y)=(N−1−x)×R(−1,y)+(1+x)×R(N,−1), 0<=x,y<N (4)
座標(x,y)におけるターゲット画素について、R(x,−1)は、上側の参照サンプルであり、R(−1,y)は、左側の参照サンプルであり、R(−1,N)は、左下の参照サンプルであり、R(N,−1)は、右上の参照サンプルである。これは、JEMの文脈において図4に示されている。したがって、垂直補間は、すぐ上の参照サンプルと左下の参照サンプルとの間の線形補間であり、水平補間は、すぐ左の参照サンプルと右上の参照サンプルとの間の線形補間である。本出願人は、補間に必要なスケーリングが、式(2)における補間の平均化と組み合わされていることを、理解している。
JEMにおけるPLANAR予測及びDC予測
JEMでは、四本木二本木構造(QTBT)のために、参照配列のそれぞれは、(1+W+H)サンプルを有し、式中、W及びHは、ターゲットブロックのそれぞれ幅及び高さを表す。JEMでは、DCモード及びPLANARモードでの予測は、不均等な高さ及び幅を考慮するために上記の式内に必要とされる変更を除いては、基本的にHEVCと同じである。加えて、境界での不連続性を低減することを目的としたDC予測及びPLANAR予測を改良するために、提案がなされている。
「Unequal weight planar prediction and constrained PDPC」と題するK.Panusopone、S.Hong、L.WangによるJVET−E0068、ジュネーブ、2017年1月における論文「(以下、「JVET−E0068」)は、不均等重みプレーナ(UWP)予測と称されるPLANAR予測の変形例を提案している。垂直補間及び水平補間を形成するために、まず、(W,H)におけるターゲット画素の値P(W,H)が、左下及び右上の参照サンプルの重み付け合計として推定される。
Figure 2021528877
その後、この推定値と、左下及び右上の参照サンプルと、の間を線形補間することにより、ターゲットブロックのすぐ下及びすぐ右の画素の予測値が推定される。
Figure 2021528877
ここで、左側の参照サンプルと、すぐ右に関する推定サンプルと、の間において水平補間が行われる。同様に、上側の参照サンプルと、すぐ下の推定サンプルと、の間において垂直補間が行われる。
(x,y)=(W−1−x)×R(−1,y)+(x+1)×P(W,y)
(x,y)=(H−1−y)×R(x,−1)+(y+1)×P(x,H)
水平補間が、左側の参照により近い方がより正確な予測ができることから、また、垂直補間が、上側の参照により近い方がより正確な予測ができることから、最終的な予測を得るために、2つの補間の加重平均が取られる。
Figure 2021528877
アルゴリズムの最初の部分は、垂直補間及び水平補間を改良することを目的とするものであり、最後の部分は、境界により近い方におけるより正確な補間に対してより大きな重みを与えることにより、境界の平滑化を担当する。計算には分割操作が含まれるので、近似的な予測値を得ることを目的として、シフト演算子及び集計値を使用した代替可能な計算が提供される。
「Simplification and extension of PDPC」と題するX.Zhao、V.Seregin、A.Said、M.KarczewiczによるJVET−H0057、マカオ、2017年10月における論文(以下、「JVET−H0057」)は、PDPCの概念を使用した他の方法を提案している。1つの経路で予測を行うJVET−E0068とは異なり、1経路目では通常の予測方法を使用して初期的イントラ予測値を取得し、2経路目ではターゲットブロックの、上側、左側、及び左上、の参照サンプルを使用して1経路目での予測値を更新する、という2経路方式が提案されている。
P’(x,y)=(wL×R(−1,y)+wT×R(x,−1)+wTL×R(−1,−1)+(64−wL−wT−wTL)×P(x,y)+32)>>6
式中、wL、wT、及びwTLは、左側、上側、及び左上の参照サンプルに対応する重みであり、次のように計算される。
wT=32>>((y<<1)>>shift)
wL=32>>((x<<1)>>shift)
wTL=−((wL>>4)+(wT>>4))
式中、shift=(log2(W)+log2(H)+2)>>2である。PLANAR予測モードとDC予測モードとの双方が、この更新方法を使用している。本出願人が理解しているように、画素が参照配列から離れるにつれて重みが減少するので、この方法は、近くの参照サンプルに対して追加の重みを与えて境界を平滑化することを目的としている。
JVET−E0068及びJVET−H0057の方法とは異なり、境界を平滑化する本出願人による方法は、勾配アプローチに基づくものである。本出願人は、参照サンプルと予測値との差を計算することにより、参照サンプルの位置での勾配を推定する。適切な減衰関数を使用して、本出願人は、ブロック境界におけるターゲット画素の予測値に対して、勾配の漸減部分を追加する。本出願人による方法も、また、通常の予測方法を使用して得られた1経路目からのオリジナル予測値を、勾配を使用して更新することのために、2経路方式である。
PLANARモードに関する境界フィルタリング
一般化のために、ここでは、幅Wかつ高さHの矩形ブロックを想定する。上述したように、PLANARモード予測は、2つの中間構成要素を有している。すなわち、1つの水平補間と、1つの垂直補間と、を有している。これら2つの構成要素の平均が、最終的な予測値を生成する。
線形補間が、強度値の漸次的な変化を提供することのために、水平補間は、ターゲットブロックの左側境界での急激な変化を生成するものではなく、右上の参照サンプルR(W,−1)に依存して、上側の境界で不連続性を生成し得るものである。同様に、垂直補間は、ターゲットブロックの上側の境界での急激な変化を生成するものではなく、左下の参照サンプルR(−1,H)に依存して、左側の境界で不連続性を生成し得るものである。
式(4)における水平補間P(x,y)について考察する。幅Wかつ高さHの矩形ブロックの場合には、次のように書き換えることができる。
(x,y)=(W−1−x)×R(−1,y)+(1+x)×R(W,−1), 0<=x<W;0<=y<H
上側の参照サンプルに対して同じ補間を適用すると、すなわち、左上の参照サンプルと右上の参照サンプルとの間を補間すると、本出願人は、水平補間においてR(x,−1)を予測する予測子を得る。
(x,−1)=(W−1−x)×R(−1,−1)+(1+x)×R(W,−1), 0<=x<W (P1)
よって、上側の参照サンプルでの勾配は、次のように推定することができる。
Δ(x)=R(x,−1)−(P(x,−1)>>log2(W)), 0<=x<W (P2)
そして、本出願人は、水平補間を次のように修正することができる。
P’(x,y)=P(x,y)+W×Δ(x)×L(y), 0<=x<W;0<=y<H
ここでL(y)は、閉区間[0,1]内の値を有する減衰関数である。固定小数点の実装のために、本出願人は、次のような代替可能な定式化を使用することができる。
P’(x,y)=P(x,y)+(W×Δ(x)×L(y)+32)>>6, 0<=x<W;0<=y<H
式中、L(y)は、[0,32]の範囲内で正の整数値を有することができ、例えば、L(y)=(32>>((y<<1)>>shift))であり、式中、shift=(log2(W)−1+log2(H)−1)>>2である。このシフトパラメータ値では、減衰関数は、この場合、ターゲットブロックのサイズによって変化することに注意されたい。
ここで、式(3)における垂直補間P(x,y)について考察する。幅Wかつ高さHの矩形ブロックの場合には、次のように書き換えることができる。
(x,y)=(H−1−y)×R(x,−1)+(1+y)×R(−1,H), 0<=x<W;0<=y<H
同じ補間を左側の参照サンプルに対して適用すると、すなわち、左上の参照サンプルと左下の参照サンプルとの間を補間すると、本出願人は、垂直補間においてR(−1,y)を予測する予測子を得る。
(−1,y)=(H−1−y)×R(−1,−1)+(1+y)×R(−1,H), 0<=y<H (P3)
よって、左側の参照サンプルでの勾配は、次のように推定することができる。
Δ(y)=R(−1,y)−(P(−1,y)>>log2(H)), 0<=y<H (P4)
そして、本出願人は、垂直補間を次のように修正することができる。
P’(x,y)=P(x,y)+H×Δ(y)×L(x), 0<=x<W;0<=y<H
式中、L(x)は、閉区間[0,1]内の値を有する減衰関数である。planar予測には方向性がないので、一般性を何ら失うことなく、本出願人は、L(y)として同じ減衰関数を使用することができる。よって、本出願人は、次のような代替可能な定式化を使用することができる。
P’(x,y)=P(x,y)+(H×Δ(y)×L(x)+32)>>6, 0<=x<W;0<=y<H
式中、L(x)=(32>>((x<<1)>>shift))であり、shift=(log2(W)−1+log2(H)−1)>>2である。
これで、最終的な予測は、式(2)のように求めることができる。
P’(x,y)=(W×P’(x,y)+H×P’(x,y)+W×H)>>(1+log2(W)+log2(H))
=P(x,y)+((Δ(x)×L(y)+Δ(y)×L(x)+64)>>7)
更新は、ダイナミックレンジ外の値を取ることができるので、本出願人は、ダイナミックレンジにクリッピングして上の式を使用することができる。
P’(x,y)=Clip(P(x,y)+((Δ(x)×L(y)+Δ(y)×L(x)+64)>>7)) (P5)
よって、アルゴリズムは、以下のようにまとめることができる。
(i)既存のplanar法と同様に、P(x,y)を計算する。
(ii)式(P1)及び式(P2)のように、0<=x<Wに関して、P(x,−1)を計算し、その後、Δ(x)を計算する。
(iii)式(P3)及び式(P4)のように、0<=y<Hに関して、P(−1,y)を計算し、その後、Δ(y)を計算する。
(iv)式(P5)のようにP(x,y)を更新することにより、P’(x,y)を得る。
(x,−1)及びP(−1,y)の計算が、複雑さの理由のために問題である場合には、本出願人が、水平補間におけるR(x,−1)に関する予測子として、P(x,−1)に代えて、第1の予測行であるP(x,0)を単に使用し得るとともに、垂直補間におけるR(−1,y)に関する予測子として、P(−1,y)に代えて、第1の予測列であるP(0,y)を使用し得ることに、注意されたい。あるいは、本出願人は、以下に示すように、1経路目の予測値P(x,y)の、第1の列及び第1の行を使用した境界フィルタリングに関して、代替可能な定式化を使用することもできる。
同様の境界フィルタリングを実行する代替可能な定式化は、1経路目の予測を直接的に使用することである。この場合、本出願人は、水平方向勾配及び垂直方向勾配を、次のように計算することとなる。
Δ(x)=R(x,−1)−P(x,0), 0<=x<W
Δ(y)=R(−1,y)−P(0,y), 0<=y<H
加えて、本出願人は、また、左上の画素での勾配を、次のように計算することとなる。
Δ=R(−1,−1)−P(0,0)
これらの値を使用して、1経路目の予測は、次のようにフィルタリングされることとなる。
P’(x,y)=Clip(P(x,y)+((Δ(x)×L(y)+Δ(y)×L(x)−Δ×L+32)>>6)) (P6)
式中、L=min(L(x),L(y))である。
上記では、本出願人は、イントラ予測において提案された境界フィルタリング方法を説明するために、JEM6.0におけるPLANARモードを使用している。PLANARモード予測が、垂直部分と水平部分とを使用して構成され、これら2つの部分が、それぞれの参照サンプルにおいて比較的滑らかなものである限り、本方法が、また、他の種類のPLANARモードに対しても適用可能であることに留意されるべきである。例えば、不均等重みプレーナ(UWP)では、提案されたフィルタリングは、中間補間に対して適用することができる。PLANAR予測が中間補間なしで直接的に構成される場合には、上述した代替可能な定式化を使用することができる。
DCモードに関する境界フィルタリング
HEVC及びJEMでは、ターゲットブロックの上側及び左側における参照サンプルを使用した1経路目の予測において、DC値が計算される。その後、2経路目において、上述したように、第1行目の予測値と第1列目の予測値とが、フィルタリングされる。
ここで、本出願人は、DC値の計算を2つのステップへと分けることを提案する。まず、本出願人は、すぐ左の参照サンプルのみを使用して、水平方向DCを計算する。その後、本出願人は、すぐ上の参照サンプルのみを使用して、垂直方向DCを計算する。計算の順序は、重要ではない。最終的なDC値は、水平方向DC値と垂直方向DC値との平均を取って計算する。この計算方法は、ターゲットブロックの幅及び高さの合計が2のべき乗でない時には、JEMで必要とされる分割操作を回避するものではあるけれども、結果として得られる予測は、いくつかの場合には、オリジナルDC値よりも精度が低くなる可能性がある。本出願人が、1経路目の予測の後に境界サンプルをフィルタリングすることにより、予測の不正確さを無視することができる。
本出願人は、水平方向DC及び垂直方向DCを次のように計算する。
Figure 2021528877

その後、ターゲットブロックは、初期的には、次のように予測される。
Figure 2021528877

本出願人は、すぐ上の垂直方向勾配を、次のように計算する。
Δ(x)=R(x,−1)−dcVal, 0<=x<W (D2)
同様に、本出願人は、すぐ左の水平方向勾配を、次のように計算する。
Δ(y)=R(−1,y)−dcVal, 0<=y<H (D3)
本出願人は、左上コーナーの勾配を、次のように計算する。
Δ=((R(−1,0)+R(0,−1))>>1)−dcVal (D4)
その後、予測された画素値は、次のようにフィルタリングされる。
P’(x,y)=Clip(dcVal+((Δ(x)×L(y)+Δ(y)×L(x)−Δ×L+32)>>6)) (D5)
式中、L(x)及びL(y)は、PLANAR境界フィルタリングに関して以前に与えられたものであり、L=min(L(x),L(y))である。
JEMで計算された際のオリジナルDC値が、DCとDCとの加重和として計算され得ることに注意されたい。ここで、重みは、高さH及び幅Wである。
Figure 2021528877

したがって、HEVC及びJEMで行われているように、フィルタリングが、ルマ成分のみに関する小さなブロックサイズのみに適用される場合には、本出願人は、残りのブロックに関するDCモードでの予測値として、dcValorigを使用することができる。
同様の境界フィルタリングを行う代替可能な定式化は、PLANAR境界フィルタリングの場合と同様に導出することができる。水平方向DCは、DC予測として使用される場合には、左側の参照サンプルに近い傾向が大きい(それらの分散が小さい場合)けれども、上側の境界で不連続性が生じる可能性がある。同様に、垂直方向DCは、DC予測として使用された場合には、上側の参照サンプルに近い傾向が大きい(それらの分散が小さい場合)けれども、左側の境界で不連続性が生じる可能性がある。したがって、本出願人は、DCを予測として使用して上側境界フィルタリングを適用し得るとともに、DCを予測として使用して左側境界フィルタリングを適用することができ、その後、双方の平均を取ることができる。
P’(x,y)=DC+(Δ(x)×L(y)+32)<<6, 0<=x<W;0<=y<H
式中、Δ(x)=R(x,−1)−DC, 0<=x<W
P’(x,y)=DC+(Δ(y)×L(x)+32)>>6, 0<=x<W;0<=y<H
ここで、Δ(y)=R(−1,y)−DC, 0<=y<H
Figure 2021528877

=dcVal+((Δ(x)×L(y)+Δ(y)×L(x)+64)>>7)
ここで、dcValは、式(D1)で与えられる。上記と同様に、本出願人は、フィルタリングされた値が、なおも有効なダイナミックレンジ内にあることを確認するために、クリッピングを使用することができる。
P’(x,y)=Clip(dcVal+((Δ(x)×L(y)+Δ(y)×L(x)+64)>>7)), 0<=x<W;0<=y<H
参照サンプルの分散が小さくない場合には、2つのDC値は、反対側の境界で不連続性を生じる可能性があるけれども、それらが計算される境界でもいくらかの不連続性を生じる。したがって、この代替可能な定式化は、上記の定式化と比較して、効率が悪いと予想される。
図5は、一実施形態による、イントラ予測における境界フィルタリングの方法500を示している。方法500では、HEVCコーデックに基づくJEMコーデックが使用されるものと仮定する。ビットストリームがデコーダによって適切に復号されるためには、エンコーダ及びデコーダでのイントラ予測に関して、同じ境界フィルタリング方法が使用されるべきである。
この実施形態では、DCモード又はPLANARモードのいずれかを使用してブロックがイントラ予測された後に、予測されたサンプルは、上述したようにして境界フィルタリングされる。これは、エンコーダ及びデコーダの双方で行われる。この実施形態の単純な変形例では、提案されたフィルタリングは、クロマブロックを除いて、ルマブロックのみに対して適用されることとなる。他の変形例では、小さなサイズのブロックのみを考慮することができる、例えば、図5に示すように、高さ及び幅が16以下であるブロックのみを考慮することができる。
図5を参照すると、ステップ510において、イントラDCモード又はイントラPLANARモードに関して、エンコーダ又はデコーダは、ブロックがルマCUであるかどうかをチェックするとともに、ブロックの幅及び高さが16を超えていないかどうかをチェックする。これらの条件が満たされた場合には、エンコーダ又はデコーダは、例えば上述した方法を使用して、左側の参照サンプルにおける垂直方向勾配と、上側の参照サンプルにおける水平方向勾配とを、計算する(520)。その後、初期予測(すなわち、1経路目)からの予測ブロックを、境界フィルタリングを使用して調整する(530)。その後、フィルタリングされた予測ブロックは、エンコーダ側において予測残差を得るために使用されてもよいし、デコーダ側においてブロックを再構成するために予測残差に対して加算されてもよい。
他の実施形態では、ブロックを、DCモード又はPLANARモードにおいて初期的にイントラ予測した後に、勾配しきい値を使用して、境界フィルタリングを使用するかどうかの決定を行う。その後、勾配しきい値条件が満たされた場合には、ブロックは、境界フィルタリングを受けることとなる。式(P5)を見ると、Δ(x)及びΔ(y)の値がゼロであれば、どの減衰関数に対しても更新項がゼロであることがわかる。その結果、更新を行うことは無意味である。このことは、フィルタリングの決定を行う前に、勾配値に関して合理的なしきい値を適用することを、本出願人に対して動機付ける。勾配値が、ターゲットブロックの境界上において変化し得ることにより、本出願人は、次のように計算し得る平均絶対勾配を考慮することとなる。
Figure 2021528877
|Δ|が、事前設定されたしきい値よりも大きい場合には、本出願人は、勾配フィルタリングを使用し、そうでない場合には、フィルタリングはスキップされる。しきい値は、ビット深度に基づいて、及び/又は、ブロックサイズに基づいて、決定することができる。上側の又は左側の復号されたブロックが利用可能でない場合には、本出願人は、左側のブロックが利用可能であるか又は上側のブロックが利用可能であるかに応じて、|Δ|又は|Δ|のいずれかを使用することとなる。上側のブロックも左側のブロックも利用可能でない場合には、本出願人は、何らの境界フィルタリングも行わないこととなる。
他の実施形態では、本出願人は、複数の減衰関数を使用することができる。最良のRD性能を与える減衰関数は、追加的なビットを使用して、デコーダに対して信号を送出する。例えば、本出願人が2つの減衰関数を使用する場合には、コンテキスト符号化された1つのビットを使用して、本出願人は、より良好な方を信号送出する。本出願人が3つの減衰関数を使用する場合には、最良の減衰関数を示すために、本出願人は、信号送出ビット組合せを、0、10、及び11として使用する。この信号送出は、ブロックレベルで、スライスレベルで、又はフレームレベルで、行うことができる。
他の実施形態では、本出願人は、スライス、フレーム、あるいは、映像シーケンスの任意のフレームにおいて、DC及びPLANARのイントラ予測における境界フィルタリングを使用するとともに、スライスヘッダ、ピクチャパラメータセット(PPS)ヘッダ、又はシーケンスパラメータセット(SPS)ヘッダ、における1ビットフラグを使用して、デコーダに対しての境界フィルタリングの適用を信号送出する。
本出願人は、JVETテストシーケンスから1フレームのみを取り出して、オールイントラ(AI)構成のJVET BMS(ベンチマークセット)コードによって実験を行った。本出願人は、上記において与えられた二項減衰関数を使用した。DC予測モードでは、本出願人は、提案した境界フィルタリングを、幅及び高さが16以下であるルマブロックのみに適用する。PLANAR予測モードでは、本出願人は、提案した境界フィルタリングを、すべての有効なサイズのルマブロックとクロマブロックとの双方に対して適用する。表1及び表2は、JVETベンチマークコード(BMS1.0)についてのDCモード及びPLANARモードにおける提案した境界フィルタリングに関するBDレート性能を示している。計算の複雑さをほとんど変化させることなく、BDレートの低下が約0.15%及び約0.51%であることに、留意されたい。
Figure 2021528877
Figure 2021528877
イントラ予測において提案する境界フィルタリングは、DC予測モード及びPLANAR予測モードにおいてターゲットブロック境界での連続性を改良することを目的としている。提案する方法では、DCモード又はPLANARモードでのイントラ予測が、水平補間/平均値及び垂直補間/平均値に由来することを、考慮する。まず、初期予測子が形成される。その後、上側の参照サンプルと水平補間/平均値との間の差を使用することにより、垂直方向に沿って初期予測子を調整するとともに、左側の参照サンプルと垂直補間/平均値との間の差を使用することにより、水平方向に沿って初期予測子を調整する。
フィルタリングプロセスは、境界参照サンプルで勾配を使用することのために、及び、ビットシフトによって実装し得る二項減衰関数を使用することのために、極めて単純である。したがって、追加的な複雑さの要件は、非常に小さい。これにより、本出願人は、DC予測モード及びPLANAR予測モードにおいてごくわずかに複雑さを増大させるのみで、より高いBDレート性能と、より良好な視覚的品質と、が得られるものと、予想している。
上述したような本実施形態による様々な方法を使用することにより、例えば、図1に示すようなJVET又はHEVCエンコーダ100におけるイントラ予測モジュール(160)、及び、図2に示すようなJVET又はHEVCデコーダ200におけるイントラ予測モジュール(260)、を修正することができる。その上、本実施形態は、JVET又はHEVCに限定されるものではなく、他の規格、他の推奨、及び、その拡張に対して、適用することができる。
様々な方法について本明細書において説明しており、各方法は、説明した方法を達成する、1つ又は複数のステップ、あるいは、1つ又は複数のアクション、を含む。ステップ又はアクションの特定の順序が、方法の適切な動作のために必要とされない限り、特定のステップ及び/又は特定のアクションに関しての、順序及び/又は使用は、変更されてもよいし、また、組み合わされてもよい。別段の指示がない限り、あるいは、技術的に除外されない限り、本明細書において説明する様々な態様は、個々に使用することができる、あるいは、互いに組み合わせて使用することができる。本明細書では、様々な数値が使用されており、例えば、整数実装のためにビットシフトで使用されるパラメータ、フィルタリングパラメータ、及び、イントラ予測のために使用される参照サンプルの数、などが使用されている。特定の数値は、例示の目的のものであり、説明する態様は、これら特定の数値に限定されるものではない。
図6は、一実施形態による、映像データを復号する方法(600)を示している。ステップ610において、複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成し、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとする。ステップ620において、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得する。ステップ630において、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成する。その後、ステップ640において、形成された予測子に応答して、例えば予測ブロックに対して予測残差を加算することによって、サンプルを再構成する。
図7は、一実施形態による、映像データを符号化する方法(700)を示している。ステップ710において、複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成し、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとする。ステップ720において、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得する。ステップ730において、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成する。その後、ステップ740において、形成された予測子に応答して、例えば、オリジナルブロックと予測子ブロックとに基づいて予測残差を形成することにより、その後、変換と量子化とエントロピー符号化とを行うことにより、ブロックを符号化する。
図8は、様々な態様及び様々な実施形態が実装されるシステムの一例に関するブロック図を示している。システム800は、後述する様々な構成要素を含むデバイスとして具現し得るとともに、本出願で説明する1つ又は複数の態様を実行するように構成されている。このようなデバイスの例としては、限定するものではないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビジョン受信機、パーソナル映像録画システム、接続された家電製品、及びサーバ、などの様々な電子デバイスが挙げられる。システム800の様々な構成要素は、単独で又は互いに組み合わせて、単一の集積回路内において、複数のICs内において、及び/又は、個別の部品内において、具現することができる。例えば、少なくとも1つの実施形態では、システム800の処理構成要素及びエンコーダ/デコーダ構成要素は、複数のICsにわたって、及び/又は、個別の部品にわたって、分散している。様々な実施形態では、システム800は、例えば、通信バスを介してあるいは専用の入出力ポートを介して、他のシステムに対してあるいは他の電子デバイスに対して、通信可能に結合される。様々な実施形態では、システム800は、本明細書において説明する様々な態様のうちの1つ又は複数を実装するように構成されている。
システム800は、例えば本明細書において説明する様々な態様を実装するために、内部にロードされた命令を実行するように構成された少なくとも1つのプロセッサ810を含む。プロセッサ810は、当該技術分野において公知なように、組み込みメモリ、入出力インターフェース、及び、様々な他の回路、を含むことができる。システム800は、少なくとも1つのメモリ820(例えば、揮発性メモリデバイス、及び/又は、不揮発性メモリデバイス)を含む。システム800は、ストレージデバイス840を含み、このストレージデバイスは、限定するものではないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、及び/又は、光ディスクドライブを含めた、不揮発性メモリ及び/又は揮発性メモリを含むことができる。ストレージデバイス840は、非限定的な例として、内部ストレージデバイス、付属ストレージデバイス、及び/又は、ネットワークアクセス可能なストレージデバイス、を含むことができる。
システム800は、例えば符号化された映像又は復号された映像を提供するようにデータを処理するように構成されたエンコーダ/デコーダモジュール830を含み、エンコーダ/デコーダモジュール830は、それ自身のプロセッサ及びそれ自身のメモリを含むことができる。エンコーダ/デコーダモジュール830は、符号化機能及び/又は復号機能を実行するためにデバイス内に含まれ得る1つ又は複数のモジュールを表す。公知なように、デバイスは、符号化モジュール及び復号モジュールのうちの、一方又は双方を含むことができる。これに加えて、エンコーダ/デコーダモジュール830は、システム800の別個の構成要素として実装することができる、あるいは、当業者には公知なように、ハードウェア及びソフトウェアの組合せとしてプロセッサ810内に組み込むことができる。
本明細書において説明する様々な態様を実行するためにプロセッサ810又はエンコーダ/デコーダ830上にロードされるべきプログラムコードは、ストレージデバイス840内に記憶することができ、その後、プロセッサ810による実行のためにメモリ820上へとロードすることができる。様々な実施形態によれば、プロセッサ810、メモリ820、ストレージデバイス840、及び、エンコーダ/デコーダモジュール830、のうちの1つ又は複数は、本明細書において説明するプロセスの実行中に、様々な項目のうちの1つ又は複数を記憶することができる。そのような記憶される項目は、限定するものではないが、入力映像、復号された映像又は復号された映像の一部、ビットストリーム、行列、変数、及び、方程式や数式や演算や演算ロジックの処理に起因する中間結果又は最終結果、を含むことができる。
いくつかの実施形態では、プロセッサ810の内部のメモリ、及び/又は、エンコーダ/デコーダモジュール830の内部のメモリは、命令を記憶するために、また、符号化時に又は復号時に必要とされる処理のワーキングメモリを提供するために、使用される。しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ810又はエンコーダ/デコーダモジュール830のうちの、いずれかとすることができる)の外部メモリが、これらの機能のうちの1つ又は複数のために使用される。外部メモリは、メモリ820及び/又はストレージデバイス840とすることができ、例えば、動的揮発性メモリ及び/又は不揮発性フラッシュメモリとすることができる。いくつかの実施形態では、外部不揮発性フラッシュメモリが、テレビジョンのオペレーティングシステムを記憶するために使用される。少なくとも1つの実施形態では、RAMなどの高速の外部動的揮発性メモリが、MPEG−2やHEVCやVVC(多用途映像符号化)などの映像符号化操作及び映像復号操作のワーキングメモリとして使用される。
システム800の構成要素に対する入力は、ブロック805で示すような様々な入力デバイスを介して提供され得る。そのような入力デバイスは、限定するものではないが、(i)例えば放送事業者によって空中を通して送信されたRF信号を受信するRF部分、(ii)複合入力端子、(iii)USB入力端子、及び/又は、(iv)HDMI(登録商標)入力端子、を含む。
様々な実施形態では、ブロック805の入力デバイスは、当該技術分野で公知なように、関連付けられたそれぞれの入力処理構成要素を有している。例えば、RF部分は、(i)所望の周波数の選択(信号の選択とも称される、また、周波数帯域への信号の帯域制限とも称される)、(ii)選択された信号のダウンコンバート、(iii)特定の実施形態ではチャネルと称され得る信号周波数帯域を(例えば)選択する、より狭い周波数帯域への再度の帯域制限、(iv)ダウンコンバートされて帯域制限された信号の復調、(v)エラー補正の実行、及び、(vi)データパケットの所望ストリームを選択する多重化解除、に適した構成要素と関連付けることができる。様々な実施形態のRF部分は、これらの機能を実行する1つ又は複数の構成要素を含み、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー補正器、及び、デマルチプレクサ、を含む。RF部分は、例えば、受信信号をより低い周波数(例えば、中間周波数、又は、ベースバンド近傍の周波数)へとダウンコンバートすることあるいは受信信号をベースバンドへとダウンコンバートすることを含むこれらの様々な機能を実行するチューナを含むことができる。セットトップボックスの一実施形態では、RF部分及びその関連する入力処理構成要素は、有線(例えば、ケーブル)媒体を介して送信されたRF信号を受信し、所望の周波数帯域へと、フィルタリングとダウンコンバートと再度のフィルタリングとを行うことによって、周波数選択を実行する。様々な実施形態では、上述した(及び他の)構成要素の順序を再配置したり、これらの構成要素の一部を省略したり、及び/又は、同様の機能又は異なる機能を実行する他の構成要素を追加したり、する。構成要素の追加は、既存の構成要素どうしの間に構成要素を挿入することを含むことができ、例えば、増幅器及びアナログ/デジタルコンバータを挿入することを含むことができる。様々な実施形態では、RF部分は、アンテナを含む。
これに加えて、USB端子及び/又はHDMI(登録商標)端子は、USB接続及び/又はHDMI(登録商標)接続を介してシステム800を他の電子機器に対して接続するそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な態様が、例えばリード−ソロモンエラー補正が、必要に応じて、例えば、別個の入力処理IC内に又はプロセッサ810内に実装され得ることは、理解されよう。同様に、USBインターフェース処理又はHDMI(登録商標)インターフェース処理の態様は、必要に応じて、別個のインターフェースICs内で又はプロセッサ810内で実装することができる。復調され、エラー補正され、多重化解除されたストリームは、例えば、プロセッサ810に対して、ならびに、メモリ素子及びストレージ素子と組み合わせて動作するエンコーダ/デコーダ830、を含む様々な処理構成要素に対して提供され、これにより、出力デバイス上への提示のために、必要に応じて、データストリームが処理される。
システム800の様々な構成要素は、一体化されたハウジング内に設けることができる。一体化されたハウジング内では、様々な構成要素を相互接続することができ、適切な接続構成815を使用して、例えば、I2Cバスや配線やプリント回路基板を含めた当該技術分野で公知の内部バスを使用して、それらの間でデータを送信することができる。
システム800は、通信チャネル890を介して他のデバイスとの通信を可能にする通信インターフェース850を含む。通信インターフェース850は、限定するものではないが、通信チャネル890を介してデータを送受信するように構成されたトランシーバを含むことができる。通信インターフェース850は、限定するものではないが、モデム又はネットワークカードを含むことができ、通信チャネル890は、例えば、有線媒体及び/又は無線媒体内で実装することができる。
データは、様々な実施形態では、IEEE802.11などのWi−Fiネットワークを使用して、システム800に対してストリーミングされる。これらの実施形態のWi−Fi信号は、Wi−Fi通信のために適合された通信チャネル890及び通信インターフェース850を介して、受信される。これらの実施形態の通信チャネル890は、典型的には、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするために、インターネットを含む外部ネットワークに対してのアクセスを提供するアクセスポイント又はルータに対して接続される。他の実施形態では、入力ブロック805のHDMI(登録商標)接続を介してデータを配信するセットトップボックスを使用して、システム800に対して、ストリーミングデータを提供する。さらに他の実施形態では、入力ブロック805のRF接続を使用して、システム800に対して、ストリーミングデータを提供する。
システム800は、ディスプレイ865、スピーカ875、及び、他の周辺機器885を含めた、様々な出力デバイスに対して出力信号を提供することができる。他の周辺機器885は、実施形態の様々な例では、スタンドアロンDVR、ディスクプレーヤ、ステレオシステム、照明システム、及び、システム800の出力に基づいて機能を提供する他のデバイス、のうちの1つ又は複数を含む。様々な実施形態では、制御信号は、AV.Linkや、CECや、ユーザの介入の有無にかかわらずデバイスどうしの間の制御を可能にする他の通信プロトコル、などの信号送出を使用して、システム800と、ディスプレイ865又はスピーカ875又は他の周辺機器885と、の間にわたって通信される。出力デバイスは、それぞれのインターフェース860、870、及び880を介した専用の接続を介して、システム800に通信可能に結合することができる。これに代えて、出力デバイスは、通信インターフェース850を介して、通信チャネル890を使用して、システム800に対して接続することができる。ディスプレイ865及びスピーカ875は、例えばテレビジョンなどの電子デバイス内において、システム800の他の構成要素と一緒に、単一ユニットとして一体化することができる。様々な実施形態では、ディスプレイインターフェース860は、ディスプレイドライバを含み、例えばタイミングコントローラ(Tコン)チップを含む。
ディスプレイ865及びスピーカ875は、これに代えて、例えば入力805のRF部分が個別のセットトップボックスの一部である場合には、1つ又は複数の他の構成要素とは、個別のものとすることができる。ディスプレイ865及びスピーカ875が外部構成要素である様々な実施形態では、出力信号は、例えばHDMI(登録商標)ポートやUSBポートや複合出力を含む専用の出力接続を介して、提供することができる。
一実施形態によれば、映像を復号する方法が提示され、この方法は、複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、サンプルを再構成することと、を含む。
他の実施形態によれば、映像を符号化する方法が提示され、この方法は、複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、ブロックを符号化することと、を含む。
他の実施形態によれば、映像を復号する装置が提示され、この装置は、1つ又は複数のプロセッサを含み、この1つ又は複数のプロセッサは、複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、サンプルを再構成することと、を実行するように構成されている。装置は、1つ又は複数のメモリをさらに含むことができる。
他の実施形態によれば、映像を符号化する装置が提示され、この装置は、1つ又は複数のプロセッサを含み、この1つ又は複数のプロセッサは、複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成することであって、複数の隣接する参照サンプルを、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含むものとすることと、第1参照サンプルについて第1予測子を取得し、第2参照サンプルについて第2予測子を取得することと、サンプルに関する初期予測子を、(1)第1参照サンプルと第1予測子との間の第1差に基づいて、及び、(2)第2参照サンプルと第2予測子との間の第2差に基づいて、調整し、これにより、サンプルに関する予測子を形成することと、形成された予測子に応答して、ブロックを符号化することと、を実行するように構成されている。装置は、1つ又は複数のメモリをさらに含むことができる。
一実施形態によれば、第1参照サンプルは、復号されるべき又は符号化されるべきブロックに対して隣接しているとともに、サンプルと同じ水平方向位置にあり、第2参照サンプルは、復号されるべき又は符号化されるべきブロックに対して隣接しているとともに、サンプルと同じ垂直方向位置にある。
一実施形態によれば、第1差は、復号されるべき又は符号化されるべきブロック内のサンプルの垂直方向位置に依存する第1スケーリングファクタによってスケーリングされ、第2差は、復号されるべき又は符号化されるべきブロック内のサンプルの水平方向位置に依存する第2スケーリングファクタによってスケーリングされる。
一実施形態によれば、第1スケーリングファクタ及び第2スケーリングファクタは、ブロックの幅及び高さのうちの少なくとも1つに依存する。
一実施形態によれば、第1予測子は、ブロックの上側の参照サンプルを使用して取得され、第2予測子は、ブロックの左側の参照サンプルを使用して取得される。
一実施形態によれば、第1予測子は、左上の参照サンプルと右上の参照サンプルとの補間であり、第2予測子は、左上の参照サンプルと左下の参照サンプルとの補間である。
一実施形態によれば、ブロック内の第2サンプルを、第1参照サンプルに対して隣接するものとした時に、その第2サンプルに関する予測子が、第1予測子として使用され、ブロック内の第3サンプルを、第2参照サンプルに対して隣接するものとした時に、その第3サンプルに関する予測子が、第2予測子として使用される。
一実施形態によれば、サンプルに関する初期予測子を調整するかどうかは、第1差及び第2差に基づくものとされる。一例では、それぞれが参照サンプルに対応した複数の差が取得され、サンプルに関する初期予測値は、それら複数の差の平均に基づいて調整されるべきであることが決定される。
一実施形態によれば、サンプルに関する初期予測子を調整するかどうかは、さらに、ブロックのビット深度とブロックサイズとのうちの少なくとも1つに基づくものとされる。
一実施形態によれば、ブロックは、DCイントラ予測モードで又はplanarイントラ予測モードで、復号される又は符号化される。
一実施形態によれば、ブロックは、DCモードで、復号され又は符号化され、第1予測子は、上側の参照サンプルの平均に対応し、第2予測子は、左側の参照サンプルの平均に対応している。
一実施形態は、命令を含むコンピュータプログラムを提供するものであり、その命令は、1つ又は複数のプロセッサによって実行された時には、1つ又は複数のプロセッサに、上述した任意の実施形態による符号化方法又は復号方法を実行させる。本実施形態の1つ又は複数は、また、上述した方法により映像データを符号化又は復号する命令を記憶したコンピュータ可読ストレージ媒体を提供する。1つ又は複数の実施形態は、また、上述した方法により生成されたビットストリームを記憶したコンピュータ可読ストレージ媒体を提供する。1つ又は複数の実施形態は、また、上述した方法により生成されたビットストリームを送信又は受信する、方法及び装置を提供する。
様々な実装は、復号を含む。本出願において使用された際には、「復号」は、表示に適した最終出力を生成するために、例えば受信した符号化済みシーケンスに対して実行されるプロセスのすべて又は一部を包含することができる。様々な実施形態では、そのようなプロセスは、例えば、エントロピー復号、逆量子化、逆変換、及び差分復号などの、デコーダによって典型的に実行されるプロセスのうちの1つ又は複数を含む。「復号プロセス」という表現が、操作の部分集合を具体的に参照することを意図しているか、あるいは、一般的により広義の復号プロセスを参照することを意図しているかは、特定の説明に関する文脈に基づいて明らかであり、当業者によって十分に理解されるものと考えられる。
様々な実施形態は、符号化を含む。「復号」に関する上記の説明と同様に、本出願において使用された際には、「符号化」は、符号化されたビットストリームを生成するために、例えば入力映像シーケンスに対して実行されるプロセスのすべて又は一部を包含することができる。
本明細書において説明する実装及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、あるいは、信号、で実装することができる。単一の実装形態の文脈においてのみ説明されている場合であっても(例えば、方法としてのみ説明されている)、説明された特徴点の実施形態は、また、他の形態(例えば、装置又はプログラム)においても実施することができる。装置は、例えば、適切なハードウェア、適切なソフトウェア、及び適切なファームウェアで、実装することができる。方法は、例えば、例えばプロセッサなどの装置で実装することができ、ここでの装置は、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブルロジックデバイス、を含む一般的な処理デバイスを参照する。プロセッサは、また、通信デバイスを含み、この通信デバイスは、例えば、コンピュータ、携帯電話、ポータブル/パーソナルのデジタルアシスタント(「PDAs」)、及び、エンドユーザどうしの間の情報通信を容易とする他のデバイス、を含む。
「1つの実施形態」又は「一実施形態」又は「1つの実装」又は「一実装」、及び、これらの他の変形、に対する参照は、その実施形態に関連して説明した特定の特徴点や構造や特性などが、少なくとも1つの実施形態の中に含まれていることを意味する。よって、本明細書中の様々な箇所に現れる「1つの実施形態では」又は「一実施形態では」又は「1つの実装では」又は「一実装では」という表現の出現、及び、任意の他の変形表現の出現は、必ずしもすべてが同じ実施形態を参照しているわけではない。
これに加えて、本明細書では、情報の様々な断片を「決定すること」を参照することができる。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、あるいは、メモリから情報を取り出すこと、のうちの1つ又は複数を含むことができる。
さらに、本明細書では、情報の様々な断片に対して「アクセスすること」を参照することができる。情報に対してアクセスすることは、例えば、情報を受信すること、情報を(例えば、メモリから)取り出すこと、情報を記憶すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を決定すること、情報を予測すること、あるいは、情報を推定すること、のうちの1つ又は複数を含むことができる。
これに加えて、本明細書では、情報の様々な断片を「受信すること」を参照することができる。「受信すること」は、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報に対してアクセスすること、あるいは、情報を(例えば、メモリから)取り出すこと、のうちの1つ又は複数を含むことができる。さらに、「受信すること」は、典型的には、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を決定すること、情報を予測すること、あるいは、情報を推定すること、のうちの1つ又は複数の操作の最中に、ある方法で又は他の方法で、関与する。
例えば、「A/B」、「A及び/又はB」、「A及びBのうちの少なくとも1つ」などの場合における、「/」、「及び/又は」、「のうちの少なくとも1つ」のいずれかの使用が、第1に記載された選択肢(A)のみの選択、又は、第2に記載された選択肢(B)のみの選択、又は、双方の選択肢(A及びB)の選択、を包含することが意図されていることは、理解されよう。さらなる例として、「A、B、及び/又は、C」及び「A、B、及びC、のうちの少なくとも1つ」の場合には、そのような表現は、第1に記載された選択肢(A)のみの選択、又は、第2に記載された選択肢(B)のみの選択、又は、第3に記載された選択肢(C)のみの選択、又は、第1及び第2に記載された選択肢(A及びB)のみの選択、又は、第1及び第3に記載された選択肢(A及びC)のみの選択、又は、第2及び第3に記載された選択肢(B及びC)のみの選択、又は、すべての選択肢(A及びB及びC)の選択、を包含することが意図されている。これは、本技術及び関連技術の当業者には自明なように、記載される項目の数だけ、拡張することができる。
当該技術分野の当業者には自明であるように、実装は、例えば記憶され得る又は送信され得る情報を搬送するためにフォーマットされた様々な信号を生成することができる。情報は、例えば、方法を実行する命令、あるいは、説明された実装のいずれかによって生成されたデータ、を含むことができる。例えば、信号は、説明した実施形態のビットストリームを搬送するようにフォーマットすることができる。そのような信号は、例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用して)、あるいは、ベースバンド信号として、フォーマットすることができる。フォーマット化は、例えば、データストリームを符号化することと、符号化されたデータストリームによってキャリアを変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログ情報又はデジタル情報とすることができる。信号は、公知のように、様々に異なる有線リンク又は無線リンクを介して、送信することができる。信号は、プロセッサ可読媒体上に記憶することができる。

Claims (15)

  1. 映像を復号する方法であって、
    複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成することであって、前記複数の隣接する参照サンプルが、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含む、形成することと、
    前記第1参照サンプルに関する第1予測子を取得すること及び前記第2参照サンプルに関する第2予測子を取得することと、
    前記サンプルに関する前記初期予測子を、(1)前記第1参照サンプルと前記第1予測子との間の第1差に基づいて、及び、(2)前記第2参照サンプルと前記第2予測子との間の第2差に基づいて調整し、前記サンプルに関する予測子を形成することと、
    前記形成された予測子に応答して前記サンプルを再構築することと、を含む、方法。
  2. 映像を符号化する方法であって、
    複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成することであって、前記複数の隣接する参照サンプルが、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含む、形成することと、
    前記第1参照サンプルに関する第1予測子を取得すること及び前記第2参照サンプルに関する第2予測子を取得することと、
    前記サンプルに関する前記初期予測子を、(1)前記第1参照サンプルと前記第1予測子との間の第1差に基づいて、及び、(2)前記第2参照サンプルと前記第2予測子との間の第2差に基づいて調整し、前記サンプルに関する予測子を形成することと、
    前記形成された予測子に応答して前記ブロックを符号化することと、を含む、方法。
  3. 映像を復号する装置であって、
    1つ又は複数のプロセッサであって、前記1つ又は複数のプロセッサが、
    複数の隣接する参照サンプルを使用して、復号されるべきブロック内のサンプルに関する初期予測子を形成し、ここにおいて、前記複数の隣接する参照サンプルが、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含み、
    前記第1参照サンプルに関する第1予測子を取得及び前記第2参照サンプルに関する第2予測子を取得し、
    前記サンプルに関する前記初期予測子を、(1)前記第1参照サンプルと前記第1予測子との間の第1差に基づいて、及び、(2)前記第2参照サンプルと前記第2予測子との間の第2差に基づいて調整し、前記サンプルに関する予測子を形成し、
    前記形成された予測子に応答して前記サンプルを再構築するように構成される、1つ又は複数のプロセッサを含む、装置。
  4. 映像を符号化する装置であって、
    1つ又は複数のプロセッサであって、前記1つ又は複数のプロセッサが、
    複数の隣接する参照サンプルを使用して、符号化されるべきブロック内のサンプルに関する初期予測子を形成し、ここにおいて、前記複数の隣接する参照サンプルが、隣接する上側のブロックからの第1参照サンプルと、隣接する左側のブロックからの第2参照サンプルと、を含み、
    前記第1参照サンプルに関する第1予測子を取得及び前記第2参照サンプルに関する第2予測子を取得し、
    前記サンプルに関する前記初期予測子を、(1)前記第1参照サンプルと前記第1予測子との間の第1差に基づいて、及び、(2)前記第2参照サンプルと前記第2予測子との間の第2差に基づいて調整し、前記サンプルに関する予測子を形成し、
    前記形成された予測子に応答して前記ブロックを符号化するように構成される、1つ又は複数のプロセッサを含む、装置
  5. 前記第1参照サンプルが、復号又は符号化されるべき前記ブロックに隣接し、かつ前記サンプルと同じ水平方向位置にあり、前記第2参照サンプルが、復号又は符号化されるべき前記ブロックに隣接し、かつ前記サンプルと同じ垂直方向位置にある、請求項1もしくは2に記載の方法、又は請求項3もしくは4に記載の装置。
  6. 前記第1差が、復号又は符号化されるべき前記ブロック内の前記サンプルの垂直方向位置に依存する第1スケーリングファクタによってスケーリングされ、前記第2差が、復号又は符号化されるべき前記ブロック内の前記サンプルの水平方向位置に依存する第2スケーリングファクタによってスケーリングされる、請求項1、2、5のいずれかに記載の方法、又は請求項3〜5のいずれか1項に記載の装置。
  7. 前記第1スケーリングファクタ及び前記第2スケーリングファクタが、前記ブロックの幅及び高さのうちの少なくとも1つに依存する、請求項1、2、5、及び6のいずれか1項に記載の方法、又は請求項3〜6のいずれか1項に記載の装置。
  8. 前記第1予測子が、前記ブロックの上側の参照サンプルを使用して取得され、前記第2予測子が、前記ブロックの左側の参照サンプルを使用して取得される、請求項1、2及び5〜7のいずれか1項に記載の方法、又は請求項3〜7のいずれか1項に記載の装置。
  9. 前記第1予測子が、左上の参照サンプルと右上の参照サンプルとの補間であり、前記第2予測子が、左上の参照サンプルと左下の参照サンプルとの補間である、請求項8に記載の方法、又は請求項8に記載の装置。
  10. 前記ブロック内の第2サンプルに関する予測子が前記第1予測子として使用され、前記第2サンプルが前記第1参照サンプルに隣接し、前記ブロック内の第3サンプルに関する予測子が前記第2の予測子として使用され、前記第3サンプルが前記第2参照サンプルに隣接する、請求項1、2及び5〜9のいずれか1項に記載の方法、又は請求項3〜9のいずれか1項に記載の装置。
  11. 前記サンプルに関する前記初期予測子を調整するかどうかが、前記第1差及び前記第2差に基づく、請求項1、2及び3〜10のいずれか1項に記載の方法、及び請求項3〜10に記載の装置。
  12. 前記1つ又は複数のプロセッサが、
    それぞれが参照サンプルに対応した複数の差を取得することと、
    前記サンプルに関する前記初期予測値が前記複数の差の平均に基づいて調整されるべきであることを決定することと、を実行するようにさらに構成される、請求項11に記載の方法、又は請求項11に記載の装置。
  13. 前記サンプルに関する前記初期予測子を調整するかどうかが、前記ブロックのビット深度とブロックサイズとのうちの少なくとも1つにさらに基づく、請求項11もしくは12に記載の方法、又は請求項11もしくは12に記載の装置。
  14. 前記ブロックが、DC又はplanarイントラ予測モードで復号又は符号化される、請求項1、2及び3〜13のいずれか1項に記載の方法、又は請求項3〜13のいずれか1項に記載の装置。
  15. 前記ブロックが、DCモードで、復号又は符号化され、前記第1予測子が、上側の参照サンプルの平均に対応し、前記第2予測子が、左側の参照サンプルの平均に対応する、請求項1、2及び3〜14のいずれか1項に記載の方法、又は請求項3〜14のいずれか1項に記載の装置。
JP2020554486A 2018-06-18 2019-04-29 イントラ予測におけるplanarモード及びdcモードの境界フィルタリング Active JP7473478B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18305746 2018-06-18
EP18305746.2 2018-06-18
EP18306108.4 2018-08-13
EP18306108.4A EP3611920A1 (en) 2018-08-13 2018-08-13 Boundary filtering for planar and dc modes in intra prediction
PCT/US2019/029724 WO2019245650A1 (en) 2018-06-18 2019-04-29 Boundary filtering for planar and dc modes in intra prediction

Publications (3)

Publication Number Publication Date
JP2021528877A true JP2021528877A (ja) 2021-10-21
JPWO2019245650A5 JPWO2019245650A5 (ja) 2022-05-12
JP7473478B2 JP7473478B2 (ja) 2024-04-23

Family

ID=66554474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020554486A Active JP7473478B2 (ja) 2018-06-18 2019-04-29 イントラ予測におけるplanarモード及びdcモードの境界フィルタリング

Country Status (6)

Country Link
US (1) US11368677B2 (ja)
EP (1) EP3808079A1 (ja)
JP (1) JP7473478B2 (ja)
CN (1) CN112272950A (ja)
MX (1) MX2020013481A (ja)
WO (1) WO2019245650A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020211849A1 (en) * 2019-04-19 2020-10-22 Huawei Technologies Co., Ltd. Method and apparatus for division-free intra-prediction
CN117478878A (zh) * 2019-07-09 2024-01-30 北京字节跳动网络技术有限公司 用于自适应环路滤波的样点确定
CN114503594B (zh) 2019-09-22 2024-04-05 北京字节跳动网络技术有限公司 自适应环路滤波中样点填充的选择性应用
EP4022910A4 (en) 2019-09-27 2022-11-16 Beijing Bytedance Network Technology Co., Ltd. ADAPTIVE LOOP FILTERING BETWEEN DIFFERENT VIDEO UNITS
WO2021068906A1 (en) 2019-10-10 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Padding process at unavailable sample locations in adaptive loop filtering

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015109695A (ja) * 2010-01-07 2015-06-11 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP2016040935A (ja) * 2011-06-20 2016-03-24 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像符号化/復号化方法及びその装置
US20170310986A1 (en) * 2014-12-11 2017-10-26 Mediatek Inc. Method and apparatus of intra prediction in video coding

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2658263T3 (pl) * 2010-12-22 2023-03-13 Lg Electronics Inc. Sposób predykcji wewnątrzramkowej i urządzenie wykorzystujące ten sposób
KR101383775B1 (ko) * 2011-05-20 2014-04-14 주식회사 케이티 화면 내 예측 방법 및 장치
GB2494468B (en) * 2011-09-12 2014-01-15 Canon Kk Method and device for encoding or decoding information representing prediction modes
US9282344B2 (en) * 2011-11-04 2016-03-08 Qualcomm Incorporated Secondary boundary filtering for video coding
WO2014003421A1 (ko) * 2012-06-25 2014-01-03 한양대학교 산학협력단 비디오 부호화 및 복호화를 위한 방법
US10499053B2 (en) * 2014-10-31 2019-12-03 Mediatek Inc. Method of improved directional intra prediction for video coding
US10523949B2 (en) * 2016-05-25 2019-12-31 Arris Enterprises Llc Weighted angular prediction for intra coding
CN114286091A (zh) * 2016-09-05 2022-04-05 Lg电子株式会社 图像编码和解码方法、比特流存储介质及数据传输方法
US11166036B2 (en) * 2016-09-30 2021-11-02 Lg Electronics Inc. Image processing method and apparatus therefor
KR102424239B1 (ko) * 2017-04-28 2022-07-25 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015109695A (ja) * 2010-01-07 2015-06-11 株式会社東芝 動画像符号化装置及び動画像復号化装置
JP2016040935A (ja) * 2011-06-20 2016-03-24 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像符号化/復号化方法及びその装置
US20170310986A1 (en) * 2014-12-11 2017-10-26 Mediatek Inc. Method and apparatus of intra prediction in video coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIN, JIAN-LIANG ET AL.: "3D-CE5 related: Removal of Boundary Filters for Depth Intra Prediction", JCT3V-G0051 (VERSION 2), JPN6023022033, 23 July 2014 (2014-07-23), pages 1 - 5, ISSN: 0005073267 *

Also Published As

Publication number Publication date
MX2020013481A (es) 2021-02-26
WO2019245650A1 (en) 2019-12-26
US11368677B2 (en) 2022-06-21
CN112272950A (zh) 2021-01-26
US20210195171A1 (en) 2021-06-24
EP3808079A1 (en) 2021-04-21
JP7473478B2 (ja) 2024-04-23

Similar Documents

Publication Publication Date Title
JP7473478B2 (ja) イントラ予測におけるplanarモード及びdcモードの境界フィルタリング
KR20210083353A (ko) 이웃 샘플 의존 파라메트릭 모델에 기초한 코딩 모드의 단순화
US11985306B2 (en) Method and apparatus for video encoding and decoding with matrix based intra-prediction
EP3954118A1 (en) Wide angle intra prediction with sub-partitions
EP3854098A1 (en) Method and device for picture encoding and decoding
CN111937383B (zh) 视频编码和解码中的色度量化参数调整
WO2020086248A1 (en) Method and device for picture encoding and decoding
WO2020263799A1 (en) High level syntax for controlling the transform design
KR20220053516A (ko) 비디오 인코딩 및 디코딩에 대한 인트라 예측
EP3641311A1 (en) Encoding and decoding methods and apparatus
JP2021528893A (ja) 可変重みを使用する複数参照イントラ予測
US20220256161A1 (en) Method and apparatus for video encoding and decoding with matrix based intra-prediction
US11991389B2 (en) Method and apparatus for video encoding and decoding with optical flow based on boundary smoothed motion compensation
EP3611920A1 (en) Boundary filtering for planar and dc modes in intra prediction
US11563975B2 (en) Motion compensation boundary filtering
CN118077198A (zh) 用于对视频进行编码/解码的方法和装置
WO2024002699A1 (en) Intra sub-partition improvements
WO2021001215A1 (en) Chroma format dependent quantization matrices for video encoding and decoding
WO2024012810A1 (en) Film grain synthesis using encoding information
WO2020260310A1 (en) Quantization matrices selection for separate color plane mode
WO2023194104A1 (en) Temporal intra mode prediction
WO2024064329A1 (en) Reinforcement learning-based rate control for end-to-end neural network bsed video compression
EP3997876A1 (en) Luma to chroma quantization parameter table signaling
CN117616750A (zh) 基于模板的帧内模式推导

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220428

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240411

R150 Certificate of patent or registration of utility model

Ref document number: 7473478

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150