JP2022500895A - イントラ変換コード化及び広角イントラ予測の調和 - Google Patents

イントラ変換コード化及び広角イントラ予測の調和 Download PDF

Info

Publication number
JP2022500895A
JP2022500895A JP2021509169A JP2021509169A JP2022500895A JP 2022500895 A JP2022500895 A JP 2022500895A JP 2021509169 A JP2021509169 A JP 2021509169A JP 2021509169 A JP2021509169 A JP 2021509169A JP 2022500895 A JP2022500895 A JP 2022500895A
Authority
JP
Japan
Prior art keywords
prediction
block
video block
rectangular
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021509169A
Other languages
English (en)
Other versions
JPWO2020061319A5 (ja
Inventor
ナセル,カラム
ラケイプ,ファビアン
ラス,ガガン
Original Assignee
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターデジタル ヴイシー ホールディングス, インコーポレイテッド filed Critical インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Publication of JP2022500895A publication Critical patent/JP2022500895A/ja
Publication of JPWO2020061319A5 publication Critical patent/JPWO2020061319A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

位置依存イントラ予測コンビネーションと共に広角イントラ予測を使用するための方法及び機器。広角イントラ予測は従来の45度よりも高いイントラ予測方向角度を使用可能にする。更に、位置依存イントラ予測コンビネーション(PDPC)は次世代のビデオコード化H.266/VVCのための仕様に採用され、ブロックの辺沿いのより多くの参照ピクセルを使用可能にする。一実施形態では、コード化又は復号されるビデオブロックが正方形ではない場合、ブロックの長辺方向において追加のイントラ予測方向が使用可能にされる。インデックスが予測方向を示すために使用され、ブロックの短辺沿いの相応に少ない予測方向を伴って長手方向の追加のイントラ予測に応じて適応され得る。このことはインデックス付けする必要がある予測モードの数を維持するが、予測モードの角度がブロックの形状に対応することを可能にする。

Description

技術分野
本明細書の実施形態の少なくとも1つは一般に、ビデオを符号化又は復号、圧縮又は解凍するための方法又は機器に関する。
背景
高い圧縮効率を実現するために、画像及びビデオのコード化方式は通常、動きベクトル予測を含む予測及び変換を使用してビデオコンテンツ内の空間的及び時間的な冗長性を活用する。概して、フレーム内の又はフレーム間の相関を利用するためにイントラ予測又はインタ予測が使用され、その後、予測誤差又は予測残差として示されることが多い原画像と予測画像との差が変換され、量子化され、エントロピーコード化される。ビデオを再構築するために、エントロピーコード化、量子化、変換、及び予測に対応する逆のプロセスによって圧縮データが復号される。
Versatile Video Coding(VVC)規格の開発ではブロックの形状が矩形であり得る。矩形のブロックは広角イントラ予測モードをもたらす。
概要
本明細書の実施形態の少なくとも1つは一般にビデオを符号化し又は復号するための方法又は機器に関し、より具体的にはビデオ符号器又はビデオ復号器における最大変換サイズと変換コード化ツールとの間の相互作用のための方法又は機器に関する。
第1の態様によれば方法が提供される。この方法は、矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して矩形ビデオブロックのサンプルを予測するためのステップであって、矩形ブロックのアスペクト比に比例して広角の数が増加し、矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される、予測するためのステップと、イントラコード化モードにおいて前述の予測を使用して矩形ビデオブロックを符号化するためのステップとを含む。
第2の態様によれば方法が提供される。この方法は、矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して矩形ビデオブロックのサンプルを予測するためのステップであって、矩形ブロックのアスペクト比に比例して広角の数が増加し、矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される、予測するためのステップと、イントラコード化モードにおいて前述の予測を使用して矩形ビデオブロックを復号するためのステップとを含む。
別の態様によれば機器が提供される。この機器はプロセッサを含む。プロセッサは、上記の方法の何れかを実行することによってビデオのブロックを符号化するように又はビットストリームを復号するように構成され得る。
少なくとも1つの実施形態の別の全般的な側面によれば、復号の実施形態の何れかによる機器と、(i)信号を受信するように構成されるアンテナであって、信号はビデオブロックを含む、アンテナ、(ii)ビデオブロックを含む周波数帯域に受信信号を制限するように構成される帯域制限器、又は(iii)ビデオブロックを表す出力を表示するように構成されるディスプレイのうちの少なくとも1つとを含む装置が提供される。
少なくとも1つの実施形態の別の全般的な側面によれば、記載した符号化の実施形態又はその改変形態の何れかに従って生成されるデータコンテンツを含む非一時的コンピュータ可読媒体が提供される。
少なくとも1つの実施形態の別の全般的な側面によれば、記載した符号化の実施形態又はその改変形態の何れかに従って生成されるビデオデータを含む信号が提供される。
少なくとも1つの実施形態の別の全般的な側面によれば、記載した符号化の実施形態又はその改変形態の何れかに従って生成されるデータコンテンツを含むようにビットストリームがフォーマットされる。
少なくとも1つの実施形態の別の全般的な側面によれば、コンピュータによってプログラムが実行されるとき、記載した復号の実施形態又はその改変形態の何れかをコンピュータに実行させる命令を含むコンピュータプログラム製品が提供される。
添付図面に関連して読まれる例示的実施形態の以下の詳細な説明から全般的な態様のこれらの及び他の側面、特徴、及び利点が明らかになる。
図面の簡単な説明
幅が高さを上回る横長な矩形の場合のイントラ方向の置換の一例を示し、2つのモード(#2及び#3)が広角モード(35及び36)によって置換される。 標準的な汎用ビデオ圧縮方式を示す。 標準的な汎用ビデオ解凍方式を示す。 記載する全般的な態様を実装するためのプロセッサベースのサブシステムの一例を示す。 記載する態様に基づく方法の一実施形態を示す。 記載する態様に基づく方法の別の実施形態を示す。 記載する態様に基づく機器の一例を示す。
詳細な説明
本明細書の実施形態の少なくとも1つは一般に、ビデオを符号化又は復号及び圧縮するための方法又は機器に関し、より詳細には強化された複数の変換及び/又は二次変換が広角イントラ予測と組み合わせて使用されるイントラ予測残差の変換コード化に関係する部分に関する。
高い圧縮効率を実現するために、画像及びビデオのコード化方式は通常、動きベクトル予測を含む予測及び変換を使用してビデオコンテンツ内の空間的及び時間的な冗長性を活用する。概して、フレーム内の又はフレーム間の相関を利用するためにイントラ予測又はインタ予測が使用され、その後、予測誤差又は予測残差として示されることが多い原画像と予測画像との差が変換され、量子化され、エントロピーコード化される。ビデオを再構築するために、エントロピーコード化、量子化、変換、及び予測に対応する逆のプロセスによって圧縮データが復号される。
本明細書に記載する実施形態はビデオを圧縮する分野に含まれ、ビデオの圧縮並びにビデオの符号化及び復号に関する。
HEVC(High Efficiency Video Coding, ISO/IEC 23008-2, ITU-T H.265)のビデオ圧縮規格では、ビデオの連続ピクチャ間に存在する冗長性を活用するために動き補償時間予測が使用される。
そのために、各予測単位(PU)に動きベクトルが関連付けられる。各コード化ツリー単位(CTU)は圧縮領域内のコード化ツリーによって表される。これはCTUの4分木分割であり、それぞれの葉をコード化単位(CU)と呼ぶ。
次いで各CUに何らかのイントラ予測パラメータ又はインタ予測パラメータ(予測情報)が与えられる。そのために、1つ又は複数の予測単位(PU)へとCUを空間的に分割し、各PUには何らかの予測情報が指定される。イントラコード化モード又はインタコード化モードはCUレベルで指定される。
Joint Exploration Model(JEM)として知られる新たなビデオ圧縮規格に関するJVET(Joint Video Exploration Team)の提案では、圧縮性能が高いことを理由に4分木2分木(QTBT)ブロック分割構造を受け入れることが提案されている。2分木(BT)におけるブロックは、そのブロックを中央で水平に又は垂直に分けることによって2つの等サイズのサブブロックに分割することができる。その結果、高さと幅が等しい正方形の形状をブロックが常に有するQTにおけるブロックと異なり、BTのブロックは幅と高さが等しくない矩形形状を有し得る。HEVCでは、angularイントラ予測の方向は45度から−135度までの180度にわたって定められ、angularイントラ予測の方向は標的ブロックの形状とは独立に角度方向の定義を行ったJEMでも保たれている。
これらのブロックを符号化するにはイントラ予測を使用し、過去に再構築した近傍サンプルを用いてブロックの推定版を提供する。次いでソースブロックと予測との差を符号化する。上記の古典的なコーデックでは、現在のブロックの左及び上の参照サンプルの単一のラインが使用される。
最近の研究では、従来の45度よりも高いイントラ予測方向角度を使用可能にする広角イントラ予測が提案された。更に、次世代のビデオコード化H.266/VVCのための現在の仕様に位置依存イントラ予測コンビネーション(PDPC:position dependent intra prediction combination)が採用された。
Joint Exploration Model(JEM)として知られる新たなビデオ圧縮規格に関するJVET(Joint Video Exploration Team)の提案では、圧縮性能が高いことを理由に4分木2分木(QTBT)ブロック分割構造を受け入れることが提案されている。2分木(BT)におけるブロックは、そのブロックを中央で水平に又は垂直に分けることによって2つの等サイズのサブブロックに分割することができる。その結果、高さと幅が等しい正方形の形状をブロックが常に有するQTにおけるブロックと異なり、BTのブロックは幅と高さが等しくない矩形形状を有し得る。HEVCでは、angularイントラ予測の方向は45度から−135度までの180度にわたって定められ、angularイントラ予測の方向は標的ブロックの形状とは独立に角度方向の定義を行ったJEMでも保たれている。しかし、コード化ツリー単位(CTU)をCUへと分割する考えはオブジェクト又はオブジェクトの一部を捕捉することであり、ブロックの形状はオブジェクトの方向性に関連するので、より高い圧縮効率を得るには定義済みの予測方向をブロックの形状に従って適応させることが有意味である。この脈絡において、記載する全般的な態様は矩形の標的ブロックについてイントラ予測方向を再定義することを提案する。
HEVC(High Efficiency Video Coding, H.265)では、ビデオシーケンスのフレームの符号化が4分木(QT)ブロック分割構造に基づく。フレームが正方形のコード化ツリー単位(CTU)へと分割され、それらのCTUは全てレート−歪み(RD)基準に基づき複数のコード化単位(CU)への4分木ベースの分割にかけられる。各CUはイントラ予測され、つまり因果的近傍CUから空間的に予測され、又はインタ予測され、つまり既に復号された参照フレームから時間的に予測される。Iスライスでは全てのCUがイントラ予測されるのに対し、P及びBスライスではCUをイントラ予測することもインタ予測することもできる。イントラ予測では、HEVCは1つのplanarモード(モード0としてインデックス付けする)、1つのDCモード(モード1としてインデックス付けする)、及び33個のangularモード(モード2〜34としてインデックス付けする)を含む35個の予測モードを定める。angularモードは時計方向に45度から−135度に及ぶ予測方向に関連付けられる。HEVCは4分木(QT)ブロック分割構造をサポートするので、全ての予測単位(PU)は正方形の形状を有する。従って45度から−135度までの予測角度の定義はPU(予測単位)の形状の観点から正当化される。N×Nピクセルのサイズの標的予測単位では、上の参照アレイ及び左の参照アレイのサイズはそれぞれ2N+1サンプルであり、これは全ての標的ピクセルについて上記の角度範囲をカバーするのに必要なサイズである。PUの高さ及び幅が等しい長さだと考えると、2つの参照アレイの長さの等しさも理にかなっている。
次のビデオコード化規格に関して、Joint Exploration Model(JEM)としてのJVETの試みは、planarモード及びDCモードに加えて65個のangularイントラ予測モードの使用を提案する。しかし予測方向は同じ角度範囲、つまり時計方向に45度から−135度の角度範囲にわたって定められている。WXHピクセルのサイズの標的ブロックでは、上の参照アレイ及び左の参照アレイのサイズはそれぞれ(W+H+1)ピクセルであり、これは全ての標的ピクセルについて上記の角度範囲をカバーするのに必要なサイズである。JEMにおける角度のこの定義は、他の任意の特殊な理由というよりかは単純さを得るために行われた。しかし、そのように定義することで幾らかの非効率が生じた。
図1は、35個のイントラ方向性モードの場合に非正方形ブロックについてangularイントラモードがどのようにwide angularモードで置換されるのかの一例を示す。この例では、モード2及びモード3が広角モード35及びモード36で置換され、モード35の方向はモード3の反対方向を指しており、モード36の方向はモード4の反対方向を指している。
図1は、横長な矩形(with>高さ)の場合にイントラ方向を置換することを示す。この例では2つのモード(#2及び#3)が広角モード(35及び36)によって置換される。
65個のイントラ方向性モードでは、広角イントラ予測は10モードまで移転することができる。ブロックの幅が高さよりも長い場合、本明細書に記載の全般的な実施形態に基づいて例えばモード#2からモード#11までを除去し、モード#67から#76までを追加する。
将来の規格H.266/VVCのためのドラフトで現在採用されているPDPCは幾つかのイントラモード、つまりplanarモード、DCモード、水平モード、垂直モード、対角線モード、及び所謂隣接対角線モード、即ち対角線に近い方向に適用される。図1の例では、対角線モードはモード2及びモード34に対応する。対角線方向ごとに2つの隣接モードが追加される場合、隣接モードは例えばモード3、4、32、33を含み得る。採用されたPDPCの現在の設計では対角線ごとに8個のモード、即ち合計16個の隣接対角線モードが検討されている。対角線モード及び隣接対角線モードに関するPDPCについては以下で詳述する。
H.265/HEVCの後継であることが予期されているVersatile Video Coding VVC(H.266)向けの現在のテストモデルに広角イントラ予測(WAIP)が最近採用された。WAIPは基本的に、矩形の標的ブロックの形状によりよくフィットするようにイントラ方向性モードの範囲を適応させる。例えばWAIPが横長ブロック、即ち幅が高さを上回るブロックに使用される場合、一部の水平モードが反対角(antidiagonal)モード#34(−135度)を超えて反対方向の追加の垂直モードによって置換される。同様に縦長ブロック、即ち高さが幅を上回るブロックでは、一部の垂直モードがモード#2(45度)を超えて反対方向の追加の水平モードによって置換される。図1はモード#2及び#3が#35及び#36によって置換される例示的事例を示し、この事例は古典的なイントラ予測では考慮されていない。追加の予測モードをサポートするために、ブロックの長辺上の参照アレイが辺の長さの2倍まで延長される。他方で短辺上の参照アレイは辺の長さの2倍に短縮され、その理由はその辺から生じる一部のモードが除去されるからである。
新たに導入されるモードを広角モードと呼ぶ。モード番号#34(−135度)を超えるモードは#35、#36等として順番に番号を付けられる。同様に、モード#2(45度)を超える新たに導入されるモードは#1、#2等として順番に番号を付けられる。モード#0及び#1は、HEVCにあるPlanar及びDCにそれぞれ対応する。現在のVVCではイントラ予測モードの数が67個まで拡張されており、モード#0及び#1はPLANARモード及びDCモードに対応し、残りの65個のモードは方向性モードに対応することに留意すべきである。WAIPでは方向の数が85個まで拡張されており、モード#66(−135度)及びモード#2(45度)を超えて10個の更なる方向がそれぞれ追加されている。この場合、モード#66(−135度)を超えて追加されるモードは#67、#68...#76として順番に番号を付けられる。同様に、モード#2(45度)を超えて追加されるモードは#−1、#−2...#−10として順番に番号を付けられる。85個の方向性モードのうち、任意の所与のブロックについて65個のモードだけが検討される。標的ブロックが正方形である場合、方向性モードは不変のままである。つまりモードは#2から#66に及ぶ。標的ブロックが横長であり、幅が高さの2倍に等しい場合、方向性モードは#8から#72に及ぶ。他の全ての横長ブロック、つまり幅と高さの比が4以上のブロックでは方向性モードが#12から#76に及ぶ。同様に、標的ブロックが縦長であり、高さが幅の2倍に等しい場合、方向性モードは#−6から#60に及ぶ。他の全ての縦長ブロック、つまり高さと幅の比が4以上のブロックでは方向性モードが#−10から#56に及ぶ。方向性モードの総数は依然として65個なので、モードインデックスの符号化は不変のままである。つまり符号化のために、広角モードは除去される反対方向にある対応する元のモードと同じインデックスを用いてインデックス付けされる。換言すれば、広角モードは元のモードのインデックスにマップされる。所与の標的ブロックではこのマッピングが一対一であり、従って符号器及び復号器が従う符号化間の不一致はない。
WAIPが使用される場合、実際の符号化イントラ予測方向が符号化イントラ予測モードのインデックスの逆に対応し、即ちコード化モードのインデックスは変更されず、ブロックの寸法を知りながら復号器が実際のモードを導出する。このことは予測モードに依存する他のコード化ツールに影響を与える。本明細書に記載の全般的な態様では、拡張多重変換(EMT:enhanced multiple transforms)及び非分離可能2次変換(NSST:non-separable secondary transforms)の両方のセットの選択及びインデックスのコード化に対する影響を検討する。
EMT及びNSSTはどちらもイントラ予測モードに依拠する。例えばEMTでは、イントラモードを適切な変換serにマップするテーブル索引が現在存在する。このテーブルはイントラモード数、即ち現在のVVCでは67のサイズを有する。EMTの各セットでは、4対の水平及び垂直変換が予め定められる。各予測モードに関して、NSSTのセットは恒等変換(即ちNSSTが適用されない)に加えてオフライン学習された3つの変換を含む。WAIPを検討した場合、実際の予測モードが元の最大予測モードインデックス(#66)を上回ることができ、負値を有することもできる。先に述べたように、現在の設計では85個までのイントラ方向が検討されている。従って広角予測モードの場合、予測モードを変換セットに関係付けるマッピングテーブルをそのまま使用することはできない。本明細書に記載の全般的な態様はこの問題を解決するために以下の3つの方法を提案する:
1)定数値拡張。予測モードが最大値(#66)を超える場合は常に、変換セットに対応する最大値の予測モードの値(#66)を使用する。同様に、予測モードが負の場合はangular予測モードの最も低い値(#2)の変換セットを使用する。
2)ミラー拡張:最大値を超える又は負である予測モードでは反対方向に対応する変換セットを使用し、水平及び垂直の対を交換する。
3)オフライン訓練値を用いた拡張:EMTと予測モードとの間の依存関係がオフラインデータによって学習される。WAIPの使用による新たなモード用の最良のセットを学習するために同様の手続きをたどることができる。加えて、それらのモードについてNSST変換行列を学習し、既存のセットに追加することができる。
予測モードのインデックスを検討することにより、EMTインデックスのコード化を最適化できることが最近認められている。例えば各予測モードに、又は更には対角線モードを上回る及び下回るモードにも様々なCABACコンテキストを使用することができる。加えて水平モード、垂直モード、及び対角線モードをコード化するために様々な方策を使用することができる。WAIPが使用される場合、先の節にあるのと同じ問題が生じる。それは実際の予測モードが、符号化されるものと同じではないからである。
本明細書に記載の全般的な態様は、先の節にあるのと同様のやり方でこの問題を解決する。つまり以下の2つの解決策が存在する:
1)定数値拡張:予測モードが最大値(#66)を超える場合は常に、変換セットインデックスのコード化は最大値の予測モードの値(#66)を検討し、予測モードが負の場合は変換セットインデックスのコード化はangular予測モードの最も低い値(#2)が使用されると見なす。
2)新たな値を用いた拡張:予測モードが最大値(#66)を超える又は負になる場合は常に、変換セットインデックスのコード化はCABACコンテキストのためにこれらの新たな値を利用する。更に、水平モード、垂直モード、及び対角線モードを区別するためにこれらの新たな値を使用することができる。
JEMソフトウェアでは、イントラ予測モードと変換セットとの間のマッピングが以下のように記載される:
(0から66までの)予測モードごとに、水平(g_aucTrSetHorz)及び垂直(g_aucTrSetVert)マッピングテーブルを以下のように定める:
Figure 2022500895

このテーブルは3個のサブセットのアレイによって変換サブセットインデックスを提供し:
g_aiTrSubsetIntra[3][2] = { { DST7, DCT8 },{ DST7, DCT2 },{ DST7, DCT2 } };
例えば最初のモード(0)では、水平マッピングテーブル及び垂直マッピングテーブルの両方が2の値を有する(g_aucTrSetVert[0] = 2, g_aucTrSetVert[0] = 2)。つまり水平サブセット及び垂直サブセットがどちらも{DST7,DCT8}になる。
見て分かるように、これはイントラモードと変換選択との間の依存関係の一例である。WAIPが使用される場合、以下の解決策(定数値拡張)を使用することができ:
IntraMode_WAIP = GetIntraModeWAIP(IntraMode, BlkWidth, BlkHeight)
IntraMode_WAIP = maximum(minimum(2, IntraMode_WAIP),66)
但しIntraModeは現在のイントラ予測モードである。IntraMode_WAIPはWAIPによる訂正済みのモードであり、WAIPにより66を超える値及びゼロ未満の値を含み得る。
この値はブロックの幅(BlkWidth)及び高さ(BlkHeight)を利用する関数GetIntraModeWAIPによって得られる。次いで、IntraMode_WAIPが2から66の間でクリップされる。最近の寄稿は、対角線モードを超えるモードについて変換セットインデックスを異なるように符号化することを提案している。つまり下記の通りである:
Figure 2022500895
WAIPが適用される場合、対角線モードと比較するために実際の予測モードを得るのに必要な唯一の修正。
従って先の関数は:
intraModeLuma = GetIntraModeWAIP(intraModeLuma, BlkWidth, BlkHeight)
によってプロシード(proceed)されるべきである。
本明細書に記載の全般的な態様に基づく方法500の一実施形態を図5に示す。この方法は開始ブロック501で始まり、矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して矩形ビデオブロックのサンプルを予測するためのブロック510に制御が移り、矩形ブロックのアスペクト比に比例して広角の数が増加し、矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される。制御はブロック510から、イントラコード化モードにおいて前述の予測を使用して矩形ビデオブロックを符号化するためのブロック520に移る。
本明細書に記載の全般的な態様に基づく方法600の一実施形態を図6に示す。この方法は開始ブロック601で始まり、矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して矩形ビデオブロックのサンプルを予測するためのブロック610に制御が移り、矩形ブロックのアスペクト比に比例して広角の数が増加し、矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される。制御はブロック610から、イントラコード化モードにおいて前述の予測を使用して矩形ビデオブロックを復号するためのブロック620に移る。
図7は、改善された仮想の時間的アフィン候補を使用してビデオを圧縮し、符号化し、又は復号するための機器700の一実施形態を示す。この機器はプロセッサ710を含み、少なくとも1つのポートを介してメモリ720に相互接続され得る。プロセッサ710及びメモリ720はどちらも外部接続への1つ又は複数の追加の相互接続を有することもできる。
プロセッサ710はビットストリーム内に情報を挿入し又はビットストリーム内の情報を受信するように、及び記載した態様の何れかを使用して圧縮し、符号化し、又は復号するようにも構成される。
本明細書は、ツール、特徴、実施形態、モデル、手法等を含む様々な態様を記載する。これらの態様の多くは特定的に記載されており、少なくとも個々の特性を示すために限定的であるように思われ得る方法でしばしば説明されている。しかしそれは説明を明瞭にすることを目的としており、それらの態様の応用又は範囲を限定するものではない。実際、様々な態様の全てを組み合わせ交換して更なる態様をもたらすことができる。更に態様は、先の出願に記載の態様と組み合わせ交換することもできる。
本明細書に記載し本明細書で予期する実施形態は多くの異なる形態で実装することができる。以下の図2、図3、及び図4は一部の実施形態を示すが、他の実施形態も予期され、図2、図3、及び図4の解説は実装形態の範囲を限定するものではない。態様の少なくとも1つは概してビデオを符号化し復号することに関し、少なくとも1つの他の態様は概して生成され又は符号化されたビットストリームを伝送することに関する。これらの及び他の態様は、方法、機器、記載する方法の何れかに従ってビデオデータを符号化し又は復号するための命令を記憶しているコンピュータ可読記憶媒体、及び/又は記載する方法の何れかに従って生成されるビットストリームを記憶しているコンピュータ可読記憶媒体として実装することができる。
本願では「再構築する」という用語と「復号する」という用語を区別なく使用する場合があり、「ピクセル」という用語と「サンプル」という用語を区別なく使用する場合があり、「画像」、「ピクチャ」、及び「フレーム」という用語を区別なく使用する場合がある。必ずではないが通常、「再構築する」という用語は符号器側で使用されるのに対し「復号する」は復号器側で使用される。
本明細書では様々な方法を記載し、方法のそれぞれは記載する方法を実現するための1つ又は複数のステップ又はアクションを含む。方法が適切に動作するのにステップ又はアクションの特定の順序が要求されない限り、特定のステップ及び/又はアクションの順序及び/又は使用は修正し又は組み合わせることができる。
本明細書に記載の様々な方法及び他の態様を使用してモジュール、例えば図2及び図3に示すビデオ符号器100及び復号器200のイントラ予測、エントロピーコード化、及び/又は復号モジュール(160、360、145、330)を修正することができる。更に、本明細書の態様はVVC又はHEVCに限定されず、例えば既存の又は将来開発される他の規格及び勧告、並びにそのような任意の規格及び勧告(VVC及びHEVCを含む)の拡張に適用することができる。別段の定めがない限り、又は技術的に除外されない限り、本明細書に記載の態様は個別に又は組み合わせて使用することができる
本明細書では様々な数値、例えば{{1,0}、{3,1}、{1,1}}を使用する。具体的な値は例示目的であり、記載する態様はそれらの具体的な値に限定されない。
図2は符号器100を示す。この符号器100の改変形態が考えられるが、予期される全ての改変形態を記述することなしに明瞭にするために符号器100を以下で説明する。
ビデオシーケンスは、符号化される前に、例えば入力カラーピクチャに色変換(例えばRGB4:4:4からYCbCr4:2:0への変換)を適用する、又は圧縮に対してより回復性がある信号分布を得るために入力ピクチャ成分の再マッピングを行う(例えば色成分の1つのヒストグラム平坦化を使用する)符号化前の処理(101)にかけることができる。メタデータが前処理に関連することができ、ビットストリームに付加され得る。
符号器100内で、以下に記載の通り符号器の要素によってピクチャを符号化する。符号化しようとするピクチャを例えばCUの単位で分割し(102)処理する。各単位は、例えばイントラモード又はインタモードを使用して符号化される。単位をイントラモードで符号化する場合、イントラモードはイントラ予測(160)を行う。インタモードでは動き推定(175)及び動き補償(170)を行う。符号器は単位を符号化するためにイントラモード又はインタモードのどちらを使用するのかを決定し(105)、イントラ/インタの決定を例えば予測モードフラグによって示す。例えば元の画像ブロックから予測済みブロックを減算する(110)ことによって予測残差を計算する。
次いで予測残差を変換し(125)量子化する(130)。量子化した変換係数、並びに動きベクトル及び他の構文要素(syntax element)をエントロピーコード化して(145)ビットストリームを出力する。符号器は変換を飛ばし、変換されていない残差信号に量子化を直接適用することができる。符号器は変換及び量子化の両方をバイパスすることができ、即ち変換プロセス又は量子化プロセスを適用することなしに残差が直接コード化される。
符号器は符号化済みブロックを復号して更なる予測のための参照を提供する。予測残差を復号するために量子化済み変換係数を逆量子化し(140)逆変換する(150)。復号済み予測残差と予測済みブロックとを組み合わせることで(155)画像ブロックを再構築する。例えばデブロッキング/SAO(サンプル適応オフセット)フィルタリングを実行して符号化のアーティファクトを減らすために、再構築済みピクチャにインループフィルタ(165)を適用する。フィルタ済み画像は参照ピクチャバッファ(180)内に記憶する。
図3は、ビデオ復号器200のブロック図を示す。復号器200では、以下で説明するようにビットストリームが復号器の要素によって復号される。ビデオ復号器200は、図2に記載した符号化パスと逆の復号パスを概して実行する。符号器100も、ビデオデータを符号化する一環としてビデオの復号を概して実行する。
具体的には、復号器の入力はビデオ符号器100によって生成され得るビデオビットストリームを含む。変換係数、動きベクトル、及び他のコード化情報を得るためにビットストリームを最初にエントロピー復号する(230)。ピクチャがどのように分割されるのかをピクチャ分割情報が示す。従って復号器は、復号したピクチャ分割情報に従ってピクチャを分けることができる(235)。予測残差を復号するために変換係数を逆量子化し(240)逆変換する(250)。復号した予測残差と予測済みブロックとを結合して(255)画像ブロックを再構築する。予測済みブロックはイントラ予測(260)又は動き補償予測(即ちインタ予測)(275)から得ることができる(270)。再構築済み画像にインループフィルタ(265)を適用する。フィルタ済み画像を参照ピクチャバッファ(280)に記憶する。
復号済みピクチャは、復号後の処理(285)、例えば逆色変換(例えばYCbCr4:2:0からRGB4:4:4への変換)又は符号化前の処理(101)で行われた再マッピングプロセスの逆を行う逆再マッピングを更に経ることができる。復号後の処理は、符号化前の処理において導出され、ビットストリーム内でシグナリングされるメタデータを使用することができる。
図4は、様々な実施形態が実装されるシステムの一例のブロック図を示す。システム1000は、以下に記載の様々なコンポーネントを含む装置として実装することができ、本明細書に記載の態様の1つ又は複数を実行するように構成される。かかる装置の例は、これだけに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ録画システム、接続された家庭用電化製品、及びサーバ等の様々な電子装置を含む。システム1000の要素は、単一の集積回路、複数のIC、及び/又は個別コンポーネント内に単独で又は組み合わせて実装することができる。例えば少なくとも1つの実施形態では、システム1000の処理及び符号器/復号器の要素が複数のIC及び/又は個別コンポーネントにわたって分散される。様々な実施形態において、システム1000は、例えば通信バスを介して又は専用の入力及び/又は出力ポートによって他の同様のシステムに又は他の電子装置に通信可能に結合される。様々な実施形態において、システム1000は本明細書に記載の態様の1つ又は複数を実装するように構成される。
システム1000は、例えば本明細書に記載の様々な態様を実装するために自らの中にロードされた命令を実行するように構成される少なくとも1つのプロセッサ1010を含む。プロセッサ1010は、埋め込みメモリ、入出力インタフェース、及び当技術分野で知られている他の様々な回路を含み得る。システム1000は、少なくとも1つのメモリ1020(例えは揮発性メモリ装置及び/又は不揮発性メモリ装置)を含む。システム1000は、これだけに限定されないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、及び/又は光ディスクドライブを含む不揮発性メモリ及び/又は揮発性メモリを含み得る記憶装置1040を含む。記憶装置1040は、非限定的な例として内蔵記憶装置、付加記憶装置、及び/又はネットワークアクセス可能記憶装置を含み得る。
システム1000は、例えば符号化済みビデオ又は復号済みビデオを提供するためにデータを処理するように構成される符号器/復号器モジュール1030を含み、符号器/復号器モジュール1030は独自のプロセッサ及びメモリを含み得る。符号器/復号器モジュール1030は、符号化及び/又は復号機能を実行するために装置内に含まれ得るモジュールを表す。知られているように、装置は符号化モジュール及び復号モジュールの一方又は両方を含み得る。加えて、符号器/復号器モジュール1030はシステム1000の別個の要素として実装することができ、又は当業者に知られているようにハードウェアとソフトウェアとの組み合わせとしてプロセッサ1010内に組み込まれ得る。
本明細書に記載の様々な実施形態を実行するためにプロセッサ1010又は符号器/復号器1030上にロードされるプログラムコードは記憶装置1040内に記憶され、その後プロセッサ1010によって実行するためにメモリ1020上にロードされ得る。様々な実施形態によれば、プロセッサ1010、メモリ1020、記憶装置1040、及び符号器/復号器モジュール1030の1つ又は複数が、本明細書に記載のプロセスの実行中に様々なアイテムの1つ又は複数を記憶し得る。記憶されるかかるアイテムは、これだけに限定されないが入力ビデオ、復号済みビデオ又は復号済みビデオの一部、ビットストリーム、行列、変数、並びに等式、公式、演算、及び演算ロジックの処理の中間結果又は最終結果を含み得る。
幾つかの実施形態では、プロセッサ1010及び/又は符号器/復号器モジュール1030の内部のメモリを使用して命令を記憶し、符号化又は復号中に必要な処理用のワーキングメモリを提供する。しかし他の実施形態では、これらの機能の1つ又は複数のために処理装置(例えば処理装置はプロセッサ1010又は符号器/復号器モジュール1030であり得る)の外部のメモリが使用される。外部メモリはメモリ1020及び/又は記憶装置1040、例えばダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリとすることができる。幾つかの実施形態では、テレビのオペレーティングシステムを記憶するために外部の不揮発性フラッシュメモリが使用される。少なくとも1つの実施形態では、MPEG−2、HEVC、又はVVC(Versatile Video Coding)等のビデオのコード化及び復号操作用のワーキングメモリとしてRAM等の高速な外部のダイナミック揮発性メモリが使用される。
システム1000の要素への入力は、ブロック1130内に示す様々な入力装置によって提供され得る。かかる入力装置は、これだけに限定されないが(i)例えばブロードキャスタによって無線で伝送されるRF信号を受信するRF部分、(ii)複合入力端子、(iii)USB入力端子、及び/又は(iv)HDMI入力端子を含む。
様々な実施形態において、ブロック1130の入力装置は当技術分野で知られている関連する個々の入力処理要素を有する。例えばRF部分は、(i)所望の周波数を選択する(信号を選択する又は信号を或る周波数帯域に帯域制限するとも言う)、(ii)選択した信号をダウンコンバートする、(iii)(例えば)特定の実施形態においてチャネルと呼ばれ得る信号周波数帯域を選択するために、より狭い周波数帯域へと再び帯域制限する、(iv)ダウンコンバート及び帯域制限済みの信号を復調する、(v)誤り訂正を行う、及び(vi)データパケットの所望のストリームを選択するために逆多重化するための要素に関連し得る。様々な実施形態のRF部分はこれらの機能を実行するための1つ又は複数の要素、例えば周波数セレクタ、信号セレクタ、帯域制限器、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、及びデマルチプレクサを含む。RF部分は、例えば受信した信号をより低い周波数(例えば中間周波数又は基底帯域に近い周波数)又は基底帯域にダウンコンバートすることを含む、これらの機能の様々なものを行うチューナを含むことができる。或るセットトップボックスの実施形態では、RF部分及びその関連する入力処理要素が有線(例えばケーブル)媒体上で伝送されるRF信号を受信し、所望の周波数帯域へとフィルタリングし、ダウンコンバートし、再びフィルタリングすることによって周波数の選択を行う。様々な実施形態は上記で説明した(及び他の)要素の順序を並べ替え、それらの要素の一部を除去し、及び/又は同様の若しくは異なる機能を実行する他の要素を追加する。要素を追加することは既存の要素の間に要素を挿入すること、例えば増幅器及びアナログ−デジタル変換器を挿入することを含み得る。様々な実施形態において、RF部分はアンテナを含む。
加えて、USB及び/又はHDMI端子は、USB及び/又はHDMI接続の両端間でシステム1000を他の電子装置に接続するための個々のインタフェースプロセッサを含み得る。例えば別個の入力処理IC内で又はプロセッサ1010内で入力処理、例えばリードソロモン誤り訂正の様々な側面を実装できることを理解すべきである。同様に、USB又はHDMIインタフェース処理の側面を別個のインタフェースIC内で又はプロセッサ1010内で実装することができる。出力装置上で提示するためにデータストリームを処理するために、変調済みの、誤り訂正済みの、及び逆多重化済みのストリームが、例えばメモリ及び記憶要素と組み合わせて動作するプロセッサ1010及び符号器/復号器1030を含む様々な処理要素に与えられる。
システム1000の様々な要素を一体型ハウジング内に設けることができる。一体型ハウジングの中では様々な要素が相互接続され、適切な接続構成1140、例えばI2Cバス、配線、及びプリント回路基板を含む当技術分野で知られている内部バスを使用してそれらの間でデータを伝送し得る。
システム1000は、通信チャネル1060を介して他の装置と通信することを可能にする通信インタフェース1050を含む。通信インタフェース1050は、これだけに限定されないが、通信チャネル1060上でデータを送受信するように構成されるトランシーバを含み得る。通信インタフェース1050は、これだけに限定されないがモデム又はネットワークカードを含むことができ、通信チャネル1060は例えば有線媒体及び/又は無線媒体内に実装することができる。
様々な実施形態において、IEEE 802.11等の無線ネットワークを使用してデータがシステム1000にストリームされる。これらの実施形態の無線信号は、例えばWi-Fi通信に適合される通信チャネル1060及び通信インタフェース1050上で受信される。これらの実施形態の通信チャネル1060は、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに典型的には接続される。他の実施形態は、入力ブロック1130のHDMI接続上でデータを届けるセットトップボックスを使用してストリームデータをシステム1000に与える。更に他の実施形態は、入力ブロック1130のRF接続を使用してストリームデータをシステム1000に与える。
システム1000は、ディスプレイ1100、スピーカ1110、及び他の周辺装置1120を含む様々な出力装置に出力信号を与えることができる。実施形態の様々な例において、他の周辺装置1120は、独立型DVR、ディスクプレーヤ、ステレオシステム、照明システム、及びシステム1000の出力に基づいて機能を提供する他の装置のうちの1つ又は複数を含む。様々な実施形態において、AV.Link、CEC、又はユーザの介入ありの若しくはなしの装置間制御を可能にする他の通信プロトコル等のシグナリングを使用し、システム1000とディスプレイ1100、スピーカ1110、又は他の周辺装置1120との間で制御信号が通信される。出力装置が、個々のインタフェース1070、1080、及び1090による専用接続を介してシステム1000に通信可能に結合され得る。或いは出力装置は、通信インタフェース1050を介して通信チャネル1060を使用してシステム1000に接続され得る。ディスプレイ1100及びスピーカ1110は、電子装置、例えばテレビの中でシステム1000の他のコンポーネントと共に単一のユニットに一体化することができる。様々な実施形態において、ディスプレイインタフェース1070はディスプレイドライバ、例えばタイミングコントローラ(T Con)チップを含む。
例えば入力1130のRF部分が別個のセットトップボックスの一部である場合、ディスプレイ1100及びスピーカ1110は他のコンポーネントの1つ又は複数から代わりに切り離すことができる。ディスプレイ1100及びスピーカ1110が外部コンポーネントである様々な実施形態において、出力信号は例えばHDMIポート、USBポート、又はCOMP出力を含む専用出力接続によって与えることができる。
実施形態は、プロセッサ1010によって実装されるコンピュータソフトウェアによって、又はハードウェアによって、又はハードウェアとソフトウェアとの組み合わせによって実行することができる。非限定的な例として、実施形態は1つ又は複数の集積回路によって実装され得る。メモリ1020は技術的環境に適した任意の種類のものとすることができ、非限定的な例として光メモリ装置、磁気メモリ装置、半導体ベースのメモリ装置、固定メモリ、及び脱着可能メモリ等、任意の適切なデータ記憶技術を使用して実装することができる。プロセッサ1010は技術的環境に適した任意の種類のものとすることができ、非限定的な例としてマイクロプロセッサ、汎用コンピュータ、専用コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ又は複数を包含し得る。
様々な実装形態が復号することを含む。本願で使用するとき、「復号する」は、例えば表示に適した最終出力をもたらすために受信済みの符号化シーケンスに対して実行されるプロセスの全て又は一部を包含し得る。様々な実施形態において、かかるプロセスは復号器によって典型的に行われるプロセス、例えばエントロピー復号、逆量子化、逆変換、及び差分復号の1つ又は複数を含む。様々な実施形態において、かかるプロセスは本願に記載の様々な実装形態の復号器によって行われるプロセス、例えば様々なイントラ予測参照アレイに使用される重みのインデックスを抽出することを更に又は代わりに含む。
更なる例として、或る実施形態では「復号」がエントロピー復号だけを指し、別の実施形態では「復号」が差分復号だけを指し、別の実施形態では「復号」がエントロピー復号と差分復号との組み合わせを指す。「復号プロセス」という語句が操作のサブセットを具体的に指すことを意図するのか、又はより広範な復号プロセスを概して指すことを意図するのかは具体的な説明の脈絡に基づいて明らかになり、当業者によって十分理解されると考える。
様々な実装形態は符号化することを含む。「復号」に関する上記の解説と同様に、本願で使用するとき「符号化する」は、例えば符号化済みビットストリームをもたらすために入力ビデオシーケンスに対して実行されるプロセスの全て又は一部を包含し得る。様々な実施形態において、かかるプロセスは符号器によって典型的に行われるプロセス、例えば分割、差分符号化、変換、量子化、及びエントロピー符号化の1つ又は複数を含む。様々な実施形態において、かかるプロセスは本願に記載の様々な実装形態の符号器によって行われるプロセス、例えばイントラ予測参照アレイの重み付けを更に又は代わりに含む。
更なる例として、或る実施形態では「符号化」がエントロピー符号化だけを指し、別の実施形態では「符号化」が差分符号化だけを指し、別の実施形態では「符号化」が差分符号化とエントロピー符号化との組み合わせを指す。「符号化プロセス」という語句が操作のサブセットを具体的に指すことを意図するのか、又はより広範な符号化プロセスを概して指すことを意図するのかは具体的な説明の脈絡に基づいて明らかになり、当業者によって十分理解されると考える。
本明細書で使用する構文要素は記述用語であることに留意されたい。そのため、それらは他の構文要素名の使用を排除しない。
図面が流れ図として示されている場合、その図面は対応する機器のブロック図も提供することを理解すべきである。同様に図面がブロック図として示されている場合、その図面は対応する方法/プロセスの流れ図も提供することを理解すべきである。
様々な実施形態はレート歪み計算又はレート歪み最適化に言及する。具体的には符号化プロセスの間、多くの場合計算の複雑さの制約を所与としてレートと歪みとの間のバランス又はトレードオフが通常検討される。レート歪み最適化は通常、レート及び歪みの加重和であるレート歪み関数を最小化するものとして公式化される。レート歪み最適化問題を解く様々な手法がある。例えばそれらの手法は、コード化のコスト並びにコード化及び復号後の再構築済み信号の関係する歪みを完全に評価することを伴い、検討される全てのモード又はコード化パラメータ値を含む符号化の全ての選択肢を広く試験することに基づき得る。とりわけ再構築されるものではなく、予測又は予測残差信号に基づいておおよその歪みを計算することにより、より高速の手法を使用して符号化の複雑さを省くこともできる。符号化のあり得る選択肢の一部にだけおおよその歪みを使用し、符号化の他の選択肢には完全な歪みを使用すること等により、これらの2つの手法の混合を使用することもできる。他の手法は、符号化のあり得る選択肢のサブセットだけを評価する。より全般的に、多くの手法は最適化を行うための様々な技法の何れかを使用するが、最適化は必ずしもコード化のコスト及び関係する歪みの両方の完全な評価ではない。
本明細書に記載した実装形態及び態様は、例えば方法若しくはプロセス、機器、ソフトウェアプログラム、データストリーム、又は信号によって実装することができる。単一形式の実装形態の脈絡でしか論じられていなくても(例えば方法としてしか論じられていなくても)、論じられた特徴の実装形態は他の形(例えば機器又はプログラム)でも実装することができる。機器は例えば適切なハードウェア、ソフトウェア、及びファームウェアによって実装することができる。方法は例えばプロセッサによって実装することができ、プロセッサは例えばコンピュータ、マイクロプロセッサ、集積回路、又はプログラム可能論理装置を含む処理装置全般を指す。プロセッサは、例えばコンピュータ、携帯電話、ポータブル/携帯情報端末(「PDA」)、及びエンドユーザ間の情報の通信を助ける他の装置等の通信装置も含む。
「一実施形態」、又は「或る実施形態」、又は「一実装形態」、又は「或る実装形態」並びにそれらの他の異体に言及することは、実施形態に関連して記載される特定の特徴、構造、特性等が少なくとも1つの実施形態に含まれることを意味する。従って、本明細書の全体を通して様々な箇所に登場する「一実施形態では」、又は「或る実施形態では」、又は「一実装形態では」、又は「或る実装形態では」という語句並びに他の任意の異体の登場は必ずしも全て同じ実施形態を指すものではない。
加えて、本明細書は様々な情報片を「決定すること」に言及する場合がある。情報を決定することは、例えば情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことの1つ又は複数を含み得る。
更に本明細書は、様々な情報片に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば情報を受信すること、情報を(例えばメモリから)取り出すこと、情報を記憶すること、情報を移動すること、情報を複製すること、情報を計算すること、情報を決定すること、情報を予測すること、又は情報を推定することの1つ又は複数を含み得る。
加えて本明細書は、様々な情報片を「受信すること」に言及する場合がある。受信することは「アクセスすること」と同様に広義語であることを意図する。情報を受信することは、例えば情報にアクセスすること、又は情報を(例えばメモリから)取り出すことの1つ又は複数を含み得る。更に、「受信すること」は典型的には例えば情報を記憶する操作、情報を処理する操作、情報を伝送する操作、情報を移動する操作、情報を複製する操作、情報を消去する操作、情報を計算する操作、情報を決定する操作、情報を予測する操作、又は情報を推定する操作等の操作中に何らかの形で関与する。
例えば「A/B」、「A及び/又はB」、並びに「A及びBの少なくとも1つ」の場合に「/」、「及び/又は」、並びに「〜の少なくとも1つ」の何れかを使用することは、最初に挙げられる(A)の選択肢だけを選択すること、又は2番目に挙げられる(B)の選択肢だけを選択すること、又は(A及びB)の両方の選択肢を選択することを包含することを意図することを理解すべきである。更なる例として、「A、B、及び/又はC」並びに「A、B、及びCの少なくとも1つ」の場合、かかる表現法は最初に挙げられる(A)の選択肢だけを選択すること、又は2番目に挙げられる(B)の選択肢だけを選択すること、又は3番目に挙げられる(C)の選択肢だけを選択すること、又は最初に挙げられる選択肢及び2番目に挙げられる選択肢(A及びB)だけを選択すること、又は最初に挙げられる選択肢及び3番目に挙げられる選択肢(A及びC)だけを選択すること、又は2番目に挙げられる選択肢及び3番目に挙げられる選択肢(B及びC)だけを選択すること、又は3つ全ての選択肢(A及びB及びC)を選択することを包含することを意図する。当業者に明らかであるように、この表現法は挙げられているアイテムの数だけ拡張することができる。
更に本明細書で使用するとき、「シグナリング」という単語は、とりわけ対応する復号器に何かを示すことを指す。例えば特定の実施形態では、イントラ予測参照アレイに使用される複数の重みのうちの特定のものを符号器がシグナリングする。このようにして、一実施形態では符号器側及び復号器側の両方において同じパラメータが使用される。従って、例えば符号器は特定のパラメータを復号器に伝送することができ(明確なシグナリング)、それにより復号器は同じ特定のパラメータを使用することができる。逆に、復号器が他のパラメータと共にその特定のパラメータを既に有する場合、単にその特定のパラメータを復号器が知り、選択できるようにするためにシグナリングを伝送なしに使用することができる(暗黙のシグナリング)。任意の実際の機能を伝送することを回避することにより、様々な実施形態においてビットの節約が実現される。シグナリングは様々なやり方で実現できることを理解すべきである。例えば様々な実施形態において対応する復号器に情報をシグナリングするために、1つ又は複数の構文要素、フラグ等が使用される。上記の内容は「signal」という単語の動詞の形態に関するが、「signal」という単語は本明細書では名詞としても使用することができる。
当業者に明白であるように、実装形態は、例えば記憶され又は伝送され得る情報を運ぶようにフォーマットされる様々な信号をもたらすことができる。情報は例えば方法を実行するための命令、又は記載した実装形態の1つによって作り出されるデータを含み得る。例えば信号は、記載した実施形態のビットストリームを運ぶようにフォーマットされ得る。かかる信号は、例えば電磁波として(例えばスペクトルの無線周波数部分を用いて)、又はベースバンド信号としてフォーマットされ得る。フォーマットすることは、例えばデータストリームを符号化し、符号化データストリームで搬送波を変調することを含み得る。信号が運ぶ情報は、例えばアナログ情報又はデジタル情報とすることができる。信号は、知られているように様々な異なる有線リンク又は無線リンク上で伝送され得る。信号はプロセッサ可読媒体上に記憶され得る。
上記の説明では幾つかの実施形態を記載してきた。これらの及び更なる実施形態は、様々な異なる特許請求の範囲のカテゴリ及び種類にわたり以下の任意選択的な特徴を単独で又は任意の組み合わせで含む:
−符号化及び復号する際のイントラ予測中に−135度及び45度を超える予測方向を使用すること
−広角モードとPDPCとの間の相互作用を拡張すること
−同じ総方向数を維持するために反対方向にある一部の方向を除去しながら水平方向又は垂直方向に予測方向を拡張すること
−−135度を上回る方向の数及び45度を上回る方向の数の両方を拡張すること
−ブロック内のサンプルに対してPDPC及び広角イントラ予測を組み合わせること
−どの予測方向が使用されているのかを符号器から復号器にシグナリングすること
−予測方向のサブセットを使用すること
−ブロックは矩形形状を有するCUである
−他のブロックは近傍ブロックである
−記載した構文要素又はその改変形態の1つ又は複数を含むビットストリーム又は信号
−符号器が行ったのと逆のやり方で復号器がビットストリームを処理することを可能にする構文要素をシグナリング内に挿入すること
−記載した構文要素又はその改変形態の1つ又は複数を含むビットストリーム又は信号を作成し及び/又は伝送すること、及び/又は受信し及び/又は復号すること
−記載した実施形態の何れかを行うTV、セットトップボックス、携帯電話、タブレット、又は他の電子装置
−記載した実施形態の何れかを行い、結果として生じる画像を(例えばモニタ、画面、又は他の種類のディスプレイを使用して)表示するTV、セットトップボックス、携帯電話、タブレット、又は他の電子装置
−符号化済み画像を含む信号を受信するために(例えばチューナを使用して)チャネルをチューニングし、記載した実施形態の何れかを行うTV、セットトップボックス、携帯電話、タブレット、又は他の電子装置
−符号化済み画像を含む信号を(例えばアンテナを使用して)受信し、記載した実施形態の何れかを行うTV、セットトップボックス、携帯電話、タブレット、又は他の電子装置
−他の様々な汎用化された特徴並びに特化された特徴も本開示の全体を通して支持され予期される。

Claims (15)

  1. 矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は前記矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して前記矩形ビデオブロックのサンプルを予測することであって、前記矩形ブロックのアスペクト比に比例して広角の数が増加し、前記矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される、予測すること、及び
    イントラコード化モードにおいて前記予測を使用して前記矩形ビデオブロックを符号化すること
    を含む、方法。
  2. 矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は前記矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して前記矩形ビデオブロックのサンプルを予測することであって、前記矩形ブロックのアスペクト比に比例して広角の数が増加し、前記矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される、予測すること、及び
    イントラコード化モードにおいて前記予測を使用して前記矩形ビデオブロックを符号化すること
    を行うように構成されたプロセッサ
    を含む、機器。
  3. 矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は前記矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して前記矩形ビデオブロックのサンプルを予測することであって、前記矩形ブロックのアスペクト比に比例して広角の数が増加し、前記矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される、予測すること、及び
    イントラコード化モードにおいて前記予測を使用して前記矩形ビデオブロックを復号すること
    を含む、方法。
  4. 矩形ビデオブロックの上の行からのN個の参照サンプルの少なくとも1つ又は前記矩形ビデオブロックの左の列からのM個の参照サンプルの少なくとも1つを使用して前記矩形ビデオブロックのサンプルを予測することであって、前記矩形ブロックのアスペクト比に比例して広角の数が増加し、前記矩形ビデオブロックのための予測モードが最大予測角度を上回るように設定される場合、その最大予測角度に対応して予測モードが使用される、予測すること、及び
    イントラコード化モードにおいて前記予測を使用して前記矩形ビデオブロックを復号すること
    を行うように構成されたプロセッサ
    を含む、機器。
  5. −135度及び45度を超える広角が使用される、請求項1若しくは3に記載の方法、又は請求項2若しくは4に記載の機器。
  6. 位置依存イントラ予測コンビネーションが広角イントラ予測と共に使用される、請求項1若しくは3に記載の方法、又は請求項2若しくは4に記載の機器。
  7. 同じ総角度数を維持するために反対方向にある幾つかの対応する角度を除去しながら水平方向又は垂直方向に広角イントラ予測のための予測方向を拡張する、請求項1若しくは3に記載の方法、又は請求項2若しくは4に記載の機器。
  8. 幾つかの予測角度が−135度を上回り又は45度を上回る、請求項1若しくは3に記載の方法、又は請求項2若しくは4に記載の機器。
  9. 位置依存イントラ予測コンビネーションを広角イントラ予測と組み合わせ、ブロック内のサンプルに適用する、請求項1若しくは3に記載の方法、又は請求項2若しくは4に記載の機器。
  10. 前記ブロックが矩形形状を有するコード化単位である、請求項1若しくは3に記載の方法、又は請求項2若しくは4に記載の機器。
  11. 使用されている参照サンプルが近傍ブロックからのものである、請求項1若しくは3に記載の方法、又は請求項2若しくは4に記載の機器。
  12. 請求項4〜11の何れか一項に記載の機器と、
    (i)信号を受信するように構成されたアンテナであって、前記信号はビデオブロックを含む、アンテナ、(ii)前記ビデオブロックを含む周波数帯域に前記受信信号を制限するように構成された帯域制限器、及び(iii)ビデオブロックを表す出力を表示するように構成されたディスプレイのうちの少なくとも1つと
    を含む装置。
  13. プロセッサを使用して実行するための、請求項1及び5〜11の何れか一項に記載の方法に従って、又は請求項2及び5〜11の何れか一項に記載の機器によって生成されるデータコンテンツを含む、非一時的コンピュータ可読媒体。
  14. プロセッサを使用して実行するための、請求項1及び5〜11の何れか一項に記載の方法に従って、又は請求項2及び5〜11の何れか一項に記載の機器によって生成されるビデオデータを含む、信号。
  15. コンピュータによってプログラムが実行されるとき、請求項1、3、及び5〜11の何れか一項に記載の方法を前記コンピュータに実行させる命令を含む、コンピュータプログラム製品。
JP2021509169A 2018-09-21 2019-09-19 イントラ変換コード化及び広角イントラ予測の調和 Pending JP2022500895A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18290102.5 2018-09-21
EP18290102 2018-09-21
PCT/US2019/051943 WO2020061319A1 (en) 2018-09-21 2019-09-19 Harmonization of intra transform coding and wide angle intra prediction

Publications (2)

Publication Number Publication Date
JP2022500895A true JP2022500895A (ja) 2022-01-04
JPWO2020061319A5 JPWO2020061319A5 (ja) 2022-09-21

Family

ID=67436854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021509169A Pending JP2022500895A (ja) 2018-09-21 2019-09-19 イントラ変換コード化及び広角イントラ予測の調和

Country Status (8)

Country Link
US (1) US20220124337A1 (ja)
EP (1) EP3854080A1 (ja)
JP (1) JP2022500895A (ja)
KR (1) KR20210058846A (ja)
CN (1) CN112740676A (ja)
AU (1) AU2019342129A1 (ja)
MX (1) MX2021003317A (ja)
WO (1) WO2020061319A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112104868B (zh) * 2020-11-05 2021-02-05 电子科技大学 一种针对vvc帧内编码单元划分的快速决策方法
WO2023044617A1 (zh) * 2021-09-22 2023-03-30 深圳市大疆创新科技有限公司 编解码方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018127624A1 (en) * 2017-01-03 2018-07-12 Nokia Technologies Oy Video and image coding with wide-angle intra prediction
JP2021511752A (ja) * 2018-06-03 2021-05-06 エルジー エレクトロニクス インコーポレイティド 縮小された変換を用いて、ビデオ信号を処理する方法及び装置
JP2021524170A (ja) * 2018-07-02 2021-09-09 テンセント・アメリカ・エルエルシー ビデオ圧縮における非正方形ブロックのイントラ予測のための方法および装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016137369A1 (en) * 2015-02-25 2016-09-01 Telefonaktiebolaget Lm Ericsson (Publ) Encoding and decoding of pictures in a video
US10425648B2 (en) * 2015-09-29 2019-09-24 Qualcomm Incorporated Video intra-prediction using position-dependent prediction combination for video coding
US10681379B2 (en) * 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
CN109479129B (zh) * 2016-07-18 2023-07-11 韩国电子通信研究院 图像编码/解码方法和装置以及存储比特流的记录介质
CA3101176A1 (en) * 2018-06-27 2020-01-02 Kt Corporation Method and apparatus for processing video signal
US10404980B1 (en) * 2018-07-10 2019-09-03 Tencent America LLC Intra prediction with wide angle mode in video coding
US11509908B2 (en) * 2018-09-11 2022-11-22 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
TWI826532B (zh) * 2018-09-19 2023-12-21 大陸商北京字節跳動網絡技術有限公司 基於歷史資訊的幀內模式編解碼

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018127624A1 (en) * 2017-01-03 2018-07-12 Nokia Technologies Oy Video and image coding with wide-angle intra prediction
JP2020503785A (ja) * 2017-01-03 2020-01-30 ノキア テクノロジーズ オーユー 広角イントラ予測によるビデオおよび画像の符号化
JP2021511752A (ja) * 2018-06-03 2021-05-06 エルジー エレクトロニクス インコーポレイティド 縮小された変換を用いて、ビデオ信号を処理する方法及び装置
JP2021524170A (ja) * 2018-07-02 2021-09-09 テンセント・アメリカ・エルエルシー ビデオ圧縮における非正方形ブロックのイントラ予測のための方法および装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS ET AL.: "Versatile Video Coding (Draft 2) [online]", JVET-K1001-V5(JVET-K1001-V5.DOCX), [2023年10月6日検索], JPN6023042556, 18 September 2018 (2018-09-18), pages 53 - 66, ISSN: 0005175026 *
FABIEN RACAPE ET AL.: "CE3-related: Wide-angle intra prediction for non-square blocks [online]", JVET-K0500_R4(JVET-K0500_R4.DOCX), [2023年10月6日検索], JPN6023042557, 16 July 2018 (2018-07-16), ISSN: 0005175027 *

Also Published As

Publication number Publication date
MX2021003317A (es) 2021-05-14
WO2020061319A1 (en) 2020-03-26
EP3854080A1 (en) 2021-07-28
KR20210058846A (ko) 2021-05-24
AU2019342129A1 (en) 2021-05-20
US20220124337A1 (en) 2022-04-21
CN112740676A (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
JP2023543985A (ja) 多用途ビデオコーディングのためのテンプレートマッチング予測
JP2022505470A (ja) ブロックの面に基づくビデオの符号化又は復号のための量子化
US20240089437A1 (en) Chroma quantization parameter adjustment in video encoding and decoding
US20220046244A1 (en) Directions for wide angle intra prediction
JP2022504753A (ja) ビデオエンコーディングおよびデコーディングにおけるアフィンモードシグナリング
EP3884668A1 (en) Quantization for video encoding and decoding
EP3627835A1 (en) Wide angle intra prediction and position dependent intra prediction combination
US12022079B2 (en) Wide angle intra prediction and position dependent intra prediction combination
JP2022500895A (ja) イントラ変換コード化及び広角イントラ予測の調和
US11956436B2 (en) Multiple reference intra prediction using variable weights
WO2020185492A1 (en) Transform selection and signaling for video encoding or decoding
CN114930819A (zh) 三角形合并模式中的子块合并候选
US20220038704A1 (en) Method and apparatus for determining chroma quantization parameters when using separate coding trees for luma and chroma
JP2022537173A (ja) 位置依存イントラ予測コンビネーションを用いたピクチャ符号化及び復号の方法及びデバイス
JP2022507874A (ja) 二重木を伴う現ピクチャ参照ブロックベクトル初期化
EP3664450A1 (en) Method and device for picture encoding and decoding
JP2024513657A (ja) ビデオエンコード及びデコードのためのテンプレートマッチング予測
KR20210028645A (ko) 다수의 영역에 대한 인-루프 필터
CN114531953A (zh) 使用多参考行帧内预测的最可能模式信令
CN114830656A (zh) 用于快速视频编码器的二次变换
KR20210074388A (ko) 코딩 유형 또는 코딩 트리 유형의 시그널링을 이용한 비디오 인코딩 및 디코딩을 위한 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220912

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231018

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240627