JP2023103327A - 多重変換行列のコンテキストモデリングおよび選択 - Google Patents

多重変換行列のコンテキストモデリングおよび選択 Download PDF

Info

Publication number
JP2023103327A
JP2023103327A JP2023076813A JP2023076813A JP2023103327A JP 2023103327 A JP2023103327 A JP 2023103327A JP 2023076813 A JP2023076813 A JP 2023076813A JP 2023076813 A JP2023076813 A JP 2023076813A JP 2023103327 A JP2023103327 A JP 2023103327A
Authority
JP
Japan
Prior art keywords
transform
block
mode
current video
mts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023076813A
Other languages
English (en)
Inventor
リー ジャン
Li Zhang
カイ ジャン
Kai Zhang
ホンビン リウ
Hongbin Liu
ユエ ワン
Yue Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of JP2023103327A publication Critical patent/JP2023103327A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】コンテキストモデリング及び多重変換行列選択を含むデジタル映像符号化のためのデバイス、システム並びに方法を提供する。【解決手段】映像処理方法は、映像の現在の映像ブロックとビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示が現在の映像ブロックに対し、ビットストリーム表現から排除されるかどうかを判定することと、変換を行うことと、を含む。前記指示は、シーケンスパラメータセット、ピクチャパラメータセット、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット行、符号化ユニット又は映像データユニット中にあり、判定することは、非ゼロ符号化係数の最終位置に基づき、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。【選択図】図8A

Description

関連出願の相互参照
パリ条約に基づく適用可能な特許法および/または規則に基づいて、本願は、2020年4月23日出願の国際特許出願第PCT/CN2019/083844号の優先権および利益を適時に主張することを目的とする。法に基づくすべての目的のために、上記出願の開示全体は、本明細書の開示の一部として参照により援用される。
この特許文献は、映像符号化技術、デバイスおよびシステムに関する。
映像圧縮の進歩にもかかわらず、デジタル映像は、依然として、インターネット及び他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像を受信及び表示することが可能である接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けることが予測される。
デジタル映像符号化に関し、具体的には、映像符号化のためのコンテキストモデリングおよび多重変換行列選択に関するデバイス、システムおよび方法である。記載された方法は、既存の映像符号化規格(例えば、高効率映像符号化(HEVC))および将来の映像符号化規格又はビデオコーデックの両方に適用され得る。
1つの代表的な態様において、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示がビットストリーム表現から排除されると判定することであって、現在の映像ブロックは、イントラブロックコピー(IBC)モードを使用して符号化される、判定することと、この変換を行うことと、を含み、指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、符号化ユニット、または映像データユニット中にあり、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックの符号化モードに基づいて、多重変換選択(MTS)演算の選択的適用に関して決定することと、決定に基づいて、現在の映像ブロックと映像のビットストリーム表現との間の変換を行うこととを含み、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、現在の映像ブロックの特徴に基づいて、多重変換選択(MTS)演算の少なくとも1つのインデックスにおける符号化用のコンテキストモデルを構成することと、構成することに基づいて、現在の映像ブロックと現在の映像ブロックを含む映像のビットストリーム表現との間で変換を行うこととを含み、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、現在の映像ブロックと現在の映像ブロックを含む映像のビットストリーム表現との間での変換中、多重変換選択(MTS)演算を含む変換を判定することと、判定することに基づいて、MTS演算の行列の1つ以上の水平インデックスおよび1つ以上の垂直インデックスを別個に符号化することと、を含み、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、イントラブロックコピー(IBC)モードを使用して符号化される現在の映像ブロックに対して多重変換選択(MTS)演算の変換タイプの指示を構成することと、この変換を行うことと、を含み、指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、または映像データユニット中にあり、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示が現在の映像ブロックに対し、ビットストリーム表現から排除されるかどうかを判定することと、この変換を行うことと、を含み、指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、符号化ユニット、または映像データユニット中にあり、判定することは、非ゼロ符号化係数の最終位置に基づいて、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、現在の映像ブロックの彩度成分に関して多重変換選択(MTS)演算を使用する指示を構成することと、この変換を行うことと、を含み、構成することは、現在の映像ブロックのカラーフォーマットに基づいて、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、現在の映像ブロックに対して適用されるサブブロック変換(SBT)演算を判定することと、多重変換選択(MTS)演算を使用することによって変換を行うこととを含み、SBT演算は、位置依存変換演算を含み、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
さらに別の代表的な態様では、開示される技術は、映像処理の方法を提供するために使用してもよい。この方法は、映像の現在の映像ブロックのカラーフォーマットに基づいて、現在の映像ブロックの彩度成分へのイントラサブブロック分割(ISP)演算の選択的適用に関して決定することと、決定することに基づいて、現在の映像ブロックと映像のビットストリーム表現との間で変換を行うことと、ISP演算は、ブロックを、少なくとも所定の数のサンプルを有するサブパーティションに垂直または水平に分割することとを含む。
さらに別の代表的な態様において、上記方法は、処理装置が実行可能なコードの形式で実施され、コンピュータ可読プログラム媒体に記憶される。
さらに別の代表的な態様において、上述した方法を行うように構成された、または動作可能なデバイスが開示される。この装置は、この方法を実装するようにプログラムされた処理装置を含んでもよい。
さらに別の代表的な態様において、映像デコーダ装置は、本明細書で説明されるような方法を実装してもよい。
開示される技術の上記および他の態様および特徴は、図面、説明および特許請求の範囲でより詳細に説明される。
JEMにおけるセカンダリ変換の例を示す。 提案された縮小セカンダリ変換(RST)の例を示す。 サブブロック変換モードSBT-VおよびSBT-Hの例を示す。 4×8および8×4ブロックの分割の例を示す。 4×8、8×4、および4×4を除くすべてのブロックを分割した例を示す。 1つの4×8のサンプルブロックを2つの独立した復号化可能な領域に分割する例を示す。 垂直方向予測モジュールを有する4×Nのブロックに対してスループットを最大にするための、画素の行の処理の順序の例を示す。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 映像処理の方法の一例を示すフローチャートである。 本特許明細書に記載されるビジュアルメディアの復号化又はビジュアルメディアの符号化技術を実現するためのハードウェアプラットフォームの一例を示すブロック図である。 開示された技術を実装することができる例示的な映像処理システムを示すブロック図である。
開示される技術の実施形態は、圧縮性能を向上させるために、既存の映像符号化規格(例えば、HEVC、H.265)および将来の規格に適用されてもよい。本明細書では、説明の可読性を向上させるために章の見出しを使用しており、説明または実施形態(および/または実装形態)をそれぞれの章のみに限定するものではない。
2 映像符号化の導入
より高い解像度の映像の需要が増大しているため、近代技術において、映像符号化法および技術は、遍在している。ビデオコーデックは、一般的に、デジタル映像を圧縮又は展開する電子回路又はソフトウェアを含み、より高い符号化効率を提供するように絶えず改良されている。ビデオコーデックは、非圧縮映像を圧縮フォーマットに変換する、又はその逆である。映像の品質、映像を表現するために使用されるデータの数(ビットレートで決まる)、エンコーディングおよびデコーディングアルゴリズムの複雑性、データの損失およびエラーに対する敏感さ、編集のしやすさ、ランダムアクセス、およびエンドツーエンドの遅延(待ち時間)の間には複雑な関係がある。この圧縮フォーマットは、通常、標準的な映像圧縮仕様、例えば、高効率映像符号化(HEVC)規格(H.265またはMPEG-H Part2としても知られている)、完成させるべき汎用映像符号化規格、または他の現在のおよび/または将来の映像符号化基準に準拠する。
映像符号化規格は、主に周知のITU-TおよびISO/IEC規格の開発によって発展してきた。ITU-TはH.261とH.263を作り、ISO/IECはMPEG-1とMPEG-4 Visualを作り、両団体はH.262/MPEG-2 VideoとH.264/MPEG-4 AVC(Advanced Video Coding)とH.265/HEVC規格を共同で作った。H.262以来、映像符号化規格は、時間予測と変換符号化が利用されるハイブリッド映像符号化構造に基づく。HEVCを超えた将来の映像符号化技術を探索するため、2015年には、VCEGとMPEGが共同でJVET(Joint Video Exploration Team)を設立した。それ以来、多くの新しい方法がJVETによって採用され、JEM(Joint Exploration Mode)と呼ばれる参照ソフトウェアに組み込まれてきた。2018年4月には、VCEG(Q6/16)とISO/IEC JTC1 SC29/WG11(MPEG)の間にJoint Video Expert Team(JVET)が発足し、HEVCと比較して50%のビットレート削減を目標にVVC規格の策定に取り組んでいる。
2.1 離散正弦関数変換ファミリー
離散正弦関数変換ファミリーは、周知の離散フーリエ、コサイン、サイン、およびカルーネン-レーブ(1次マルコフ条件下)変換を含む。すべてのメンバーの中で、コサイン関数に基づく8つのタイプの変換、およびサイン関数に基づく8つのタイプの変換、すなわち、それぞれ、DCT-I、II、・・、VIII、およびDST-I、II、・・・、VIIIがある。これらの離散コサイン変換およびサイン変換の変形は、それらに対応する対称-周期的シーケンスの異なる対称性に由来する。提案される方法に利用されるような、選択されたタイプのDCTおよびDSTの変換基底関数を、以下の表1にまとめる。
表1:N点入力用DCT-II/V/VIII、DST-I/VIIの変換ベースの関数
2.2 HEVC/H.265における変換設計
HEVC規格は、ブロックベースの動き補償映像圧縮のコンテキストにおいて2次元変換に使用されるべき、サイズ4×4、8×8、16×16、および32×32のコア変換行列を規定する。従来の映像符号化規格と同様に、HEVCは、すべての変換サイズに対して逆離散コサイン変換(IDCT)に類似した2次元変換を規定する。複数の変換サイズは、圧縮性能を向上させるが、実装の複雑性を増大させる。
知られているように、離散サイン変換タイプVII(DST-VII)は、予測方向に沿ってDCT-IIよりも最適変換を近似する。HEVCにおいて、輝度イントラ予測残差を符号化するために、4×4のDST-VIIが採用されている。
標準、例えばVTM-2標準と比較した差は、二重太括弧を使用して区切られる。即ち、((a))は、“a”が追加されたことを示す。
7.3.2.3.1 一般ピクチャパラメータセットRBSP構文
7.3.2.3.2 ピクチャパラメータセットの範囲拡大構文
7.3.8.11 残差符号化構文
transform_skip_rotation_enabled_flagが1の場合は、変換スキップ動作を使用して符号化されたイントラ4×4ブロックの残差データブロックに回転が適用されることを示す。transform_skip_rotation_enabled_flagが0の場合は、この回転が適用されないことを示す。存在しない場合、transform_skip_rotation_enabled_flagの値は0であると推測される。
transform_skip_context_enabled_flagが1の場合は、変換がスキップされた変換ブロックのsig_coeff_flagの構文解析に特定のコンテキストが使用されることを示す。transform_skip_context_enabled_flagが0の場合は、変換ブロックの変換スキップまたは変換バイパスの有無が、このフラグのコンテキスト選択に使用されないことを示す。存在しない場合、transform_skip_context_enabled_flagの値は0であると推測される。
2.3 VVCワーキングドラフト3におけるMTS
多重変換選択(Multiple Transform Selection、MTS)技術において、代替変換のグループが予め定義される。エンコーダは、複数の予め定義された候補から1つの変換を選択し、その選択をビットストリームに明示的に信号通知するように権限を与えられる。これは、単一の予測方向であっても、残差統計量が有意に変化するという観察結果に基づいている。
2.3.1 VTM3における複数変換選択
現在のVVC設計において、MTSは、幅および高さの両方が64以下の輝度符号化ユニット(CU)に適用され、MTSが適用されるか否かは、tu_mts_flagと呼ばれるCUレベルフラグによって制御される。CUレベルフラグが0の場合、デフォルト変換DCT-IIをCUに適用し、剰余を符号化する。MTS有効化CU内の輝度符号化ブロックの場合、使用される水平および垂直変換をそれぞれ識別するように、2つの追加のフラグが信号通知される。各フラグは、DST-VIIまたはDCT-VIIIのいずれが利用されるかを示すために、1ビットで符号化される。
DCT-2変換に加え、DST-7およびDCT-8を適用してもよい。水平または垂直変換のいずれかのために、1ビットフラグ(mts_idxと呼ばれる)がデコーダ側に送信される。mts_idxと変換行列との間のマッピングを表2に示す。
表2:許容される変換行列のリスト
2.3.2 MTSの構文要素
7.3.2.1 シーケンスパラメータセットRBSP構文
7.3.4.10 変換ユニット構文
7.3.4.11 残差符号化構文
2.3.3 MTS構文要素の意味論
sps_mts_intra_enabled_flagが1の場合は、tu_mts_flagがイントラ符号化ユニットの残差符号化構文に存在する可能性があることを示す。sps_mts_intra_enabled_flagが0の場合は、tu_mts_flagはイントラ符号化ユニットの残差符号化構文内に存在しないことを示す。
sps_mts_inter_enabled_flagは、tu_mts_flagがインター符号化ユニットの残差符号化構文に存在する可能性があることを示す。sps_mts_inter_enabled_flagが0の場合は、tu_mts_flagはインター符号化ユニットの残差符号化構文内に存在しないことを示す。
tu_mts_flag[x0][y0]が1の場合は、関連する輝度変換ブロックの残差サンプルに多重変換選択を適用することを示す。tu_mts_flag[x0][y0]が0の場合は、関連する輝度変換ブロックの残差サンプルに多重変換選択を適用しないことを示す。配列インデックスx0,y0は、ピクチャの左上輝度サンプルに対する、考慮される変換ブロックの左上輝度サンプルの位置(x0,y0)を指定する。
mts_flag[x0][y0]が存在しない場合、0に等しいと推測される。
mts_idx[x0][y0][cIdx]は、現在の変換ブロックの水平および垂直方向に沿ってどの変換カーネルを残差サンプルに適用するかを指定する。配列インデックスx0,y0は、考慮される変換ブロックの左上の輝度サンプルの、ピクチャの左上の輝度サンプルに対する位置(x0,y0)を指定し、配列インデックスcIdxは、色成分のインジケータを指定し、輝度については0であり、Cbについては1であり、Crについては2である。
mts_idx[x0][y0][cIdx]iが存在しない場合、-1に等しいと推測される。
表8-9 - mts_idx[x][y][cIdx]に基づくtrTypeHor,trTypeVerの仕様
2.4 (VVC作業草案4に従った)MTSの新進捗状況
2.4.1 JVET-L0134
イントラ予測誤差信号の分布はブロックの形状に相関するように見えるので、変換ブロックの幅および高さに基づいて、異なる方向への異なる変換を選択することが提案される。より正確には、変換ブロックの短辺にDST7を使用し、ブロックの長辺にDCT2を使用することが提案される。正方形のブロックの場合、水平および垂直変換の両方にDCT2を使用することが提案される。
表3:提案されたVTM-2とは異なる変換導出および信号通知テーブルを、太二重括弧を使用して囲んで区切る。
2.4.2 JVET-M0464
まずMTSフラグを構文解析する代わりに、変換スキップ(TS)フラグの後に、MTSインデックスのために2つのビンを有する固定長符号化が続き、新しい結合構文要素tu_mts_idxは、短縮された単項2値化を使用する。第1のビンはTSを示し、第2のビンはMTSフラグを示し、すべての後続のMTSインデックスを示す。完全な意味論および2値化を以下の表に示す。
コンテキストモデルの数は変更されず、tu_mts_idxの各ビンへのコンテキストインデックスの増分ctxIncの割り当ては、以下のようになる。
2.4.3 JVET-M0303における黙示的MTS
イントラ予測誤差信号の分布はブロックの形状に相関するように見えるので、変換ブロックの幅および高さに基づいて、異なる方向への異なる変換を選択することが提案される。より正確には、変換ブロックの短辺にDST7を使用し、ブロックの長辺にDCT2を使用することが提案される。正方形のブロックの場合、シーケンスに対してMTSが有効化される場合、水平および垂直変換の両方にDCT2を使用し、シーケンスに対してMTSが無効化される場合、DST7を使用することが提案される。形状適応性は、空間的予測モードで予測されるイントラブロックに対してのみ使用される。
2.4.4 最新のVVCワーキングドラフトにおける構文、意味論および復号化処理
2.4.4.1 シンタックス設計
7.3.2.1 シーケンスパラメータセットRBSP構文
7.3.6.10 変換ユニット構文
2.4.4.2 意味論
sps_mts_enabled_flagが1の場合、シーケンスパラメータセットRBSPの構文にsps_explicit_mts_intra_enabled_flagが存在し、シーケンスパラメータセットRBSPの構文にsps_explicit_mts_inter_enabled_flagが存在することを示す。sps_mts_enabled_flagが0の場合、シーケンスパラメータセットRBSPの構文にsps_explicit_mts_intra_enabled_flagが存在しないこと、およびsps_explicit_mts_inter_enabled_flagが存在しないことを示す。

sps_explicit_mts_intra_enabled_flagが1の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_intra_enabled_flagが0の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_intra_enabled_flagの値は0と推測される。

sps_explicit_mts_inter_enabled_flagが1の場合、インター符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_inter_enabled_flagが0の場合、インター符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_inter_enabled_flagの値は0と推測される。
2.4.4.3 復号化処理
暗黙的MTSを有効化するかどうかは、以下の規則に従って判定される。
変数implicitMtSEnabledは、以下のように導出される。
- sps_mts_enabled_flagが1であり、以下の条件の1つが真である場合、implicitMtsEnabledは1に設定される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITではない。
- cu_sbt_flagが1であり、Max(nTbW,nTbH)=32以下である
- sps_explicit_mts_intra_enabled_flag、sps_explicit_mts_inter_enabled_flagは両方とも0であり、CuPredMode[xTbY][yTbY]は、MODE_INTRAである。
- そうでない場合、implicitMtSEnabledは0に設定される。

水平変換カーネルを指定する変数trTypeHorおよび垂直変換カーネルを規定する変数trTypeVerは、以下のように導出される。
- cIdxが0よりも大きい場合、trTypeHorおよびtrTypeVerは、0に設定される。
- そうでない場合、implicitMtSEnabledが1の場合、以下が適用される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITでない場合、trTypeHorおよびtrTypeVerは、intraPredModeに依存して、表8-15に規定される。
- そうでない場合、cu_sbt_flagが1である場合、trTypeHorおよびtrTypeVerは、表8-14において、cu_sbt_horizontal_flagおよびcu_sbt_pos_flagに基づいて指定される。
- そうでない場合、(sps_explicit_mts_intra_enabled_flagとsps_explicit_mts_inter_enabled_flagが0の場合)、trTypeHorとtrTypeVerは以下のように導出される。
trTypeHor=(nTbW>=4 && nTbW<=16 && nTbW<=nTbH) ?1:0 (8-1030)
trTypeVer=(nTbH>=4 && nTbH<=16 && nTbH<=nTbW) ?1:0 (8-1031)
- そうでない場合、trTypeHorおよびtrTypeVerはtu_mts_idx[xTbY][yTbY]に基づいて、表8-13に指定される。
表8-13 - tu_mts_idx[x][y]に依存するtrTypeHor,trTypeVerの仕様
2.4.5 縮小セカンダリ変換
JEMにおいて、セカンダリ変換は、順方向プライマリ変換と量子化(エンコーダにおいて)の間、及び逆量子化と逆方向プライマリ変換(デコーダ側において)の間に適用される。図1に示すように、ブロックサイズにより4×4(または8×8)のセカンダリ変換を行う。例えば、4×4のセカンダリ変換は、小さなブロック(すなわち、min(幅、高さ)<8)に適用され、8×8のセカンダリ変換は、8×8ブロック当たりより大きなブロック(すなわち、min(幅、高さ)>4)に適用される。
セカンダリ変換には、非可分変換が適用されるので、これは非可分二次変換(Non-Separable Secondary Transform、NSST)とも呼ばれている。全体で35個の変換セットがあり、1つの変換セット当たり3つの非可分変換行列(カーネル、それぞれ16×16行列を有する)が使用される。
イントラ予測方向に従って、JVET-K0099では縮小セカンダリ変換(RST)が導入され、JVET-L0133では4つの変換セット(35の変換セットの代わりに)マッピングが導入された。この寄与において、8×8ブロック及び4×4ブロックのために、それぞれ16×48及び16×16行列が使用される。表記の便宜上、16×48変換をRST8×8として、16×16変換をRST4×4として表す。このような方法は、近年、VVCによって採用されている。
セカンダリな順方向及び逆方向変換は、プライマリ変換の処理ステップとは別個の処理ステップである。
エンコーダの場合、まずプライマリ順方向変換を行い、次にセカンダリ順方向変換及び量子化、並びにCABACビット符号化を行う。デコーダ、CABACビット復号化、及び逆量子化の場合、まずセカンダリ逆変換を実行し、次にプライマリ逆変換を行う。
RSTは、イントラ符号化TUsにのみ適用される。
2.5 VVCワーキングドラフト5におけるMTS
最近のVVC作業草案において、意味論および構文表の整列がずれている。
7.3.2.3 シーケンスパラメータセットRBSP構文
7.3.7.10 変換ユニット構文
sps_explicit_mts_intra_enabled_flagが1の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_intra_enabled_flagが0の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_intra_enabled_flagの値は0と推測される。
sps_explicit_mts_inter_enabled_flagが1の場合、インター符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_inter_enabled_flagが0の場合、インター符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_inter_enabled_flagの値は0と推測される。

pred_mode_flagが0に等しい場合、現在の符号化ユニットがインター予測モードで符号化されることを規定する。pred_mode_flagが1に等しい場合、現在の符号化ユニットがイントラ予測モードで符号化されることを規定する。変数CuPredMode[x][y]は、x=x0..x0+cbWidth-1およびy=y0..y0+cbHeight-1に対しては以下のように導出される。
- pred_mode_flagが0に等しい場合、CuPredMode[x][y]は、MODE_INTERに等しく設定される。
- あるいは、(pred_mode_flagが1に等しい場合)、CuPredMode[x][y]をMODE_INTRAに等しく設定する。
pred_mode_flagが存在しない場合、Iスライスをデコードするとき、1に等しいと推測され、PまたはBスライスを復号化するとき、それぞれ0に等しいと推測される。

pred_mode_ibc_flagが1に等しい場合、現在の符号化ユニットがIBC予測モードで符号化されることを規定する。pred_mode_ibc_flagが0に等しい場合、現在の符号化ユニットがIBC予測モードで符号化されないことを規定する。
pred_mode_ibc_flagが存在しない場合、Iスライスをデコードするとき、sps_ibc_enabled_flagの値に等しいと推測され、PまたはBスライスを復号化するとき、それぞれ0と推測される。
pred_mode_ibc_flagが1に等しいとき、変数CuPredMode[x][y]は、x=x0..x0+cbWidth-1およびy=y0..y0+cbHeight-1に対してMODE_IBCと等しくなるように設定される。
2.6 サブブロック変換
cu_cbfが1に等しいインター予測されたCUの場合、cu_sbt_flagは、残差ブロック全体が復号されるのか、サブ部分が復号化されるのかを示すために信号通知されてもよい。前者の場合、インターMTS情報をさらに構文解析し、CUの変換タイプを判定する。後者の場合、残差ブロックの一部は推測適応変換で符号化され、残差ブロックの他の部分はゼロ化される。SBTは、複合インターイントラモードには適用されない。
サブブロック変換において、SBT-VおよびSBT-H(常にDCT-2を使用する彩度TB)における輝度変換ブロックに対して位置依存変換が適用される。SBT-HとSBT-Vの2つの位置は、異なるコア変換に関連付けられる。具体的には、SBT位置ごとに水平方向及び垂直方向の変換は図3に示される。例えば、SBT-V位置0の水平及び垂直変換は、それぞれDCT-8及びDST-7である。残差TUの片側が32よりも大きい場合、対応する変換をDCT-2と設定する。従って、サブブロック変換は、残差ブロックのTUタイリング、cbf、並びに水平及び垂直変換を一緒に指定し、これは、1つのブロックの主な残差がこのブロックの片側にある場合の構文ショートカットと見なすことができる。
2.7 アフィン線形重み付きイントラ予測(ALWIP、または行列ベースのイントラ予測)
JVET-N0217には、アフィン線形重み付きイントラ予測(ALWIP、別名行列ベースイントラ予測(MIP))が提案される。
JVET-N0217において、2つの試験を行った。テスト1において、ALWIPは、8Kバイトのメモリ制限と、1サンプル当たり最大4回の乗算とを備えるように設計される。テスト2は、テスト1と同様であるが、メモリ要件およびモデルアーキテクチャの点で設計をさらに簡略化する。
○すべてのブロック形状のための単一のセットの行列およびオフセットベクトル。
○すべてのブロック形状に対してモード数を19に減らす。
○メモリ要件を5760個の10ビット値、すなわち7.20キロバイトに低減する。
○予測サンプルの線形補間は、第1のテストにおけるように、反復補間に取って代わって、1つの方向につき1つのステップで行われる。
2.8 イントラサブブロック分割(ISP)
JVET-M0102において、ISPは、表4に示すように、輝度イントラ予測ブロックを垂直または水平にブロックサイズの寸法により2個または4個のサブパーティションに分割することが提案される。図4および図5は、これら2つの可能性の例を示す。すべてのサブパーティションは、少なくとも16個のサンプルを有するという条件を満たす。
表4:ブロックサイズに応じたサブパーティションの数
これらのサブパーティションの各々について、エンコーダが送信した係数をエントロピー復号化し、その後、量子化および反転変換した後、残差信号を生成する。そして、サブパーティションをイントラ予測し、最後に、予測信号に残差信号を加えることで、対応する再構成サンプルを得る。従って、各サブパーティションの再構成値は、次のサブパーティションの予測を生成するために利用可能となり、この処理等を繰り返す。すべてのサブパーティションは、同じイントラモードを共有する。
イントラモードおよび利用される分割に基づいて、2つの異なるクラスの処理順序が使用され、これらを通常順および逆順と呼ぶ。通常順では、処理対象の第1のサブパーティションは、CUの左上のサンプルを含み、その後、下方向(水平分割)または右方向(垂直分割)に続くサブパーティションである。その結果、サブパーティション予測信号を生成するために使用する参照サンプルは、ラインの左上に位置するのみである。一方、逆の処理順序は、CUの左下のサンプルを含むサブパーティションから始まり、上へ続くか、またはCUの右上のサンプルを含むサブパーティションから始まり、左へ続く。
2.9 ブロック差動パルスコード変調符号化(BDPCM)
JVET-M0057において、BDPCMが提案されている。現在の画素を予測するために左(A)(または上(B))の画素を使用する水平(または垂直)予測モジュールの形状により、ブロックを最もスループット効率よく処理する方法は、1つの列(またはライン)のすべての画素を並列に処理し、これらの列(またはライン)を順次処理することである。スループットを向上させるために、我々は、以下の処理を導入する。すなわち、このブロックにおいて選択された予測子が垂直である場合、幅4のブロックを水平フロンティアで二分割し、このブロックにおいて選択された予測子が水平である場合、高さ4のブロックを垂直フロンティアで二分割する。
1つのブロックを分割する場合、1つの領域からのサンプルに対して別の領域からの画素を使用して予測を計算することはできず、このような状況が発生した場合、予測画素を予測方向の参照画素に置き換える。これについては、垂直方向に予測された4×8個のブロック内の現在の画素Xの異なる位置について、図6に示されている。
この特性のため、図7に示すように、4×4ブロックを2サイクルで処理することができ、4×8または8×4ブロックを4サイクルで処理してもよい。
2.10 量子化残差ドメインBDPCM
JVET-N0413において、量子化残差ドメインBDPCM(以下、RBDPCMと称する)が提案される。イントラ予測は、イントラ予測と同様に、予測方向(水平または垂直予測)にサンプルコピーすることで、ブロック全体で予測する。残差を量子化し、量子化された残差とその予測子(水平または垂直)量子化値との間のデルタを符号化する。
サイズM(行)×N(列)のブロックについて、ri,j,0≦i≦M-1、0≦j≦N-1を、上または左ブロックの境界サンプルからのフィルタリングされていないサンプルを使用して、水平方向(予測ブロックに対して左隣の画素値を1ラインずつコピーする)または垂直方向(予測ブロックにおける各ラインに上隣のラインをコピーする)にイントラ予測を行った後の予測残差とする。Q(ri,j)、0≦i≦M-1、0≦j≦N-1は、残差ri,jの量子化バージョンを表し、この場合、残差は、元のブロックと予測ブロック値との間の差である。次に、ブロックDPCMが量子化された残差サンプルに適用され、その結果、要素ri,jを有する修正されたM×N個の配列Rが得られる。垂直BDPCMが信号通知されると、以下のようになる。
水平予測の場合、類似した規則が適用され、残差量子化サンプルは、以下の式によって得られる。
残差量子化サンプルr i,jはデコーダに送られる。
デコーダ側では、上記の計算を逆にして、Q(ri,j)、0≦i≦M-1、0≦j≦N-1を生成する。垂直予測の場合、
水平方向の場合、
逆量子化された残差Q-1(Q(ri,j))をイントラブロック予測値に加算し、再構成されたサンプル値を生成する。
このスキームの利点のひとつは、DPCMを逆方向にすることを、係数の構文解析中にオンザフライで行うことができ、係数の構文解析中に予測子を追加するだけで済むこと、
または、構文解析後に行うことができることである。
量子化された残差ドメインBDPCMにおいては、常に変換スキップが使用される。
3 既存の実装形態の欠点
VVCの現在の設計において、3つの異なるマージリストが異なる手順で利用され、それはハードウェア実装コストを増加させる。
(1)MTSは、4:4:4や他のカラーフォーマットが有効な場合など、カラーリッチなシーケンスには最適ではない可能性がある輝度ブロックにのみ適用されてもよい。
(2)MTSは、イントラ、インター、およびIBCの両方に対してサポートされる。そして、IBC MTSの制御は、MTSがインター符号化ブロックに対して有効化されるかどうかの条件付きチェックを受ける。IBCは第3のモードとして定義されるので、IBC MTSの使用を別個に制御するほうがよい可能性がある。
(3)MTSインデックスを符号化するコンテキストは、CUの深さに依存する。しかしながら、変換インデックスと符号化モードとの間にはある程度の相関がある。そのような相関を使用すれば、追加の符号化利得を得られる場合もある。
(4)IBCをインターモードとして扱う場合、MTSインデックスを信号通知するための条件チェックに問題はない。しかしながら、IBCは、現在、イントラモードおよびインターモードに並行して、新しいモードとして扱われ、条件付きチェックおよび意味論には問題が生じている。
4 コンテキストモデリングおよび多重変換行列選択のための例示的な方法
本開示の技術の実施形態は、既存の実装の欠点を克服し、それにより、より高い符号化効率を有する映像符号化を提供する。本明細書に開示される技術に基づいてコンテキストモデリングおよび多重変換行列選択を行う方法は、既存のおよび将来の映像符号化規格を共に向上させることができ、以下の様々な実装形態において説明する。以下に提供される開示される技術の例は、一般的な概念を説明するものであり、限定するものと解釈されるべきではない。一例において、明確に示されていない限り、逆に示されていない限り、これらの例に記載されている様々な特徴を組み合わせることができる。
1. 暗黙的MTSを適用するかどうか、および/またはどのように適用するか(すなわち、変換インデックスを明示的に信号通知せずに変換行列を選択するかどうか)は、1つのブロックがモードXで符号化されているかどうか、および/または符号化された残差情報に依存してもよい。
a. 一例において、モードXは、IBCモードであってもよい。
b. 一例において、1つのブロックがIBCモードで符号化される場合、黙示的MTSは、自動的に有効化されてもよい。
c. 一例において、IBC符号化ブロックのための変換行列の選択は、イントラ符号化ブロックのための変換行列の選択と同じであってもよい。
i. 一例において、正方形のブロックのために、DCT-2が適用される。
ii. 一例において、非正方形のブロックの場合、短辺にDST-7が適用され、長辺にDCT-2が適用される。
d. 一例において、変換行列の選択は、ブロックがイントラ符号化されるかまたはIBC符号化されるか等の符号化モード情報に依存してもよい。
i. 一例において、IBC符号化された正方形のブロックのために、DST-7が適用される。
ii. 一例において、IBC符号化された非正方形のブロックの場合、短辺に変換スキップを適用してもよい。
iii. 一例において、IBC符号化された非正方形のブロックの場合、長辺に変換スキップまたはDST-7を適用してもよい。
e. 他の例において、モードXは、セカンダリ変換であってもよい。
f. 他の例において、モードXは、BDPCMモードまたは/およびDPCMモードまたは/およびRBDPCMモードまたは/およびALWIPモードであってもよい。
g. 他の例では、モードXは、任意の特定の角度イントラ予測モード(例えば、DC、平面、垂直、水平等)でもよい。
2. 1つのブロックがモードXで符号化されているかどうかに従って、許容される変換のセットを判定してもよい。
a. 一例において、モードXは、IBCモードであってもよい。
b. 一例において、モードXは、イントラおよびインター予測(CIIP)複合モードであってもよい。
c. 一例において、IBC符号化ブロックのための許容される変換行列のセットは、イントラ符号化ブロックのための変換行列の選択と同じであってもよい。
d. 代替的に、IBC符号化ブロックのための許容される変換行列の異なるセットは、イントラ符号化ブロックのためのものと同じであってもよく、例えば、IBC符号化ブロックのために、変換スキップ、DCT-2、DCT-8、DST-7が許容されてもよい。
e. 他の例において、モードXは、BDPCMモードまたは/およびDPCMモードまたは/およびRBDPCMモードまたは/およびALWIPモードであってもよい。
f. 他の例では、モードXは、任意の特定の角度イントラ予測モード(例えば、DC、平面、垂直、水平等)でもよい。
g. 他の例において、モードXは、セカンダリ変換であってもよい。
3. MTSインデックスを符号化するためのコンテキストモデリングは、符号化モード情報に依存してもよいことが提案される。
a. 符号化モード情報は、イントラまたはノンイントラを含んでもよい。
i. 代替的に、符号化モード情報は、イントラまたはインターまたはIBCを含んでもよい。
ii. 代替的に、符号化モード情報は、インターまたはノンインターを含んでもよい。
b. 代替的に、MTSインデックスを符号化するためのコンテキストモデリングは、ブロック形状情報に依存してもよい。
i. 一例において、ブロック形状情報は、ブロックが正方形であるかまたは非正方形であるかを含んでもよい。
ii. 一例において、ブロック形状情報は、幅が高さ以下であるかどうかを含んでもよい。
iii. 一例において、ブロック形状情報は、幅が高さ以上であるか否かを含んでもよい。
iv. 一例において、ブロック形状情報は、幅と高さの比を含んでもよい。
4. 水平および垂直変換行列インデックスを別個に符号化することが提案される。
a. 一例において、変換スキップフラグは、別個に符号化されない。その代わりに、それは水平および垂直変換行列インデックスの1つとして扱われる。
i. 一例において、変換スキップは、一方向(例えば、水平方向または垂直方向)にのみ適用されてもよい。
b. 垂直変換行列インデックスのコンテキストモデリングは、水平変換行列インデックスに依存してもよい。代替的に、水平変換行列インデックスのコンテキストモデリングは、垂直変換行列インデックスに依存してもよい。
c. 一例において、1つのフラグは、まず水平および垂直変換行列が同じであるかどうかを示すように符号化されてもよい。
5. IBC符号化ブロックのためのMTSの使用の指示は、シーケンス/ピクチャ/タイルグループ/スライス/CTU行/任意の映像データユニットレベルで信号通知されてもよい。
a. 一例において、IBC符号化ブロックのためにMTSを有効化するかどうか(例えば、1つのフラグ)は、SPS/PPS/スライスヘッダ/ピクチャヘッダ/タイルグループヘッダ/タイルヘッダ等において信号通知されてもよい。
i. さらに、代替的に、このようなフラグは、SPS/PPS/スライスヘッダ/ピクチャヘッダ等において明示的なMTSおよびIBCが有効にされているかどうかに基づいて、条件付きで符号化されてもよい。
b. 代替的に、IBC符号化ブロックのためにMTSを有効にするかどうか(例えば、1つのフラグ)は、インター符号化ブロックのためにMTSを有効にするかどうかから導出されてもよい。
i. この場合、1つのSPSフラグのみが、IBCおよびインターMTS間の両方を制御するように信号通知されてもよい。
c. 一例において、IBC符号化ブロックのためのMTSは、常に許容されなくてもよい。
d. 一例において、MTSの適用の有無および/またはその方法は、非ゼロ符号化係数の数に依存してもよい。
e. 一例において、MTSの適用の有無および/またはその方法は、非ゼロ符号化係数の絶対値の合計に依存してもよい。
f. 一例において、MTSの適用の有無および/またはその方法は、非ゼロ係数の最後の位置に依存してもよい。
6. 彩度成分へのMTSの適用の有無および/またはその方法は、カラーフォーマットに依存してもよい。
a. 一例において、カラーサブサンプリングフォーマットが4:4:4である場合、彩度成分(またはB/R色成分等の従属成分)のためのMTSを有効化してもよい。
b. 一例において、彩度成分のためのMTSが有効化される場合、色成分の2つの対応するブロックは、強制的に同じ変換行列を適用されてもよい。
i. 選択された変換行列の指示は、1つの色成分における1つのブロックに対して信号通知されてもよく、別の色成分における別のブロックは同じ行列に従う。
ii. 彩度成分に適用される変換行列は、対応する輝度ブロックまたは主成分(例えば、G色成分)に使用される変換行列から導出されてもよい。
c. 一例において、彩度成分のためのMTSが有効化される場合、2つの対応する色成分の対応するブロックは、異なる変換行列を使用してもよい。
i. 2つのブロックのために選択された変換行列の指示は、別個に信号通知されてもよい。
1. さらに、代替的に、2色成分間での変換行列インデックスの予測符号化を適用してもよい。
2. さらに、代替的に、1つの色成分と輝度/主成分との間での変換行列インデックスの予測符号化を適用してもよい。
3. 代替的に、1つの色成分の変換行列および/または輝度/主成分を、別の色成分のインデックスを符号化するコンテキストモデリングに利用してもよい。
d. 彩度成分のためのMTSインデックスを信号通知するかどうかは、カラーフォーマットおよび/または別個のプレーン符号化が有効化されているかどうかに依存してもよい。
i. 一例において、それが4:0:0であるおよび/または別個のプレーン符号化が有効化されている場合、彩度成分のためにMTSインデックスを信号通知する必要がない。
7. 暗黙的MTSに適用される上記方法は、オンザフライで変換行列を導出するSBTにも適用可能でもよい。
8. 彩度成分に対してISPの適用の有無および/またはその方法は、カラーフォーマットに依存してもよい。
a. 一例において、カラーサブサンプリングフォーマットが4:4:4である場合、彩度成分(またはB/R色成分等の従属成分)のためのISPを有効化してもよい。さらに、代替的に、カラーサブサンプリングフォーマットが4:4:4でない場合、彩度成分(またはB/R色成分等の従属成分)のISPを無効化してもよい。
b. 彩度成分のためにISPが有効化されるとき、彩度ブロックのためのISPおよび/または他の関連情報(例えば、ISP分割)の使用の指示が符号化されてもよい。
i. 一例において、それは、ブロック寸法に従って条件付きで符号化されてもよい。
ii. 一例において、イントラ予測方法に従って、例えば、クロス成分線形モデル予測方法が適用されるかどうかなどの条件付き符号化を行ってもよい。
iii. 一例において、イントラ予測方法に従って、ジョイント彩度残差符号化が適用されるかどうか等の条件付き符号化を行ってもよい。
iv. 一例において、それは、イントラ予測方向に従って条件付きで符号化されてもよい。
v. 一例において、DMが使用されるかどうか(すなわち、イントラ予測モードが輝度成分から導出されるかどうか)に従って、それを条件付きで符号化してもよい。
c. 彩度成分のためにISPが有効化されるとき、彩度ブロックのためのISPおよび/または他の関連情報(例えば、ISP分割)の使用の指示は、オンザフライで導出されてもよい。
i. 一例において、それらは、近傍の彩度ブロックの再構成されたサンプル/符号化された情報に従って導出されてもよい。
ii. 一例において、それらは、同一位置の輝度ブロック内の1つまたは複数の選択ブロックに従って導出されてもよい。
iii. 一例において、それらは、同一位置の輝度ブロックの近傍の情報に従って導出されてもよい。
上述した例は、例えば、方法810、820、830、840、850、860、870、880、890に記載される方法のコンテキストに援用されてもよく、これらの方法は、映像デコーダまたは映像エンコーダにおいて実装されてもよい。
図8Aは、例示的な映像処理方法のフローチャートを示す。方法810は、ステップ812において、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示がビットストリーム表現から排除されると判定することを含み、現在の映像ブロックは、イントラブロックコピー(IBC)モードを使用して符号化される。
方法810は、ステップ814において、変換を行うことを含む。いくつかの実施形態において、指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、符号化ユニットまたは映像データユニット中にあり、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
図8Bは、例示的な映像処理方法のフローチャートを示す。方法820は、ステップ822において、映像の現在の映像ブロックの符号化モードに基づいて、多重変換選択(MTS)演算の選択的適用に関して決定することを含む。
方法820は、ステップ824において、決定に基づいて、現在の映像ブロックと映像のビットストリーム表現との間で変換を行うことを含む。いくつかの実施形態において、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
図8Cは、例示的な映像処理方法のフローチャートを示す。方法830は、ステップ832において、現在の映像ブロックの特徴に基づいて、多重変換選択(MTS)演算の少なくとも1つのインデックスにおける符号化用のコンテキストモデルを構成することを含む。
方法830は、ステップ834において、構成することに基づいて、現在の映像ブロックと、現在の映像ブロックを構成する映像のビットストリーム表現との間で変換を行うことを含む。いくつかの実施形態において、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
図8Dは、例示的な映像処理方法のフローチャートを示す。方法840は、ステップ842において、現在の映像ブロックと現在の映像ブロックを含む映像のビットストリーム表現との間での変換中、多重変換選択(MTS)演算を含む変換を判定することを含む。
方法840は、ステップ844において、判定することに基づいて、MTS演算の行列の1つ以上の水平インデックスおよび1つ以上の垂直インデックスを別個に符号化することを含む。いくつかの実施形態において、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
図8Eは、例示的な映像処理方法のフローチャートを示す。方法850は、ステップ852において、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示を、イントラブロックコピー(IBC)モードを使用して符号化されるように構成することを含む。
方法850は、ステップ854において、変換を行うことを含む。いくつかの実施形態において、指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、または映像データユニット中にあり、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
図8Fは、例示的な映像処理方法のフローチャートを示す。方法860は、ステップ862において、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、現在の映像ブロックに対し、多重変換選択(MTS)演算における変換タイプの指示がビットストリーム表現から排除されるかどうかを判定することを含む。
方法860は、ステップ864において、変換を行うことを含む。いくつかの実施形態において、指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、符号化ユニットまたは映像データユニット中にあり、判定することは、非ゼロ符号化係数の最終位置に基づいて、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
図8Gは、例示的な映像処理方法のフローチャートを示す。方法870は、ステップ872において、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、現在の映像ブロックの彩度成分に対して多重変換選択(MTS)演算を使用する指示を構成することを含む。
方法870は、ステップ874において、変換を行うことを含む。いくつかの実施形態において、構成することは、現在の映像ブロックのカラーフォーマットに基づいており、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む。
図8Hは、例示的な映像処理方法のフローチャートを示す。方法880は、ステップ882において、映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、現在の映像ブロックに対してサブブロック変換(SBT)演算が適用されると判定することを含む。
方法880は、ステップ884において、多重変換選択(MTS)演算を使用して変換を行うことを含む。いくつかの実施形態において、SBT演算は位置依存変換演算を含み、MTS演算は、変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義された変換候補からの変換を使用することを含む。
図8Iは、例示的な映像処理方法のフローチャートを示す。方法890は、ステップ892において、映像の現在の映像ブロックのカラーフォーマットに基づいて、現在の映像ブロックの彩度成分に対してイントラサブブロック分割(ISP)動作の選択的適用に関して決定することを含む。
方法890は、ステップ894において、決定に基づいて、現在の映像ブロックと映像のビットストリーム表現との間で変換を行うことを含む。いくつかの実施形態において、ISP演算は、ブロックを、少なくとも所定の数のサンプルを有するサブパーティションに垂直または水平に分割することを含む。
5 開示される技術の例示的な実装形態
図9は、映像処理装置900のブロック図である。装置900は、本明細書に記載の方法の1つ以上を実装するために使用してもよい。装置900は、スマートフォン、タブレット、コンピュータ、IoT(モノのインターネット)受信機等により実施されてもよい。装置900は、1つ以上の処理装置902と、1つ以上のメモリ904と、映像処理ハードウェア906と、を含んでもよい。1つまたは複数の処理装置902は、本明細書に記載される1つ以上の方法(方法800、810、820、830および840を含むが、これに限定されない)を実装するように構成されてもよい。メモリ(複数可)904は、本明細書で説明される方法および技術を実装するために使用されるデータおよびコードを記憶するために使用してもよい。映像処理ハードウェア906は、本明細書に記載される技術をハードウェア回路にて実装するために使用してもよい。
いくつかの実施形態において、映像符号化法は、図9を参照して説明したように、ハードウェアプラットフォームに実装される装置を使用して実施してもよい。
開示される技術のいくつかの実施形態は、映像処理ツールまたはモードを有効化するように決定または判定することを含む。一例において、映像処理ツールまたはモードが有効化される場合、エンコーダは、1つの映像ブロックを処理する際にこのツールまたはモードを使用するまたは実装するが、このツールまたはモードの使用に基づいて、結果として得られるビットストリームを必ずしも修正しなくてもよい。すなわち、映像のブロックから映像のビットストリーム表現への変換は、決定または判定に基づいて映像処理ツールまたはモードが有効化される場合に、この映像処理ツールまたはモードを使用する。別の例において、映像処理ツールまたはモードが有効化される場合、デコーダは、ビットストリームが映像処理ツールまたはモードに基づいて修正されたことを知って、ビットストリームを処理する。すなわち、決定または判定に基づいて有効化された映像処理ツールまたはモードを使用して、映像のビットストリーム表現から映像のブロックへの変換を行う。
開示される技術のいくつかの実施形態は、映像処理ツールまたはモードを無効化するように決定または判定することを含む。一例において、映像処理ツールまたはモードが無効にされている場合、エンコーダは、映像のブロックを映像のビットストリーム表現に変換する際に、このツールまたはモードを使用しない。別の例において、映像処理ツールまたはモードが無効にされている場合、デコーダは、決定または判定に基づいて有効化された映像処理ツールまたはモードを使用してビットストリームが修正されていないことを知って、ビットストリームを処理する。
図10は、本明細書で開示される様々な技術が実装され得る例示的な映像処理システム1000を示すブロック図である。様々な実装形態は、システム1000のモジュールの一部又は全部を含んでもよい。システム1000は、映像コンテンツを受信するための入力ユニット1002を含んでもよい。映像コンテンツは、未加工又は非圧縮フォーマット、例えば、8又は10ビットのマルチモジュール画素値で受信されてもよく、又は圧縮又は符号化フォーマットで受信されてもよい。入力ユニット1002は、ネットワークインターフェース、周辺バスインターフェース、又は記憶インターフェースを表してもよい。ネットワークインターフェースの例は、イーサネット(登録商標)、パッシブ光ネットワーク(PON)等の有線インターフェース、およびWi-Fi(登録商標)またはセルラーインターフェース等の無線インターフェースを含む。
システム1000は、本明細書に記載される様々な符号化又は符号化方法を実装することができる符号化モジュール1004を含んでもよい。符号化モジュール1004は、入力ユニット1002からの映像の平均ビットレートを符号化モジュール1004の出力に低減し、映像の符号化表現を生成してもよい。従って、この符号化技術は、映像圧縮または映像コード変換技術と呼ばれることがある。符号化モジュール1004の出力は、モジュール1006によって表されるように、記憶されてもよいし、接続された通信を介して送信されてもよい。入力ユニット1002において受信された、記憶された又は通信された映像のビットストリーム(又は符号化)表現は、モジュール1008によって使用されて、表示インターフェースユニット1010に送信される画素値又は表示可能な映像を生成してもよい。ビットストリーム表現からユーザが見ることができる映像を生成する処理は、映像伸張(映像展開)と呼ばれることがある。さらに、特定の映像処理動作を“符号化”動作又はツールと呼ぶが、符号化ツール又は動作は、エンコーダ及びそれに対応する、復号化の結果を逆にする復号化ツール又は動作が、デコーダによって行われることが理解されよう。
周辺バスインターフェースユニットまたは表示インターフェースユニットの例は、ユニバーサルシリアルバス(USB)または高精細マルチメディアインターフェース(HDMI)(登録商標)またはディスプレイポート等を含んでもよい。ストレージインターフェースの例は、シリアルアドバンスドテクノロジーアタッチメント(SATA)、PCI、IDEインターフェース等を含む。本明細書に記載される技術は、携帯電話、ノートパソコン、スマートフォン、又はデジタルデータ処理及び/又は映像表示を実施可能な他のデバイス等の様々な電子デバイスに実施されてもよい。
以下の実施形態において、太二重丸括弧を使用して追加を示す。例えば、{{a}}は、“a”が追加されたことを示し、また、削除は、太二重大括弧を使用して示し、例えば、[[b]]は、“b”が削除されたことを示す。
5.1 実施形態#1
この章では、IBCおよびインター符号化ブロックのためのMTSの別個の制御の例を示す。
7.3.2.3 シーケンスパラメータセットRBSP構文
代替的に、条件付き信号通知を利用してもよい。
7.3.7.10 変換ユニット構文
sps_explicit_mts_intra_enabled_flagが1の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_intra_enabled_flagが0の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_intra_enabled_flagの値は0と推測される。
sps_explicit_mts_inter_enabled_flagが1の場合、インター符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_inter_enabled_flagが0の場合、インター符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_inter_enabled_flagの値は0と推測される。
{{sps_explicit_mts_ibc_enabled_flagが1の場合、IBC符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_ibc_enabled_flagが0の場合、IBC符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_ibc_enabled_flagの値は0と推測される。}}
5.2 実施形態#2
この章は、IBCおよびインター符号化ブロックのためのMTSのジョイント制御の例を示す。
現在の構文設計は修正されないままであるが、意味論は以下のように変更される。
sps_explicit_mts_intra_enabled_flagが1の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_intra_enabled_flagが0の場合、イントラ符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_intra_enabled_flagの値は0と推測される。
sps_explicit_mts_inter_enabled_flagが1の場合、{{non-intra}}[[inter]]符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_inter_enabled_flagが0の場合、インター符号化ユニットのインター変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_inter_enabled_flagの値は0と推測される。
代替的に、意味論は、以下のように修正されてもよい。
sps_explicit_mts_inter_enabled_flagが1の場合、インター{{and IBC}}符号化ユニットの変換ユニット構文にtu_mts_idxが存在する可能性があることを示す。sps_explicit_mts_inter_enabled_flagが0の場合、インター符号化ユニットの変換ユニット構文にtu_mts_idxが存在しないことを示す。存在しない場合、sps_explicit_mts_inter_enabled_flagの値は0と推測される。
いくつかの実施形態において、次の技術的解決策を実装してもよい。
A1.映像の現在の映像ブロックと映像のビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示が前記ビットストリーム表現から排除されると判定することであって、前記現在の映像ブロックは、イントラブロックコピー(IBC)モードを使用して符号化される、判定することと、前記変換を行うことと、を含み、前記指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、符号化ユニット、または映像データユニット中にあり、前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
A2.映像の現在の映像ブロックの符号化モードに基づいて、多重変換選択(MTS)演算の選択的適用に関して決定することと、決定することに基づいて、前記現在の映像ブロックと前記映像のビットストリーム表現との間で変換を行うこととを含み、前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
A3.前記MTS演算は暗黙的MTS演算であり、前記MTS演算の変換インデックスは前記ビットストリーム表現から除外される、解決策A2に記載の方法。
A4.前記符号化モードは、イントラブロックコピー(IBC)モードである、解決策A2またはA3に記載の方法。
A5.前記MTS演算は、前記符号化モードがイントラブロックコピーモードまたはイントラモードである場合にも同様に適用される、解決策A2またはA3に記載の方法。
A6.前記現在の映像ブロックが正方形のブロックであり、離散コサイン変換タイプII(DCT-II)が適用される、解決策A5に記載の方法。
A7.前記現在の映像ブロックが非正方形のブロックであり、離散コサイン変換タイプII(DCT-II)が前記現在の映像ブロックの長辺に適用され、DCT-VIIが前記現在の映像ブロックの短辺に適用される、解決策A5に記載の方法。
A8.前記符号化モードは、イントラブロック(IBC)コピーモードであり、前記現在の映像ブロックは、正方形のブロックであり、離散コサイン変換タイプVII(DCT-VII)が適用される、解決策A2またはA3に記載の方法。
A9.前記符号化モードは、イントラブロックコピー(IBC)モードであり、前記現在の映像ブロックは非正方形のブロックであり、前記現在の映像ブロックの短辺に変換スキップを適用する、解決策A2またはA3に記載の方法。
A10.前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、解決策A2またはA3に記載の方法。
A11.前記符号化モードは、角度イントラ予測モードである、解決策A2またはA3に記載の方法。
A12.前記ビットストリーム表現は、現在の映像ブロックの符号化モードに基づいて判定される、許容される変換のセットの指示を含む、解決策A2に記載の方法。
A13.前記符号化モードは、イントラブロックコピー(IBC)モードである、解決策A12に記載の方法。
A14.前記符号化モードは、イントラおよびインター予測(CIIP)複合モードである、解決策A12に記載の方法。
A15.前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、解決策A12に記載の方法。
A16.前記符号化モードは、角度イントラ予測モードである、解決策A12に記載の方法。
A17.この方法は、現在の映像ブロックの特徴に基づいて、多重変換選択(MTS)演算の少なくとも1つのインデックスにおける符号化用のコンテキストモデルを構成することと、この構成することに基づいて、前記現在の映像ブロックと前記現在の映像ブロックを含む映像のビットストリーム表現との間で変換を行うこととを含み、前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
A18.前記特徴は、前記現在の映像ブロックの符号化モードを含む、解決策A17に記載の方法。
A19.前記符号化モードは、イントラ符号化モード、またはインター符号化モード、またはインターブロックコピー(IBC)を含む、解決策A18に記載の方法。
A20.前記符号化モードは、インター符号化モードまたは非インター符号化モードを含む、解決策A18に記載の方法。
A21.前記特徴は、前記現在の映像ブロックに関連付けられた形状情報を含む、解決策A17に記載の方法。
A22.前記形状情報は、前記現在の映像ブロックが正方形または非正方形であることを含む、解決策A21に記載の方法。
A23.前記形状情報は、前記現在の映像ブロックの幅が前記現在の映像ブロックの高さよりも小さい、解決策A21に記載の方法。
A24.前記形状情報は、前記現在の映像ブロックの幅が前記現在の映像ブロックの高さよりも大きい、解決策A21に記載の方法。
A25.前記形状情報は、前記現在の映像ブロックの幅と前記現在の映像ブロックの高さとの比を含む、解決策A21に記載の方法。
A26.現在の映像ブロックと前記現在の映像ブロックを含む映像のビットストリーム表現との間での変換中、多重変換選択(MTS)演算を含む変換を判定することと、前記判定することに基づいて、前記MTS演算の行列の1つ以上の水平インデックスおよび1つ以上の垂直インデックスを別個に符号化することと、を含み、前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
A27.前記1つ以上の水平方向インデックスおよび/または前記1つ以上の垂直方向インデックスは、変換スキップ動作を含む、解決策A26に記載の方法。
A28.前記1つ以上の水平方向インデックスのためのコンテキストモデルは、前記1つ以上の垂直方向インデックスに基づく、解決策A26に記載の方法。
A29.前記1つ以上の垂直インデックスのためのコンテキストモデルは、前記1つ以上の水平インデックスに基づく、解決策A26に記載の方法。
A30.映像の現在の映像ブロックと前記映像のビットストリーム表現との間での変換のために、イントラブロックコピー(IBC)モードを使用して符号化される現在の映像ブロックに多重変換選択(MTS)演算の変換タイプの指示を構成することと、前記変換を行うことと、を含み、前記指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、または映像データユニット中にあり、MTS演算は、前記変換中に現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
A31.前記指示は、前記SPS、前記PPS、前記タイルグループヘッダ、前記スライスヘッダ、前記ピクチャヘッダ、前記タイルヘッダ、前記CTU行、または前記映像データユニットにおいて、前記MTS演算および前記IBCモードが明示的に符号化されているかどうかに基づいて、前記ビットストリーム表現により条件付きで符号化される、解決策A30に記載の方法。
A32.前記指示は、前記MTS演算がインター符号化映像ブロックに対して有効化されているかどうかに基づいて、前記ビットストリーム表現において条件付きで符号化される、解決策A30に記載の方法。
A33.前記SPSは前記指示を含み、前記指示は、インターコードされた映像ブロックのために前記MTS演算を使用することをさらに構成する、解決策A30に記載の方法。
A34.前記指示は、非ゼロ符号化係数の数に基づく、解決策A30に記載の方法。
A35.前記指示は、非ゼロ符号化係数の絶対値の合計に基づく、解決策A30に記載の方法。
A36.前記変換は、前記ビットストリーム表現から現在のブロックを生成する、解決策A1~A35のいずれかに記載の方法。
A37.前記変換は、前記現在のブロックから前記ビットストリーム表現を生成する、解決策A1~A35のいずれかに記載の方法。
A38.処理装置と、命令を記憶する非一時的メモリとを備える装置であって、前記処理装置による実行時に、前記命令は、前記処理装置に解決策A1~A37のいずれかに記載の方法を実施させる映像システムの装置。
A39.非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品であって、解決策A1~A37のいずれかに記載の方法を実行するためのプログラムコードを含む、コンピュータプログラム製品。
いくつかの実施形態において、次の技術的解決策を実装してもよい。
B1.映像の現在の映像ブロックと前記映像のビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示が現在の映像ブロックに対し、前記ビットストリーム表現から排除されるかどうかを判定することと、前記変換を行うことと、を含み、前記指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、符号化ユニット、または映像データユニット中にあり、前記判定することは、非ゼロ符号化係数の最終位置に基づき、前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
B2.映像の現在の映像ブロックと前記映像のビットストリーム表現との間での変換のために、前記現在の映像ブロックの彩度成分に対して多重変換選択(MTS)演算を使用する指示を構成することと、前記変換を行うことと、を含み、前記構成することは、前記現在の映像ブロックのカラーフォーマットに基づいており、前記MTS演算は、前記変換中に前記現在の映像ブロックの予測誤差を変換するために、予め定義された複数の変換候補からの変換を使用することを含む、映像処理方法。
B3.前記カラーフォーマットが4:4:4であると判定された場合、前記MTS演算を前記彩度成分に適用する、解決策B2に記載の方法。
B4.前記MTS演算は前記彩度成分に適用され、1つの色成分の2つのブロックは同一の変換行列を使用する、解決策B2に記載の方法。
B5.前記MTS演算は前記彩度成分に適用され、1つの色成分の2つのブロックは異なる変換行列を使用する、解決策B2に記載の方法。
B6.前記ビットストリーム表現に前記指示を含めることは、カラーフォーマットまたは別個のプレーン符号化の使用に基づく、解決策B2に記載の方法。
B7.映像の現在の映像ブロックと前記映像のビットストリーム表現との間での変換のために、現在の映像ブロックに対して適用されるサブブロック変換(SBT)演算を判定することと、多重変換選択(MTS)演算を使用することによって変換を行うこととを含み、前記SBT演算は、位置依存変換演算を含み、前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
B8.前記符号化モードは、イントラブロックコピー(IBC)モードである、解決策B7に記載の方法。
B9.前記SBT演算は、符号化モードがイントラブロックコピーモードまたはイントラモードである場合にも同様に適用される、解決策7に記載の方法。
B10.前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、解決策B7に記載の方法。
B11.前記符号化モードは、角度イントラ予測モードである、解決策B7に記載の方法。
B12.映像の現在の映像ブロックのカラーフォーマットに基づいて、前記現在の映像ブロックの彩度成分へのイントラサブブロック分割(ISP)演算の選択的適用に関して決定することと、前記決定に基づいて、前記現在の映像ブロックと前記映像のビットストリーム表現との間で変換を行うことと、前記ISP演算は、ブロックを、少なくとも所定の数のサンプルを有するサブパーティションに、垂直または水平に分割することを含む、映像処理方法。
B13.前記ISP演算が彩度成分に適用され、前記カラーフォーマットが4:4:4である、解決策B12に記載の方法。
B14.前記ISP演算を前記彩度成分に適用し、前記ISP演算の構成は、(i)現在の映像ブロックの高さまたは幅、(ii)現在の映像ブロックにクロスコンポーネント線形モデル(CCLM)予測方法を適用するかどうか、(iii)現在の映像ブロックにジョイント彩度残差符号化を適用するかどうか、(iv)イントラ予測方向、または(v)現在の映像ブロックの輝度成分からイントラ予測モードを導出するかどうか、のうちの1つ以上に基づく、解決策B12に記載の方法。
B15.前記ISP演算は前記彩度成分に適用され、前記ISP演算の構成は、1つ以上の近傍のブロックの彩度成分の再構成サンプルまたは符号化された情報に基づく、解決策B12に記載の方法。
B16.前記変換は、前記ビットストリーム表現から前記現在のブロックを生成する、解決策B11~B15のいずれかに記載の方法。
B17.前記変換は、前記現在の映像ブロックから前記ビットストリーム表現を生成する、解決策B11~B15のいずれかに記載の方法。
B18.処理装置と、その処理装置に命令が記憶された非一時的メモリとを備える装置であって、命令が処理装置によって実装されることにより、処理装置に、解決策B1~B17のいずれかに記載の方法を実施させる映像システムの装置。
B19.非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品であって、解決策B1~B17のいずれかに記載の方法を実行するためのプログラムコードを含む、コンピュータプログラム製品。
いくつかの実施形態において、次の技術的解決策を実装してもよい。
C1.現在の映像ブロックの符号化モードに基づいて、多重変換選択(MTS)演算の選択的適用に関して決定することと、決定に基づいて、現在の映像ブロックと現在の映像ブロックを含む映像のビットストリーム表現との間で変換を行うこととを含み、MTS演算は、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
C2.前記MTS演算は、前記MTS演算における1つ以上の変換インデックスの暗黙的信号通知を含む、解決策C1に記載の方法。
C3.前記符号化モードは、イントラブロックコピー(IBC)モードである、解決策C2に記載の方法。
C4.前記MTS演算は、前記符号化モードがイントラブロックコピーモードまたはイントラモードである場合にも同様に適用される、解決策C2に記載の方法。
C5.現在の映像ブロックが正方形のブロックであり、離散コサイン変換タイプII(DCT-II)が適用される、解決策C4に記載の方法。
C6.現在の映像ブロックが非正方形のブロックであり、離散コサイン変換タイプII(DCT-II)が現在の映像ブロックの長辺に適用され、DCT-VIIが現在の映像ブロックの短辺に適用される、解決策C4に記載の方法。
C7.前記符号化モードは、イントラブロックコピー(IBC)モードであり、現在の映像ブロックは正方形のブロックであり、離散コサイン変換タイプVII(DCT-VII)が適用される、解決策C2に記載の方法。
C8.前記符号化モードは、イントラブロックコピー(IBC)モードであり、現在の映像ブロックは非正方形のブロックであり、現在の映像ブロックの短辺に変換スキップを適用する、解決策C2に記載の方法。
C9.前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、解決策C2に記載の方法。
C10.前記符号化モードは、角度イントラ予測モードである、解決策C2に記載の方法。
C11.前記MTS演算は、現在の映像ブロックの符号化モードに基づいて判定される、許容される変換のセットを含む、解決策C1に記載の方法。
C12.前記符号化モードは、イントラブロックコピー(IBC)モードである、解決策C11に記載の方法。
C13.前記符号化モードは、イントラおよびインター予測(CIIP)複合モードである、解決策C11に記載の方法。
C14.前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、解決策C11に記載の方法。
C15.前記符号化モードは、角度イントラ予測モードである、解決策C11に記載の方法。
C16.この方法は、現在の映像ブロックの特徴に基づいて、多重変換選択(MTS)演算のインデックスにおける符号化用のコンテキストモデルを構成することと、構成することに基づいて、現在の映像ブロックと現在の映像ブロックを含む映像のビットストリーム表現との間で変換を行うこととを含み、MTS演算は、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
C17.前記特徴は、現在の映像ブロックの符号化モード情報を含む、解決策C16に記載の方法。
C18.前記符号化モード情報は、イントラブロックコピー、インターブロックコピー、またはインターブロックコピー(IBC)を含む、解決策C17に記載の方法。
C19.前記符号化モード情報は、インターまたはノンインターを含む、解決策C17に記載の方法。
C20.前記特徴は、現在の映像ブロックの形状情報を含む、解決策C16に記載の方法。
C21.前記形状情報は、現在の映像ブロックが正方形であるかまたは非正方形であるかを含む、解決策C20に記載の方法。
C22.前記形状情報は、現在の映像ブロックの幅が現在の映像ブロックの高さよりも小さいかどうかを含む、解決策C20に記載の方法。
C23.前記形状情報は、現在の映像ブロックの幅が現在の映像ブロックの高さよりも大きいかどうかを含む、解決策C20に記載の方法。
C24.前記形状情報は、前記現在の映像ブロックの幅と前記現在の映像ブロックの高さとの比を含む、解決策C20に記載の方法。
C25.現在の映像ブロックと現在の映像ブロックを含む映像のビットストリーム表現との間での変換中、多重変換選択(MTS)演算を含む変換を判定することと、MTS演算の行列の1つ以上の水平インデックスおよび1つ以上の垂直インデックスを別個に符号化することと、を含み、MTS演算は、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
C26.前記1つ以上の水平インデックスまたは前記1つ以上の垂直インデックスは、変換スキップフラグを含む、解決策C25に記載の方法。
C27.前記1つ以上の水平インデックスのためのコンテキストモデルは、前記1つ以上の垂直インデックスに基づく、解決策C25に記載の方法。
C28.前記1つ以上の垂直インデックスのためのコンテキストモデルは、前記1つ以上の水平インデックスに基づく、解決策C25に記載の方法。
C29.前記符号化モードは、イントラブロックコピー(IBC)モードであり、前記決定は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行または映像データユニットにおける信号通知に基づく、解決策C1に記載の方法。
C30.前記符号化モードは、イントラブロックコピー(IBC)モードであり、前記決定は、非ゼロ符号化係数の数に基づく、解決策C1に記載の方法。
C31.前記符号化モードは、イントラブロックコピー(IBC)モードであり、前記決定は、非ゼロ符号化係数の絶対値の合計に基づく、解決策C1に記載の方法。
C32.前記符号化モードは、イントラブロックコピー(IBC)モードであり、前記決定は、非ゼロ符号化係数の最後の位置に基づく、解決策C1に記載の方法。
C33.前記MTS演算の前記選択的適用は、現在の映像ブロックの彩度成分への選択的適用を含み、前記決定は、現在の映像ブロックのカラーフォーマットに基づく、解決策C1に記載の方法。
C34.前記MTS演算が彩度成分に適用され、カラーフォーマットが4:4:4である、解決策C33に記載の方法。
C35.前記MTS演算は前記彩度成分に適用され、1つの色成分の2つのブロックは同一の変換行列を使用する、解決策C33に記載の方法。
C36.前記MTS演算は前記彩度成分に適用され、1つの色成分の2つのブロックは異なる変換行列を使用する、解決策C33に記載の方法。
C37.現在の映像ブロックのカラーフォーマットに基づいて、彩度成分のためのMTS演算のインデックスを信号通知することに関して決定を行うことをさらに含む、解決策C33に記載の方法。
C38.現在の映像ブロックの符号化モードに基づいて、サブブロック変換(SBT)演算の選択的適用に関して決定することと、前記決定に基づいて、前記現在の映像ブロックと前記現在の映像ブロックを含む映像のビットストリーム表現との間で変換を行うこととを含み、前記SBT演算は、前記現在の映像ブロックに関連付けられた輝度変換ブロック上の位置依存変換を使用することを含む、映像処理方法。
C39.前記符号化モードは、イントラブロックコピー(IBC)モードである、解決策C38に記載の方法。
C40.前記SBT演算は、符号化モードがイントラブロックコピーモードまたはイントラモードである場合にも同様に適用される、解決策C38に記載の方法。
C41.前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、解決策C38に記載の方法。
C42.前記符号化モードは、角度イントラ予測モードである、解決策C38に記載の方法。
C43.現在の映像ブロックのカラーフォーマットに基づいて、前記現在の映像ブロックの彩度成分へのイントラサブブロック分割(ISP)演算の選択的適用に関して決定することと、前記決定に基づいて、前記現在の映像ブロックと前記現在の映像ブロックを含む映像のビットストリーム表現との間で変換を行うことと、前記ISP演算は、ブロックを、少なくとも所定の数のサンプルを有するサブパーティションに、垂直または水平に分割することを含む、映像処理方法。
C44.前記ISP演算が彩度成分に適用され、カラーフォーマットが4:4:4である、解決策C43に記載の方法。
C45.前記ISP演算を前記彩度成分に適用し、前記ISP演算の構成は、(i)現在の映像ブロックの高さまたは幅、(ii)現在の映像ブロックにクロスコンポーネント線形モデル(CCLM)予測方法を適用するかどうか、(iii)現在の映像ブロックにジョイント彩度残差符号化を適用するかどうか、(iv)イントラ予測方向、または(v)現在の映像ブロックの輝度成分からイントラ予測モードを導出するかどうか、のうちの1つ以上に基づく、解決策C43に記載の方法。
C46.前記ISP演算は前記彩度成分に適用され、前記ISP演算の構成は、1つ以上の近傍のブロックの彩度成分の再構成サンプルまたは符号化された情報に基づく、解決策C43に記載の方法。
C47.処理装置と、その処理装置に命令が記憶された非一時的メモリとを備える装置であって、命令が処理装置によって実装されることにより、処理装置に、解決策C1~C46のいずれかに記載の方法を実施させる映像システムの装置。
C48.非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品であって、解決策C1~C46のいずれかに記載の方法を実行するためのプログラムコードを含む、コンピュータプログラム製品。
以上、説明の目的で本開示の技術の特定の実施形態を説明したが、本発明の範囲から逸脱することなく様々な修正が可能であることは、理解されるであろう。従って、本開示の技術は、添付の特許請求の範囲による場合を除き、限定されない。
本特許明細書に記載された主題および機能操作の実装形態は、本明細書に開示された構造およびその構造的等価物を含め、様々なシステム、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、またはそれらの1つ以上の組み合わせで実施してもよい。本明細書に記載された主題の実装形態は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置によって実行されるため、又はデータ処理装置の操作を制御するために、有形で非可搬性のコンピュータ可読媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実装することができる。このコンピュータ可読媒体は、機械可読記憶装置、機械可読記憶基板、メモリデバイス、機械可読伝播信号をもたらす物質の組成物、又はこれらの1つ以上の組み合わせであってもよい。“データ処理ユニット”又は“データ処理装置”という用語は、例えば、プログラマブル処理装置、コンピュータ、又は複数の処理装置若しくはコンピュータを含め、データを処理するためのすべての装置、デバイス、および機械を含む。この装置は、ハードウェアの他に、当該コンピュータプログラムの実行環境を作るコード、例えば、処理装置ファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはこれらの1つ以上の組み合わせを構成するコードを含むことができる。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる)は、コンパイルされた言語または解釈された言語を含む任意の形式のプログラミング言語で記述することができ、また、それは、スタンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、成分、サブルーチン、または他のユニットとして含む任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えば、マークアップ言語文書に格納された1つ以上のスクリプト)に記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよいし、複数の調整ファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部を格納するファイル)に記憶されていてもよい。1つのコンピュータプログラムを、1つのサイトに位置する1つのコンピュータ、または複数のサイトに分散され通信ネットワークによって相互接続される複数のコンピュータで実行させるように展開することも可能である。
本明細書に記載された処理およびロジックフローは、入力データ上で動作し、出力を生成することによって機能を実行するための1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブル処理装置によって行うことができる。処理およびロジックフローはまた、特定用途のロジック回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって行うことができ、装置はまた、特別目的のロジック回路として実装することができる。
コンピュータプログラムの実行に適した処理装置は、例えば、汎用および専用マイクロ処理装置の両方、並びに任意の種類のデジタルコンピュータの任意の1つ以上の処理装置を含む。一般的に、処理装置は、読み出し専用メモリ又はランダムアクセスメモリ又はその両方から命令及びデータを受信する。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令およびデータを記憶するための1つ以上の記憶装置とである。一般的に、コンピュータは、データを記憶するための1つ以上の大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれらの大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、およびメモリデバイスを含み、例えば、EPROM、EEPROM、フラッシュメモリデバイス等の半導体メモリデバイスを含む。処理装置およびメモリは、特定用途のロジック回路によって補完されてもよく、または特定用途のロジック回路に組み込まれてもよい。
本明細書は、図面とともに、例示のみを目的とするものであり、例示的とは例を意味することが意図される。本明細書において、「または」の使用は、文脈からそうでないことが明確に示されていない限り、「および/または」を含むことが意図される。
本特許明細書は多くの詳細を含むが、これらは、任意の発明の範囲又は特許請求の範囲を限定するものと解釈されるべきではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明と解釈されるべきである。本特許文献において別個の実施形態の文脈で説明されている特定の特徴は、1つの例において組み合わせて実装してもよい。逆に、1つの例のコンテキストで説明された様々な特徴は、複数の実施形態において別個にまたは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが、主張された組み合わせからの1つ以上の特徴は、場合によっては、組み合わせから抜粋されることができ、主張された組み合わせは、サブコンビネーションまたはサブコンビネーションのバリエーションに向けられてもよい。
同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成するために、このような動作が示された特定の順番でまたは連続した順番で行われること、または示された全ての動作が行われることを必要とするものと理解されるべきではない。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。
いくつかの実装形態および例のみが記載されており、この特許文献に記載され図示されているコンテンツに基づいて、他の実施形態、拡張および変形が可能である。
関連出願の相互参照
本願は、2021年10月20日出願の日本国特願2021-562775号に基づいており、これは2020年4月23日出願の国際特許出願第PCT/CN2020/086354号の国内段階であり、2019年4月23日出願の国際特許出願第PCT/CN2019/083844号の優先権および利益を主張する。前述の出願の全開示は、本明細書の開示の一部として参照により援用される。

Claims (39)

  1. 映像の現在の映像ブロックと前記映像のビットストリーム表現との間での変換のために、多重変換選択(MTS)演算における変換タイプの指示が前記ビットストリーム表現から排除されると判定することであって、前記現在の映像ブロックは、イントラブロックコピー(IBC)モードを使用して符号化される、判定することと、
    前記変換を行うことと、を含む映像処理方法であって、
    前記指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、符号化ユニット、または映像データユニット中にあり、
    前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、
    映像処理方法。
  2. 映像の現在の映像ブロックの符号化モードに基づいて、多重変換選択(MTS)演算の選択的適用に関して決定することと、
    前記決定することに基づいて、前記現在の映像ブロックと前記映像のビットストリーム表現との間で変換を行うこととを含み、
    前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、
    映像処理方法。
  3. 前記MTS演算は暗黙的MTS演算であり、前記MTS演算の変換インデックスは前記ビットストリーム表現から除外される、請求項2に記載の方法。
  4. 前記符号化モードは、イントラブロックコピー(IBC)モードである、請求項2または3に記載の方法。
  5. 前記MTS演算は、前記符号化モードがイントラブロックコピーモードまたはイントラモードである場合にも同様に適用される、請求項2または3に記載の方法。
  6. 前記現在の映像ブロックが正方形のブロックであり、離散コサイン変換タイプII(DCT-II)が適用される、請求項5に記載の方法。
  7. 前記現在の映像ブロックが非正方形のブロックであり、離散コサイン変換タイプII(DCT-II)が前記現在の映像ブロックの長辺に適用され、DCT-VIIが前記現在の映像ブロックの短辺に適用される、請求項5に記載の方法。
  8. 前記符号化モードは、イントラブロック(IBC)コピーモードであり、前記現在の映像ブロックは、正方形のブロックであり、離散コサイン変換タイプVII(DCT-VII)が適用される、請求項2または3に記載の方法。
  9. 前記符号化モードは、イントラブロックコピー(IBC)モードであり、前記現在の映像ブロックは非正方形のブロックであり、前記現在の映像ブロックの短辺に変換スキップを適用する、請求項2または3に記載の方法。
  10. 前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、請求項2または3に記載の方法。
  11. 前記符号化モードは、角度イントラ予測モードである、請求項2または3に記載の方法。
  12. 前記ビットストリーム表現は、前記現在の映像ブロックの前記符号化モードに基づいて判定される、許容される変換のセットの指示を含む、請求項2に記載の方法。
  13. 前記符号化モードは、イントラブロックコピー(IBC)モードである、請求項12に記載の方法。
  14. 前記符号化モードは、イントラおよびインター予測(CIIP)複合モードである、請求項12に記載の方法。
  15. 前記符号化モードは、ブロック差分パルス符号変調(BDPCM)モード、DPCMモード、残差BDPCM(RBDPCM)モード、またはアフィン線形重み付けイントラ予測(ALWIP)モードである、請求項12に記載の方法。
  16. 前記符号化モードは、角度イントラ予測モードである、請求項12に記載の方法。
  17. 現在の映像ブロックの特徴に基づいて、多重変換選択(MTS)演算の少なくとも1つのインデックスを符号化するためのコンテキストモデルを構成することと、
    前記構成することに基づいて、前記現在の映像ブロックと前記現在の映像ブロックを含む映像のビットストリーム表現との間で変換を行うことと、を含む映像処理方法であって、
    前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
  18. 前記特徴は、前記現在の映像ブロックの符号化モードを含む、請求項17に記載の方法。
  19. 前記符号化モードは、イントラ符号化モード、またはインター符号化モード、またはインターブロックコピー(IBC)を含む、請求項18に記載の方法。
  20. 前記符号化モードは、インター符号化モードまたは非インター符号化モードを含む、請求項18に記載の方法。
  21. 前記特徴は、前記現在の映像ブロックに関連付けられた形状情報を含む、請求項17に記載の方法。
  22. 前記形状情報は、前記現在の映像ブロックが正方形または非正方形であることを含む、請求項21に記載の方法。
  23. 前記形状情報は、前記現在の映像ブロックの幅が前記現在の映像ブロックの高さよりも小さい、請求項21に記載の方法。
  24. 前記形状情報は、前記現在の映像ブロックの幅が前記現在の映像ブロックの高さよりも大きい、請求項21に記載の方法。
  25. 前記形状情報は、前記現在の映像ブロックの幅と前記現在の映像ブロックの高さとの比を含む、請求項21に記載の方法。
  26. 現在の映像ブロックと前記現在の映像ブロックを含む映像のビットストリーム表現との間での変換中、前記変換が多重変換選択(MTS)演算を含むと判定することと、
    前記判定することに基づいて、前記MTS演算の行列の1つ以上の水平インデックスおよび1つ以上の垂直インデックスを別個に符号化することと、を含む映像処理方法であって、
    前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、映像処理方法。
  27. 前記1つ以上の水平方向インデックスおよび/または前記1つ以上の垂直方向インデックスは、変換スキップ動作を含む、請求項26に記載の方法。
  28. 前記1つ以上の水平インデックスのためのコンテキストモデルは、前記1つ以上の垂直平インデックスに基づく、請求項26に記載の方法。
  29. 前記1つ以上の垂直インデックスのためのコンテキストモデルは、前記1つ以上の水平インデックスに基づく、請求項26に記載の方法。
  30. 映像の現在の映像ブロックと前記映像のビットストリーム表現との間での変換のために、イントラブロックコピー(IBC)モードを使用して符号化される前記現在の映像ブロックに対して多重変換選択(MTS)演算の変換タイプの指示を構成することと、
    前記変換を行うことと、を含む映像処理方法であって、
    前記指示は、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)、タイルグループヘッダ、スライスヘッダ、ピクチャヘッダ、タイルヘッダ、符号化ツリーユニット(CTU)行、または映像データユニット中にあり、
    前記MTS演算は、前記変換中に前記現在の映像ブロックの予測エラーを変換するために、複数の予め定義した変換候補からの変換を使用することを含む、
    映像処理方法。
  31. 前記指示は、前記SPS、前記PPS、前記タイルグループヘッダ、前記スライスヘッダ、前記ピクチャヘッダ、前記タイルヘッダ、前記CTU行、または前記映像データユニットにおいて、前記MTS演算および前記IBCモードが明示的に符号化されているかどうかに基づいて、前記ビットストリーム表現により条件付きで符号化される、請求項30に記載の方法。
  32. 前記指示は、前記MTS演算がインター符号化映像ブロックに対して有効化されているかどうかに基づいて、前記ビットストリーム表現において条件付きで符号化される、請求項30に記載の方法。
  33. 前記SPSは前記指示を含み、前記指示は、インターコードされた映像ブロックのために前記MTS演算を使用することをさらに構成する、請求項30に記載の方法。
  34. 前記指示は、非ゼロ符号化係数の数に基づく、請求項30に記載の方法。
  35. 前記指示は、非ゼロ符号化係数の絶対値の合計に基づく、請求項30に記載の方法。
  36. 前記変換は、前記ビットストリーム表現から前記現在の映像ブロックを生成する、請求項1~35のいずれかに記載の方法。
  37. 前記変換は、前記現在の映像ブロックから前記ビットストリーム表現を生成する、請求項1~35のいずれかに記載の方法。
  38. 処理装置と、命令を含む非一時的メモリとを備える映像システムの装置であって、前記処理装置による実行時に、前記命令は、前記処理装置に請求項1~37のいずれか1項に記載の方法を実装させる、映像システムの装置。
  39. 非一時的なコンピュータ可読媒体に記憶されたコンピュータプログラム製品であって、
    請求項1~37のいずれか1項に記載の方法を実行するためのプログラムコードを含む、コンピュータプログラム製品。
JP2023076813A 2019-04-23 2023-05-08 多重変換行列のコンテキストモデリングおよび選択 Pending JP2023103327A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019083844 2019-04-23
CNPCT/CN2019/083844 2019-04-23
JP2021562775A JP7277608B2 (ja) 2019-04-23 2020-04-23 多重変換行列のコンテキストモデリングおよび選択

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021562775A Division JP7277608B2 (ja) 2019-04-23 2020-04-23 多重変換行列のコンテキストモデリングおよび選択

Publications (1)

Publication Number Publication Date
JP2023103327A true JP2023103327A (ja) 2023-07-26

Family

ID=72940829

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021562775A Active JP7277608B2 (ja) 2019-04-23 2020-04-23 多重変換行列のコンテキストモデリングおよび選択
JP2023076813A Pending JP2023103327A (ja) 2019-04-23 2023-05-08 多重変換行列のコンテキストモデリングおよび選択

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021562775A Active JP7277608B2 (ja) 2019-04-23 2020-04-23 多重変換行列のコンテキストモデリングおよび選択

Country Status (6)

Country Link
US (1) US11930176B2 (ja)
EP (1) EP3939282A4 (ja)
JP (2) JP7277608B2 (ja)
KR (1) KR20210154157A (ja)
CN (3) CN116896634A (ja)
WO (2) WO2020216282A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020243258A1 (en) * 2019-05-31 2020-12-03 Interdigital Vc Holdings, Inc. Transform selection for implicit multiple transform selection
KR20210065063A (ko) * 2019-11-26 2021-06-03 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN115633172A (zh) * 2020-12-06 2023-01-20 浙江大华技术股份有限公司 基于ibc模式编码方法、电子设备及存储介质
WO2022197139A1 (ko) * 2021-03-19 2022-09-22 현대자동차주식회사 크로마 블록의 인트라 서브블록 예측을 이용하는 비디오 코딩방법 및 장치
WO2023191404A1 (ko) * 2022-03-27 2023-10-05 엘지전자 주식회사 적응적 mts에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체
WO2024020117A1 (en) * 2022-07-19 2024-01-25 Google Llc Dependent context model for transform types
WO2024050099A1 (en) * 2022-09-02 2024-03-07 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for intra block copy
WO2024080766A1 (ko) * 2022-10-12 2024-04-18 엘지전자 주식회사 비분리 변환에 기반한 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190143460A (ko) * 2009-01-27 2019-12-30 인터디지탈 매디슨 페이튼트 홀딩스 비디오 인코딩 및 디코딩에서 변환 선택을 위한 방법 및 장치
US9172968B2 (en) 2010-07-09 2015-10-27 Qualcomm Incorporated Video coding using directional transforms
US9219915B1 (en) * 2013-01-17 2015-12-22 Google Inc. Selection of transform size in video coding
US11323747B2 (en) * 2013-06-05 2022-05-03 Qualcomm Incorporated Residual differential pulse code modulation (DPCM) extensions and harmonization with transform skip, rotation, and scans
AU2013228045A1 (en) * 2013-09-13 2015-04-02 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
GB2519070A (en) * 2013-10-01 2015-04-15 Sony Corp Data encoding and decoding
US9906813B2 (en) * 2013-10-08 2018-02-27 Hfi Innovation Inc. Method of view synthesis prediction in 3D video coding
WO2015100522A1 (en) 2013-12-30 2015-07-09 Mediatek Singapore Pte. Ltd. Methods for inter-component residual prediction
CN106063262A (zh) 2013-12-30 2016-10-26 高通股份有限公司 3d视频译码中的增量dc残差译码的简化
CN103780910A (zh) * 2014-01-21 2014-05-07 华为技术有限公司 视频编码中的块分割方式和最佳预测模式确定方法及相关装置
US10271052B2 (en) * 2014-03-14 2019-04-23 Qualcomm Incorporated Universal color-space inverse transform coding
WO2015139165A1 (en) * 2014-03-17 2015-09-24 Microsoft Technology Licensing, Llc Encoder-side decisions for screen content encoding
GB2531004A (en) * 2014-10-06 2016-04-13 Canon Kk Residual colour transform signalled at sequence level for specific coding modes
TW201626798A (zh) 2014-10-06 2016-07-16 Vid Scale Inc 用於螢幕內容編碼之改良調色編碼
WO2016081939A1 (en) * 2014-11-21 2016-05-26 Vid Scale, Inc. One-dimensional transform modes and coefficient scan order
US10306229B2 (en) * 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
WO2017041271A1 (en) 2015-09-10 2017-03-16 Mediatek Singapore Pte. Ltd. Efficient context modeling for coding a block of data
US10440399B2 (en) 2015-11-13 2019-10-08 Qualcomm Incorporated Coding sign information of video data
CN107231566B (zh) * 2016-03-25 2020-12-18 阿里巴巴集团控股有限公司 一种视频转码方法、装置和系统
US10904526B2 (en) * 2016-03-28 2021-01-26 Kt Corporation Method and apparatus for processing video signal
US20170374369A1 (en) * 2016-06-24 2017-12-28 Mediatek Inc. Methods and Apparatuses of Decoder Side Intra Mode Derivation
US10972733B2 (en) * 2016-07-15 2021-04-06 Qualcomm Incorporated Look-up table for enhanced multiple transform
US10880564B2 (en) * 2016-10-01 2020-12-29 Qualcomm Incorporated Transform selection for video coding
KR102476148B1 (ko) * 2016-12-28 2022-12-12 소니그룹주식회사 화상 처리 장치 및 방법
WO2018143496A1 (ko) * 2017-02-03 2018-08-09 엘지전자(주) 예측 모드를 유도하여 비디오 신호를 인코딩, 디코딩하는 방법 및 장치
KR20180092774A (ko) * 2017-02-10 2018-08-20 삼성전자주식회사 샘플 적응적 오프셋 처리를 수행하는 영상 처리 장치 및 영상 처리 방법
US11405645B2 (en) * 2017-02-28 2022-08-02 Google Llc Transform kernel selection and entropy coding
TWI683573B (zh) * 2017-03-10 2020-01-21 聯發科技股份有限公司 用於視訊編解碼中具有畫面內方向預測模式之內含畫面內編解碼工具設定的方法和裝置
US10855997B2 (en) * 2017-04-14 2020-12-01 Mediatek Inc. Secondary transform kernel size selection
US10750181B2 (en) * 2017-05-11 2020-08-18 Mediatek Inc. Method and apparatus of adaptive multiple transforms for video coding
US11166045B2 (en) * 2017-10-11 2021-11-02 Lg Electronics Inc. Method for image coding on basis of separable transform and apparatus therefor
US11284112B2 (en) * 2018-12-06 2022-03-22 Tencent America LLC Method and apparatus for a primary transform using an 8-bit transform core

Also Published As

Publication number Publication date
KR20210154157A (ko) 2021-12-20
CN113711597A (zh) 2021-11-26
CN116896634A (zh) 2023-10-17
WO2020216288A1 (en) 2020-10-29
CN113728641B (zh) 2023-09-15
JP7277608B2 (ja) 2023-05-19
WO2020216282A1 (en) 2020-10-29
EP3939282A4 (en) 2022-11-16
CN113728641A (zh) 2021-11-30
US20220295061A1 (en) 2022-09-15
US11930176B2 (en) 2024-03-12
EP3939282A1 (en) 2022-01-19
JP2022531553A (ja) 2022-07-07
CN113711597B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
JP7269373B2 (ja) ビデオ処理方法、装置、記憶媒体及び記憶方法
JP7277608B2 (ja) 多重変換行列のコンテキストモデリングおよび選択
JP7277616B2 (ja) ビデオ・データを処理する方法、装置及び記憶媒体
JP7265040B2 (ja) 変換スキップ・モードのブロック寸法設定
JP2022543102A (ja) ビデオ・コーディングにおける縮小二次変換のための行列の選択
CN113826398B (zh) 变换跳过模式和其它编解码工具之间的交互
JP2023153169A (ja) 画像およびビデオコーディングのための高精度変換および量子化
JP2024010156A (ja) イントラコーディングにおけるサブパーティショニング
WO2020244663A1 (en) Applicability of implicit transform selection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230529

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240227